Où est-ce que je peux télécharger une liste de mots de vocabulaire SAT?

De préférence en format CSV.

Réponse

Étape 1: Utilisez la commande « curl » pour télécharger mots sur un site de vocabulaire.

curl -o "words.html" http://freevocabulary.com

Cette commande enregistre le contenu HTML de http://freevocabulary.com sur le fichier "words.html".

Étape 2: Ouvert de Python

python

Étape 3: Une fois à l’intérieur de Python, charger la bibliothèque d’expressions régulières , qui vous aidera à trouver les pièces du dossier qui ressemblent à des SAT mots de vocabulaire.

>>> word_file = open("words.html")

Pendant que vous y êtes, chargez le fichier lui-même.

"^([A-Za-z]+) (n|v|adj)\. .*
"

Étape 4: Utilisez la commande « filtre » pour récupérer uniquement les lignes du fichier contenant les mots et leurs définitions.  Le modèle >>> word_lines = filter(lambda line: re.match("^([A-Za-z]+) (n|v|adj)\. .*
", line), word_file)
correspond à des chaînes qui commencent par un mot, puis un espace, puis le « n ». « v. » ou « adj. » et finalement un »
« caractère (qui est le symbole HTML pour une nouvelle ligne).

>>> word_lines = filter(lambda line: re.match(>>> words = [line.split()[0].lower() for line in word_lines], line), word_file)

Notez que la commande filtre fonctionne sur n’importe quel itérable, c’est pourquoi nous pouvons utiliser le "filtre" sur un fichier objet.

Faire un rapide test de cohérence pour s’assurer que nous avons les bonnes données, car il est facile de bousiller les expressions régulières.

 >>> word_lines[0]
 'abbess n. The lady superior of a nunnery. 
        \n'
 >>> word_lines[1]
 'abbot n. The superior of a community of monks. 
        \n'
 >>> word_lines[-1]
 'zephyr n. Any soft, gentle wind. 
          \n'

Étape 5: Prenez le premier mot de chaque ligne, de transformer les mots en minuscules le long du chemin.

Un autre test de rapide-validation :

 >>> words[:10]
 ['abbess', 'abbot', 'abdicate', 'abdominal', 'abduction', 'aberration', 'abet', 'abeyance', 'abhorrence', 'abhorrent']

Étape 6: Écrire la liste de mots dans un fichier :

 >>> out = open("words.csv", "w")
 >>> out.write("\n".join(words))


Tags: Anglais (langue), SAT (test d’admission standardisé de collège), Question de recherche, Téléchargement, Développement du vocabulaire