Traitement du langage naturel : Quels sont les meilleurs algorithmes, les papiers sur l’extraction de l’entité, les relation extraction de texte?

Meilleur = méthodes actuelles de l’état-of-the-art.

Entité ne = pas simplement nommées entités telles que les personnes et organisations, situation. Plus généralement, tout ce qui pourrait être un titre de l’article de Wikipedia, ou synsets WordNet, etc..

Essentiellement mieux effectuer des méthodes pour aller de Wikipedia à Freebase automatiquement.

EDIT :
Je suppose que la description était trompeuse. Ce que je cherche est des algorithmes qui créeraient automatiquement les bases de données structurées comme Freebase, WordNet ou ConceptNet, etc..
C’est à dire, par extraction de relation que je me réfère à l’apprentissage de la relation (cheval, est un animal) en passant par un corpus de texte.

Réponse

Je pense que ce que vous êtes après est de construction automatique de bases de connaissances sémantiques. J’ai co-écrit un sondage publié cette année, qui examine les différentes méthodes et leurs applications : construction automatique de lexiques, taxonomies, ontologies et autres structures de connaissances
Voici le PDF de la version présentée : http://www.medelyan.com/files/WI...


Tags: Apprentissage automatique, Traitement du langage naturel, Extraction d’information