Comment diffère Computational Linguistics de traitement du langage naturel?

Je songeais à obtenir un diplôme en linguistique computationnelle, mais surtout parce que je suis intéressé dans le traitement du langage naturel. J’ai remarqué que l’école offre également un diplôme en informatique, alors j’ai été curieux de savoir pourquoi ce n’était pas seulement une concentration au sein de l’informatique. S’il vous plaît laissez-moi savoir quelle est la différence? On cherchera mieux aux employés que l’autre? Irez-vous au cours de différentes choses. Je suis conscient que c’est un long shot, mais je voudrais vraiment travailler sur des logiciels tels que Siri, Cortana, Alexa ou quelque chose de nouveau sort dans le futur.

Réponse

J’utilise ces termes pour indiquer les buts de recherche différents.  Les méthodes sont souvent associées et les communautés se chevauchent.  Nous allons aux mêmes conférences (les travaux plus forte dans les deux champs apparaît au EMNLP, ANACT, ACL, etc.) et facilement parler ensemble de nos problèmes et solutions.

Voici la distinction que je fais personnellement :

Computational linguistics est analogue à la biologie computationnelle ou tout autre calcul fill-in-le-blanc.  Il développe des méthodes de calcul pour répondre aux questions scientifiques de la linguistique.

Les questions de base en linguistique impliquent la nature des représentations linguistiques et les connaissances linguistiques et savoir comment linguistique est acquise et déployé dans la production et la compréhension du langage.  Répondre à ces questions, décrit la capacité du langage humain et peut aider à expliquer la répartition des données linguistiques et le comportement que nous observons en réalité.

En linguistique informatique, nous vous proposons formelles réponses à ces questions fondamentales.  Linguistes sont demandent vraiment ce que les humains sont calcul et comment.  Si nous définissons mathématiquement classes de représentations linguistiques et des grammaires formelles (qui sont aujourd'hui des modèles habituellement probabilistes) qui semblent suffisants pour saisir l’éventail de phénomènes dans les langues humaines.  Nous étudions leurs propriétés mathématiques et concevoir des algorithmes efficaces pour l’apprentissage, de production et de compréhension.  Parce que les algorithmes peuvent exécuter réellement, nous pouvons tester nos modèles et savoir si ils font des prévisions appropriées.

Linguistique estime également une variété de questions au-delà de ce noyau - pense sociolinguistique, la linguistique historique, psycholinguistique et neurolinguistique.  Ces questions scientifiques sont un jeu équitable aussi bien pour les linguistes computationnels, qui pourrait utiliser des modèles et algorithmes pour donner un sens les données.  Dans ce cas, nous ne cherchons pas à modéliser la compétence des intervenants de tous les jours dans leur langue maternelle, mais plutôt pour automatiser la spéciale type de raisonnement que les linguistes ne, potentiellement ce qui nous permet de travailler sur plus grands ensembles de données (ou même de nouveaux types de données) et de tirer des conclusions plus précises.  De même, linguistes computationnels peuvent concevoir des outils logiciels pour aider à documenter les langues en danger.

Traitement du langage naturel est l’art de résoudre les problèmes techniques qui doivent analyser (ou produire) texte en langage naturel.  Ici, la métrique du succès n'est pas que vous conçu une meilleure théorie scientifique ou s’est avéré que les langues X et Y ont été historiquement liés.  Au contraire, la métrique est si tu as des bonnes solutions sur le problème d’ingénierie.

Par exemple, vous ne jugez pas Google Translate sur si il capte quelle translation « est vraiment » ou explique traducteurs humains comment faire leur travail.  Vous jugez sur si elle produit des traductions raisonnablement précises et fluides pour ceux qui ont besoin de traduire certaines choses dans la pratique.  La communauté de la traduction automatique a des moyens de mesurer cela, et ils se concentreront fortement sur l’amélioration de ces scores.

NLP est principalement utilisé pour aider les gens à naviguer et digérer de grandes quantités d’informations qui ont déjà existent sous forme de texte.  Il est également utilisé pour produire de meilleures interfaces utilisateur afin que l’homme peut mieux communiquer avec les ordinateurs et avec d’autres humains.

En disant que la PNL est mécanique, je ne veux pas dire qu’il est toujours centré sur le développement d’applications commerciales.  PNL peut être utilisé à des fins scientifiques dans les autres disciplines scientifiques telles que les sciences politiques (blogue), économie (nouvelles financières et rapports), médecine (notes du médecin), humanités numériques (oeuvres littéraires, des sources historiques), etc..  Mais alors il est utilisé comme un outil dans le calcul de X-ology afin de répondre aux questions scientifiques de X-ologists, plutôt que les questions scientifiques, des linguistes.

Les deux champs se servir d’une formation en CS, linguistique et apprentissage de la machine.  Si vous voulez vraiment avancer soit champ durablement, vous devez développer une force suffisante pour faire des recherches originales dans tous les trois de ces zones.  Il peut permettre d’aller à l’école avec une forte culture interdisciplinaire, où beaucoup de la faculté de CS et les étudiants s’intéressent activement en linguistique pour son saké (ou vice versa).

Cela dit, les gens PNL souvent impunément linguistique relativement superficiel.  Ils regardent les erreurs commises par leur système actuel et d’apprendre seulement autant linguistique que dont ils ont besoin pour comprendre et résoudre les principaux types d’erreurs.  Après tout, leur but n’est pas une théorie complète, mais plutôt l’approche plus simple et plus efficace, qui obtiendra le travail réalisé.

À l’inverse, si vous étudiez dans un département de linguistique, la linguistique computationnelle, vous généralement obtiendrez linguistique beaucoup plus et beaucoup moins CS/ML.  Les étudiants dans ces départements sont techniquement habiles, étant donné que la linguistique est un domaine technique.  Mais ils ont tendance à connaître beaucoup moins mathématiques et CS.  Si les cours informatiques ont tendance à fournir seulement une exposition à la théorie du langage formel, programmation et appliqué la PNL.  (Ces cours sont populaires parmi les étudiants de linguistique qui espèrent améliorer leur employabilité).

Par la suite J’espère que les programmes de deux recherche attirera encore plus étroitement ensemble.  Si nous pouvons construire un modèle fort de la capacité linguistique humaine, qui devrait résoudre des problèmes un large éventail de la PNL pour nous.  Donc aujourd'hui computational linguistics élabore des méthodes pour PNL de demain.  Cela a été historiquement vrai trop.


Tags: Informatique, Apprentissage automatique, Computational Linguistics, Traitement du langage naturel