Quels langages de programmation ont les meilleures implémentations pour divers algorithmes de distance?

http://en.wikipedia.org/wiki/dat...

Réponse

En python, il y a quelques distances chaîne commune (Levenshtein, distance de Levenshtein-Damerau, Jaro, etc. de Jaro-Winkler) mis en place dans le paquet de méduses (http://pypi.python.org/pypi/jell...).

Les p-normes (distance euclidienne, distance de Manhattan, max-norm, etc...) peuvent être facilement calculées avec le paquet de numpy (http://numpy.scipy.org/).

Similitudes basées sur les mesures de dépendance, de concordance ou de cointégration (corrélation, corrélation, etc.) peuvent être facilement calculés avec scipy et numpy également.

Information mutuelle est un peu plus compliquée.


Tags: Algorithmes, Classification (machine learning), Analyse des données, Chaîne des algorithmes de recherche, Pattern Recognition