mguesser

Lien

mguesser est une librairie extraite du logiciel mnoGoSearch (un moteur de recherche), qui permet de deviner la langue et le type d’encodage d’un texte.
mguesser est implémenté en utilisant la technique “N-Gram-Based Text Categorization”, qui est disponible dans TextCat. Ce programme est développé en C, et optimisé pour détecter très rapidement la langue d’un texte.

Site: mnogosearch.org