12 septembre 2006
Sources diverses
Google et la reconnaissance optique des caractères
Le moteur de recherche a annoncé la renaissance d’un logiciel open source de reconnaissance de caractères. Issu du logiciel Tesseract, développé par HP entre 1985 et 1995 avant d’être abandonné, le moteur a corrigé les bugs les plus importants. Le logiciel permet de convertir rapidement un document papier en un texte indexable par les moteurs.
Source : JournalDuNet