Sans connaître forcément le nom de cette application, vous avez certainement déjà utilisé le captcha. Vous savez, c'est ce petit utilitaire de sécurité servant à empêcher une machine de répondre à la place des humains. Un truc pour empêcher par exemple le spam en faisant recopier par l'utilisateur une image représentant des lettres distordues. Et bien le captcha pourrait bien avoir un autre usage, raconte David Monniaux sur son blog. Un emploi tout à fait intéressant pour nous les généalogistes. En effet, chaque jour, des milliers, voire des millions de captcha sont recopiés par des internautes. Jusqu'ici, on n'avait rien trouvé d'autre à faire que de recopier des lettres en forme de tourbillon ou bien barrées ou encore dispersées un peu partout dans l'image.
Et si on remplaçait ces images par des lettres anciennes, des formules du XVIIe siècle ou encore par des abréviations de notaires ? En bref, si l'on remplaçait une tâche totalement inutile par une tâche utile ? Car le captcha, en collectant les lettres difficiles à exploiter informatiquement permettrait d'alimenter une base de données très utile pour déchiffrer les textes anciens. A quoi sert-il à Google de numériser des kilomètres de textes anciens, des rayonnages entiers de bibliothèques, si ceux ci ne peuvent être lus par une machine (OCR : reconnaissance optique de caractères), donc indexés et facilement retrouvés ? Utiliser le captcha permettrait de trouver une solution à peu de frais. Imaginez un peu : vous scannez un testament illisible de 1621, vous le passez dans une moulinette OCR et vous voilà en possession d'un document transcrit sans même avoir fait l'école des chartes ! Utopique ? Non, mais sans doute un peu prématuré. Sans compter que le grand public ne sait pas forcément lire cette phrase : (par devant nous
furent présents
et comparurent
début traditionnel d'un acte notarié au XVIIe siècle)
bjr a tous
Voila une idée a suivre et a developper , car il est en effet tres souvent difficile de transcrire un texte, ou d'y passer des heures avec l'aide de specialistes.
Bon courage et tenacité pour les futurs developpeur de ce systeme
cdt
j p c
Rédigé par : jp Chauvin | 03 octobre 2009 à 09:14