Le pire cauchemard du thésard

Qu’y a-t-il de pire dans une thèse ? La bibliographie.

Qu’y a-t-il de pire dans une bibliographie ? La bibliographie dite « généraliste » ; le genre de truc où on cherche, mais on sait pas bien quoi…

Qu’y a-t-il de pire dans un biblio généraliste ? Le fichier PDF de 1000 pages correspondant à un vieux livre des années 70, tapé à la machine. Autrement dit : chaque page est équivalente à une image, il n’y a pas un seul mot, donc pas la peine d’essayer d’y chercher quoi que ce soit (Ctrl-F, la fameuse fonction « recherche »).

thesard_dragon

CQFD

Cet article a été publié il y a 11 ans. Son contenu est sans doute daté, tant sur la forme que sur le fond... Toutefois, cela n’empêche pas d'échanger à son propos. N'hésitez donc pas à vous exprimer en commentaires.

17 Responses

  1. En gros, c’est le même principe que la reconnaissance de caractères parfois livrée avec des logiciels de scan…

    Je n’y avais pas pensé. Mais bon, j’imagine que ça a une certaine fiabilité… En l’occurence, pour un document tapé à la machine, sur deux colonnes, et de plutôt mauvaise qualité, ça ne doit pas faire de miracles, si ? Cela dit, j’essayerai quand même à l’occasion.

  2. Exactement Ekho.

    Au contraire, si c’est tapé à la machine, il y a de très bon résultat ! (après ça dépend de ce que tu appelles mauvaise qualité, hein)
    On arrive même à reconnaitre de l’écriture manuscrite avec de l’OCR (à condition qu’elle soit relativement « propre »)

  3. La prochaine fois que j’ai un problème avec ma thèse, je demanderai directement à Djo, il aura ptetre une réponse !!!

    (je ne sais pas si ça marche, mais il a quand même défoncer le problème : « une porte fermée? On n’a pas la clé? Attends, j’ai le bélier pas loin » :D)

  4. Et est-ce qu’il y a des logiciels de ce type, fonctionnant sous Windows (PC du boulot), libres, et « stand alone » (je ne peux pas me permettre de confier certains documents à Google)…?

    Je vois que tu avais aussi rencontré ce problème, Ji-Pi ?

  5. J’ai eu le même problème que toi, mon ptit Ekho, sauf que la documentation était en papier, et non informatique… ça abime moins les yeux, certes, mais la solution de Djo ne marche pas 😀

  6. Pour revenir sur ce vieil article, qui reste cependant d’actualité… J’ai testé les solutions windows proposées sur ubuntu-fr.com (oui, c’est paradoxal) :

    SimpleOCR : très partiel en version gratuite, ne semble pas lire les PDF.

    ABBY FineReader 8.0 OCR : Payant.

    WebOCR : Ne lit pas les PDF.

    ReadIris : limité à 30 jours, plante après le premier démarrage.

    C’eut été trop beau… 🙁

Répondre à JPeG Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Post comment