{"id":635,"date":"2023-07-04T20:30:37","date_gmt":"2023-07-04T18:30:37","guid":{"rendered":"https:\/\/sceau-archives-ovni.org\/?p=635"},"modified":"2025-08-23T21:00:41","modified_gmt":"2025-08-23T19:00:41","slug":"utilisation-de-lintelligence-artificielle-pour-traiter-automatiquement-les-documents-numerises","status":"publish","type":"post","link":"https:\/\/sceau-archives-ovni.org\/?p=635&lang=fr","title":{"rendered":"Utilisation de l&rsquo;Intelligence Artificielle pour traiter automatiquement les documents num\u00e9ris\u00e9s."},"content":{"rendered":"\n<p>Depuis quelques temps, nous utilisons l&rsquo;IA pour acc\u00e9l\u00e9rer tr\u00e8s fortement notre capacit\u00e9 de traitement en particulier pour les documents brefs  ( coupures de presse, fiches).  Nous effectuons des traitements par lots.<\/p>\n\n\n\n<p>Les \u00e9tapes cl\u00e9 sont <\/p>\n\n\n\n<ul><li>Reconnaissance de caract\u00e8res<\/li><li>Analyse et extraction d&rsquo;information, dont le r\u00e9sum\u00e9<\/li><li>Renommage des fichiers<\/li><li>Cr\u00e9ation de tableaux tri\u00e9s par date<\/li><li>Mise en ligne pr\u00e9liminaire<\/li><li>Corrections manuelles (d\u00e8s que possible) <\/li><\/ul>\n\n\n\n<p>Les IA font encore beaucoup d&rsquo;erreurs d&rsquo;interpr\u00e9tation.<br><strong>Il est n\u00e9cessaire de bien v\u00e9rifier le document d&rsquo;origine<\/strong>.  <br>Les tableaux produits et fichiers json non corrig\u00e9s ne devraient pas \u00eatre utilis\u00e9s pour faire des statistiques.<br><br>Les documents mal trait\u00e9s ont tendance \u00e0 \u00eatre en d\u00e9but et fin de tableau car il arrive que la date soit mal identifi\u00e9e et tr\u00e8s \u00e9loign\u00e9e de la v\u00e9rit\u00e9. <br>Les causes sont multiples : <\/p>\n\n\n\n<ul><li>scan de mauvaise qualit\u00e9<\/li><li>document tr\u00e8s abim\u00e9<\/li><li>mauvaise reconnaissance de caract\u00e8res (mauvais scan, texte manuscrit, texte du verso visible en transparence, m\u00e9lange entre des colonnes trop proches, etc&#8230; )<\/li><li>ambigu\u00eft\u00e9  dans le texte<\/li><li>absence de la date dans le document (hallucination)<\/li><li>date cach\u00e9e par un repli du papier au moment du scan (hallucination)<\/li><li>page volante esseul\u00e9e (hallucination)<\/li><li>mauvaise interpr\u00e9tation du texte<\/li><li>annotations manuscrites sauvages qui perturbent l&rsquo;interpr\u00e9tation<\/li><li>mauvais ordonnancement des pages<\/li><\/ul>\n\n\n\n<p>Voici les <a href=\"https:\/\/sceau-archives-ovni.org\/?page_id=501&amp;lang=fr\">r\u00e9sultats de ces traitements<\/a><\/p>\n\n\n\n<p>Voici les <a rel=\"noreferrer noopener\" href=\"https:\/\/www.ufowaves.org\/ltdsp\/ltsdp\/nommage#les_etapes_de_traitement_automatique\" target=\"_blank\">\u00e9tapes du traitement<\/a> si vous voulez tous les d\u00e9tails.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Depuis quelques temps, nous utilisons l&rsquo;IA pour acc\u00e9l\u00e9rer tr\u00e8s fortement notre capacit\u00e9 de traitement en particulier pour les documents brefs ( coupures de presse, fiches). Nous effectuons des traitements par lots. Les \u00e9tapes cl\u00e9 sont Reconnaissance de caract\u00e8res Analyse et extraction d&rsquo;information, dont le r\u00e9sum\u00e9 Renommage des fichiers Cr\u00e9ation de tableaux tri\u00e9s par date Mise &hellip; <a href=\"https:\/\/sceau-archives-ovni.org\/?p=635&#038;lang=fr\" class=\"more-link\">Continuer la lecture de <span class=\"screen-reader-text\">Utilisation de l&rsquo;Intelligence Artificielle pour traiter automatiquement les documents num\u00e9ris\u00e9s.<\/span>  <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[10],"tags":[70],"_links":{"self":[{"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=\/wp\/v2\/posts\/635"}],"collection":[{"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=635"}],"version-history":[{"count":5,"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=\/wp\/v2\/posts\/635\/revisions"}],"predecessor-version":[{"id":1184,"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=\/wp\/v2\/posts\/635\/revisions\/1184"}],"wp:attachment":[{"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=635"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=635"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/sceau-archives-ovni.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=635"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}