Google reconnaît les caractères des documents numérisés

Livres blancs

Transition numérique dans le secteur du mobilier commercial : Étude de cas HMY Haut du formulaire
Innovation et transformation : Les défis de la digitalisation dans le secteur de la location
Ransomware et stockage : Comment sécuriser son infrastructure

Google reconnaît les caractères des documents numérisés

Google commence à indexer les documents scannés. Le moteur de recherche a mis en place les ressources nécessaires pour reconnaître les caractères (OCR) contenus dans les documents numérisés et encapsulés au format PDF. Google précise que les internautes peuvent consulter le texte (et non l'image) en cliquant sur le lien "View as HTML - Version HTML" de leurs pages de recherche. Google ne donne aucune information sur l'état d'avancement de cette indexation d'un nouveau genre. Ni sur la prise en compte d'une autre langue que l'anglais. Des défenseurs des Libertés publiques, comme public.resource.org, dénoncent la menace que fait peser cet OCR sur des données personnelles. Ils visent en particulier les jugements rendus. Ils contiennent des informations comme le numéro de sécurité sociale. Aux Etats-Unis, ce numéro est fréquemment utilisé pour identifier un individu.

Sur le même thème

Partenaires

Google reconnaît les caractères des documents numérisés

Livres blancs

Commentaire

Suivre toute l'actualité

Newsletter

Livres blancs

Newsletter LMI

Commentaire

Suivre toute l'actualité

Newsletter