Bureautique

Inscrivez-vous flux rss

Consulter le centre de compétences

imprimer cet article envoyer à un ami recevoir les newsletters contacter la rédaction s'abonner au flux rss partager

Cebit 2007 : un moteur d'OCR en Open Source


Edition du 16/03/2007 - par Olivier Rafal

« Habituellement, les moteurs d'OCR en Open Source affichent des taux d'erreur de 6 à 10%. Nous avons pour notre part avec Ocropus un taux d'erreur de 3%. » Fort de ce résultat, Christian Kofler, ingénieur au centre de recherches allemand sur l'intelligence artificielle, qui expose sur le pavillon « Future Parc » du Cebit, s'apprête à lancer son projet dans une version finalisée à la fin du mois. L'OCR (Optical character recognition, reconnaissance optique de caractères), tel que pratiqué par les logiciels commerciaux, affiche un taux d'erreur qui ne dépasse pas 1%. « Nous espérons réduire le fossé d'ici un an », complète Christian Kofler.
L'autre projet présenté par cet ingénieur prolifique est une création originale de l'Université d'Aachen. Le projet Fire est un outil de recherche d'image par similarité. Le logiciel analyse une image donnée en exemple, puis recherche des caractéristiques similaires dans les images contenues dans son système de fichiers. Problème : il faut trouver l'image qui doit servir d'exemple. Fire propose pour ce faire diverses images tirées aléatoirement de Flickr. « Le but, explique Christian Kofler, est de fournir une technologie de base, en Open Source, qui pourra être utilisée dans des applications pour utilisateurs finaux. »





envoyer recevoir
imprimer commenter
0 commentaires postés >> Tous les commentaires

L'ACTUALITÉ DU JOUR
Réseaux Nasuni professionnalise le cloud personnel

(09/02/2010 17:45) - Nasuni a été créée en 2009 et vient donc de présenter la version bêta de son produit (...)

Infrastructure serveur Avec le Power7, IBM relance la bataille des puces haut de gamme pour grands systèmes

(09/02/2010 17:41) - « Cadencé de 3 à 4,14 GHz, le processeur Power7 sera livré avec 4, 6 ou 8 coeurs (...)

Internet Les familles ne sont pas assez prudentes sur Internet

(09/02/2010 12:23) - D'après ce sondage, deux enfants sur trois ont déjà partagé leur adresse email, et (...)

Internet La Chine ferme le site Black Hawk Safety Net, et arrête trois de ses membres

(09/02/2010 12:23) - Certains journaux, dont le People's Daily, le journal officiel du Parti communiste, (...)

Réseaux Cisco fédère et optimise les datacenters distants

(09/02/2010 12:22) - Cisco dévoile des solutions dédiées aux datacenters pour faciliter l'interconnexion (...)

Mobilité Smartphones : 2010 va confirmer la percée d'Android et de WebOS

(09/02/2010 12:22) - IDC complète son étude sur l'évolution du marché mondial des mobiles par un focus (...)

LE TOP
  1. Combien de machines virtuelles sur un serveur, les avis d'experts ne concordent pas
  2. Certifications : quelles sont les plus rémunératrices ?
  3. Forrester : les architectes français en pointe sur la transformation des entreprises
  4. Une tablette Google Chrome pour contrer l'iPad
  5. La NSA va aider Google à renforcer sa sécurité




CONFERENCES
23/03/2010
CLOUD COMPUTING
De 8h30 - 14h00 à l'Automobile Club de France - Paris
PARTNER ZONE
LIVRES BLANCS
Pourquoi des règles métier ? : Un cas pour les utilisateurs métier de l'informatique 10 février 2010 - IBM
Pourquoi des règles métier ? : Un cas pour les utilisateurs métier de l'informatique
Ce livre blanc permet aux professionnels de définir directement comment leurs règles métier doivent être exécutées. Il fournit également un ensemble d'outils (...)