Architecture logicielle

Inscrivez-vous flux rss

Consulter le centre de compétences

imprimer cet article envoyer à un ami recevoir les newsletters contacter la rédaction s'abonner au flux rss partager

Le MIT invente la programmation par copier-coller de captures d'écran

Le MIT invente la programmation par copier-coller de captures d'écran


Edition du 22/01/2010 - par Olivier Rafal

Si les ordinateurs étaient dotés du sens de la vue, on pourrait leur montrer ce qu'on attend d'eux. C'est en quelque sorte le postulat d'un professeur du MIT, Rob Miller, qui, avec l'aide du post-doc Tsung-Hsiang Chang et de Tom Yeh de l'université du Maryland, a mis au point Sikuli, un outil de programmation par copier-coller de captures d'écran.

Lors de la première présentation du projet de recherche, les inventeurs de Sikuli ont proposé l'exemple d'utilisation suivant : une employée de bureau souhaite être prévenue par un sms lorsque le bus qu'elle prend arrive à un point particulier de la rue. Elle se rend alors sur le site de géolocalisation fourni par la compagnie de bus, fait une capture d'écran de la carte où figure le point qui l'intéresse, et une autre capture de l'icône représentant le bus. Dans Sikuli, elle doit tout de même écrire un peu de Python, mais surtout coller les images ; le programme comprendra que lorsque l'icône apparaît sur le morceau de carte, alors il doit déclencher l'action (image ci-dessus).

Sikuli peut également servir à simplifier des recherches. Il sera parfois plus simple de coller une image que de recourir à des mots-clés dans un moteur de recherche. Les inventeurs du programme expliquent qu'un éditeur de logiciel pourra ainsi proposer un système d'aide beaucoup plus intuitif : il suffira de copier-coller telle icône ou tel autre élément de l'interface graphique pour obtenir des informations dessus. La technologie peut également servir en ingénierie logicielle, lors des phases de tests de non régression, les scripts de tests pouvant alors être réalisés à l'aide de captures d'écran.

Le mot Sikuli est emprunté à l'Amérindien (les Huichol du Mexique), et signifie « oeil de Dieu », capable de voir et de comprendre l'inconnu. De fait, les chercheurs du MIT s'appuient sur des travaux d'intelligence artificielle permettant à l'ordinateur de distinguer les motifs graphiques. Dans l'exemple du bus suivi par GPS, le programme ne cherche pas à transcrire en données XML ou autres la capture d'écran : il surveille véritablement les pixels, à la manière d'un observateur humain.

Les chercheurs reconnaissent que la technique reste à perfectionner. Notamment, Sikuli peut être perdu si des éléments graphiques qu'il doit reconnaître sont changés à cause d'un thème utilisateur, ou cachés par d'autres fenêtres. Mais cette première avancée du « picture-driven computing » laisse entrevoir d'étonnantes possibilités.


En savoir plus

Le descriptif de Sikuli (PDF, 10 pages, en anglais)




envoyer recevoir
imprimer commenter
0 commentaires postés >> Tous les commentaires

L'ACTUALITÉ DU JOUR
Internet Le Parlement européen lance un avertissement sur l'ACTA

(12/03/2010 17:24) - L'ACTA (Anti-Counterfeiting Trade Agreement) n'en finit pas de diviser les institutions (...)

Décisionnel Décisionnel : accéder aux rapports BIRT depuis son iPhone

(12/03/2010 16:55) - Les utilisateurs des outils de reporting BIRT vont pouvoir consulter leurs rapports (...)

Infrastructure serveur La gestion des datacenters laisse encore à désirer selon IDC

(12/03/2010 16:44) - Si la virtualisation et l'automatisation ont été à l'origine de gains en efficacité (...)

Réseaux Des vidéoconférences plus souples avec Vidyo

(12/03/2010 16:08) - Crée fin 2005 par un ancien cadre de Radvison, Vidyo propose un système de visioconférence (...)

Business Simon Phipps, patron de l'Open Source de Sun, s'en va lui aussi

(12/03/2010 15:58) - Après Jonathan Schwartz, ex-PDG de Sun, qui a annoncé début février (...)

Société France Télécom épinglé pour "mise en danger d'autrui"

(12/03/2010 13:37) - Selon notre confrère le Parisien, l'opérateur France (...)

LE TOP
  1. Cisco dévoile son routeur CRS-3 qui laisse sceptique son principal concurrent
  2. Google rachète DocVerse pour créer un pont vers MS Office
  3. Microsoft mise tout sur le cloud, confesse Steve Ballmer
  4. Brevets abusifs : Jonathan Schwartz, ex-PDG de Sun, se lâche sur son blog
  5. Huit coeurs et tolérance aux pannes accrue pour les Intel Xeon Nehalem-EX




CONFERENCES
23/03/2010
CLOUD COMPUTING
De 8h30 - 14h00 à l'Automobile Club de France - Paris 8e
PARTNER ZONE
LIVRES BLANCS
La valeur commerciale de la confiance 13 mars 2010 - VERISIGN
La valeur commerciale de la confiance
Ce rapport d'étude se penche sur le rôle du facteur confiance dans le web marchand et passe en revue les moyens mis en oeuvre par les entreprises pour (...)