DOSSIER : Les évolutions du réseau mondial Internet

 

TITRE :L'art de récolter des images ou les "fouineurs" d'images sur la toile

par Carrie Jérémie , directeur artistique
et Philippe Coval , chef de rubrique
Rédactrice en chef : Florence Sedes
 
 

Sous-titre :

Qu'ils soient des évolutions ou des extensions des moteurs et autres annuaires de recherche existants, ou bien le fruit de recherches universitaires ou individuelles , tous ces programmes s'évertuent à fournir au surfeur un semblant de Base de Données Images se rapprochant au mieux des attentes de cet utilisateur plus ou moins averti.
 

Présentation :

Au vue de la croissance exponentielle du nombre de pages Web, il est souvent difficile de retrouver un site correspondant au sujet pour lequel on recherche des informations. Afin de faciliter le travail d'investigation du surfeur, des moteurs et annuaires de recherche ont vu le jour ; pour simplifier, la différence entre ces deux types d'application se trouve sur l'ensemble de sites qui vont être étudiés par l'application, les moteurs recherchant suivant des algorithmes qui leur sont propres sur l' "ensemble" du Web  - le terme ensemble est à nuancer !, cela va s'en dire :) - alors que les annuaires le font sur leur propre base de sites qu'ils ont au préalable classés  - d'où les classements par thèmes que l'on peut utiliser sur ces sites ! -
Les techniques du multimédia aidant, nos sites se sont vus enrichir d'images, sons et vidéos qui malgré l'alourdissement du temps de chargement - qui n'a jamais maugréé contre ces attentes de loading interminables !? :( - ont grandement embelli et surtout rendu attractif les sites constitués d'effets textuels souvent mornes.
A l'arrivée de ces nouveaux types de données manipulées, les moteurs et autres annuaires ont du évolué pour satisfaire une demande de plus en plus forte de recherche non plus textuelle  mais visuelle avec par exemple le souhait de retrouver toutes les images présentant l'éclosion d'un oeuf d'alligator :) . Avec plus ou moins de bonheur, chaque moteur et annuaire ont réussi à intégrer cette nouvelle donne. Nous présenterons par la suite deux des plus connus et des plus utilisés que sont Yahoo et Altavista ainsi que des moteurs spécialisés dans les images, tels que Image Search, qui sont souvent le fruit d'universitaires ou tout simplement de passionnés désirant perdre moins de temps dans leur recherche.
Malheureusement, on a beau savoir exactement ce que l'on recherche au niveau des images attendues, il est souvent nécessaire de naviguer entre différentes pages pour obtenir un ensemble de clichés de notre oeuf d'alligator par exemple qui nous conviennent ; il est inconcevable de trouver sur un site personnel la totalité des images recherchées quand on sait que la taille d'un site personnel est souvent - pour ne pas dire tout le temps :( - limitée.
Pour bien comprendre cela, imaginez donc que vous disposiez d'un disque dur de 10 Go, il pourra engranger plus de 50 000 clichés en plein écran (calcul effectué sur la base d'images en 800x600 et enregistrées au format Jpeg) ; maintenant sachant qu'un site peut avoir une moyenne de 1Mo, vous pouvez donc mettre 5 clichés sur votre site ! - il est vrai que la résolution de 800x600 peut-être conséquente pour notre oeuf mais si nous avons besoin du moindre petit détail ... :) -
De cette optique, certains sites ont donc été créés pour présenter une base de données assez étendues sur des sujets aussi divers que les animaux - pour notre petit alligator par exemple :) - , les voitures, les célébrités etc.. Deux exemples de ce type de site, Webseek et  Photodisc, vous seront détaillés  et nous verrons comment ils peuvent présenter à l'aide notamment de "thumbnails" ou images icônifiés leur base d'images sans faire accroître le temps d'attente de l'internaute.
Autre donne de la navigation sur le Web, celle-ci étant d'ailleurs plus proche de l'origine de l'internet en général, c'est l'utilisation beaucoup moins ludique faite par les scientifiques spécialisés en traitement d'images. Grâce aux trois applications présentés en fin d'article, nous verrons que de nombreuse études d'universités ou d'écoles telles que l'INRIA ont été faites pour fournir une recherche plus précise d'images soit par comparaison avec une image prédéfinie par l'utilisateur, ce qui demande de mettre en place des algorithmes d'appariement ou de mise en correspondance, etc..
soit par recherche d'éléments caractéristiques tels que la couleur, le sujet de la photo, etc..
Ces différentes approches pourraient être classées dans les catégories d'application vues précédemment mais elles ont surtout pour finalité de présenter une technique de recherche développée par le laboratoire du créateur ;  même si par exemple elle utilisait une base de donnée pour présenter des résultats d'utilisation de leur algorithme. D'ailleurs, ces techniques sont souvent lorgnées de très prés par les moteurs de recherche les plus connus, avides d'ajouter des fonctionnalité à leur programme ; par exemple, l'option 'similar' d' Altavista Search Image ! se rapproche beaucoup des techniques utilisées par  Amore ou PicToSeek.
 

 Principales caractéristiques des applications énumérées :

Nous tenons à signaler que les notes qui suivent ne doivent en aucun cas être prises pour argent comptant ; elles permettent juste de donner une idée plus précise des différents éléments constituant les trois voire quatre catégories d'application que nous avons signalées plus haut. De plus, vue les évolutions constantes des techniques, nous tenons à inciter les lecteurs à récupérer ces logiciels ou leur démos afin de s'en faire leur propre opinion.
Les principaux éléments à prendre en compte sont les suivant :

Résultats obtenus pour la recherche de : "tall blonde girl in a red dress holding flowers"

OUTILS
Exemple de page-resultats
Image Pertinente
REMARQUES
 
Altavista
"tall girl" + "red dress" flowers
On peux affiner la recherche en jouant sur les booléens (and , or ... + ) 
Leiden Image Search
dress
Recherche sur nom de fichiers peu évoluées 
Yahoo 
Red dress
Rubriques 
Photodisc
girl and red and dress 
La requête doit rester simple ! 
Webseek 
girl
240 images dont les premières ne sont pas très pertinentes ! 
Amore
Movie / girl
Recherche Thèmatique 
Pictoseek
Similarité 
Critères de similarité 
Surfimage 
Similarité 
Critères de similarité 

 

 

Moteurs de recherche :

Altavista Search Image
 

http://www.altavista.com/cgi-bin/query?mmdo=1&stype=simage
 
 

Ce moteur de recherche offre la possibilité de rechercher des images avec l'onglet 'Images'. De part sa catégorie, il est supposé fonctionner sur une base de Données illimitée mais permet aussi de surfer sur des sites partenaires tels que CD Now ou Corbis Collection. Après un temps d'attente plutôt court, les résultats sont présentés sous forme d'icônes ou thumbnails permettant une navigation plus rapide. Il est à noter que la recherche peut être accès vers les photos, la couleur ou le noir&blanc.
 
 
 

Image search
 

http://ind134a.wi.leidenuniv.nl:2001/

Ce moteur de recherche est, à la différence du précédent, spécifique aux images. A l'aide de thèmes prédéfinis, la recherche semble se faire sur le critère du nom de fichier ou de l'URL. Cet outil n'a pas eu l'unanimité auprès des rédacteurs ! En effet, après un temps plutôt long, la présentation des résultats en colonne n'est pas pratique malgré la bonne initiative de présenter sous chaque icône l'adresse Web du site où a été trouvé l'image. Pour les mêmes raisons que celles exposées pour l'outil Altavista, la Base de Données est aussi vaste que peut l'être le réseau Internet.
 
 

Annuaires de recherche :

Yahoo Image Surfer
 

http://isurf.yahoo.com/

A la différence des moteurs de recherche, les annuaires tels que Yahoo permettent de rechercher des informations suivant des thèmes prédéfinis dans des pages référencées par les créateurs de ce type de site. A priori, la Base de Données semble moins important car dépendante des pages référencées mais ces annuaires permettent d'avoir des résultats assez précis. Présentant ces résultats de la même façon qu'Altavista, nous avons pu constater que pour notre exemple, les images retournées étaient beaucoup plus "sexy", et même si Altavista semble utilisait plus de mots clés. Nous pouvons regretter qu'il n'y ait pas de liens sous l'image vers le site où elle a pu être trouvée.
 
 

Bases de données :

Photodisc
 

http://www.photodisc.com/am/default.asp

Cette Base de Donnée a deux inconvénients majeurs : sa taille plutôt faible et le fait d'être payante si l'utilisateur est amené à utiliser les photos trouvées. La présentation des résultats similaire à Yahoo est obtenue après un temps d'attente presque normal mais le chargement de chaque page est plutôt long ! Différents possibilités de recherche sont possibles : choix par pays, nombre d'images à trouver, mots clés en entrée.
 
 

Webseek
 

http://disney.ctr.columbia.edu/webseek/

Cette Base de Données plus importante que Photodisc mais gratuite a été développé par la Columbia Innovative Enterprise de l'université de Columbia. De la même façon que Yahoo, les thèmes permettent de cibler la recherche malgré l'impossibilité d'affiner celle-ci en augmentant le nombre de mots-clés par exemple. Par contre, il est possible de restreindre la recherche aux options suivantes : vidéo, images noir et blanc, etc .. Le temps d'attente des résultats est normal, la navigation aisée mais il faut patienter lors du chargement des images.
 
 

Autres :

Amore
 

http://www.ccrl.com/amore/

La version testée a été proposée par le C&C Research Laboratoire de San Jose USA. Cet outil permet de rechercher des images dite "similaires". Sur une Base de Donnée limitée, les résultats ne sont pas très convaincants lorsque nous combinons texte et images, et même certaines images similaires ne sont pas toujours très pertinentes. Six thèmes de recherche sont disponibles et des options avancées sont accessibles permettant de choisir une similarité sémantique au lieu de visuelle. Le temps de réponse est normal.

Zomax, solution basé sur Java pour le traitement et la recherche d'images
 

http://www.wins.uva.nl/research/isis/zomax/
-> présentation du procédé de recherche : PicToSeek
 

http://zomax.wins.uva.nl:5345/ret_user/

Autre outil de recherche par similarité, cette version démo basée sur Java est proposée par l'équipe Intelligent Sensory Information System de l'University of Amsterdam, et fait partie d'une gamme large de produits tels que PicToVision. Les données recherchées peuvent être des photos, des graphes ou des visages ; les types de recherche sont basés sur des techniques de Logique Flou, d'intersection, d'exactitude, etc.. ; et les caractéristiques de similarité peuvent être définies par l'utilisateur à la différence de l'outil Amore : couleur, RGB, point de vue invariant, etc.. La démo testée est rapide mais le nombre de réponses est limité aux seize emplacements utilisés pour exposer les résultats.

Surfimage
 

http://www-rocq.inria.fr/cgi-bin/imedia/surfimage.cgi
 

La démo testée de cet outil français a été développé par l'INRIA au cours du projet IMEDIA 1999. Le(s) technique(s) de similarité utilisée(s) permettent de regrouper des images présentant un même visage mais orienté différemment. Les types d'objets vont de l'objet 3D, au visage en passant par les textures. Les résultats pour cet échantillon de Base de Données sont obtenus rapidement et sont plutôt bons. A noter qu'aucun mot-clé ou autre donnée ne sont utilisés pour la recherche mais ils utilisent plutôt une technique appelée "perceptual content". La navigation correcte est facilitée par des flèches de déplacement.

Liens :

The Computer Vision Image
 

http://www.cs.cmu.edu/~cil/vision.html
 

Annexes : Banque de Photographies et Images Foto Search Premières recherches

  Carrie & Coval, Mars 2000