Beaucoup de bruit pour rien dans le monde des moteurs de recherche

25/06/2007 12:40

De nombreuses sociétés annoncent régulièrement avoir mis au point l’arme absolue pour contrer Google. Il ne se crée ainsi pas moins d’un moteur de recherche généraliste chaque jour dans le monde, parfois à grand renfort de capital risque et de communication.

Jusqu’à maintenant toutefois, personne ne semble encore en mesure de contexter l’hégémonie du géant de Mountain View. Revue de détail de deux de ces outsiders particulièrement médiatisés mais dont l’avenir semble loin d’être assuré : Megaglobe et Powerset.

  • Megaglobe

Annoncé depuis de nombreux mois à grand renfort de communiqués de presse parfois maladroits, le moteur de recherche Megaglobe est enfin disponible en version beta, plus d’un an après sa sortie annoncée initialement en juin 2006 (url : beta.megaglobe.com, password : welcome).

Si cette version beta fait taire les mauvaises langues en prouvant que Megaglobe existe bel et bien, l’exécution relève malheureusement de l’artisanat plus que d’un véritable effort de recherche et développement…

En effet, d’innombrables requêtes restent sans réponse, ce qui témoigne de la taille risible de l’index, alors même que l’exhaustivité constitue souvent pour un internaute le premier critère de jugement de la qualité d’un moteur.

Par ailleurs, des doublons (liens rigoureusement identiques) apparaissent parfois dans les listes de résultats (cf. flèches rouges sur la copie d’écran ci-dessous), chose à peine croyable quand on sait que ce problème était déjà résolu par les premiers moteurs de recherche il y a plus de 12 ans maintenant !

Si on ajoute que l’interface est dépourvue de toute fonctionnalité innovante (et même basique comme la version en cache des pages), on aboutit à un moteur à oublier au plus vite, d’autant plus que le temps de réponse n’a rien de “googlesque” (cf. flèche verte sur la copie d’écran ci-dessous).

  • Powerset

L’autre arlésienne des moteurs de recherche web est l’américain Powerset, qui s’appuie sur une technologie de NLP (Natural Language Processing) développée par le PARC (Palo Alto Research Center) de Xerox et a levé pas moins de 12,5 M$ en novembre 2005.

Ses fondateurs entretiennent un secret paranoïaque autour de la sortie de ce moteur censé renvoyer Google aux oubliettes.

Seul problème, les technologies employées dans ce moteur et censées donner du sens à l’information en contextualisant la requête (le Saint Graal des moteurs de recherche) ne peuvent au final pas lui conférer d’avantage concurrentiel décisif pour deux raisons :

1. L’utilisation de la recherche en language naturel dans un contexte de recherche sur Internet a toujours échoué jusqu’à maintenant car les internautes sont familiarisés avec la syntaxe de Google qui ne s’embarrasse pas de subtilités (saisie d’un à trois mots-clés au maximum, comportant par ailleurs souvent des fautes d’orthographe que le moteur se charge de corriger).

Or, tant que les claviers régneront sans partage sur l’interface homme-machine, il sera illusoire d’exiger des internautes qu’ils saisissent des phrases entières dans les moteurs de recherche…

2. Beaucoup plus ennuyeux, la recherche en language naturel n’est par nature pas multilingue, contrairement aux contenus du web. Cette technologie repose en effet sur une analyse grammaticale des textes qui est bien entendu différente pour chaque langue.

Ce principe impose à Powerset, qui ne fonctionnera à priori qu’en anglais, d’ignorer les milliards d’utilisateurs pour lesquels l’anglais n’est (au mieux) qu’une seconde langue. Comment donc dans ces conditions prétendre au titre de moteur de recherche universel ?

L’intention est toutefois louable et il n’est pas exclu que Powerset apporte une plus-value importante sur certaines requêtes particulières, sans toutefois pouvoir se substituer aux moteurs existants pour les recherches de tous les jours.

En tout état de cause, Google a décidément encore de (très) beaux jours devant lui !

4 Responses to “Beaucoup de bruit pour rien dans le monde des moteurs de recherche”

  1. Gilles Says:

    Moi je dirais : Beaucoup de blogs qui écrivent pour ne rien dire.

    Megaglobe comme Powerset semblent être en version beta alors laissez les se développer et ensuite on pourra juger.

    Je ne suis pas d’accord avec le fait que Google est de très beaux jours devant lui car ces moteurs sont amenés à évoluer non ? De plus sufer sur Google est devenu dangereux car votre vie privée est exposée.

    Donc j’ai fais mon choix et Google, même si la technologie est au rendez vous, il n’est pas le moteur que j’utilise car je ne lui fais pas confiance.

    Mais en France il y a un grave problème. On suit le troupeau comme des moutons et quand on voit le décalage entre les parts de marché de Google et Exalead, ca fait peur.

    Meme si une société exterieure que Google nous apporter le meilleur des moteurs, on le dénigrerait. C’est la mentalité Francaise et c’est pour ca qu’on est mal vu à l’étranger. La vérité c’est qu’on ne soutient pas nos entrepreneurs qui s’en vont tous à l’étranger d’ailleurs ou ils réussissent tous d’ailleurs.

    Moi je crois que c’est un grave problème chez nous et tant qu’on sera comme ca, on ne pourra prétendre à concurrencer les Etats unis ou l’Asie par exemple. Nos mentalités sont à revoir, on ne donne pas de chance à nos entrepreneurs et on ne les soutient pas. Triste réalité. Triste constat.

    Cordialement,

    Gilles

  2. Synthesio Says:

    M. Bessie,

    Comme vous l’imaginez, nous ne nous permettrions pas de critiquer ces deux moteurs de recherche sans disposer d’arguments solides :

    - En ce qui concerne Powerset, nos remarques portent sur l’aspect purement conceptuel et non la réalisation, le moteur n’étant en effet pas encore disponible au grand public. Nous ne manquerons pas de vous donner nos impressions lors de sa sortie officielle.

    - En ce qui concerne Megaglobe, nous critiquons la manière de faire autant (voire plus) que le moteur de recherche lui-même. En effet, le recours abusif à l’appellation “beta” permet parfois à certaines entreprises de se dédouaner beaucoup trop facilement de la piètre qualité de leurs services, (in)achevés à la va-vite. Nous ne faisons que pointer du doigt cette attitude qui, quand elle est couplée à une communication pour le moins arrogante comme c’est le cas de Megaglobe, mérite d’être dénoncée.

    Par ailleurs, croyez bien que si nous pensions Google indétrônable, nous ne prendrions pas la peine d’évaluer régulièrement les (très) nombreux nouveaux moteurs de recherche du marché. Un moteur comme Exalead que vous citez fort justement mérite en effet une attention particulière et constitue un outil de choix pour les internautes.

    En revanche, nous ne pouvons accepter votre discours (mille fois entendu) sur la France perdante et aigrie, que les cerveaux fuiraient en masse. Celui-ci est doublement hors sujet dans ce contexte puisque :

    - D’une part, ni Megaglobe ni Powerset ne sont des sociétés françaises,

    - D’autre part, nous nous battons justement chaque jour chez Synthesio pour prouver qu’une startup française peut réussir dans le domaine de la technologie tout en restant en France et en y créant de la valeur ajoutée et des emplois.

    Alors, de grâce, essayez à l’avenir de ne accréditer par vos propos défaitistes la thèse même que vous prétendez combattre.

    Bien cordialement,

  3. Selim Says:

    Le temps de reponse de Megaglobe est bon je trouve, il est beaucoup plus rapide qu’Exalead qui donne les réponses en 2 secondes environ. Donc 0.6 ca reste pas mal.

    Powerset j’aime beaucoup aussi, tout comme Megaglobe, il a de l’avenir c’est sur.

  4. Synthesio Says:

    Effectivement, la performance de Megaglobe en terme de temps de réponse est globalement tout à fait acceptable. Toutefois ce moteur se contente d’afficher les résultats de recherche bruts (en sortie d’index), sans apporter aucune fonctionnalité supplémentaire.

    C’est pourquoi un moteur de recherche comme Exalead affiche un temps de réponse dit “end-to-end” (de la requête à l’affichage complet de la page) en apparence plus élevé, en raison des multiples fonctionnalités innovantes qu’il propose à l’utilisateur, dont la prévisualisation des pages et surtout sa fameuse “zapette” qui permet de filtrer les résultats en fonction de nombreuses métadonnées (type de site, format des documents, catégories, etc.). Cela justifie certainement une petite seconde d’attente supplémentaire ;)

Leave a Reply