Dans la cour des grands

  Archives Categories

Dans la cour des grands

By

Synthesio a franchi fin 2006 le cap symbolique des 3 millions d’articles indexés. Profitons de l’occasion pour effectuer quelques remarques sur les capacités de traitement des moteurs de recherche. En effet, nombreux sont aujourd’hui les sites Internet et portails à proposer une recherche d’information, mais rares sont ceux à le faire par leur propre moyen.

Ainsi, dans le monde des grands moteurs généralistes, il ne reste aujourd’hui plus que quelques acteurs à disposer de leur propre index, c’est-à-dire de leur propre base de données d’informations qui se compte souvent en milliards de pages :

Les autres sites font tous appels à ces grands moteurs pour alimenter leur propre recherche.

En effet, le volume sans cesse croissant des informations à traiter rend la tâche de plus en plus ardue et nécessite des moyens importants : les moteurs de recherche constituent en quelque sorte l’équivalent dans la nouvelle économie de ce qu’on nomme “industrie lourde” dans l’ancienne économie.

Il en va de même dans le monde de l’actualité sur Internet, avec toutefois une difficulté supplémentaire : la nécessité de filtrer et trier l’information en temps réel suivant de multiples critères pour afficher des résultats très pertinents et aller au-delà de la simple recherche par mot-clé proposée par les moteurs généralistes. Le fait de disposer d’une information qualifiée explique que ces index n’atteignent pas les milliards de page des grands moteurs mais fournissent néanmoins des résultats de qualité.

Ainsi, les acteurs de la recherche d’actualités capables de gérer de tels volumes de données ne sont pas légion. A titre de comparaison, le leader mondial de la fourniture d’information business, l’américain Factiva, propose 18 millions d’articles issus du web. Un objectif en ligne de mire pour Synthesio au vu des articles indexés depuis un an !



Back to Blog

Leave a Reply