Qui veut stocker des millions…

  Archives Categories

Qui veut stocker des millions…

By

… de mégaoctets ? Hitachi vient en effet d’annoncer la disponibilité du premier disque dur d’une capacité de stockage de 1 teraoctet, soit 1000 gigaoctets. Si certains particuliers friands de vidéos peuvent parfois être amenés à avoir besoin de tels volumes de données, ce type de matériel s’adresse avant tout aux entreprises qui doivent faire face à une croissance effrenée du nombre de mails échangés et de documents numériques archivés. Cependant, qui traite au quotidien des teraoctets de données sinon… les moteurs de recherche ?

Le teraoctet est en effet l’unité de mesure de la taille du web visible, c’est-à-dire de la portion d’Internet indexable par les moteurs de recherche. Bien que ce chiffre ne soit plus communiqué depuis plus d’un an, on peut estimer qu’un moteur comme Google indexe aujourd’hui quelques dizaines de milliards de pages web, soit tout au plus une centaine de teraoctets de contenu textuel. Le coût du teraoctet étant d’environ 400€, la tâche de stockage du web paraît donc désormais à portée de toute entreprise prête à investir dans cette activité.

C’est ce constat qui a certainement amené récemment la société française Exalead à se positionner à son tour sur le marché de la recherche grand public : en effet, l’entreprise peut se targuer d’indexer plus de 8 milliards de pages avec seulement 150 serveurs. Est-ce à dire que tout un chacun peut aujourd’hui envisager de concurrencer Google ? Certes non, car si stocker est une chose, remplir en est une autre : YouTube, qui dépense plus de un million de dollars par mois en bande passante en sait quelque chose !

Enfin, rechercher en temps réel dans de tels volumes de données représente encore une véritable gageure. Ainsi, une infrastructure de recherche performante doit être répartie et massivement redondante pour garantir des temps de réponse brefs et une forte disponibilité. Des dires mêmes de son président Eric Schmidt, la force de Google réside aujourd’hui beaucoup plus dans son infrastructure qui aligne plusieurs dizaines voire centaines de milliers de serveurs que dans la technicité de ses algorithmes. C’est pourquoi les services de Google étaient pratiquement les seuls à encore fonctionner à Taïwan peu après le récent tremblement de terre en Asie qui a entraîné l’une des premières grandes pannes de l’histoire de l’Internet !



Back to Blog

Leave a Reply