RTFlash

Testez la machine à remonter le Web

Depuis leur ouverture au public fin octobre, les plus grandes archives Internet du monde sont prises d'assaut. Alléchés par la perspective de se plonger gratuitement dans une collection de dix milliards de pages web, les visiteurs se pressent mais la moitié d'entre eux est refoulée à l'entrée. Trop d'affluence. C'est que ce musée en ligne offre une expérience hors du commun: revisiter la brève mais riche histoire du Web. Surnommé «The Wayback Machine» (la machine à remonter le temps), ce site permet de retrouver des pages sauvegardées depuis 1996. Par exemple, le Yahoo! dépouillé des débuts, les premières pages personnelles - touchantes de maladresse et pour beaucoup laissées en jachère - de l'hébergeur gratuit Geocities, les sites (alors) triomphants du commerce électronique, comme l'épicier en ligne Webvan, emportés depuis par le crash de la Net économie. Le fondateur de ces archives, Brewster Kahle, a créé, il y a cinq ans, l'ancêtre de la machine à remonter le temps, «Internet Archive» , avec ses propres deniers et une passion sans limites. Ses archives n'étaient accessibles jusqu'alors qu'à un groupe restreint de chercheurs et de journalistes. Mais les attaques du 11 septembre ont incité Brewster Kahle à généraliser plus tôt que prévu l'accès à ce gigantesque champ de mémoire. Quelque 100 000 milliards d'octets d'informations, soit l'équivalent de cinq fois le contenu de la bibliothèque du Congrès à Washington, sauvés de l'oubli. «Si vous ne gardez aucune trace des contenus numériques, ils disparaissent», rappelle ce chercheur retraité d'IBM. Pour remonter le fil du Web, il suffit d'entrer l'adresse d'un site. «The Wayback Machine» présente alors toutes les versions qui en ont été sauvegardées depuis 1996. Les enregistrements se font au gré de l'humeur vagabonde des «robots» de recherche qui parcourent le Web tous les deux mois, prenant des «photos instantanées» des pages des sites détectés. Brewster Kahle rêve finalement d'une bibliothèque d'Alexandrie numérique: «Nous avons la technologie pour créer à moindre frais un énorme fonds, accessible de partout dans le monde.» Numérisé, l'ensemble des ouvrages de la librairie du Congrès tiendrait dans une machine de la taille d'un frigo. Quant aux archives de l'Internet et leurs100 teraoctets, «ça a l'air gros, mais cela coûte seulement 400 000 dollars (442 000 euros) à stocker». Chaque mois, une centaine de nouveaux serveurs rejoint le coeur de la machine à remonter le temps. C'est que son fondateur voit de plus en plus grand et espère coopérer avec la France, mais aussi l'Australie et la Suède sur des projets d'archivage de leurs sites nationaux.

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top