RTFlash

Gnutella devient un vrai moteur de recherche

Pour être vraiment libre, l'information numérique doit aussi être visible. Tel pourrait être le credo de Gnutella. Non contents de militer pour la libre circulation sur le Net ;les concepteurs de ce programme de partage de fichiers viennent de lancer InfraSearch . Le premier moteur de recherche explorant ce que l'on appelle "le web invisible".Selon une étude publiée en juillet 99, près de la moitié des informations disponibles sur le web ne sont accessibles à aucun moteur de recherche classique. Plus récemment, une enquête d'IBM a souligné que 30% des pages Web ne sont pointées par aucune autre page. Les agents de recherche (les "arpenteurs") des moteurs qui remontent de lien en lien ne peuvent donc pas les atteindre et encore moins les indexer. Sans compter les URL à contenu dynamique (celles avec des points d'interrogation dans l'adresse, comme celle que vous lisez en ce moment) illisibles pour les arpenteurs. Il était donc nécessaire de mettre au point un outil de recherche plus intelligent, plus réactif et plus sélectif que ces grosses moissonneuses-batteuses à mots que sont devenus les moteurs de recherche. Comme Gnutella, InfraSearch se fonde sur une architecture complètement distribuée. Ce nouveau type de moteur n'effectue pas lui-même la recherche et la récupération de l'information, il ne fait que transmettre les requêtes formulées par l'utilisateur aux systèmes qui lui sont connectés, qui eux-mêmes les répercutent à leurs voisins sur le réseau. Chaque hôte recevant la requête a la responsabilité totale d'effectuer lui-même la recherche sur son propre système et de renvoyer ensuite à InfraSearch les infos jugées pertinentes. Avantage : en étant traitée par un hôte "spécialiste", une requête obtiendra des données plus pointues qu'avec un moteur de recherche généraliste. Cette technique permet aussi de décharger le serveur central des ressources mobilisées pour entretenir et indexer les bases de données obèses des moteurs de recherche classiques. La distribution des temps de calculs sur l'ensemble du Net s'en trouve optimisée. En outre, la recherche est dynamique : elle ne s'effectue pas sur la base de données interne du moteur de recherche mais sur le web lui-même. Résultat, les réponses sont de toute fraîcheur : une recherche lancée jeudi sur le processeur Crusoe de Transmeta procure des liens vers des articles publiés le jour même. Essayez donc d'en obtenir autant avec Google ou Altavista !

Tranférables :

http://www.transfert.net/fr/techno/article.cfm?idx_rub=89&idx_art=939

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top