Google XXL: Un second Google est-il possible ?
Google XXL

Un second Google est-il possible ?


Blogoscoped signale l'existence d'un excellent article du Stanford Magazine racontant les débuts des moteurs de recherche. Les premiers à avoir proposé d'aider les internautes à trouver des documents sur Internet ont été David Filo et Jerry Yang, les deux fondateurs de Yahoo! Cela a commencé simplement par une liste de favoris mise en ligne et appelée "Jerry's Guide to the World Wide Web". Difficile de faire plus simple ! Une version plus évoluée a ensuite vu le jour avec comme nom "Yahoo!" (une sorte d'acronyme qu'ils tenteront de justifier en "Yet Another Hierarchical Officious Oracle").
Ce premier moteur de recherche a ensuite fait des émules qui étaient tous basés sur ce même principe : le nombre d'occurrence du mot-clé saisi par l'utilisateur déterminait la classification des sites et des pages qui allaient être affichés.
C'est officiellement à partir de décembre 1998 que Google a rendu public son moteur de recherche. Ce qui le distinguait clairement des autres était la notion du PageRank. Cet algorithme permet d'évaluer la notoriété d'une page web au travers des liens qui pointent vers elle. Il a été inventé par Larry Page alors qu'il était encore étudiant à l'université de Stanford. Hector Garcia-Molina, un des professeurs de Larry, se rappelle comment est née cette idée qui allait révolutionner la manière dont les moteurs de recherche fonctionnent.
Larry vient un jour le voir pour lui faire part d'une découverte qu'il a faite. AltaVista ne se contentait pas de collecter les mots-clés présents sur un site mais était aussi capable d'afficher les autres sites qui faisaient un lien vers cette page. Le moteur de recherche ne tirait pas partie de ces informations comme il l'aurait souhaité mais Larry suggéra que cela pouvait être une bonne manière de classer les sites. Ceux qui obtenaient le plus de liens étaient aussi les plus populaires et devaient donc être aussi les plus pertinents. Du coup, ils méritaient d'être classés dans les premiers résultats…
C'est ainsi qu'il conçu son premier logiciel capable d'analyser ce réseau de liens entre les différentes pages qui composent le Web.
C'est tout d'abord un étudiant nommé Meanwhile Lent qui a travaillé avec Brin sur un projet de recherche commun… Son histoire n'est pas courante : après avoir décliné l'offre de faire partie de Yahoo! on verra qu'il préfèrera travailler pour une obscure start-up plutôt que de continuer l'aventure Google… Le but était de retrouver sur Internet les combinaisons de recherche qui revenaient le plus souvent comme, par exemple, des noms d'auteurs ou des titres de livres. Cette méthode a pour le nom le "Data Mining". Il désigne un ensemble de techniques permettant d'extraire des informations à partir d'un grand nombre de données. Brin décida alors de concevoir un programme appelé "Crawler", capable d'arpenter le Web, de compiler les données recueillies et de les rendre accessibles sur un serveur centralisé. Ils voulaient appeler ce moteur de recherche Googol mais on sait que, suite à une erreur d'interprétation de Lent, ce fut Google.
Un peu plus tard, Larry combina sa méthode d'analyse des "Backlinks" avec le robot créé par Brin. Lent, quant à lui, quitta les deux compères pour rejoindre une autre société. Une décision qu'il regretta amèrement mais, à l'époque, tout le monde disait qu'il n'y aurait pas un second Yahoo!
Bien entendu, le moteur de recherche Google rencontra un vif succès… Et Larry et Sergei commencèrent à croire à son potentiel commercial. Avec l'aide du département de technologie de l'université de Stanford, ils décidèrent alors de créer leur propre entreprise et, afin de rentabiliser leur trouvaille, piquèrent un concept inventée par une société appelée GoTo.com (une sorte d'ancêtre des pages jaunes qui, par la suite, a été racheté par Yahoo!) et qui affichaient sur ses pages de résultats des annonces publicitaires. Google intégrera alors sur une même page des liens vers les sites trouvés et des publicités.
L'université de Stanford continua à soutenir de multiples travaux sur les moteurs de recherche. Ce projet existait sous le nom de "WebBase". Et pendant six ans, presque tous les étudiants qui avaient obtenu leur diplôme dans cette école allèrent travailler chez Google. Quand à Lent, il reçu en 2006 un appel de Microsoft, lui annonçant que la compagnie voulait "tuer Google". Il ne donna pas suite considérant que si Microsoft pouvait le faire, lui aussi en serait capable. Voici ce qu'il en dit : "Le cœur de leur système (Google) repose sur l'analyse des liens mais il reste beaucoup à faire sur l'analyse du comportement de l'internaute. C'est l'autre moitié de l'équation…" Lent parle alors de "PageRank dynamique" et ambitionne d'insuffler une dimension temporelle aux recherches sur le Web afin de mieux coïncider avec les attentes des internautes. En traquant leurs habitudes, leurs intérêts et leurs comportement, Lent estime qu'il sera en mesure de bâtir un moteur de recherche beaucoup plus pertinent. Imaginons qu'un internaute fasse des recherches sur le terme "puma", les résultats ne seront pas les mêmes selon qu'il a compulsé auparavant des sites de rugby ou des pages parlant de la vie animalière. Afin d'obtenir plus de détails sur ces travaux comme, par exemple, ceux qui ont été menés par la société Kaltix (rachetée en 2003 par Google), lisez cet article de Philippe Yonnet. Qu'en est-il de l'Université de Stanford ? Depuis que Google a fait la démonstration éclatante que les moteurs de recherche constituaient le nouvel Eldorado économique, la grande majorité des ingénieurs délaisse la recherche fondamentale pour se précipiter vers des sociétés qui sont capables de leur offrir des montagnes de stock-options. Du coup, les découvertes et les travaux les plus prometteurs ne sont pas le fait d'institutions universitaires mais bien celui des sociétés de la Silicon Valley. Mais paradoxalement, la grande question est toujours la même : "Il n'y aura pas de second Google…" ou "Un second Google est-il possible ?"

L'illustration est l'œuvre de P.C. Vey ("Pourquoi personne ne visite mon site Web ? Peut-être parce qu'il ne parle que de vous").

0 commentaires: