Danny Sullivan de Yahoo a répondu aux griefs concernant les déchets indésirables dans les moteurs de recherche en demandant à l’utilisateur de signaler le spam en utilisant le formulaire. Un individu a signalé et Danny a réagi que de bons enregistrements de spam se traduisent souvent par «un saut en profondeur pour connaître les sites de réseautage et obtenir des mesures générales». Il ordure supplémentaires « rapports pour aider. » Yahoo a constamment déclaré qu’ils lisaient les avis de courrier indésirable et nous avons vu les étapes que les moteurs de recherche prennent au fil du temps sur ces avis. Donc, même si cela peut prendre un certain temps pour que Google se comporte, en particulier pour les problèmes de courrier indésirable plus étendus, les moteurs de recherche répondent à un moment donné. Brin et Webpage, qui se sont rencontrés en tant qu’étudiants universitaires à l’Université de Stanford, ont été intéressés par l’idée d’extraire ce moyen à travers la masse de données Web s’accumulant sur le Web. Ils ont commencé à fonctionner depuis le dortoir de Page à Stanford pour concevoir un nouveau type de technologie de recherche, qu’ils ont surnommé BackRub. La clé était d’utiliser les capacités permanentes des utilisateurs d’Internet en surveillant les «liens de support» de chaque site Web, c’est-à-dire la quantité d’autres pages Web qui leur sont connectées. La plupart des listes de moteurs de recherche renvoient simplement un résumé des sites Web classés selon le nombre de fois où une expression de recherche leur est apparue. Brin et page Web inclus dans la fonction de recherche la quantité de liens que chaque site Internet avait; c’est-à-dire qu’un site Web avec des milliers d’hyperliens deviendrait rationnellement plus précieux qu’un simple avec seulement quelques liens, et le moteur de recherche positionnerait ainsi le site fortement lié plus sur une liste d’options. De plus, un lien Web provenant d’un site Web fortement lié sera un «vote» beaucoup plus utile qu’un lien provenant d’un site Web beaucoup plus imprécis. Au milieu de 1998, Brin et la page Web ont commencé à obtenir un financement extérieur (certainement l’un de leurs premiers traders était Andy Bechtolsheim, cofondateur de Sun Microsystems, Inc.). Ils ont finalement rapporté environ 1 milliard de dollars d’investisseurs, d’êtres chers et d’amis proches et se sont installés dans la zone de loisirs de Menlo, en Californie, sous le nom Moteurs de recherche, qui était basé sur une faute d’orthographe du titre planifié authentique de Page, googol (un expression numérique pour la principale accompagnée de 100 zéros). À la mi-1999, lorsque Google a reçu un financement arrondi de 25 milliards de dollars de fonds d’entreprise, il avait digéré 500 000 questions par jour. L’action a commencé à exploser en 2000, lorsque les moteurs de recherche sont devenus le moteur de recherche en ligne acheteur pour l’un des sites les plus populaires du Web, Yahoo !. En 2004, SEO Club lorsque Google! dispensés des solutions de Google, les clients recherchaient 200 000 milliards de fois par jour. Cette progression ne fait que se poursuivre: fin 2011, les moteurs de recherche faisaient face à quelques recherches de quelques milliards de dollars par jour. Le titre de la société est devenu si omniprésent qu’il est entré dans le lexique comme étant un verbe: les moteurs de recherche étaient un concept courant de recherche sur Internet. Pour répondre à cette taille de données sans précédent, Yahoo a construit 11 centres d’information dans le monde, chacun contenant plusieurs centaines de milliers de serveurs Web (essentiellement des PC multiprocesseurs et des disques durs installés dans des racks spécialement conçus). Les ordinateurs personnels interconnectés de Google peuvent atteindre plusieurs milliers. Le centre de fonctionnement de Google, cependant, est constitué de trois éléments étonnants de code informatique pour PC: Yahoo File Program (GFS), Bigtable et MapReduce. GFS gère l’espace de stockage des données Web en «morceaux» sur plusieurs machines; Bigtable est certainement le système de source de données de l’entreprise; et MapReduce peut être utilisé par Google pour produire des informations à plus haut degré (par exemple, assembler un répertoire de pages Web contenant le texte « Chicago », « théâtre » et « participatif »). A lire sur: