Google in the Plex – Partie 1: une technologie …

In the Plex est un (autre) livre étonnant à propos de mon entreprise préférée. Google est la raison pour laquelle j’ai écrit un livre sur les start-up : après avoir préparé une présentation PowerPoint en 2006 sur ce que je savais de la start-up de Mountain View, des amis me conseillèrent d’écrire un livre plus général sur les start-up. Ce que je fis en 2007. D’où ce blog!

J’ai déjà lu trois livres sur Google et celui-ci est aussi bon que les précédents. Peut-être meilleur. Je dois donc remercier ici Michele Catasta, qui m’a conseillé de le lire alors que je venais de faire une nouvelle présentation à peine mise à jour de celle de 2006. Et je l’aurais certainement lire avant de ce livre publié en 2011 … J’ai également posté de nombreux articles sur cette entreprise d’exception, il suffit de cliquer sur le tag Google. Mais j’ai appris beaucoup de choses dans le livre In the Plex, et c’est ce sur quoi je veux mettre l’accent avec cette nouvelle série. Et tout d’abord la technologie dont il est question dans le chapitre 1.

in-the-plex-home

Google n’a pas été la seule à inventer sa méthode de recherche

Larry Page n’ était pas la seule personne à comprendre en 1996 que l’exploitation de la structure des liens du web conduirait à une façon radicalement plus puissante de trouver des informations. Durant l’été de cette année-là, un jeune informaticien nommé Jon Kleinberg arriva en Californie pour postdoc d’un an au centre de recherche d’IBM à Almaden, à la limite sud de San Jose. Avec son récent doctorat du MIT, il avait déjà accepté un emploi dans le département d’informatique de l’Université Cornell. […] Kleinberg a commencé à jouer avec des moyens d’analyser les liens. Mais il ne disposa pas de l’aide, des ressources, du temps, ou de l’inclination nécessaires à indexer l’ensemble du Web pour son analyse des liens. […] Toutes sortes vice-présidents d’IBM s’attroupèrent à Almaden pour regarder des démonstrations de cette drôle de chose et essayer de réfléchir à ce qu’ils pourraient faire avec elle. « En fin de compte, la réponse fut … pas grand-chose. » […] Kleinberg garda des liens avec Google. Il déclina toutefois des offres d’emploi en 1999 et de nouveau en 2000. Il était heureux à l’Université Cornell. Il gagnerait des prix d’enseignement et une bourse MacArthur. Il a mené sa vie dans le milieu universitaire qu’il a choisi, et ne pas devenir un milliardaire ne semble pas l’avoir dérangé. [Pages 24-26]

Il y avait une troisième personne avec la même idée, un ingénieur chinois nommé Yanhong (Robin) Li. […] Li est venu aux États-Unis en 1991 pour obtenir un diplôme de maîtrise à SUNY Buffalo, et en 1994, a pris un emploi chez IDD à Scotch Plains, New Jersey, une division de Dow Jones. […] Il se rendit compte que le principe du Science Citation Index pourrait être appliqué à l’Internet. Le lien hypertexte peut être considéré comme une citation! « Quand je suis rentré, j’ai commencé à écrire cela et réalisé que c’était révolutionnaire », dit-il. Il conçut une méthode de recherche qui calcule la pertinence à la fois de la fréquence des liens et du contenu du texte. Il appela son système RankDev. […] Robin Li a quitta IDD vers la côte Ouest et la start-up InfoSeek. En 1999, Disney a acheté la compagnie et, peu après Li est retourné en Chine. C’est là à Pékin qu’il rencontrera plus tard – et rivalisera avec – Larry Page et Sergey Brin. [Pages 26-27] (Robin Li est le fondateur de Baidu)

La technologie a finalement été la meilleure, mais personne n’en a vraiment vu la valeur au début

Excite achèterait BackRub, puis Larry seul irait y travailler. L’adoption de la technologie BackRub par Ecite, selon lui, devrait augmenter son trafic de 10 pour cent. En extrapolant, en termes de recettes publicitaires, Excite gagnerait 130’000$ de plus chaque jour, pour un total de 47 millions en un an. Page envisageait un mandat chez Excite de sept mois, assez longtemps pour aider l’entreprise à mettre en œuvre le moteur de recherche. Il l’aurait quitté à temps pour le trimestre d’automne 1997 de Stanford pour reprendre sa progression vers un doctorat. Le coût total pour Excite serait de 1,6 million de dollars, dont 300’000$ à Stanford pour la licence, un salaire de 200’000 $, un bonus de 400’000$ pour la mise en œuvre dans les trois mois, et 700’000$ en actions Excite. […] « Avec mon aide», écrit l’étudiant qui n’avait pas encore vingt-quatre ans, « cette technologie donnera à Excite un avantage substantiel et la propulsera à la position de leader sur le marché. » Khosla fit une contre-offre provisoire de $ 750’000 au total. Mais l’affaire n’a jamais eu lieu. [Page 29]

En à peine un an, depuis que Page et Brin avaient formé leur entreprise, ils réunirent un groupe de scientifiques de haut niveau totalement engagés dans la vision de leurs jeunes fondateurs. Ces premiers employés feraient partie d’une équipe qui innovation après innovation agrandirait l’avance de Google sur ses concurrents et établirait son nom comme synonyme de recherche. […] Le processus durait au début dix jours avec l’un des premiers ingénieurs de Google, Harry Cheung (tout le monde l’appelait Spider-Man), à ses machines, suivant le progrès des « araignées » qui se propagent à travers le net et puis, après cette phase, brisant les pages Web pour l’indexage et le calcul du page rank, en utilisant le système compliqué de Sergey, processus mathématique utilisant quelque chose appelé vecteurs propres, alors que tout le monde attendait que les deux processus convergent. (« Les professeurs de mathématiques nous aiment parce que Google a rendu les vecteurs propres pertinents pour chaque étudiant en algèbre matricielle en Amérique », dit Marissa Mayer.) [Page 41]

Une technologie mais pas une science … et peut-être une technologie dangereuse

Dans ses premières années, Google a développé un certain nombre de formes spécialisées de recherche, connus sous le nom verticaux, pour divers corpus-comme la vidéo, les images, les catalogues commerciaux, et les emplacements (cartes). Krishna Bharat avait créé un de ces marchés verticaux appelé Google News, un service d’information virtuel avec une Une déterminée non par les éditeurs mais par des algorithmes. Un autre produit vertical, appelé Google Scholar, utilisait les revues universitaires. Mais pour accéder à ces marchés verticaux, les utilisateurs devaient choisir le vertical. Page et Brin ont poussé pour un système où l’on rechercherait et trouverait Tout. [Quelque chose appelé Universal Search]. [Page 58]

Lorsque l’équipe de Universal Search a montré un prototype aux cadres dirigeants de Google, tout le monde a réalisé que le lancement du projet […] en avait valu la peine. Les résultats de cette expérience au début étaient tous dans le mauvais ordre, mais la réaction a été viscérale – vous tapiez un mot sur le clavier, et toutes ces choses émergeaient. Cela n’était tout simplement jamais arrivé auparavant. « C’était certainement l’une des projets les plus risqués », dit Bailey. « Il était difficile, car ce n’est pas que de la science – cela fait aussi appel au jugement. Nous utilisons aussi dans une certaine mesure nos tripes. Je me lève toujours le matin en étant étonné que tout cela fonctionne. » La recherche de Google ne consistait plus à juste rechercher le web. Google était à la recherche de tout. Dans son livre de 1991, Mirror Worlds, l’informaticien de Yale, David Gelernter, a esquissé un avenir où les humains interagissent et échangent avec des représentations numériques modélisées du monde réel. […] Même si Gelernter envisagea avec enthousiasme cette perspective globale des mondes miroirs, il la craignait ainsi. « Je me sens vraiment partagé sur le sujet des mondes miroirs. Il y a des risques évidents de surveillance, mais je pense qu’il y a des risques plus profonds », at-il dit. Sa principale préoccupation était que les mondes miroirs seraient pilotés par des entreprises de geek qui les ont construits, par opposition au public. « Ces risques doivent être confrontés par la société au sens large, et non par les techno-geeks, » at-il ajouté. «Je ne leur fais pas confiance. Ils ne sont pas larges d’esprit et ne savent pas assez. Ils ne savent pas assez d’histoire, ils n’ont pas assez de bagage. [Page 59-60]

Les chercheurs de Google seraient d’accord pour reconnaître que travailler avec un système d’apprentissage de cette taille les a mis dans un territoire inexploré. L’amélioration constante de son système d’apprentissage a flirté avec les conséquences postulées par le scientifique et philosophe Raymond Kurzweil, qui spéculé sur une «singularité» imminente qui viendrait le jour où un système informatique massif évolue sur son chemin vers l’intelligence. Larry Page était une adepte enthousiaste de Kurzweil et un partisan de la Singularity University, une entreprise éducative inspirée de Kurzweil et qui anticipe le jour où les humains vont passer le relais de la conscience à notre descendance inorganique. [Page engagerait Kurzweil en 2012] Qu’est-ce que cela signifie de dire que Google “sait” quelque chose? […] « Voilà une question très profonde», dit Spector. « Les êtres humains, vraiment, sont de grands sacs faits principalement d’eau qui se promènent avec un grand nombre de tubes et quelques neurones. Mais nous savons. Alors maintenant examinons le système Google, ce cluster de calcul. C’est un ensemble de plusieurs heuristiques, il sait que «véhicule» est synonyme d’ «automobile», et il sait que en français, il y a voiture, et il sait ce qu’es le mot en allemand et dans chaque langue. Il sait ces choses. Et il sait beaucoup plus de choses qu’il a apprises de ce que chacun frappe sur le clavier. »[…] Spector ajouta que Google en apprendrait encore beaucoup, beaucoup plus dans les prochaines années. “Faire ces choses approche-il du niveau de la connaissance?” se demande-t-il rhétoriquement. «Mes enfants de dix ans le croient. Ils pensent que Google sait beaucoup de choses. Si vous demandez à n’importe qui dans leur classe à l’école, je pense que les enfants diraient oui. » Mais qu’est-ce que Spector, un scientifique, pense? « Je crains que ce ne soit pas une question qui se prête à une réponse scientifique, » dit-il. « Je ne pense, cependant, intuitivement, que Google sache. La question est : allons-nous construire une intelligence à des fins générales, qui se trouve juste là, regarde autour d’elle, puis développe toutes ces compétences en soi, peu importe ce qu’elles sont, que ce soit un diagnostic médical ou … »Spector fait une pause. « Nous en sommes loin, » dit-il. « Ce ne sera probablement pas fait durant ma carrière chez Google. » (Spector avait cinquante-cinq ans au moment de la conversation au début de 2010.) «Je pense que Larry aimerait beaucoup voir cela se produire”, a-t-il ajouté. [Page 66-67]

Comme dernier commentaire lisez ce livre. Vous pouvez également jeter un œil à ma présentation Slideshare.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Time limit is exhausted. Please reload CAPTCHA.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.