Google


Google gère des bases de données fantastiques de par les dimensions, plusieurs centaines de milliards de pages (une page = un fichier  = un écran). Nous sommes bien loin des petites bases relationnelles de la sécurité sociale.

Le problème essentiel qui se pose à Google et aux internautes est le référencement. De quoi s'agit-il ? Donnons un exemple : dans la boite affichée par Google pour saisir des mots, je mets : Mathématiques Partout. Google me propose 855.000 pages (Janvier 2011) qui contiennent ces mots. Elles sont affichées 10 par 10. En tant que gestionnaire d'un site qui contient une page dans laquelle figurent les deux mots saisis, j'ai bien envie que ma page figure dans les 10 premières adresses affichées par Google.

La technique du référencement fait améliorer le classement des pages de mon site dans les résultats de la recherche. Google propose aux gestionnaires de sites des "recettes" pour améliorer le référencement.

Mais Google se garde bien de publier ses techniques de stockages et surtout ses algorithmes pour rechercher des pages qui contiennent certains mots. Et pour cause, la concurrence est sévère, les intérêts financiers sont énormes (revenus de la publicité).

Il y a besoin de beaucoup de matière grise et d'ordinateurs puissants et de capacités énormes pour gérer ces problèmes.