Les moteurs de recherche gardent jalousement un grand secret sur leur mode de fonctionnement. Leur modèle économique leur impose ce comportement. Il faut tenter de les comprendre et de les suivre pour exploiter au mieux les avantages qu’ils apportent.
Les moteurs de recherche sont nombreux mais le marché est, aujourd’hui, dominé par Google qui représente (statistiques 2007) environ 90% des parts de visites sur le Web, le deuxième, Yahoo étant à environ 3%.
Un moteur de recherche est un logiciel qui permet de trouver des pages et sites Web à partir d’une requête faite sur un ou plusieurs mots (expressions ...) significatifs des centres d’intérêt immédiats de l’internaute. En fait le moteur de recherche n’est rien s’il ne fait pas partie d’un outil de recherche qui comporte, outre le moteur lui-même, un système (robots + bases de données) capable d’indexer (prendre note des mots contenus dans les texte) le plus grand nombre de pages accessibles sur le Web. C’est cette opération d’indexation qui va permettre par la suite de retrouver le/les mot(s) inclus dans la requête et fournir le résultat sous la forme d’une liste, en général très longue, de pages répondant à cette recherche.
La partie délicate est alors de présenter ces résultats et les moteurs de recherche vont différer pour beaucoup sur ce point. C’est le domaine de ce qu’on appelle l’algorithme du moteur, base mathématique du calcul effectué dans la recherche.
Par exemple, Google va sélectionner les résultats des recherches en évaluant l’importance de chaque page Web avec des méthodes mathématiques, sur la base d’un contrôle de plus de 500 millions de variables et de 2 milliards de termes. Cette technologie, appelée PageRank contrôle non seulement le contenu de la page Web, mais vérifie également d’autres sites éventuels qui auraient un lien vers cette page. C’est sur la base de la quantité et du type de liens que la page va être plus ou moins bien classée.
D’autres caractéristiques intéressantes d’un moteur vont être sa rapidité d’exécution (temps de réponse moyen pour une recherche) et la taille de sa base de données.
Les moteurs ne « comprennent », pour le moment, que les textes, pas les images. Ils accordent de l’importance à la place du texte dans la page aux titres et sous-titres, aux textes des liens. Gardons bien à l’esprit que malgré la sophistication des programmes qui les animent ils n’ont pas notre intelligence : ce sont des machines.
Les moteurs de recherche (Google pour ne pas le nommer par exemple) ne sont, par ailleurs, pas en place sur le Web par philanthropie. Il y a derrière leur développement un « modèle économique » en général basé sur des services payants. Ils doivent par conséquent être largement utilisés par les internautes et, pour cela, leurs concepteurs rechercheront les meilleures performances : facilité d’utilisation, rapidité d’affichage des résultats, pertinence des résultats.
Les moteurs indexent les textes trouvés par leurs robots sur les sites Web. Une requête lancée avec quelques mots ou expressions va être exploitée par le moteur. Celui-ci va chercher dans ses bases les références qui, selon lui, correspondent le mieux aux termes de la requête. Correspondre « le mieux » ? C’est là où les efforts du concepteur du site et des pages pour comprendre le mode de fonctionnement du moteur et placer des mots clés pertinents aux meilleurs endroits vont être payants.
En matière de recherche une stratégie intéressante peut être de faire sa requête sur ce qu’on appelle un « métamoteur », c’est à dire un site qui permet de lancer une recherche sur plusieurs moteurs en même temps et couvrir ainsi, en partie, les lacunes de tel ou tel moteur par rapport à la pertinence des résultats que l’on attend de sa recherche.
Mis en ligne le vendredi 27 août 2010
Corrélats
Rédaction Web - Référencement
Le Web comme source d’informations
La page Web et l’informatique - Le code HTML de la page Web est la source des informations pour les moteurs de recherche
La qualité et la lisibilité des textes sont importantes pour les visiteurs d’un site ou d’une page Web
La présentation et l’écriture des textes Web sont particulières
Les mots-clés et le référencement. Insertion de mots clés qui correspondent au message véhiculé par la page Web
Tout savoir sur l’hypertexte. A l’origine du succès du Web. Un système qui a ses règles et ses limites.