|
LES ROBOTS DE RECHERCHE |
|
|
|
Cas d'utilisation:
Ils sont très utiles pour des recherches précises avec des mots-clefs spécifiques. ("John Lenon", "mégane scénic", "benchmarking"). Caractéristiques: Le spider a pour mission de visiter de façon permanente les milliers de sites web et d'en stocker le contenu. L'indexeur (propre à chaque robot) analyse, de façon plus ou moins fine, l'information des millions de documents rapatriés et crée un fichier d'indexage. C'est ce fichier qui sera consulté au moment où vous enverrez une recherche par mot-clé (keyword). Ils existent de nombreux robots, qui varient en fonction de la rapidité à la quelle les sites sont enregistrés, de la quantité de sites stockés, de la finesse de l'analyse (intégralité du document ou seulement quelques lignes).... Les techniques qu'ils utilisent, sont très différentes et la qualité des résultats qu'ils présentent également. Il est toujours préférable de toujours consulter différents robots car souvent ils se complètent. Contrairement aux répertoires de recherche, souvent ils fournissent de (trop) nombreux documents. Ils peuvent donc être victimes de leur puissance d'indexation (un robot peut collecter plus de 50 millions de pages web, alors qu'un répertoire en stocke quelques dizaines de milliers). Une solution à ce problème peut-être apporté
par les robots spécialisés par secteur
d'activité. |