- Classification des types de moteurs de recherche Internet
- 1- Chercheurs hiérarchiques (Spider)
- Glisser
- Indexé
- Calculer la pertinence
- Récupérer le résultat
- 2- Répertoires
- 3- Moteurs de recherche hybrides
- 4- Méta-moteurs de recherche
- Références
La classification des moteurs de recherche Internet peut être divisée en moteurs de recherche hiérarchiques, annuaires, moteurs de recherche hybrides et méta moteurs de recherche.
Les moteurs de recherche sont un système logiciel conçu pour trouver des informations sur le World Wide Web. Ils utilisent des mots-clés pour rechercher des documents liés à ces mots, puis classent les résultats par ordre de pertinence par rapport au sujet recherché.
Les moteurs de recherche Internet cherchent à extraire les informations dont leur utilisateur a besoin; cela est possible grâce à une grande base de données disponible sur Internet.
Ils sont devenus un outil au quotidien pour trouver des informations. Grâce à cela, il est actuellement très facile de trouver des informations avec des moteurs de recherche tels que Google, AOL, Yahoo et Bing.
Il existe des milliers de moteurs de recherche différents disponibles sur Internet; chacun a ses différentes capacités et caractéristiques.
Le premier moteur de recherche développé s'appelait Archie et était utilisé pour rechercher des fichiers FTP; le premier moteur de recherche textuel s'appelait Veronica.
Les utilisateurs peuvent accéder à un moteur de recherche via le navigateur sur un ordinateur, un smartphone, une tablette ou tout autre équipement électronique.
Classification des types de moteurs de recherche Internet
1- Chercheurs hiérarchiques (Spider)
Ce type de moteur de recherche utilise une «araignée» pour rechercher des sites Web sur Internet. Cette araignée entre dans des pages Web individuelles, extrait les mots-clés, puis ajoute les pages à la base de données du moteur de recherche Internet.
L'avantage de ce type de moteur de recherche est qu'il contient un grand nombre de pages, et qu'il est facile à utiliser. Pour cette raison, il est très courant que l'utilisateur se familiarise avec celui-ci et l'utilise à plusieurs reprises.
D'un autre côté, les inconvénients incluent que, parce qu'ils extraient tellement de données, il est tout à fait possible d'avoir trop d'informations.
La plupart des moteurs de recherche populaires sur Internet sont hiérarchiques, tels que Google, Bing, Yahoo, Baidu et Yandex.
Tous les moteurs de recherche Internet hiérarchiques utilisent un robot (araignée) pour rechercher et indexer le nouveau contenu dans la base de données de recherche.
Chaque moteur de recherche hiérarchique suit quatre étapes de base avant d'afficher une page Web dans les résultats de recherche:
Glisser
Les moteurs de recherche parcourent Internet pour trouver les pages Web disponibles. Ceci est fait par un logiciel appelé spider; la fréquence entre les glissements de terrain peut prendre des jours.
Indexé
C'est le processus d'identification des mots et expressions qui décrivent le mieux la page Web. Les mots identifiés sont appelés mots-clés et la page est attribuée aux mots identifiés.
Calculer la pertinence
Le moteur de recherche compare la chaîne de recherche dans la chaîne d'exigence avec les pages indexées de la base de données.
Étant donné que plusieurs pages sont plus susceptibles de contenir la chaîne de recherche, le moteur de recherche commence à calculer la pertinence de chacune des pages de son index avec la chaîne de recherche.
Il existe plusieurs algorithmes pour calculer la pertinence. Chacun de ces algorithmes a des poids relatifs différents pour des facteurs communs tels que la densité des mots clés ou des liens.
C'est pourquoi chacun des moteurs de recherche donne différentes pages de résultats pour la même chaîne de recherche.
De temps en temps, les moteurs de recherche modifient leurs algorithmes.
Récupérer le résultat
Fondamentalement, il affiche simplement les résultats dans le navigateur; les pages interminables de résultats de recherche classées du plus pertinent au moins important.
2- Répertoires
Les annuaires sont des moteurs de recherche qui dépendent des activités humaines pour leurs annonces: une page Web est soumise à l'annuaire et son inclusion doit être approuvée par l'équipe éditoriale.
Ce processus se déroule comme suit:
1-Le propriétaire du site soumet une brève description de son site à l'annuaire avec la catégorie dans laquelle il doit être répertorié.
2-Le site soumis est revu manuellement. Il peut alors être ajouté à la catégorie appropriée ou il peut être rejeté de la liste. Un site avec un bon contenu est plus susceptible d'être ajouté qu'une page Web avec un contenu médiocre.
3-Les mots-clés saisis dans le champ de recherche seront mis en correspondance avec la description de la page Web. Cela signifie que les modifications apportées au contenu du site ne sont pas prises en considération puisque seule la description du site compte.
L'avantage est que chaque page est examinée pour sa pertinence et son contenu avant d'être incluse. Souvent, avoir moins de résultats signifie que ce dont vous avez besoin peut être trouvé plus rapidement.
Cela étant dit, le format et la mise en page ne sont pas adaptés à la plupart des gens et ils peuvent avoir du mal avec des recherches moins courantes. Un autre inconvénient est qu'il y a un retard dans la création de la page Web et son inclusion dans l'annuaire
Certains répertoires célèbres incluent le projet Open Dictionary, la bibliothèque publique Internet et la DMOZ récemment fermée.
3- Moteurs de recherche hybrides
Ces moteurs de recherche utilisent à la fois des moteurs de recherche hiérarchiques et des répertoires pour répertorier les pages Web dans les résultats de recherche.
La plupart des moteurs de recherche d'araignées, comme Google, utilisent essentiellement des moteurs de recherche hiérarchiques comme mécanisme principal et une surveillance manuelle comme mécanisme secondaire.
Parfois, l'utilisateur a la possibilité de rechercher sur le Web ou dans un répertoire. À d'autres moments, un utilisateur peut recevoir à la fois des résultats sélectionnés par l'homme et des résultats hiérarchiques dans la même recherche; lorsque c'est le cas, les résultats humains sont généralement répertoriés en premier.
Google et Yahoo sont deux des principaux moteurs de recherche qui entrent dans cette catégorie, bien que de plus en plus de moteurs de recherche migrent vers ce système.
4- Méta-moteurs de recherche
Ces moteurs de recherche Internet sont ceux qui recherchent d'autres moteurs de recherche en même temps et combinent ensuite les résultats dans une seule liste.
L'avantage est que plus de résultats sont obtenus, mais leur pertinence et leur qualité peuvent en souffrir considérablement.
Des exemples de méta moteurs de recherche incluent Dogpile, Metacrawler et Clusty.
Références
- Quels sont les différents types de moteurs de recherche (2016). Récupéré de webnotes.com
- Recherche sur Internet: types de moteurs de recherche. Récupéré de libguides.astate.edu
- Types de moteurs de recherche (2008). Récupéré de zeald.com
- Les moteurs de recherche et ses types (2015). Récupéré de slideshare.com
- Moteur de recherche (2017). Récupéré de computerhope.com