Algorithme de Page Rank

-
4
 m de lecture
-
page rank

Connaissez vous l’algorithme de Page Rank ? Au cœur du positionnement Google, découvrons son fonctionnement

Vous vous êtes sûrement déjà demandé pourquoi certaines pages internet apparaissent en premier lorsque vous effectuez une requête sur un moteur de recherche.

Si vous essayez de chercher le terme « python » dans votre barre de recherche Google, c’est le site web officiel du langage python qui apparaît en premier, suivi par la page Wikipédia dédiée au langage python.

Mais pourquoi ne retrouve-t-on pas en haut des résultats de recherche des pages web qui parlent de l’espèce de serpent, le python ? A l’origine de ces résultats un algorithme de positionnement confidentiel que Google a mis au point. 

A l’initiative de l’algorithme, Larry Page, cofondateur de Google, qui a d’ailleurs donné son nom à l’algorithme.

Son ambition était de parvenir à classer les pages web selon un score d’«importance» ou autrement dit de « popularité ».

Depuis son lancement, le rôle de l’algorithme a bien changé et d’autres indicateurs ont été mis au point pour contribuer au positionnement des pages webs, il y en aurait plus de 200 contre une dizaine au départ ! Le score obtenu par l’algorithme de PageRank contribue néanmoins toujours à ce positionnement bien que son rôle et son poids ne soient pas communiqués. 

Avant de rentrer plus en détail sur le fonctionnement de l’algorithme, il est important de comprendre ce que signifie « l’indexation d’une page web ». Faire partie de l’index des pages web c’est simplement faire partie du catalogue de pages web d’un moteur de recherche. Si une page web fait partie de l’index c’est donc qu’elle a été référencée. Sans ce référencement, elle ne pourra par la suite pas apparaître au sein des résultats de recherche.

On considère en règle générale qu’une page est bien positionnée lorsqu’elle fait partie des 20 premiers résultats d’une recherche. Au-delà de ce rang, les pages web sont rarement consultées par les internautes.

Quels sont les critères selon lesquels les pages webs sont ordonnées ?

Lorsque l’on effectue une recherche, elle contient des mots clés, Google va donc chercher quelles sont les pages web au sein de son catalogue qui contiennent ces mots clés. Il y a donc souvent énormément de résultats ! Une page web qui contient ces mots clés est donc candidate pour faire partie des premiers résultats de la recherche.

Quel est alors le rôle de l’algorithme de Page Rank dans ce positionnement final ?

Il est important de noter que le fonctionnement de l’algorithme est confidentiel, on ne sait donc pas exactement comment est calculé le score attribué à la page web et donc son rang. Le rang d’une page web n’est pas immuable, néanmoins plus il est stable plus cela est bon signe.

Si on devait résumer le fonctionnement de l’algorithme succinctement, on dirait que plus une page web est répertoriée au sein d’autres pages webs, plus son score sera élevé et meilleur sera son classement.

Ce résumé est néanmoins un peu simpliste car ce ne sont pas les seuls éléments qui entrent en jeu pour le calcul de ce score ! 

En parallèle de la fréquence d’apparition de la page web au sein des autres pages, la popularité des pages est également en question avec la proximité thématique entre les pages web. Ainsi une page web citée de façon très récurrente sur des pages qui sont peu populaires n’impactera pas de la même façon le score final attribué à la page web: plus une page est populaire, plus cela augmentera le score de la page citée.

Plus les pages qui répertorient le lien de la page web sont proches thématiquement plus le score sera impacté positivement.

En outre, si une page web cite un grand nombre de pages webs cela va impacter moindrement le score de la page web.  
Rentrons maintenant un peu plus en détail sur le fonctionnement de l’algorithme. 

Considérons une requête sur le moteur de recherche Google, à partir des mots clés qu’elle contient, Google va alors chercher au sein de son catalogue quelles sont les pages web qui les contiennent.

Afin d’ordonner ces pages, pour chaque page web, Google va observer le nombre de liens existants au sein des pages de son catalogue vers cette page web.

Chaque lien est perçu comme un “vote” de la part de la page qui contient le lien pour la page question. Un lien peut être à la fois un lien interne (lien qui redirige l’utilisateur vers une page au sein d’un même site web) ou un lien externe (lien qui redirige l’utilisateur vers une page d’une autre site web). En plus de ces liens, l’algorithme prend en compte les page rank des pages qui répertorient la page web en question (indicateur de popularité). Ainsi plus les pages qui contiennent un lien vers la page web d’intérêt ont un page rank élevé, plus cela va augmenter le page rank de la page. 

Considérons que la page web d’intérêt soit celle d’un blog de bricolage. Si le lien de cette page web est cité sur un site d’une enseigne de bricolage, alors le score de la page augmentera d’autant plus, puisqu’il y a un lien thématique entre ces deux pages webs. Supposons maintenant que l’enseigne de bricolage soit très populaire, alors cela augmentera d’autant plus le score de notre page web !

A son lancement, Google avait mis en place une « ToolBar PageRank » (TBPR) qui permettait de donner une approximation du page rank des pages web. Depuis 2014, Google a supprimé le « ToolBar PageRank », il n’est donc malheureusement plus possible d’obtenir cette approximation et donc de se procurer cette information. 

Malgré toutes ces indications, Google reste très discret sur cet algorithme de Page Rank ! Pour autant on retiendra que la quantité de liens joue un rôle majeur dans le positionnement des pages webs bien que ce ne soit pas le seul critère en jeu. La popularité des pages, leur proximité thématique mais également le nombre de liens existants sur ces pages webs jouent un rôle très important dans leur positionnement. 

Je vous propose pour conclure cet article de regarder comment se place notre site internet lorsque l’on tape la requête “formation en datascience” dans un moteur de recherche.
Datascientest se place en 1ère place avec la page web.

Il semblerait donc que le page rank n’ait plus aucun secret pour nous !

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?