C'est quoi le PageRank ? - Episode 5

🤖
Besoin d'un résumé rapide ?

Laissez l'IA vous résumer cet article en quelques secondes !

    L'Essentiel :
    Le PageRank est l'un des concepts historiques les plus importants du SEO. Créé par Larry Page et Sergey Brin, il a posé les bases du classement par popularité via les liens, avant d'évoluer vers des modèles plus contextuels et plus sélectifs.

    Ce qu'il faut retenir du PageRank

    • Définition (1998) : le PageRank est l'algorithme fondateur de Google. Il mesure la popularité d'une page à partir de ses liens entrants.
    • Surfeur aléatoire : dans le modèle initial, chaque lien transmet une part d'autorité. Le score d'une page est compris entre 0 et 1, avec un damping factor historiquement fixé à 85 %.
    • Évolution thématique (2003) : le Topic-Sensitive PageRank introduit une pondération par thématique, afin qu'une page soit mieux évaluée dans son vrai univers sémantique.
    • Surfeur raisonnable : tous les liens ne se valent pas. Un lien contextuel et visible dans le contenu principal a plus de valeur qu'un lien en menu, en sidebar ou en footer.
    • Lecture moderne : les documents et brevets liés à Google suggèrent des logiques d'autorité plus fines, notamment autour de la distance à des sources de confiance.

    La naissance du PageRank (1998) : l'algorithme fondateur

    À la fin des années 90, la grande faiblesse des moteurs de recherche est la pertinence. Ils se basent surtout sur la répétition de mots-clés dans les pages, ce qui limite fortement la qualité des résultats. Larry Page et Sergey Brin, alors chercheurs à Stanford, proposent une idée simple mais puissante : les pages les plus citées par d'autres pages ont davantage de chances d'être utiles, donc de mieux mériter leur classement.

    Le modèle mathématique : le surfeur aléatoire

    • Le web comme graphe : chaque page est un nœud, chaque lien est un arc pointant vers une autre page.
    • Le comportement simulé : un internaute virtuel clique au hasard sur un lien d'une page, ou décide d'abandonner sa navigation pour repartir ailleurs.
    • Le damping factor : le modèle retient une probabilité historique de 85 % de suivre un lien et de 15 % de se téléporter vers une autre page.
    • Le score : à l'échelle du web, chaque page reçoit une probabilité d'être atteinte par ce surfeur. C'est ce score qui matérialise son PageRank.

    Les premiers tests utilisateurs ont montré que ce tri par popularité des liens améliorait fortement la qualité perçue des résultats par rapport aux moteurs qui se basaient uniquement sur le contenu textuel.

    Source officielle : The Anatomy of a Large-Scale Hypertextual Web Search Engine.

    Le Topic-Sensitive PageRank (2003) : la dimension sémantique

    Le PageRank d'origine a une limite évidente : il transmet de l'autorité sans tenir compte du sujet traité. En 2003, Taher H. Haveliwala propose le Topic-Sensitive PageRank, une évolution qui introduit une pondération thématique dans le calcul.

    La logique de pondération thématique

    • Des univers sémantiques distincts : l'index peut être organisé en grandes thématiques.
    • Des scores multiples : une même page peut avoir une forte autorité dans une thématique et une autorité plus faible dans une autre.
    • Une transmission plus cohérente : un backlink transmet davantage de puissance lorsque la page source et la page cible appartiennent au même univers de sens.

    Concrètement, une page peut être très forte sur l'automobile et beaucoup moins légitime sur l'environnement. Cette approche rapproche donc le calcul d'autorité du contexte réel de la requête.

    Source officielle : Topic-Sensitive PageRank: A Context-Sensitive Ranking Algorithm for Web Search.

    Le Surfeur Raisonnable : tous les liens ne se valent pas

    Le modèle du surfeur aléatoire a ensuite laissé place à une lecture plus réaliste de la navigation : le Reasonable Surfer. L'idée est simple : un utilisateur ne clique pas sur tous les liens avec la même probabilité. Dès lors, Google peut accorder un poids différent à chaque lien selon sa visibilité, son contexte et son attractivité.

    Ce qui peut modifier la valeur d'un lien

    • L'emplacement : un lien dans le contenu principal a généralement plus de valeur qu'un lien en footer ou dans une zone secondaire.
    • La visibilité : un lien bien exposé, plus haut dans la page, a davantage de chances d'être cliqué.
    • Le contexte sémantique : les mots autour du lien et le paragraphe qui l'accueille aident à qualifier sa pertinence.
    • L'ancre : le texte cliquable doit être cohérent avec la page de destination.
    • La confiance : l'environnement global du lien compte aussi, autant côté source que côté cible.

    En SEO, c'est une idée centrale : tous les backlinks et tous les liens internes n'ont pas le même poids. Le lien contextuel, éditorial et thématiquement cohérent reste la forme de transmission la plus intéressante.

    Source associée : US8117209B1 - Ranking documents based on user behavior and/or feature data.

    Le PageRank Nearest Seed : la proximité avec la confiance

    Les documents internes divulgués autour de Google en mai 2024 ont remis en lumière un signal souvent interprété comme PageRank_NS, pour Nearest Seed. Pris avec prudence, cela renforce une idée déjà présente dans plusieurs travaux : l'autorité d'une page peut aussi être lue à travers sa distance avec un noyau de sites jugés extrêmement fiables.

    Le principe du nearest seed

    • Des graines de confiance : un moteur peut partir d'un ensemble restreint de sites considérés comme très fiables.
    • Une logique de distance : plus une page est proche, en nombre de sauts de liens, de ces sources de confiance, plus son signal d'autorité peut être fort.
    • Une conséquence pratique : les réseaux artificiels fermés sur eux-mêmes, comme certaines fermes de liens, restent topologiquement éloignés d'un noyau de confiance solide.

    Autrement dit, l'autorité n'est plus seulement une question de quantité de liens, mais aussi de qualité du voisinage dans le graphe web.

    Source officielle : US9165040B1 - Producing a ranking for pages using distances in a web-link graph.

    Guide pratique : comment optimiser son PageRank interne (PRi)

    Le maillage interne permet de redistribuer l'autorité déjà présente sur votre site. Si l'on applique les enseignements du surfeur raisonnable, l'objectif n'est pas seulement d'ajouter des liens, mais d'ajouter les bons liens, au bon endroit.

    Le maillage interne permet aussi de réduire le taux de rebond en incitant l'utilisateur à poursuivre sa navigation.

    Étape 1 : cartographier les liens

    Commencez par extraire l'ensemble de vos liens internes avec un crawler comme Screaming Frog. Vous identifierez rapidement les pages profondes, les pages orphelines et les zones qui captent trop peu de liens internes.

    Étape 2 : pondérer selon le surfeur raisonnable

    • Premier lien contextuel dans le contenu principal : poids maximal.
    • Liens éditoriaux intégrés au texte : poids fort.
    • Liens de structure comme le menu ou le footer : poids nettement plus faible.

    Étape 3 : sculpter la diffusion du jus de lien

    Ajoutez manuellement des liens contextuels depuis vos pages les plus fortes vers les pages stratégiques qui manquent de visibilité interne. C'est particulièrement utile pour pousser des contenus profonds, consolider des clusters thématiques ou reconnecter des pages peu accessibles.

    Le PageRank interne reste donc un levier concret : un bon maillage ne sert pas seulement à naviguer, il sert aussi à mieux distribuer la popularité et à renforcer la cohérence sémantique du site.

    Chargement de la note...
    Soyez le premier à noter cet article !
    Une erreur est survenue lors du chargement de la note
    Merci pour votre vote !
    Julien Gourdon - Consultant SEO

    Article écrit par Julien Gourdon, consultant SEO senior dans les Yvelines, près de Paris. Spécialisé dans l'intégration de l'intelligence artificielle aux stratégies de référencement naturel et dans le Generative Engine Optimization (GEO), il a plus de 10 ans d'expérience dans le marketing digital. Il a travaillé avec des clients majeurs comme Canal+ et Carrefour.fr, EDF, Le Guide du Routard ou encore Lidl Vins. Après avoir travaillé en tant qu'expert SEO au sein d'agence prestigieuse (Havas) et en tant que Team leader SEO chez RESONEO, il est consultant SEO indépendant depuis 2023.



    Si cet article vous a été utile, n'hésitez pas à le partager sur vos réseaux sociaux !

    Obtenez un résumé IA de ce podcast

    Cliquez sur l'un des boutons ci-dessous pour obtenir un résumé personnalisé de ce podcast :

    Commentaires

    Aucun commentaire pour le moment. Soyez le premier à commenter !

    Ajouter un commentaire

    Prêt à passer à la vitesse supérieure ?

    Contactez-moi dès aujourd'hui pour discuter de votre projet et commencer à optimiser votre présence en ligne.

    Commencer l'optimisation