Comment réaliser un audit de maillage interne en 2024 ? - Episode 13
Article écrit par Julien Gourdon
ancien journaliste et consultant SEO depuis 2015
Dernière modification :
- Le word embedding : la clé d'un audit de maillage interne précis en 2024
- Comment calculer la proximité sémantique des URL qui ont été embeddées ?
- Le développement en python de l'outil d'audit de maillage interne
- Fonctionnalités clés de l'outil d'audit
- Avantages d'un audit de maillage interne basé sur la proximité sémantique des URL
- Ce qu'il faut retenir
Le maillage interne est un pilier essentiel du SEO en raison de sa capacité à améliorer l'expérience de navigation de votre site pour les utilisateurs, et l'exploration de l'ensemble de vos pages par les robots des moteurs de recherche. Il peut même, lorsqu'il est très bien fait, remplacer une stratégie coûteuse en backlinks et améliorer le positionnement de vos pages sur certains mots-clés stratégiques. Mais le maillage interne est encore trop souvent délaissé ou réalisé sans aucune méthode, et reste le point mort des audits SEO, qu'ils soient techniques ou sémantiques (car dans quelle catégorie ranger le maillage interne ?) comme me le disait fort justement un directeur d'agence.
Pourtant, nous avons tous les outils en main aujourd'hui (crawler, word embeddings, IA générative) pour effectuer un maillage interne quasi parfait, basé sur la proximité sémantique de l'ensemble des URL d'un site. L'objectif est d'identifier automatiquement les pages proches sémantiquement afin de les mailler entre elles, en utilisant les bonnes ancres de liens (celles qui représentent des mots-clés sur lesquels les URL cibles sont bien positionnées mais pas encore top 1, et en privilégiant une variété d'ancres pour élargir la couverture des mots-clés de nos pages de destination). De cette manière, nous renforçons la pertinence de chacun de nos liens internes, en nous basant sur la théorie du PageRank thématique, qui veut qu'un lien parfaitement contextualisé, qui pointe vers une page qui parle de la même thématique que la page de départ, soit mieux pris en compte par Google et transmette beaucoup plus de jus qu'un lien non thématisé.
Découvrons ensemble comment réaliser un audit de maillage interne complet et précis en 2024, grâce à l'intelligence artificielle et au word embedding.
Le word embedding : la clé d'un audit de maillage interne précis en 2024
Le word embedding est une technique d'intelligence artificielle qui transforme le texte en vecteurs numériques, facilement interprétables par des machines. Ces vecteurs conservent le sens des mots et permettent de mesurer la proximité sémantique entre différents contenus.
Ainsi, grâce au word embedding, il est désormais possible de :
- Analyser la pertinence des liens internes existants ;
- Identifier les opportunités de nouveaux liens ;
- Optimiser le placement des liens dans le contenu ;
Comment calculer la proximité sémantique des URL qui ont été embeddées ?
Nous pouvons facilement visualiser la proximité sémantique des URL qui ont été embeddées grâce à une fonction mathématique qui s'appelle le cosinus de similarité.
Pour bien comprendre le concept, imaginons que nous avons deux URL qui sont représentées sous la forme de flèches projetées dans l'espace. La longueur et la direction que prennent les flèches représentent les caractéristiques des URL.
La similarité cosinus va se concentrer sur l'angle qui sépare les deux flèches. Plus cet angle est petit, plus cela signifie que les URL sont proches sémantiquement. A l'inverse, plus l'angle est ouvert, plus cela veut dire que les URL sont considérées comme éloignées d'un point de vue sémantique.
Le cosinus va transformer cet angle en un score qui va varier de -1 à 1, -1 signifiant que les deux flcèhes prennent des directions rigoureusement opposées, tandis qu'un score de 1 signifie que les deux flèches sont juxtaposées l'une sur l'autre, c'est-à-dire totalement identiques.
Dans le contexte de la proximité sémantique de deux URL, plus le score va se rapprocher de 1, plus cela veut dire que les 2 URL sont proches sémantiquement, c'est-à-dire traitent le même sujet. A l'inverse, plus le score va se rapprocher de 0, plus cela signifie que les URL sont éloignées sémantiquement, c'est-à-dire qu'elles traitent de thématiques de qui n'ont rien à voir l'une avec l'autre.
Désormais, équipés des contenus textuels des URL d'un site web qui ont été embeddées très facilement grâce à un script JS intégré à l'outil Screaming Frog, et sachant comment calculer leur proximité sémantique grâce à la fonction de similarité cosinus, nous pouvons nous concentrer sur le développement d'une petite application capable de réaliser un audit complet du maillage interne de notre site. Cette audit sera basé sur la proximité sémantique des liens existants, et sera capable de nous fournir des recommandations d'ajouts et de suppressions de liens, en faisant en sorte de ne conserver que les meilleurs liens, c'est-à-dire ceux qui sont posés sur des pages web qui traitent du même sujet que les contenus internes à qui ces liens sont destinés.
Le développement en python de l'outil d'audit de maillage interne
A l'aide du dernier modèle d'IA générative d'Anthropic, à savoir Claude 3.5 Sonnet, j'ai donc développé une application qui exploite le word embedding pour réaliser des audits de maillage interne poussé. Voici comment elle fonction :
- Extraction des données : L'outil utilise Screaming Frog pour crawler le site et extraire les données nécessaires ;
- Analyse des embeddings : Les contenus sont convertis en embeddings pour mesurer leur proximité sémantique ;
- Évaluation du maillage existant : L'application attribue un score au maillage interne actuel et identifie les liens à conserver, modifier ou supprimer ;
- Recommandations de nouveaux liens : L'outil suggère de nouveaux liens pertinents basés sur la proximité sémantique des pages ;
- Optimisation du placement des liens : L'application indique les meilleurs emplacements pour insérer les liens dans le contenu.
Fonctionnalités clés de l'outil d'audit
Score de maillage interne
L'application calcule un score global de maillage interne pour l’ensemble du site, basé sur la proximité sémantique de toutes les URL de départ d’un lien interne vers les URL de destination. Un système de filtre permet ensuite de calculer les scores de maillage interne de chaque URL prise séparemment.
Analyse des liens existants
L'outil évalue la pertinence de chaque lien interne en fonction de la proximité sémantique des pages d'origine avec les URL cibles et recommande deux types d'actions :
- Conserver les liens pertinents existants ;
- Supprimer les liens peu pertinents existants ;
Suggestions de nouveaux liens
En se basant sur la proximité sémantique des URL du site, l'application propose de nouveaux liens internes pour améliorer la pertinence du maillage interne.
Optimisation des ancres
L'outil analyse les ancres de liens existantes et suggère des améliorations pour :
- Diversifier les ancres ;
- Cibler des mots-clés pertinents ;
- Eviter les doublons d'ancres.
Placement optimal des liens
Grâce au word embedding, l'application est capable d'aller beaucoup plus loin et de calculer la proximité sémantique de chaque paragraphe d'un contenu A avec un contenu B dans son ensemble (et inversement). De cette manière, l'application peut suggérer l'emplacement idéal pour insérer un lien menant du contenu A vers le contenu B. De cette manière, on s'assure de contextualiser au maximum nos liens, afin de maximiser nos chances qu'ils soient bien pris en compte par les robots des moteurs de recherche et qu'ils transmettent un maximum de jus de lien.
Avantages d'un audit de maillage interne basé sur la proximité sémantique des URL
En transformant nos contenus textuels en vecteurs numériques plongés dans un espace multidimensionnel permettant de calculer la proximité sémantique des URL, on imite le fonctionnement de Google. Le moteur de recherche embedde en effet les pages web tout comme les requêtes des utilisateurs, afin de classer les contenus et identifier en un temps record quelles pages répondent le mieux aux besoins des internautes formulées sous la forme d'une requête.
Adopter le même fonctionnement que Google quand on veut évaluer la pertinence des contenus est évidemment une bonne chose quand on est consultant SEO.
Les avantages d'un audit de maillage interne basé sur la proximité sémnatique des URL sont donc nombreux :
- Précision : L'analyse sémantique permet des recommandations ultra précises et pertinentes ;
- Exhaustivité : Un outil basé sur la proximité sémantique des URL d'un site couvre tous les aspects du maillage interne, de l'évaluation à l'optimisation ;
- Gain de temps : L'automatisation des analyses permet des audits rapides et réguliers (je recommande un audit une fois par mois, puisque l'ajout de chaque nouveau contenu sur le site et la modification des contenus existants oblige à recalculer régulièrement la proximité sémantique des URL afin de s'assurer que nos liens internes sont toujours aussi pertinents) ;
- Personnalisation : Les recommandations tiennent compte des spécificités de chaque site.
- Evolutivité : L'application d'audit de maillage interne peut s'adapter facilement aux sites de toutes tailles, puisque le crawl du site et l'embedding des contenus web est assuré en amont par Screaming Frog.
Ce qu'il faut retenir
L'audit SEO de maillage interne entre dans une nouvelle ère grâce à l'intelligence artificielle, à Screaming Frog et au word embedding. Cette approche innovante permet des analyses plus précises et des recommandations plus pertinentes que jamais.
En adoptant cette nouvelle approche basée sur la proximité sémantique des URL, vous pouvez analyser la pertinence de chacun de vos liens internes, supprimer tout ce qui est inutile et obtenir un maillage interne sur-mesure, destiné à distribuer de la manière la plus efficace possible le jus de lien sur l'ensemble des pages de votre site.