Qu'est-ce que l'algorithme Rankbrain de Google ?
Article écrit par Julien Gourdon
ancien journaliste et consultant SEO depuis 2015
Dernière modification :
En bref
Lancé en 2015, l'algorithme Google Rankbrain exploite l'apprentissage automatique pour améliorer la pertinence des résultats de recherche en comprenant l'intention des utilisateurs.
Pour optimiser votre SEO avec RankBrain, il est crucial de vous concentrer sur la qualité du contenu et l'intention de recherche plutôt que sur les mots-clés spécifiques. Utilisez un langage naturel, des synonymes, et des entités pertinentes, en lien avec l'intention de recherche visée. Assurez-vous également que votre contenu offre une expérience utilisateur riche et engageante, ce qui peut améliorer votre classement sur Google.
Introduction à Google Rankbrain
Google Rankbrain est un algorithme d'apprentissage automatique déployé par Google en 2015 et utilisé pour améliorer la pertinence de ses résultats de recherche grâce à une compréhension approfondie du sens des requêtes des utilisateurs. Il est considéré comme le 3ème facteur de classement des résultats de Google, derrière le contenu et les liens.
Cette mise à jour fondamentale de l'algorithme du plus grand moteur de recherche au monde fut révélé pour la 1ère fois le 26 octobre 2015 par Greg Corrado, senior research scientist chez Google et travaillant au sein de Google Brain, un laboratoire de recherche en deep learning (qui a fusionné en 2023 avec DeepMind pour devenir Google DeepMind).
Ce système de machine learning est entraîné pour améliorer constamment sa compréhension des recherches des utilisateurs, notamment les requêtes rares ou qui n'ont jamais été tapées auparavant (qui représentent environ 15% des requêtes quotidiennes des internautes sur le moteur de recherche), et celles qui sont ambigües ou mal formulées.
L'objectif central de RankBrain est d'affiner la compréhension qu'a Google de l'intention de l'utilisateur derrière chaque requête, afin de lui fournir de meilleurs résultats de recherche. Ainsi, au lieu de se focaliser uniquement sur les mots-clés contenus dans une requête, ce système cherche à saisir le contexte global entourant une recherche.
En d'autres termes, RankBrain aide le moteur de recherche à traiter les nuances du langage naturel, y compris le sens figuré, les synonymes et les expressions idiomatiques. Cela permet de produire des résultats de recherche plus pertinents, même pour les requêtes n'ayant jamais été saisies auparavant.
Mais comment Google Rankbrain fonctionne-t-il exactement ?
Le fonctionnement de Rankbrain
Si la firme de Mountain View n'a pas divulgué le fonctionnement de son algorithme de machine learning, nous pouvons tenter d'expliquer le lien entre les réseaux de neurones et leur application dans le classement des résultats de recherche.
Les réseaux de neurones appliqués au classement des résultats de recherche
Les réseaux de neurones sont un type d'algorithme d'apprentissage automatique qui peuvent être utilisés pour des tâches précises, telles que le classements de résultats à partir d'une requête d'un utilisateur. L'idée est de créer un modèle qui peut apprendre à partir de données d'entraînement et prédire la pertinence d'un résultat de recherche pour une requête donnée.
Dans le contexte de la recherche d'information, le classement de résultats est un problème complexe qui nécessite de prendre en compte de nombreux facteurs, tels que la pertinence du contenu, la qualité du site web, la fréquence de mise à jour, l'expérience utilisateur, etc. Les réseaux de neurones peuvent être entraînés à partir de ces facteurs et produire un classement de résultats qui reflète la pertinence de chaque résultat pour la requête de l'utilisateur.
Lien entre word embedding et Rankbrain
Au cœur de RankBrain réside le concept de word embedding, une technique de traitement automatique du langage qui transforme les mots en vecteurs numériques. Ces vecteurs ne sont pas de simples représentations mathématiques, ils capturent la signification et le contexte des mots en les plongeant dans un espace multidimensionnel où l'emplacement de chaque vecteur par rapport aux autres donne une indication sur leur proximité sémantique. En clair, plus les vecteurs sont proches les uns des autres, plus cela signifie qu'ils ont un rapport entre eux (pas forcément en raison de leur syntaxe proche, mais aussi parce qu'on peut retrouver fréquemment ces termes dans un même contexte).
Bien que cela n'ait pas été confirmé officiellement par Google, Word2Vec, un modèle de word embedding particulièrement efficace et inventé par les équipes de Google en 2013 (parmi lesquels figure Greg Corrado, celui qui a dévoilé l'algorithme Rankbrain en 2015), est certainement utilisé par le moteur de recherche pour établir des liens sémantiques entre les termes d'une requête et ceux de son vaste corpus d'apprentissage. C'est ce qui lui permet de bien mieux comprendre les requêtes rares que par le passé, en les reformulant pour les faire correspondre à des termes issus de son apprentissage, et ainsi pouvoir renvoyer des résultats plus pertinents à l'utilisateur.
Architecture d'un modèle de réseau de neurones
Un modèle de réseau de neurones pour le classement de résultats de recherche peut être conçu de la manière suivante :
- La couche d'entrée prend en charge les caractéristiques de la requête et des résultats de recherche, telles que les mots-clés, les métadonnées, les liens, etc.
- La couche cachée utilise des neurones pour apprendre les relations entre les caractéristiques d'entrée et les résultats de recherche.
- La couche de sortie produit un score de pertinence pour chaque résultat de recherche, qui est utilisé pour classer les résultats.
Entraînement du modèle
Le modèle est entraîné à l'aide d'un ensemble de données d'entraînement, qui comprend des requêtes et des résultats de recherche annotés par des humains. L'objectif est de minimiser la perte entre les scores de pertinence prédits et les annotations humaines.
Avantages et limites
Les réseaux de neurones pour le classement de résultats de recherche offrent plusieurs avantages, tels que :
- Amélioration de la pertinence des résultats de recherche
- Meilleure prise en compte des contextes et des nuances de la langue naturelle
- Capacité à apprendre à partir de grandes quantités de données
Cependant, les réseaux de neurones pour le classement de résultats de recherche ont également des limitations, telles que :
- Besoin de grandes quantités de données d'entraînement de haute qualité
- Risque de sur-apprentissage et de sous-apprentissage
- Difficulté à interpréter les résultats du modèle
L'application concrète de Rankbrain sur la recherche des utilisateurs
En transformant les termes de recherche en vecteurs numériques conservant la sémantique de ces termes, l'algorithme d'apprentissage automatique va être en mesure de mettre en relation ces vecteurs avec d'autres vecteurs numériques issus de son apprentissage. Il peut ainsi retraduire une requête qu'il estime mal-formulée en allant piocher dans son corpus d'apprentissage des termes proches de ceux formulés par l'utilisateur. Il en résulte une bien meilleure compréhension de la recherche puisque le machine learning permet de resituer chacun des termes dans leur contexte.
Mais Rankbrain ne se contente pas de vectoriser les requêtes et de les reformuler, il identifie également les entités dans les recherches des internautes. Les entités sont des concepts ou des objets qui ont une existence indépendante, tels que des personnes, des lieux, des organisations, des événements, etc. Ces entités ont des attributs et sont reliées les unes aux autres, ce qui permet à Google d'identifier des liens entre elles et de les afficher à l'utilisateur dans ses pages de résultats, pour lui fournir la meilleure expérience utilisateur possible. Par exemple, si un utilisateur saisit la requête "Leonardo DiCaprio", RankBrain peut identifier l'acteur américain et fournir des résultats de recherche pertinents liés à sa carrière, ses films, sa famille, etc.
Ces différents éléments améliore grandement la pertinence des résultats puisqu'avec Rankbrain, Google ne se limite pas à proposer des pages qui contiennent les termes de recherche tapés par l'utilisateur, mais peut afficher des documents beaucoup plus pertinents qui contiennent une sémantique similaire à l'intention réelle de la recherche de l'internaute.
Comment exploiter Rankbrain pour améliorer son SEO ?
Si cela avait déjà été initié par Google Hummingbird deux ans plus tôt, avec cette mise à jour de 2015 cela ne fait désormais plus aucun doute : les créateurs de contenu et éditeurs de site doivent se détourner de la pure optimisation des pages par la multiplication des mêmes mots-clés à l'intérieur du contenu, pour se focaliser sur l'intention de recherche des utilisateurs. Autrement dit : quels besoins cherchent à combler les internautes quand ils tapent telle ou telle requête dans la barre de recherche des utilisateurs ?
Pour répondre à ce besoin utilisateur, il faut enrichir le contenu de votre site avec un univers sémantique varié incluant des synonymes et des entités nommées pertinents. RankBrain traitant les relations complexes entre les mots, votre contenu peut gagner en visibilité grâce à des termes et des phrases contextuellement liés.
La création de contenu doit par ailleurs se concentrer sur l'expérience utilisateur, avec des informations détaillées, des réponses aux questions fréquemment posées et l'ajout de médias variés tels que des images et des vidéos pour maintenir l'engagement de l'utilisateur et réduire le taux de rebond. Un contenu qui parvient à garder l'utilisateur sur la page démontre à RankBrain que votre site est une source d'information fiable et pertinente pour une requête donnée.
Enfin, il est essentiel de suivre de près l'évolution du CTR (Click Through Rate) et les métriques d'interaction des utilisateurs pour juger de l'efficacité de votre référencement et de sa pérennité. En effet si, à mesure que le temps passe, l'engagement des internautes avec vos pages se dégrade, il est probable Rankbrain considère que votre contenu n'est plus aussi pertinent et vous dégrade dans les pages de résultats de Google.
Il est donc nécessaire de toujours rester vigilant. Car, comme l'algorithme Google Rankbrain, le SEO est un apprentissage en continu.
Cette définition vous a plu ? Découvrez d'autres termes SEO en lien avec les algorithmes de recherche en cliquant sur les boutons ci-dessous :