Accueil > Lexique IA > Rankbrain

Catégorie(s) :

Qu'est-ce que l'algorithme Rankbrain de Google ?

Photo de Greg Corrado, co-créateur de l'algorithme Google Rankbrain
Greg Corrado, senior research scientist chez Google, l'un des co-créateurs de l'algorithme Rankbrain (ndlr: photo générée par l'IA)
Portrait de l'auteur de l'article, Julien Gourdon

Article écrit par Julien Gourdon
ancien journaliste et consultant SEO depuis 2015



Publié le :
Dernière modification :
⏱ Environ 6 minutes

Introduction à Google Rankbrain

Google Rankbrain est un algorithme d'apprentissage automatique déployé par Google en 2015 et utilisé pour améliorer la pertinence de ses résultats de recherche grâce à une compréhension approfondie du sens des requêtes des utilisateurs. Il est considéré comme le 3ème facteur de classement des résultats de Google, derrière le contenu et les liens.

Cette mise à jour fondamentale de l'algorithme du plus grand moteur de recherche au monde fut révélé pour la 1ère fois le 26 octobre 2015 par Greg Corrado, senior research scientist chez Google et travaillant au sein de Google Brain, un laboratoire de recherche en deep learning (qui a fusionné en 2023 avec DeepMind pour devenir Google DeepMind).

Ce système de machine learning est entraîné pour améliorer constamment sa compréhension des recherches des utilisateurs, notamment les requêtes rares ou qui n'ont jamais été tapées auparavant (qui représentent environ 15% des requêtes quotidiennes des internautes sur le moteur de recherche), et celles qui sont ambigües ou mal formulées.

L'objectif central de RankBrain est d'affiner la compréhension qu'a Google de l'intention de l'utilisateur derrière chaque requête, afin de lui fournir de meilleurs résultats de recherche. Ainsi, au lieu de se focaliser uniquement sur les mots-clés contenus dans une requête, ce système cherche à saisir le contexte global entourant une recherche.

En d'autres termes, RankBrain aide le moteur de recherche à traiter les nuances du langage naturel, y compris le sens figuré, les synonymes et les expressions idiomatiques. Cela permet de produire des résultats de recherche plus pertinents, même pour les requêtes n'ayant jamais été saisies auparavant.

Mais comment Google Rankbrain fonctionne-t-il exactement ?

Le fonctionnement de Rankbrain

Si la firme de Mountain View n'a pas divulgué le fonctionnement de son algorithme de machine learning, nous pouvons tenter d'expliquer le lien entre les réseaux de neurones et leur application dans le classement des résultats de recherche.

Les réseaux de neurones appliqués au classement des résultats de recherche

Les réseaux de neurones sont un type d'algorithme d'apprentissage automatique qui peuvent être utilisés pour des tâches précises, telles que le classements de résultats à partir d'une requête d'un utilisateur. L'idée est de créer un modèle qui peut apprendre à partir de données d'entraînement et prédire la pertinence d'un résultat de recherche pour une requête donnée.

Dans le contexte de la recherche d'information, le classement de résultats est un problème complexe qui nécessite de prendre en compte de nombreux facteurs, tels que la pertinence du contenu, la qualité du site web, la fréquence de mise à jour, l'expérience utilisateur, etc. Les réseaux de neurones peuvent être entraînés à partir de ces facteurs et produire un classement de résultats qui reflète la pertinence de chaque résultat pour la requête de l'utilisateur.

Architecture d'un modèle de réseau de neurones

Un modèle de réseau de neurones pour le classement de résultats de recherche peut être conçu de la manière suivante :

Entraînement du modèle

Le modèle est entraîné à l'aide d'un ensemble de données d'entraînement, qui comprend des requêtes et des résultats de recherche annotés par des humains. L'objectif est de minimiser la perte entre les scores de pertinence prédits et les annotations humaines.

Avantages et limites

Les réseaux de neurones pour le classement de résultats de recherche offrent plusieurs avantages, tels que :

Cependant, les réseaux de neurones pour le classement de résultats de recherche ont également des limitations, telles que :

L'application concrète de Rankbrain sur la recherche des utilisateurs

En transformant les termes de recherche en vecteurs numériques conservant la sémantique de ces termes, l'algorithme d'apprentissage automatique va être en mesure de mettre en relation ces vecteurs avec d'autres vecteurs numériques issus de son apprentissage. Il peut ainsi retraduire une requête qu'il estime mal-formulée en allant piocher dans son corpus d'apprentissage des termes proches de ceux formulés par l'utilisateur. Il en résulte une bien meilleure compréhension de la recherche puisque le machine learning permet de resituer chacun des termes dans leur contexte.

Mais Rankbrain ne se contente pas de vectoriser les requêtes et de les reformuler, il identifie également les entités dans les recherches des internautes. Les entités sont des concepts ou des objets qui ont une existence indépendante, tels que des personnes, des lieux, des organisations, des événements, etc. Ces entités ont des attributs et sont reliées les unes aux autres, ce qui permet à Google d'identifier des liens entre elles et de les afficher à l'utilisateur dans ses pages de résultats, pour lui fournir la meilleure expérience utilisateur possible. Par exemple, si un utilisateur saisit la requête "Leonardo DiCaprio", RankBrain peut identifier l'acteur américain et fournir des résultats de recherche pertinents liés à sa carrière, ses films, sa famille, etc.

Ces différents éléments améliore grandement la pertinence des résultats puisqu'avec Rankbrain, Google ne se limite pas à proposer des pages qui contiennent les termes de recherche tapés par l'utilisateur, mais peut afficher des documents beaucoup plus pertinents qui contiennent une sémantique similaire à l'intention réelle de la recherche de l'internaute.

Comment exploiter Rankbrain pour améliorer son SEO ?

Si cela avait déjà été initié par Google Hummingbird deux ans plus tôt, avec cette mise à jour de 2015 cela ne fait désormais plus aucun doute : les créateurs de contenu et éditeurs de site doivent se détourner de la pure optimisation des pages par la multiplication des mêmes mots-clés à l'intérieur du contenu, pour se focaliser sur l'intention de recherche des utilisateurs. Autrement dit : quels besoins cherchent à combler les internautes quand ils tapent telle ou telle requête dans la barre de recherche des utilisateurs ?

Pour répondre à ce besoin utilisateur, il faut enrichir le contenu de votre site avec un univers sémantique varié incluant des synonymes et des entités nommées pertinents. RankBrain traitant les relations complexes entre les mots, votre contenu peut gagner en visibilité grâce à des termes et des phrases contextuellement liés.

La création de contenu doit par ailleurs se concentrer sur l'expérience utilisateur, avec des informations détaillées, des réponses aux questions fréquemment posées et l'ajout de médias variés tels que des images et des vidéos pour maintenir l'engagement de l'utilisateur et réduire le taux de rebond. Un contenu qui parvient à garder l'utilisateur sur la page démontre à RankBrain que votre site est une source d'information fiable et pertinente pour une requête donnée.

Enfin, il est essentiel de suivre de près l'évolution du CTR (Click Through Rate) et les métriques d'interaction des utilisateurs pour juger de l'efficacité de votre référencement et de sa pérennité. En effet si, à mesure que le temps passe, l'engagement des internautes avec vos pages se dégrade, il est probable Rankbrain considère que votre contenu n'est plus aussi pertinent et vous dégrade dans les pages de résultats de Google.

Il est donc nécessaire de toujours rester vigilant. Car, comme l'algorithme Google Rankbrain, le SEO est un apprentissage en continu.

Cette définition vous a plu ? Découvrez d'autres termes SEO en lien avec les algorithmes de recherche en cliquant sur les boutons ci-dessous :


Algorithme BERT Caffeine Learning to rank

Approfondissez vos connaissances dans le domaine du référencement naturel et du marketing digital en consultant le dictionnaire du SEO.


Automatisez la création de vos contenus web parfaitement optimisés SEO avec Help Content

Récupérez le contenu principal des URLs qui se positionnent en Page 1 de Google sur votre requête cible, enrichissez les connaissances de l'API GPT-4 grâce à ces contenus et obtenez de longs articles de blog parfaitement optimisés SEO pour améliorer la visibilité de votre site web sur les moteurs de recherche

J'automatise mes contenus