Comprendre les algorithmes de Learning to Rank
Article écrit par Julien Gourdon
ancien journaliste et consultant SEO depuis 2015
Dernière modification :
Un algorithme de learning to rank (ou de re-ranking ou de re-classement en français) est devenu un élément important des efforts déployés par les moteurs de recherche, et notamment Google, pour fournir les résultats les plus pertinents et les plus précis à ses utilisateurs. Mais voyons tout ceci en détail.
Qu'est-ce qu'un algorithme de learning to rank ?
Le "Learning to Rank" ou L2R est une approche basée sur l'apprentissage machine pour le classement des résultats dans les systèmes de récupération d'informations (typiquement un moteur de recherche). En d'autres termes, il s'agit d'appliquer des techniques d'apprentissage automatique pour construire des modèles de classement. Ces modèles sont formés à partir de données d'entraînement composées de listes d'éléments avec un ordre partiel spécifié entre eux. Les paramètres du modèle sont ensuite ajustés afin que le classement attendu soit le plus proche du résultat souhaité.
Comment fonctionne le Learning to Rank ?
Trois étapes principales sont nécessaires afin que l'algorithme fonctionne correctement :
- Collecte de données : Tout commence par la collecte de données. Ces données sont généralement des paires de requêtes et de documents, accompagnées d'une note indiquant la pertinence du document pour la requête.
- Entraînement du modèle : Les données collectées sont ensuite utilisées pour entraîner un modèle de machine learning. Ce modèle apprend à prédire la pertinence d'un document pour une requête donnée en fonction des caractéristiques du document et de la requête.
- Ajustement du modèle : Les paramètres ou poids du modèle sont ensuite ajustés afin que le classement de la liste des documents corresponde le plus possible à un taux de satisfaction des utilisateurs de 100% par rapport aux résultats perçus. Dans le cadre d'un moteur de recherche tel que Google, les données utilisateurs entrent en jeu pour l'ajustement du modèle. Il s'agit d'identifier le comportement des internautes sur une page de résultat donnée en se posant par exemple les questions suivantes : le taux de clics des résultats est-il cohérent avec la liste des résultats (si non, re-classement des résultats), les internautes reviennent-ils sur la SERP après avoir cliqué sur tel ou tel résultat (si oui, le résultat en question pourrait rapidement voir son classement baisser), les utilisateurs reformule-t-il leur requête après avoir effectué une première recherche (si oui, c'est une grosse indication pour Google que la page de résultat ne correspond pas à ce qu'attend l'utilisateur et dans ce cas, la refonte de la SERP peut être totale), etc.
- Prédiction et classement : Une fois le modèle formé et ajusté, il peut être utilisé pour prédire la pertinence de nouveaux documents pour de nouvelles requêtes. Les documents sont ensuite classés en fonction de ces prédictions.
Pourquoi cet algorithme est essentiel pour les moteurs de recherche ?
Le Learning to Rank a révolutionné la manière dont les moteurs de recherche classent les résultats. Avant eux, le classement était basé sur des algorithmes heuristiques définis manuellement. Avec le L2R, les moteurs de recherche peuvent automatiquement apprendre les meilleurs poids et caractéristiques pour le classement à partir des données. Cela permet d'obtenir des résultats plus pertinents et de s'adapter rapidement aux changements dans les comportements des utilisateurs.
Quels sont les avantages du Learning to Rank ?
- Adaptabilité : Les modèles L2R peuvent s'adapter rapidement aux nouvelles tendances et aux changements dans les comportements des utilisateurs.
- Personnalisation : Ils permettent une personnalisation poussée des résultats en fonction des préférences et des comportements individuels des utilisateurs.
- Précision : Grâce à l'apprentissage automatique, les modèles L2R peuvent atteindre une précision de classement supérieure à celle des méthodes traditionnelles.
Cette définition vous a plu ? Découvrez d'autres termes SEO en lien avec les algorithmes de recherche en cliquant sur les boutons ci-dessous :
Approfondissez vos connaissances dans le domaine du référencement naturel et du marketing digital en consultant le lexique du SEO.