QBST : L'algorithme de Google qui analyse les termes saillants

Article écrit par Julien Gourdon
ancien journaliste et consultant SEO depuis 2015
Dernière modification :
QBST (Query Based Salient Terms) est un composant fondamental du système de classement de Google, qui intervient dès les premières étapes du processus de tri des résultats. Cet algorithme, dont on peut trouver une trace dès 2013 dans un brevet de Microsoft, a été officialisé lors du procès antitrust de Google fin 2023 et confirmé par la fameuse Google Leaks de mai 2024. Il joue un rôle crucial dans la pertinence des résultats de recherche du plus grand moteur de recherche au monde, notamment parce qu'il s'appuie sur les données utilisateurs, que Google stocke par milliard. Mais voyons tout ceci en détails.
Qu'est-ce que QBST ?
QBST, ou Query Based Salient Terms, est un système développé par Google qui se concentre sur l'identification et l'analyse des termes les plus significatifs (saillants) dans une requête et dans les documents web. Le terme "salient" fait référence aux mots ou expressions qui sont les plus importants et les plus pertinents dans un contexte donné.
Dans le contexte de QBST, les termes saillants sont définis comme les mots les plus importants d'un document ou d'une requête en tant que descripteurs. Ils sont caractérisés par différents attributs comme le Signal Term, qui représente un indicateur du degré de pertinence d'un mot dans un contexte donné; la Virtual Term Frequency, qui évalue l'importance d'un terme en tenant compte des cooccurrences et de son poids sémantique; ou encore l'IDF (Inverse Document Frequency), qui mesure la rareté d'un mot à travers l'ensemble des documents indexés pour distinguer les termes vraiment significatifs des termes communs.
Les termes saillants sont définis comme les mots les plus importants d'un document ou d'une requête en tant que descripteurs. Ils sont caractérisés par différents attributs comme le Signal Term, la Virtual Term Frequency, ou encore l'IDF (Inverse Document Frequency).
Une approche inspirée d'un brevet de Microsoft datant de 2013
L'approche de QBST est très proche d'un système breveté par Microsoft en 2013, où l'on utilise des ratios basés sur les clics des utilisateurs pour déterminer la pertinence contextuelle d'un terme ou d'un document. Ces ratios permettent de mesurer à quel point un terme est central dans une page en fonction des requêtes des utilisateurs et des clics enregistrés. Cependant, ce ne sont pas les requêtes prises individuellement qui permettent d'identifier les termes saillants, mais bien l'ensemble des requêtes ayant généré des clics vers une page donnée. En regroupant ces requêtes, QBST identifie les termes les plus fréquents et contextuellement pertinents associés à une page, permettant une analyse globale des termes saillants.
Google entraîne QBST sur une période de 13 mois de données utilisateurs (tiens, comme Navboost !), un volume qui représente l'équivalent de 17 ans de données accumulées par Bing. Cette base massive de données permet à Google d'identifier les modèles comportementaux récurrents tout en ajustant dynamiquement la priorité des termes saillants en fonction des tendances de recherche. Ce processus améliore précision et pertinence dans les résultats de recherche, en garantissant que chaque clic enregistré contribue directement à affiner les classements des contenus.
L'objectif principal de QBST
L'objectif principal de QBST est de réaliser un premier tri crucial dans l'immense base de données de Google (Alexandria). Dès qu'un utilisateur saisit une requête, QBST analyse celle-ci pour en extraire les termes saillants : des mots, synonymes, variantes, entités ou concepts associés qui définissent le contexte pertinent.
Exemple concret : Pour une recherche sur "appareil photo", QBST identifie automatiquement des termes saillants comme "objectif", "résolution", "capteur", "mode", "stabilisation", "flash", "batterie" ou "mémoire". Ces termes servent de filtres initiaux pour réduire drastiquement le nombre de pages potentiellement pertinentes.
Le processus de classement avec QBST
Position stratégique dans le processus
QBST occupe une position stratégique au tout début du processus de classement, lorsque l'utilisateur tape une requête dans la barre de recherche de Google. Il intervient avant d'autres algorithmes majeurs dans un ordre précis :
- QBST : Premier tri basé sur les termes saillants
- Mustang : Raffinage des résultats
- Superroot : Application des "twiddlers" (corrections algorithmiques)
- Navboost : Réordonnancement final basé sur les interactions utilisateurs des 13 derniers mois
Un système d'analyse sophistiqué
QBST fonctionne comme un modèle "pairwise", analysant les paires requêtes/documents. Son fonctionnement s'articule autour de plusieurs éléments clés :
- L'analyse des uni-grams et bi-grams (mots seuls et paires de mots)
- L'utilisation des données de clics des utilisateurs pour l'apprentissage
- L'évaluation de la fréquence virtuelle des termes
- Le calcul de l'IDF pour mesurer la rareté des termes dans l'ensemble des documents et éliminer ceux qui sont trop communs et qui n'apportent pas de sens particulier.
Les attributs analysés par QBST
QBST prend en compte plusieurs signaux pour évaluer l'importance des termes :
- Les signaux provenant du corps du texte (body) ;
- La position des termes dans le texte (plus ils sont placés haut dans le contenu principal, plus ils ont de valeur) ;
- La fréquence des termes dans des sections stratégiques du contenu (titres, ancres, etc.) ;
- Les signaux des ancres de liens (anchor) ;
- Les données de clics des utilisateurs ;
- La fréquence d'apparition des termes ;
- La rareté des termes dans l'index global.
Comment optimiser son site pour QBST ?
Structuration du contenu
Pour optimiser un site pour QBST, il est crucial de :
1. Identifier les termes saillants
Analysez les pages déjà bien positionnées pour une requête donnée afin d'identifier les termes saillants qu'elles utilisent. Des outils sémantiques comme YourText.guru, Semrush ou encore mon outil SEO sémantique boosté à l'IA, peuvent vous aider dans cette tâche.
2. Optimiser la structure du contenu
Intégrez les termes saillants de manière naturelle dans votre contenu, tout en gardant à l'esprit le besoin informationnel du lecteur. Placez ces termes dans des sections stratégiques (titres, paragraphes initiaux, ancres de liens).
3. Surveiller l'évolution des SERPs
Les termes saillants peuvent évoluer au fil du temps sous l'influence des autres algorithmes (Mustang, Superroot, Navboost). Une surveillance régulière est nécessaire.
Signaux comportementaux
QBST utilisant les données de clics pour son apprentissage, il est important de travailler sur :
- L'optimisation des titres et meta-descriptions pour améliorer le CTR ;
- La qualité de l'expérience utilisateur pour augmenter le temps passé sur page ;
- La pertinence du contenu par rapport à l'intention de recherche ;
- La structure de navigation pour faciliter l'exploration du site.
Pour conclure
En 2025, il n'est plus acceptable pour un professionnel du SEO d'ignorer l'importance des termes saillants dans sa stratégie de contenu. En combinant une écriture engageante, une structure optimisée et en distillant les bons termes aux bons endroits dans votre contenu, vous pouvez non seulement répondre aux attentes des utilisateurs, mais aussi vous conformer aux exigences de Google. N'en déplaise aux poètes, la rédaction web est devenue une science où chaque détail compte pour améliorer la visibilité et l'engagement !