Rédige des articles SEO de qualité supérieure avec l’IA de Help Content

Publié le :
Dernière modification :
⏱ Environ 9 minutes

Portrait de l'auteur de l'article, Julien Gourdon

Article écrit par Julien Gourdon

Sommaire 📚

Tout le monde le sait, la compétition dans le domaine du marketing digital est de plus en plus intense. A l’ère de l’IA, créer des contenus qui se démarquent devient de plus en plus dure, mais est pourtant absolument vital.



Face à ce constat, l’application Help Content est née d'une ambition simple mais audacieuse : transformer le processus de rédaction SEO en une science précise. Grâce à une analyse sémantique préalable, similaire à celle qu’effectue Google pour évaluer et classer les contenus, Help Content vous permet de créer des articles qui visent spécifiquement à plaire aux moteurs de recherche.

Bienvenue dans l’ère de la rédaction assistée par IA, où chaque mot compte, chaque phrase est stratégique, et où rien, de la compréhension de l’intention de recherche des utilisateurs, jusqu’à l’identification complète du champ lexical à utiliser pour viser juste, n’est laissé au hasard.

Mais découvrons maintenant le fonctionnement de l’application.

Comment fonctionne l’application Help Content ?

A partir du moment où vous vous êtes créé un compte et que vous vous êtes logué, vous avez 2 choix :

Quand vous faites ce second choix, vous avez la possibilité de récupérez la page de résultats de 7 pays différents : la France (qui est le choix par défaut), les USA, le Royaume-Uni, l’Espagne, l’Italie, le Portugal ou l’Allemagne.

Après avoir cliqué sur le bouton “Launch query”, l’application Help Content va récupérer toutes les URLs qui se trouvent en Page 1 de Google, puis va extraire le contenu principal de chacune de ces URLs, ainsi que les balises Title, les meta description, toutes les balises Hn, puis va identifier les expressions qui apportent le plus de sens par rapport à la thématique traitée par l’ensemble des URLs récupérées.

Oui, j’ai bien dit les mots-clés et expressions qui apportent le plus de sens, et non pas les mots-clés les plus récurrents qui se trouvent dans un corpus textuel.

Comment l’application Help Content réussit-elle ce prodige ?

En utilisant des algorithmes de traitement automatiques du langage, pardi ! En l’occurrence, l’application va utiliser l’algorithme du TF-IDF pour analyser les contenus récupérés et extraire ces fameuses expressions dont elle considère que ce sont elles qui, parce qu’elles apparaissent statistiquement plus de fois dans les contenus textuels analysés que dans la moyenne des contenus produits par les humains, ont le plus de valeur pour déterminer le sens d’un texte.

Tous ces contenus récupérés sont ensuite transformés en vecteurs numériques et embeddés dans une base de données vectorielles (je sais, je vous ai perdu) dans des index différents :

L’embedding est vraiment intéressant car cela permet de plonger des vecteurs dans un espace multi-dimensionnel où la sémantique des mots va être conservée et où chacun des vecteurs va être placé dans un endroit stratégique de l’espace multi-dimensionnel correspondant à leur sens. En clair, dans cet espace multi-vectoriel, plus un vecteur est proche d’un autre vecteur, plus cela signifie que leur sens est proche.

Pourquoi c’est important ? Parce que par la suite, lorsque vous demanderez à l’application de rédiger un article à partir d’un brief éditorial, le brief éditorial va lui-même être transformé en vecteur et embeddé dans l’espace multi-dimensionnel (dans le cadre de la l’application Help Content, il s’agit de la base de données vectorielles où se trouvent l’ensemble des contenus récupérés) dans le but d’aller récupérer les contenus les plus pertinents en appliquant un algorithme de recherche par similarité sémantique. Pour schématiser, le brief éditorial plonge dans l’espace multi-dimensionnel et va aller chercher l’endroit où se trouve la meilleure réponse (les morceaux de contenu qui se trouvent le plus proche sémantiquement du brief éditorial).

Ce système s’appelle la récupération augmentée par génération. Elle permet de résoudre de nombreux problèmes posés par les grands modèles de langage, parmi lesquels :

Les informations affichées par l’application Help Content

Quand l’application a terminé son travail de récupération, de vectorisation et d’embedding, elle affiche toute une série de données qui vont être très intéressantes pour l’optimisation de votre contenu.

Le graphique des N-Grams

Un premier graphique affiche le taux de présence moyen des N-Grams (terme scientifique qui représente un groupe de mots sont situés les uns à la suite des autres dans un contenu). Pour le plus grand bonheur des utilisateurs, lapplication va aller récupérer 3 types de N-Grams :

Par défaut, l’application classe les N-Grams par ordre décroissant de leur score TF-IDF (voir plus haut).

Mais l’utilisateur peut filtrer le graphique comme il le souhaite. Il peut en effet choisir d’augmenter ou de réduire le nombre de N-Grams affichés, (sachant que le nombre de N-Grams affichés va dépendre de la taille de l’écran de l’utilisateur), de trier par ordre décroissant d’occurrences, ou encore par ordre décroissant d’URLs différentes dans lesquelles chaque N-Gram est utilisé.

L’utilisateur a également la possibilité de filtrer le graphique des N-Grams par une ou plusieurs URLs spécifiques, ce qui lui permet par exemple d’avoir une vue précise sur les N-Grams utilisés par les 3 contenus qui se positionnent sur le podium de la SERP sur un mot-clé cible.

Le graphique du nombre de mots par URL

Comme son nom l’indique, le second graphique en barre vous permet de visualiser le nombre de mots de chacune des URLs récupérées par l’application. Deux lignes horizontales vous permet également de visualiser le nombre de mots moyen et médian de l’ensemble des contenus positionnés en Page 1 de Google, ce qui vous donne une indication de ce qui est à peu près attendu par Google sur la thématique choisie (donnée à prendre avec d’extrêmes pincettes, évidemment, puisque Google n’attend pas un nombre de mots précis pour qu’un contenu puisse être visible. Mais selon moi, plus votre contenu est riche, plus votre contenu à des chances d’être compris par les robots de Google, et plus votre contenu à des chances d’être visible sur un maximum de mots-clés de longue traîne. L’essentiel est que votre contenu soit rédigé de manière naturelle, agréable à lire et qu’il ne donne pas l’impression d’un remplissage de mots et de phrases mis bout à bout dans un seul but de ranking).

La génération de contenu par l’IA

Maintenant que la partie dédiée à l’analyse des données récupérées par l’application est traitée, passons maintenant à la partie qui vous intéresse le plus : celle dédiée à la génération des contenus par l’IA.

Résumés des URL récupérés + analyse complémentaire

Le bouton “URLs summary + extra analysis” va vous permettre d’obtenir un résumé de chacune des URLs récupérés sous la forme des 5 questions principales auxquelles chaque contenu répond. L’IA va également vous donner le type de contenu de l’URL qui vient d’être résumé (contenu de blog, article journalistique, etc.), ainsi que l’intention de recherche principale à laquelle l’URL tente de répondre. En plus de ces résumés d’URL, l’application va vous fournir une analyse supplémentaire qui va se diviser en 5 parties :

Génération du brief éditorial

Le bouton “Get your editorial brief” va vous permettre de générer un brief éditorial. Il s’agit de l’élément le plus important de l’application parce que c’est sur ce brief que va s’appuyer ensuite l’intelligence artificielle pour générer votre article SEO. Il est donc vraiment important de passer du temps sur ce brief (puisque celui généré par l’IA est modifiable) pour s’assurer qu’il va permettre à l’IA de traiter le sujet demandé de la manière la plus complète possible afin de répondre aux besoins utilisateurs, donc à l’intention de recherche.

Pour générer ce brief, vous avez la possibilité de choisir entre deux modèles de langage (pour l’instant) :

Le brief éditorial généré par l’IA est rédigé au format HTML. Il comprend :

Il est important de noter que pour rédiger le brief éditorial, l’intelligence artificielle s’est appuyée sur les balises title, les meta descriptions et les balises Hn des contenus récupérés, sans jamais les recopier. Au contraire, l’IA a pour mission de faire mieux, tout en s’assurant de répondre de la manière la plus complète possible aux besoins des utilisateurs qui tape la fameuse requête en question.

Génération de l’article SEO

Maintenant que nous avons notre brief éditorial, nous allons pouvoir générer notre contenu SEO. Mais avant cela, je tiens à vous expliquer en détails comme l’IA fait pour rédiger l’article.

En cliquant sur le bouton “Generate your article”, l’application va tout d’abord compter le nombre de H2 qui se trouve dans le brief éditorial. Puis l’intelligence artificielle va recevoir dans un prompt le brief éditorial dans son ensemble afin d’avoir une vision globale du contenu à générer. A partir de ce brief éditorial, l’IA va rédiger toute la partie qui correspond au premier H2 du brief jusqu’au deuxième H2, en suivant scrupuleusement toutes les indications qui se trouvent entre les deux H2. Une fois que le LLM a rédigé cette première partie, le même processus va être répété jusqu’au dernier H2. Ce qui signifie donc que l’application va faire autant d’appel au modèle de langage qu’il y a de H2 dans le brief éditorial.

Pourquoi l’application procède de cette façon ? Deux raisons principales :

Et c’est donc au moment de la rédaction de l’article dans son ensemble que le système de la récupération augmentée par génération intervient. En effet, pour chaque partie du brief éditorial qu’elle va rédiger, l’intelligence va s’appuyer sur les contenus qui ont été récupérés et stockés dans la base de données vectorielles. Grâce à un algorithme de recherche par similarité, le système va en effet récupérer les informations qui matchent le mieux (les plus proches sémantiquement) de le partie du brief éditorial à rédiger. En plus de cela, elle va aller récupérer les N-Grams les plus pertinents qui sont stockés dans un index à part du vector store afin de rédiger le contenu le plus précis et optimisé possible ! Et ceci sans jamais recopier tels quels les contenus concurrents.

Vérification du plagiat

Pour vous assurer que le contenu généré par l’IA n’a pas plagié un contenu existant, il vous suffit de cliquer sur le bouton “Identifying plagiarized content”. Un tableau à deux colonnes va apparaître, la première colonne affichant la liste des URL récupérées par l’application, la deuxième colonne indiquant sur le score de similarité. Que les choses soient claires. Si le score est inférieur à 0,90, aucun problème. Un score élevé indique surtout que le contenu généré par l’intelligence artificielle traite de la même thématique qu’un contenu concurrent. C’est en réalité bon signe, puisque le but est effectivement de traiter, en mieux, de la même thématique que les contenus récupérés.

Dans ce tableau, en cliquant sur l’une des URLs, vous allez voir une pop-up apparaître. Elle est composée de deux parties distinctes. La partie gauche affiche le contenu brut de l’URL récupérée, et la partie droite affiche le contenu brut de l’article généré par l’IA. Dans cette partie droite, les groupes de 4 mots consécutifs ou plus qui sont identiques à ceux du contenu concurrent sont surlignés en turquoise. Cela n’arrive en réalité jamais que l’IA recopie tels quels des paragraphes entiers de contenus concurrents.

Recommandations de maillage interne

L’application Help Content peut également vous faire des recommandations de maillage interne. Pour cela, évidemment, il faut qu’elle ait connaissance des contenus de votre site internet. Comme elle n’est pas capable de le crawler elle-même, il va falloir l’aider.

Dans le footer de l’application, vous avez un lien “internal linking” sur lequel vous pouvez cliquer. Ce lien va vous mener vers une page où vous allez pouvoir uploader un fichier xlsx dans lequel se trouveront vos articles.

Attention cependant. Pour ne pas surcharger l’application en lui fournissant 300 000 contenus ou plus d’un coup, le fichier xslx ne doit pas dépasser 1000 lignes.

Une fois que vous avez uploadé vos articles dans l’application, vous allez pouvoir revenir à la page où votre article a été généré par l’IA. En cliquant sur le bouton “Recommendations for internal links”, vous allez voir un tableau à deux colonnes apparaître, affichant par ordre décroissant les 10 pages de votre site web les plus proches sémantiquement du contenu qui vient d’être généré par l’IA.

Quoi de mieux pour faire votre maillage interne ?

Pour affiner les recommandations, vous pourriez également ne prendre qu’un paragraphe de votre article afin de savoir quels sont les contenus existants qui matchent le mieux avec ce paragraphe.

Vous pourriez également, avant même la génération de l’article, rentré uniquement le titre du contenu afin d’avoir des recommandations en amont sur les pages existantes qui ont les scores de similarité les plus proches. De cette manière, vous pourriez demander, dès la génération du brief éditorial, à l’intelligence artificielle de créer des liens vers les pages les plus pertinentes (cette fonctionnalité existe lors du paramétrage du brief éditorial à générer) en lui indiquant les ancres de lien à insérer.

Lors de la génération du contenu, l’intelligence artificielle insérerait alors de manière fluide et naturelle les liens que vous avez indiqué.

Maintenant que ce tour d’horizon très complet est terminé, je vous souhaite une bonne utilisation de l’application Help Content.

Mais surtout n’oubliez pas : l’IA, c’est super bien, mais augmenté par l’humain, c’est beaucoup mieux !

Rendez-vous prochainement pour un nouvel épisode des Petites Histoires du SEO.


Automatisez la création de vos contenus web parfaitement optimisés SEO avec Help Content

Récupérez le contenu principal des URLs qui se positionnent en Page 1 de Google sur votre requête cible, enrichissez les connaissances de l'API GPT-4 grâce à ces contenus et obtenez de longs articles de blog parfaitement optimisés SEO pour améliorer la visibilité de votre site web sur les moteurs de recherche

J'automatise mes contenus