Accueil > Lexique SEO > Apprentissage automatique
Débogage des données de notation: rating=5.0, count=2

Les diffĂ©rents types d'apprentissage automatique : Le guide complet 📚

Portrait de l'auteur de l'article, Julien Gourdon

Définition rédigée par Julien Gourdon
ancien journaliste et consultant SEO depuis 2015



Publié le :
DerniĂšre modification :
⏱ Environ 6 minutes

    Introduction Ă  l'apprentissage automatique et son importance en IA

    Comment Google fait-il pour comprendre aussi bien et toujours mieux les requĂȘtes complexes des utilisateurs ? Comment rĂ©ussit-il Ă  nous proposer avec toujours plus de pertinence la suite de notre recherche quand nous avons nous-mĂȘme du mal Ă  formuler notre besoin ? Ou encore, comment ChatGPT se dĂ©brouille-t-il pour comprendre notre question et y apporter la rĂ©ponse appropriĂ©e ? La rĂ©ponse Ă  toutes ces questions rĂ©side dans le machine learning (ML) et les rĂ©seaux de neurones, qui sont au cƓur de cette technologie. Le ML a permis l'Ă©mergence de l’intelligence artificielle et ne cesse d'influencer l'avenir du SEO. Mais voyons tout ceci en dĂ©tails.

    Les fondamentaux de l'apprentissage automatique

    L'apprentissage automatique, ou Machine Learning en anglais, est une sous-discipline de l'intelligence artificielle qui permet aux machines d'apprendre Ă  partir de donnĂ©es. Au cƓur de cette technologie se trouvent les rĂ©seaux de neurones, des modĂšles informatiques inspirĂ©s du cerveau humain qui sont capables d'apprendre Ă  partir de donnĂ©es d'entrĂ©e. Pour donner un exemple, imaginez que vous ĂȘtes en train d’apprendre Ă  un enfant comment reconnaĂźtre les diffĂ©rentes formes que sont les cercles, les carrĂ©s et les triangles. Vous lui montrez des photos de chaque forme et petit Ă  petit, l’enfant rĂ©ussit Ă  identifier les formes par lui-mĂȘme. C’est essentiellement ce que fait le machine learning, mais avec des ordinateurs.

    Les applications concrĂštes de l'apprentissage automatique dans le marketing digital

    Le machine learning est utilisĂ© de multiples façons dans le contexte du marketing digital et du SEO. Il peut par exemple aider Ă  prĂ©dire les tendances de recherche, à mieux comprendre le langage naturel de l'internaute et ses intentions de recherche lorsqu'il tape une requĂȘte dans Google, Ă  optimiser les campagnes en ligne, Ă  catĂ©goriser une liste de mots-clĂ©s, Ă  personnaliser l’expĂ©rience utilisateur, et bien plus encore.

    Le machine learning est aussi Ă  la base des outils d’intelligence artificielle gĂ©nĂ©rative, qui permettent la production de contenus textuels, comme ChatGPT, ou la crĂ©ation d’images, tels que Midjourney ou Dall-E.

    Mais lorsque nous parlons de machine learning, nous parlons en rĂ©alitĂ© de plusieurs types d’apprentissage automatique. Passons-les en revue.

    L'apprentissage supervisé : une approche basée sur les données annotées

    Principe et fonctionnement de l'apprentissage supervisé

    Le supervised learning est une mĂ©thode oĂč les algorithmes apprennent Ă  partir de donnĂ©es Ă©tiquetĂ©es. Prenons l’analogie du professeur et de l’élĂšve. L’instructeur guide l’élĂšve en lui fournissant des exemples pour l’aider Ă  s’amĂ©liorer. Pour en revenir Ă  nos moutons, l’ingĂ©nieur fournit Ă  l'algorithme des exemples d'entrĂ©es et de sorties souhaitĂ©es, et l’algo apprend Ă  partir de ces exemples.

    Les techniques courantes d'apprentissage supervisé : régression et classification

    Il existe deux techniques principales en apprentissage supervisĂ© : la rĂ©gression et la classification. La rĂ©gression est utilisĂ©e lorsque la sortie attendue est un nombre continu. Elle est souvent utilisĂ©e pour prĂ©dire des valeurs quantitatives, comme le prix d’une maison par exemple.

    • La rĂ©gression : elle est utilisĂ©e lorsque la sortie attendue est un nombre continu. Elle permet de prĂ©dire des valeurs quantitatives, comme le prix d’une maison par exemple. Le concept de rĂ©gression repose sur l'idĂ©e de trouver une relation entre les variables d'entrĂ©e (ou caractĂ©ristiques) et la variable de sortie (ou cible). Dans le cas de la prĂ©diction du prix d'une maison, les variables d'entrĂ©e pourraient ĂȘtre la taille de la maison, le nombre de chambres, l'emplacement, l'Ăąge de la maison, etc. La variable de sortie serait le prix de la maison. La rĂ©gression utilise ces variables d'entrĂ©e pour crĂ©er un modĂšle mathĂ©matique qui peut prĂ©dire la variable de sortie. Ce modĂšle est crĂ©Ă© en utilisant des donnĂ©es d'entraĂźnement, qui sont des exemples pour lesquels nous connaissons dĂ©jĂ  les valeurs d'entrĂ©e et de sortie. Le modĂšle apprend Ă  partir de ces donnĂ©es d'entraĂźnement et peut ensuite ĂȘtre utilisĂ© pour prĂ©dire la variable de sortie pour de nouvelles donnĂ©es d'entrĂ©e. Il existe plusieurs types de rĂ©gression, tels que la rĂ©gression linĂ©aire, la rĂ©gression logistique, la rĂ©gression polynomiale, etc. Chacun de ces types de rĂ©gression utilise une approche lĂ©gĂšrement diffĂ©rente pour crĂ©er le modĂšle mathĂ©matique, mais tous partagent le mĂȘme objectif de prĂ©dire une variable de sortie continue Ă  partir des variables d'entrĂ©e.
    • La classification : elle est utilisĂ©e lorsque la sortie attendue est une catĂ©gorie ou une classe. Elle permet par exemple de dĂ©terminer si un email est un spam ou non en identifiant certaines caractĂ©ristiques, telles que les mots dans l’email, la frĂ©quence de certains termes, l’adresse de l’expĂ©diteur, etc. GrĂące aux donnĂ©es d’entraĂźnement qui ont Ă©tĂ© fournies au prĂ©alable au modĂšle de classification, il peut ensuite ĂȘtre utilisĂ© pour prĂ©dire la catĂ©gorie de sortie pour de nouvelles donnĂ©es d’entrĂ©e. Il existe plusieurs modĂšles de classification, comme la rĂ©gression logistique, les arbres de dĂ©cision, les forĂȘts alĂ©atoires, les machines Ă  vecteurs de support (SVM), etc.

    Exemples d'utilisation de l'apprentissage supervisé en pratique

    Le supervised learning peut ĂȘtre utilisĂ© pour la reconnaissance d'images par exemple, oĂč l'algorithme apprend Ă  identifier des objets Ă  partir d'images Ă©tiquetĂ©es (c’est notre exemple citĂ© prĂ©cĂ©demment Ă  propos des ronds, des carrĂ©s et des triangles, que l’enfant apprend Ă  reconnaĂźtre petit Ă  petit grĂące aux exemples qu’on lui donne). On peut Ă©galement citer la prĂ©diction de la demande en Ă©lectricitĂ©, oĂč l'algorithme apprend Ă  prĂ©dire la demande future en fonction des donnĂ©es historiques.

    L'apprentissage non supervisé : détection de patterns sans étiquetage

    Comprendre le concept d'unsupervised machine learning'

    L'apprentissage non supervisĂ© est une mĂ©thode oĂč les algorithmes apprennent Ă  partir de donnĂ©es non Ă©tiquetĂ©es. Dans ce cas, le modĂšle cherche Ă  dĂ©couvrir par lui-mĂȘme des structures et des relations dans les donnĂ©es sans aucune intervention humaine.

    Clustering et réduction de dimensions : méthodes fréquentes en apprentissage non supervisé

    Les méthodes courantes en apprentissage non supervisé incluent le clustering et la réduction de dimensions. Le clustering est utilisé pour regrouper les données en différents groupes sur la base de leur similarité. La réduction de dimensions, quant à elle, est utilisée pour réduire la complexité des données en diminuant le nombre de variables.

    Cas d'application de l'apprentissage non supervisé dans le marketing digital

    L'unsupervised machine learning trouve de nombreuses applications dans le domaine du marketing digital et du SEO. Il s'agit d'un outil précieux pour découvrir des schémas ou des tendances non évidentes dans les données, sans avoir besoin de directives ou de classifications préalables. Prenons quelques exemples :

    • Segmentation des clients : il peut ĂȘtre utilisĂ© pour segmenter les clients en diffĂ©rents groupes en fonction de leurs comportements en ligne. Par exemple, il peut identifier des groupes de clients ayant des comportements de navigation ou d'achat similaires sur un site web. Ces informations peuvent ensuite ĂȘtre utilisĂ©es pour personnaliser les messages marketing et amĂ©liorer l'efficacitĂ© des campagnes publicitaires ;
    • Analyse des sentiments : il peut ĂȘtre utilisĂ© pour analyser les sentiments des clients Ă  partir de commentaires ou de critiques en ligne. Cela peut aider les propriĂ©taires de sites Ă  comprendre comment leurs produits ou services sont perçus et Ă  identifier les domaines d'amĂ©lioration ;
    • Analyse des tendances de recherche Ă©mergentes : il peut ĂȘtre utilisĂ© pour identifier les sujets ou les mots-clĂ©s qui sont les plus pertinents pour un public cible, en analysant les tendances de recherche et les donnĂ©es de trafic ;
    • DĂ©tection d'anomalies : il peut Ă©galement ĂȘtre utilisĂ© pour dĂ©tecter les anomalies dans les donnĂ©es de trafic d'un site web, qui peuvent rĂ©vĂ©ler une opportunitĂ© marketing.

    L'apprentissage par renforcement : optimisation basée sur la rétroaction

    Les bases de l'apprentissage par renforcement

    L'apprentissage par renforcement est une mĂ©thode oĂč un agent apprend Ă  prendre des dĂ©cisions en fonction de la rĂ©troaction qu'il reçoit de son environnement. L'agent reçoit des rĂ©compenses ou des punitions (renforcements) pour ses actions, ce qui l'incite Ă  choisir des actions qui maximisent la rĂ©compense cumulĂ©e sur le long terme.

    Processus de prise de décision en reinforcement learning

    Dans l'apprentissage par renforcement, l'agent doit Ă©quilibrer entre l'exploration de nouvelles actions et l'exploitation des actions qui ont donnĂ© de bons rĂ©sultats dans le passĂ©. Il s’agit d’un processus de prise de dĂ©cision complexe qui nĂ©cessite un Ă©quilibre dĂ©licat.

    Comment l’apprentissage par renforcement a Ă©tĂ© utilisĂ© pour former ChatGPT ?

    L'apprentissage par renforcement est largement utilisĂ© dans des domaines comme la robotique, oĂč un robot apprend Ă  effectuer des tĂąches en interagissant avec son environnement. Il est Ă©galement utilisĂ© dans les jeux vidĂ©o, oĂč un agent apprend Ă  jouer Ă  un jeu en essayant diffĂ©rentes stratĂ©gies et en recevant des rĂ©compenses ou des pĂ©nalitĂ©s en fonction de ses actions.

    Dans le contexte de ChatGPT, l'apprentissage par renforcement a été utilisé pour affiner le modÚle aprÚs un premier entraßnement avec le supervised learning. Cette méthode a permis à ChatGPT d'apprendre à générer du texte en se basant sur de grands volumes de données textuelles provenant d'Internet.

    Mais pour aider le modĂšle Ă  gĂ©nĂ©rer des rĂ©ponses plus prĂ©cises et utiles dans le contexte d'une conversation, une Ă©tape supplĂ©mentaire de reinforcement learning a Ă©tĂ© mise en Ɠuvre. Dans cette Ă©tape, le modĂšle a Ă©tĂ© "formĂ©" Ă  l'aide de conversations simulĂ©es, oĂč les rĂ©ponses gĂ©nĂ©rĂ©es par le modĂšle Ă©taient Ă©valuĂ©es par des humains. Ces Ă©valuations ont servi de "rĂ©compenses" ou de "punitions" pour guider l'apprentissage du modĂšle.

    Ainsi, en combinant l'apprentissage supervisé (pour apprendre à partir de grandes quantités de texte) et l'apprentissage par renforcement (pour affiner les réponses dans le contexte d'une conversation), ChatGPT a été formé pour générer des réponses pertinentes et utiles dans une variété de situations de conversation.

    Autres types d'apprentissage automatique

    Il existe également d'autres types d'apprentissage automatique, comme l'apprentissage semi-supervisé, l'apprentissage partiellement supervisé et l'apprentissage par transfert.

    L'apprentissage semi-supervisé est une mĂ©thode qui utilise Ă  la fois des donnĂ©es Ă©tiquetĂ©es et non Ă©tiquetĂ©es pour former un modĂšle. L'idĂ©e sous-jacente est que mĂȘme si le modĂšle ne connaĂźt pas la rĂ©ponse pour les donnĂ©es non Ă©tiquetĂ©es, ces donnĂ©es peuvent toujours lui fournir des informations utiles pour l’aider Ă  se former. Par exemple, si vous essayez d’entraĂźner un modĂšle Ă  classer des images de chiens et de chats et que parmi les images que vous fournissez Ă  l’algorithme, certaines sont Ă©tiquetĂ©es et d’autres pas, les images non-Ă©tiquetĂ©es peuvent quand mĂȘme aider le modĂšle Ă  comprendre Ă  quoi ressemblent gĂ©nĂ©ralement les chiens et les chats, ce qui peut l’aider Ă  s’amĂ©liorer.

    L'apprentissage partiellement supervisĂ©, Ă©galement connu sous le nom d'apprentissage Ă  Ă©tiquetage faible, est une mĂ©thode de machine learning qui utilise des donnĂ©es Ă©tiquetĂ©es de maniĂšre imparfaite ou incomplĂšte. Les Ă©tiquettes peuvent ĂȘtre bruitĂ©es (c'est-Ă -dire qu'elles contiennent des erreurs) ou elles peuvent ĂȘtre incomplĂštes (c'est-Ă -dire que certaines donnĂ©es sont Ă©tiquetĂ©es et d'autres non).

    L'apprentissage par transfert, quant Ă  lui, est une mĂ©thode oĂč un modĂšle formĂ© sur une tĂąche est rĂ©utilisĂ© comme point de dĂ©part pour un modĂšle sur une deuxiĂšme tĂąche.

    DĂ©fis et enjeux liĂ©s Ă  l’apprentissage automatique

    L'apprentissage automatique n'est pas sans dĂ©fis. Il y a des questions de biais et de discrimination, de confidentialitĂ© et de sĂ©curitĂ© des donnĂ©es (raison principale pour laquelle Google Bard n’est toujours pas dĂ©ployĂ© en Europe Ă  l’heure Ă  laquelle j’écris ces lignes, c’est Ă  dire le 3 juillet 2023), et de transparence et d'explicabilitĂ© des modĂšles. De plus, le machine learning nĂ©cessite de grandes quantitĂ©s de donnĂ©es et de puissance de calcul, ce qui peut ĂȘtre coĂ»teux Ă  la fois en termes financiers, mais Ă©galement environnementaux.

    Un autre dĂ©fi majeur est la confiance excessive que les utilisateurs peuvent placer dans les outils d'intelligence artificielle gĂ©nĂ©rative. Alors que ces outils peuvent produire des rĂ©sultats impressionnants, il est important de se rappeler qu'ils ne sont pas infaillibles. Ils sont formĂ©s Ă  partir de datasets et peuvent donc reproduire les biais et les erreurs prĂ©sents dans ces donnĂ©es. Ils peuvent Ă©galement fournir des rĂ©sultats qui sont hors contexte (on parle alors d’hallucinations !) ou inappropriĂ©s.

    Prudence, donc ! L'apprentissage automatique, un monde riche en promesses et dĂ©bordant d'opportunitĂ©s, surtout pour les professionnels du marketing digital, nous invite Ă  avancer avec sagesse et discernement. Gardons un Ɠil vigilant sur les dĂ©fis et les enjeux actuels, et restons prĂȘts Ă  affronter ceux qui ne manqueront pas de surgir dans les semaines, les mois et les annĂ©es Ă  venir.

    ★ ★ ★ ★ ★
    Chargement de la note...


    Catégorie(s) :


    Commentaires

    Aucun commentaire pour le moment. Soyez le premier Ă  commenter !

    Ajouter un commentaire