Intelligence artificielle · Article

Définir l'intelligence artificielle

Thème: Intelligence artificielle

Qu'est-ce que l'intelligence artificielle et comment la définir ?

Principales définitions de l’IA et des LLM

Résumé exécutif

Cet article fournit les définitions clés de l’intelligence artificielle (IA) et de ses sous-domaines, ainsi que celles de concepts associés tels que l’apprentissage automatique (Machine Learning), l’apprentissage profond (Deep Learning), les modèles de langage (dont les grands modèles de langage, LLM), les réseaux de neurones et différents modes d’entraînement (supervisé, non supervisé, auto-supervisé). Chaque terme est défini de façon concise et sourcée, illustré par des exemples concrets ou analogies pédagogiques, et complété par les enjeux éthiques ou limitations majeures. Un glossaire final récapitule les définitions, et un tableau compare IA/ML/DL/LLM selon leur définition, volume de données, exemples d’application, forces et limites. Le diagramme ci-dessous montre les relations hiérarchiques entre ces concepts. L’article s’appuie de préférence sur des sources primaires (articles fondateurs, publications institutionnelles) et des références en français lorsqu’elles existent, pour être accessible à un public général informé.

Diagramme : relations hiérarchiques entre l’intelligence artificielle (IA), le Machine Learning (ML), le Deep Learning (DL) et les grands modèles de langage (LLM). Ce schéma emboîté illustre que l’IA est la discipline englobant tous les systèmes « intelligents », parmi lesquels on trouve le Machine Learning et, plus spécifiquement, le Deep Learning (apprentissage profond). Les grands modèles de langage (LLM) sont un cas particulier de modèles de Deep Learning entraînés sur d’énormes volumes de texte. Le diagramme indique également des jalons chronologiques (années 1950 pour l’IA, 1980 pour le Deep Learning, etc.), rappelant que ces domaines ont émergé progressivement.

Définitions clés

Intelligence artificielle (IA)

L’IA désigne la capacité d’un système informatique à reproduire ou simuler certains comportements considérés comme « intelligents », autrement dit des tâches traditionnellement attribuées à l’humain. Selon le Parlement européen, l’IA permet à des systèmes techniques de percevoir leur environnement, de résoudre des problèmes et d’entreprendre des actions pour atteindre un but précis. Concrètement, un système IA peut, par exemple, planifier les trajets d’un robot, diagnostiquer des maladies à partir d’images médicales ou dialoguer avec un utilisateur (chatbot).

Analogie pédagogique : on peut voir l’IA comme un « assistant numérique » qui apprend à accomplir certaines tâches de raisonnement ou de reconnaissance, un peu comme un apprentissage humain guidé par des exemples et des contraintes.
Exemple concret : un assistant vocal (Siri, Google Assistant) utilise l’IA pour comprendre et répondre aux questions de l’utilisateur.
Limites et enjeux : l’IA d’aujourd’hui est spécialisée (IA « faible ») : elle excelle pour des tâches précises (reconnaissance d’images, traduction automatique, etc.) mais ne possède pas d’intelligence générale. Les systèmes IA peuvent être coûteux en données et en énergie, et soulèvent des enjeux de responsabilité et de gouvernance (qui est responsable en cas d’erreur ?).

Apprentissage automatique (Machine Learning)

Le Machine Learning (ML), ou apprentissage automatique, est une branche de l’IA où un algorithme « apprend » automatiquement à partir de données, sans être explicitement programmé pour chaque tâche. En pratique, un modèle ML analyse des ensembles de données pour en extraire des relations statistiques et établir des prédictions. Par exemple, un modèle ML peut apprendre à partir de milliers d’exemples d’emails étiquetés « spam » ou « non-spam » pour filtrer automatiquement les courriels indésirables.

Définition sourcée : « Le machine learning, ou apprentissage automatique, est une branche de l’intelligence artificielle qui permet à des systèmes informatiques d’apprendre à partir de données, sans être explicitement programmés pour chaque tâche ».
Analogie pédagogique : c’est comme enseigner à un enfant à distinguer les chats des chiens en lui montrant de nombreuses photos annotées, sans jamais lui dire une règle précise, mais en laissant l’enfant induire les différences (taille, forme des oreilles, etc.).
Exemples : reconnaissance d’images (identifier un objet dans une photo), détection de fraude (modèles financiers entraînés sur des transactions historiques) ou recommandation de produits (algorithmes qui apprennent vos goûts).
Limites et enjeux : la qualité du ML dépend fortement de la qualité et de la représentativité des données d’entraînement. Des données biaisées peuvent induire des modèles biaisés (cf. biais, infra). Le ML est souvent opaque : il peut apprendre des corrélations sans que l’on sache exactement comment, ce qui pose des défis en explicabilité et en validation des modèles.

Apprentissage profond (Deep Learning)

Le Deep Learning (apprentissage profond) est un sous-ensemble du Machine Learning utilisant des réseaux de neurones artificiels multicouches. Ces réseaux, inspirés grossièrement du cerveau, comportent plusieurs couches cachées : chaque couche apprend à extraire des caractéristiques de plus en plus abstraites des données brutes (pixels d’image, signaux audio, textes, etc.). Par exemple, dans la reconnaissance d’images, les premières couches détectent des bords et des textures simples, les couches suivantes des formes complexes, jusqu’à l’identification d’objets entiers.

Définition sourcée : « Le deep learning, ou apprentissage profond, est un sous-domaine du machine learning fondé sur des réseaux de neurones artificiels comportant de multiples couches. […] Ces modèles sont capables d’apprendre des représentations complexes à partir de données brutes ».
Analogie pédagogique : c’est comme une pyramide d’apprentissage où chaque étage apprend à mieux comprendre les données. Par exemple, pour comprendre une phrase écrite, les premières « étages » peuvent repérer les lettres, le suivant les mots, puis les structures grammaticales, etc.
Exemples : reconnaissance vocale (transcription automatique de la parole), traduction automatique moderne (basée sur les modèles transformers), détection de fraude bancaire, ou diagnostic d’anomalies sur des scanners médicaux. Ces tâches exploitent souvent des données non structurées (images, sons, texte) où le DL excelle.
Limites et enjeux : les réseaux profonds requièrent d’énormes volumes de données et de puissance de calcul pour s’entraîner, et peuvent être « boîtes noires » très difficiles à expliquer en détail. Ils sont sujets au surapprentissage (overfitting) si le nombre de paramètres est très supérieur à la quantité de données disponibles. Leur coût énergétique est une préoccupation croissante. Comme tout ML, ils reflètent les biais des données d’entraînement (par exemple, un réseau entraîné sur des images sous-représentant certaines populations peut mal les reconnaître).

Réseau de neurones artificiels

Un réseau de neurones artificiels est le modèle de base du Deep Learning : un système informatique dont l’architecture s’inspire du fonctionnement des neurones biologiques. Il consiste en de nombreux « nœuds » (neurones artificiels) interconnectés par des liens pondérés. Chaque neurone calcule une somme pondérée de ses entrées et passe le résultat à travers une fonction (souvent une non-linéarité). Les réseaux peuvent varier de simples (perceptron multicouche) à très complexes (transformers, CNNs, RNNs).

Définition sourcée : « Un réseau de neurones artificiels, ou réseau neuronal artificiel, est un système informatique dont la conception est inspirée à l’origine du fonctionnement des neurones ».
Analogie pédagogique : imaginez une toile d’araignée de petites unités (neurones) où chaque liaison peut être renforcée ou affaiblie (le poids du lien) au fil de l’entraînement. C’est un peu comme un réseau de neurones humain en simplifié : chaque connexion peut apprendre à mieux « déclencher » l’autre.
Exemples : un réseau neuronal simple peut être entraîné pour reconnaître si une photo contient un chat (classification binaire) ou prévoir un prix immobilier en entrée un ensemble de caractéristiques (régression).
Limites et enjeux : plus un réseau est profond et large (nombre de couches et de neurones), plus il peut apprendre de fonctions complexes, mais plus il devient « opaque » et difficile à expliquer. Il peut intégrer des millions de paramètres (poids) qu’on ne peut interpréter individuellement. Leur conception (architecture, réglages) relève souvent de tâtonnements expérimentaux.

Entraînement supervisé, non supervisé et auto-supervisé

Apprentissage supervisé : le modèle est entraîné sur des données étiquetées, c’est-à-dire où chaque exemple d’entrée est associé à une sortie « correcte » préalablement connue. Le but est que le modèle apprenne à associer entrées et sorties afin de généraliser sur de nouvelles données. Par exemple, on entraîne un réseau sur des milliers d’images de chiens/chiots étiquetées “chien” ou “pas chien” pour qu’il puisse classer de nouvelles images.
- Définition sourcée : « Dans l’apprentissage supervisé, les modèles sont entraînés à l’aide de données étiquetées, où chaque entrée est associée à une sortie connue ».
- Analogie : c’est comme un élève qui fait un exercice pour lequel le professeur donne la bonne réponse. L’élève compare sa réponse à la bonne réponse pour s’améliorer (réduction de l’erreur).
- Limites/Enjeux : nécessite des données annotées manuellement, ce qui peut être coûteux ou subjectif. Si les étiquettes sont incorrectes ou biaisées (par exemple, marquer systématiquement certaines images d’un genre particulier comme “non pertinent”), le modèle apprendra de mauvaises règles.
Apprentissage non supervisé : le modèle apprend des structures dans des données non étiquetées, sans réponses fournies. Il cherche des motifs, regroupements ou simplifications inhérents. Par exemple, un algorithme de clustering regroupe des clients selon leurs comportements d’achat sans connaître d’avance les catégories de clients.
- Définition sourcée : « L’apprentissage automatique non supervisé analyse des données non étiquetées pour identifier des modèles, des structures ou des relations sans cibles prédéfinies ».
- Analogie : comme explorer une grande bibliothèque sans plan, pour y découvrir soi-même les thèmes ou regroupements de livres sans qu’on nous dise où sont les romans, les essais, etc.
- Limites/Enjeux : les résultats sont plus difficiles à valider (on n’a pas de « bonne réponse ») et demandent souvent une interprétation humaine a posteriori. Des corrélations insignifiantes (bruit) peuvent sembler signifiantes pour l’algorithme.
Apprentissage auto-supervisé : approche récente où le modèle génère ses propres pseudo-étiquettes à partir de données non étiquetées, puis apprend de manière supervisée sur ces pseudo-étiquettes. Par exemple, on masque une partie d’un texte et on demande au modèle de prédire le mot manquant, la partie masquée servant de « vérité terrain » implicite.
- Définition sourcée : « L’apprentissage auto-supervisé est une technique de machine learning qui utilise l’apprentissage non supervisé pour des tâches qui habituellement nécessitent un apprentissage supervisé. Au lieu de s’appuyer sur des jeux de données étiquetés, les modèles auto-supervisés génèrent des étiquettes implicites à partir de données non structurées ».
- Analogie : c’est comme un élève qui crée ses propres exercices et réponses à partir du matériel de cours, pour s’entraîner sans l’intervention directe d’un professeur.
- Exemple : de nombreux grands modèles de langage (BERT, GPT, etc.) utilisent l’auto-supervision. BERT est pré-entraîné en masquant des mots de phrases puis en apprenant à les prédire.
- Limites/Enjeux : cette approche réduit le besoin d’étiquetage manuel, mais elle dépend de la qualité des tâches artificielles (prédire un mot, reconstruire une image). Si ces tâches ne reflètent pas exactement le problème final, la performance peut être limitée. De plus, les biais des données brutes se répercutent sans filtre humain.

Fine-tuning

Le fine-tuning (réglage fin) est le processus d’adaptation d’un modèle pré-entraîné à une nouvelle tâche ou un nouveau jeu de données spécifique. Au lieu d’entraîner un grand modèle à partir de zéro (coûteux en temps et en données), on prend un modèle déjà formé sur des données génériques (par exemple, Wikipédia ou ImageNet) et on « réentraîne » ses paramètres sur le nouvel objectif.

Définition sourcée : selon Nexa, « il s’agit d’adapter un modèle pré-entraîné à un nouvel ensemble de données ou à une tâche différente de celle d’origine ». Concrètement, on réentraîne tout ou partie du modèle avec un taux d’apprentissage plus faible, pour préserver les connaissances acquises tout en spécialisant le modèle.
Exemple : on peut fine-tuner BERT (pré-entraîné sur du texte général) sur un corpus médical pour qu’il comprenne le jargon des maladies, ou prendre ResNet (pré-entraîné sur ImageNet) et le réentraîner sur des radiographies pour détecter des anomalies médicales.
Analogie pédagogique : c’est comme prendre un musicien déjà formé sur plusieurs instruments (le modèle pré-entraîné) et lui apprendre un morceau spécifique d’un nouveau style (la nouvelle tâche). On ne recommence pas à zéro son apprentissage, on ajuste juste certains détails.
Limites/Enjeux : si le domaine de la nouvelle tâche est trop éloigné des données originales, le fine-tuning peut être inefficace. Il existe aussi un risque d’« oubli catastrophique » si l’on entraîne tous les paramètres sur de petites données, et une complexité accrue (geler certaines couches du réseau est souvent nécessaire). En outre, le fine-tuning propage potentiellement les biais initiaux du modèle pré-entraîné dans la nouvelle tâche.

Transfert d’apprentissage (Transfer Learning)

Le transfert d’apprentissage désigne la réutilisation des connaissances acquises par un modèle sur une tâche donnée pour en faciliter l’apprentissage d’une autre tâche. En pratique, un modèle est d’abord pré-entraîné sur une tâche source (souvent large et générique), puis adapté (par fine-tuning ou reconfiguration) à une tâche cible.

Définition sourcée : « La réutilisation d’un modèle pré-entraîné sur une nouvelle tâche est appelée ‘apprentissage par transfert’ ».
Exemple : un CNN (Convolutional Neural Network) entraîné sur des milliers d’images de la base ImageNet peut servir de point de départ pour détecter des anomalies dans des images médicales. La base visuelle (formes, textures) apprise sur ImageNet « transfère » à la tâche médicale, réduisant la quantité de données nécessaires.
Analogie pédagogique : c’est comme apprendre à conduire une voiture et transposer ces compétences pour piloter un camion. On adapte des acquis antérieurs à un nouveau contexte proche.
Limites/Enjeux : le transfert est efficace si les tâches source et cible sont liées ; sinon, le transfert peut mal réussir (phénomène de « transfert négatif »). Il peut également transférer des biais ou des erreurs du modèle source vers la cible.

Modèle de langage (Language Model)

Un modèle de langage (MLang) est un modèle statistique ou neuronal qui attribue une probabilité à des séquences de mots (ou de symboles) dans une langue. En d’autres termes, il apprend les régularités du langage pour prédire la suite d’un texte.

Définition sourcée : « Un modèle de langage estime la probabilité qu’un jeton ou une séquence de jetons se produisent dans une séquence de jetons plus longue ». Ici, un jeton peut être un mot complet, une partie de mot (sous-mot) ou un caractère.
Exemples : les modèles de langage sont utilisés pour la complétion de texte (prédiction du mot suivant), la génération automatique (réponse à une question), la traduction, la transcription automatique, etc. Par exemple, un modèle de langage entraîné sur des romans peut écrire le paragraphe suivant d’une histoire en fonction des phrases précédentes.
Analogie pédagogique : imaginez quelqu’un lisant un livre et devinant quel mot vient ensuite sur la base de ce qu’il a déjà lu. De même, le modèle a vu des milliards de mots et prévoit la suite la plus probable.
Limites/Enjeux : les modèles de langage classiques (n-grammes, RNN) peuvent manquer de contexte sur de longues distances ; les modèles modernes (transformers) pallient cela mais sont gourmands en données et calcul. Ils peuvent reproduire les biais présents dans les textes d’apprentissage (stéréotypes, désinformation) et, surtout, ils ne « comprennent » pas le sens de la même manière qu’un humain, ce qui peut mener à des hallucinations.

Grand modèle de langage (LLM, Large Language Model)

Un LLM est un modèle de langage d’apprentissage profond très grand (en termes de paramètres) et entraîné sur des volumes massifs de données textuelles. Les LLM exploitent l’architecture transformer et sont capables de générer du texte cohérent et souvent de grande qualité.

Définitions sourcées : Cloudflare définit le LLM comme « un modèle d’apprentissage automatique capable de comprendre et générer des textes en langage humain » et souligne qu’il opère sur « d’immenses volumes de données linguistiques ». Plus en détail, « un grand modèle de langage (LLM) est un programme d’IA capable, entre autres, de reconnaître et de générer du texte. Les LLM sont entraînés sur d’immenses ensembles de données, d’où l’emploi du terme « large ». »
Exemples : GPT-3, GPT-4, PaLM, LLaMA sont des exemples de LLM. Ces modèles peuvent écrire des articles, coder, traduire automatiquement, répondre à des questions en langage naturel, etc.
Analogie pédagogique : on peut comparer un LLM à un lecteur humain très assidu : il a « lu » des trillions de mots (Wikipédia, livres, sites web) et s’est entraîné à écrire ou prédire du texte de manière plausible. En revanche, sans véritable compréhension, il « parie » sur des suites de mots statistiques.
Limites/Enjeux : bien qu’extrêmement puissants, les LLM présentent des risques particuliers. Ils sont connus pour halluciner – c’est-à-dire générer des affirmations fausses avec assurance (voir infra) – et pour amplifier des biais si le corpus d’apprentissage est déséquilibré. Ils nécessitent d’énormes ressources de calcul et soulèvent des questions éthiques de confiance : comment être sûr que la réponse produite est fiable ? L’incapacité actuelle de ces modèles à expliquer leur raisonnement aggrave ces préoccupations (relier au point « explicabilité »).

Hallucination

Une hallucination en IA (ou confabulation) est une réponse fausse ou inventée qu’un modèle génératif présente comme un fait certain. Le terme vient de l’analogie avec les hallucinations humaines, mais ici il s’agit d’erreurs factuelles systématiques d’une IA.

Définition sourcée : « Dans le domaine de l’IA, une hallucination ou une confabulation est une réponse fausse ou trompeuse qui est présentée comme un fait certain ».
Exemple concret : un chatbot LLM peut fournir de « faux » résultats de recherche (inventer des références scientifiques) ou des données chiffrées incorrectes dans un rapport, alors qu’il génère le texte de façon convaincante.
Analogie pédagogique : c’est un peu comme si un élève devinait une réponse à un problème sans en connaître la solution correcte, puis l’énonçait avec confiance. Le modèle « imagine » le mot suivant sans ancrage dans la réalité vérifiable.
Limites/Enjeux : les hallucinations posent un grave problème de fiabilité et d’éthique. Dans un contexte médical, elles pourraient être dangereuses en donnant des diagnostics inventés. Dans un chatbot généraliste, elles peuvent induire en erreur l’utilisateur. Les chercheurs travaillent à réduire ce phénomène (via des données de meilleure qualité ou des techniques comme le RLHF), mais c’est un défi non résolu pour les LLM. Le fait que ces systèmes soient conçus pour « être persuasifs, pas véridiques » souligne la nécessité de vérification humaine des informations sensibles.

Biais

Le biais en IA désigne les distorsions ou préjugés systématiques intégrés dans un modèle ou un jeu de données, conduisant à des résultats injustes ou erronés pour certains groupes. Cela peut provenir de la manière dont les données d’apprentissage reflètent des inégalités sociétales.

Définition sourcée : selon IBM, « le biais de l’IA… fait référence à l’apparition de résultats biaisés en raison de préjugés humains qui faussent les données d’entraînement ou l’algorithme d’origine ».
Exemple concret : un algorithme de reconnaissance faciale entraîné sur un ensemble de visages surtout clairs peut avoir un taux d’erreur très élevé sur des visages foncés. De même, un modèle de recrutement automatisé formé sur d’anciens CV (souvent majoritairement masculins dans certains secteurs) peut défavoriser les candidates.
Analogie pédagogique : imaginez une balance dont un plateau est plus lourd ; même si l’on pose le même poids des deux côtés, l’évaluation sera faussée. De même, des données d’entraînement biaisées « déséquilibrent » le modèle.
Limites/Enjeux : les biais en IA ont des conséquences sociales graves (discrimination, perte de confiance). Ils peuvent survenir à différents niveaux (biais de sélection des données, de mesure, algorithmique, etc.). Les organisations doivent détecter et atténuer ces biais pour déployer des IA justes (par exemple, en diversifiant les données, en audité les algorithmes). La transparence et l’explicabilité sont clés pour identifier ces problèmes.

Explicabilité (Explainability)

L’explicabilité d’un système d’IA est sa capacité à fournir des explications compréhensibles sur la façon dont il parvient à une décision ou à une prédiction.

Définition sourcée (CNIL) : « Dans le domaine de l’IA, l’explicabilité est la capacité de mettre en relation et de rendre compréhensible les éléments pris en compte par le système d’IA pour la production d’un résultat ». Concrètement, cela signifie pouvoir expliquer comment les variables d’entrée (features) ont influé sur la décision finale.
Analogie pédagogique : c’est comme demander à un élève non seulement la réponse, mais aussi de détailler les étapes de son raisonnement.
Exemple concret : dans une application de crédit bancaire, un algorithme explicable pourra dire « votre demande a été refusée parce que votre historique de crédit présentait trop d’impayés, et ce critère avait le poids le plus important dans la décision ». Des méthodes comme LIME ou SHAP sont utilisées pour interpréter les modèles complexes.
Limites/Enjeux : beaucoup de modèles (notamment de Deep Learning) sont intrinsèquement complexes, rendant l’explication difficile. Pourtant, l’explicabilité est souvent requise par la réglementation (droit à l’explication du RGPD) et pour la confiance des utilisateurs. Le développement de modèles explicables est donc un enjeu majeur pour des applications critiques (santé, justice, finance) où il faut justifier les décisions automatisées.

RLHF (Reinforcement Learning from Human Feedback)

Le RLHF est une technique d’apprentissage par renforcement guidée par des retours humains. Elle sert à « aligner » un modèle (souvent un LLM) sur les préférences humaines en affinant ses sorties à l’aide d’évaluations humaines.

Définition sourcée : selon Wikipédia, « l’apprentissage par renforcement à partir de rétroaction humaine (RLHF) est une technique permettant d’aligner un agent intelligent avec les préférences humaines ». Elle fonctionne en deux étapes clés : d’abord on entraîne un modèle de préférences (Reward model) sur la base de classements faits par des annotateurs humains, puis on continue l’entraînement du modèle principal en renforçant les générations qui obtiennent de bonnes notes du modèle de préférences.
Exemple : pour ajuster GPT, des humains classent plusieurs réponses possibles à une même question. Le modèle est ensuite entraîné (via l’apprentissage par renforcement) pour générer plutôt les réponses mieux classées.
Analogie pédagogique : c’est comme entraîner un animal avec des friandises : l’IA reçoit un « renforcement » positif (une récompense) quand son comportement (texte généré) est jugé conforme aux attentes humaines.
Limites/Enjeux : le RLHF requiert une collecte soignée de feedback humain, ce qui est coûteux. Il peut encoder les biais des évaluateurs si ces derniers ne sont pas représentatifs. De plus, cela ne garantit pas l’absence d’erreurs factuelles : le modèle peut apprendre qu’une réponse erronée mais « plausible » est acceptable si les humains ne perçoivent pas immédiatement l’erreur. Toutefois, c’est l’une des méthodes les plus efficaces actuellement pour réduire l’insoutenabilité des LLM (biais de contenu, propos inappropriés, etc.).

Glossaire

Intelligence artificielle (IA) : Discipline informatique visant à créer des systèmes capables d’exécuter des tâches nécessitant l’intelligence humaine (raisonnement, perception, créativité).
Machine Learning (apprentissage automatique) : Branche de l’IA où l’ordinateur apprend automatiquement à partir de données sans être explicitement programmé.
Deep Learning (apprentissage profond) : Sous-catégorie du Machine Learning utilisant des réseaux de neurones profonds (multicouches) pour apprendre des représentations complexes à partir de données brutes.
Réseau de neurones artificiel : Modèle informatique inspiré du cerveau, composé de neurones artificiels interconnectés, utilisé pour le Deep Learning.
Modèle de langage : Modèle statistique ou neuronal qui prédit la probabilité de séquences de mots. Il sert de base aux modèles linguistiques et de génération de texte.
LLM (Large Language Model) : Modèle de langage de grande taille entraîné sur d’énormes jeux de données textuelles. Capable de générer un langage humain cohérent mais sujet à des hallucinations et biais.
Apprentissage supervisé : Entraînement avec données d’entrée et sorties « correctes » (étiquettes) fournies.
Apprentissage non supervisé : Entraînement sur données sans étiquettes, pour découvrir des structures cachées.
Apprentissage auto-supervisé : Technique où le modèle crée ses propres tâches d’entraînement à partir de données non étiquetées (p. ex. prédiction de mots masqués).
Fine-tuning (réglage fin) : Adaptation d’un modèle pré-entraîné à un nouveau domaine ou jeu de données spécifique.
Transfert d’apprentissage : Réutilisation des connaissances d’un modèle pré-entraîné sur une tâche pour en faciliter l’apprentissage sur une autre.
Hallucination : Erreur dans le contenu généré par un modèle d’IA, produisant une réponse fausse présentée comme vraie.
Biais de l’IA : Préjugés ou distorsions dans les résultats d’un modèle causés par des données d’entraînement inégales ou des algorithmes imparfaits.
Explicabilité : Capacité d’un système d’IA à expliquer son raisonnement ou ses décisions de façon compréhensible.
RLHF : Méthode d’apprentissage par renforcement guidée par la rétroaction humaine, utilisée pour aligner un modèle sur des préférences humaines.

Comparaison : IA / ML / DL / LLM

Concept	Définition (simplifiée)	Échelle de données requises	Exemples d’applications courantes	Forces principales	Limites principales
IA (général)	Systèmes informatiques pouvant simuler des fonctions cognitives humaines.	Variable (dépend du cas)	Systèmes experts, robotique, assistants virtuels.	Peut englober tout type de tâche « intelligente ».	Généralement spécialisée, pas d’IA « forte ». Coûts énergétiques et éthiques élevés.
ML	Apprentissage automatique : algorithmes qui apprennent de données sans être programmés explicitement.	Modérée (besoin de jeux d’entraînement de taille moyenne)	Classification d’images, recommandation de produits, détection de fraude.	Adaptabilité ; souvent plus rapide et moins coûteux qu’entraînement from scratch.	Performances limitées par la qualité des données. Peut être biaisé, manque d’explicabilité.
DL	Sous-ensemble du ML utilisant des réseaux de neurones profonds pour traiter des données complexes.	Très grande (exige beaucoup de données annotées, GPU)	Reconnaissance vocale, vision par ordinateur (diagnostic médical), jeux vidéo (AlphaGo).	Excellente performance sur données non structurées, hiérarchisation automatique des caractéristiques.	Très gourmand en ressources ; mode boîte noire difficile à interpréter ; surapprentissage.
LLM	Modeles de langage de grande taille (transformers) entraînés sur d’énormes corpus textuels.	Extrême (milliers de milliards de mots)	Chatbots (GPT), aide à la rédaction, traduction automatique, synthèse vocale.	Génération de texte humain convaincant, adaptation à de nombreuses tâches de NLP.	Hallucinations, biais appris, manque de compréhension sémantique réelle ; coût d’entraînement élevé.

Notes : Chaque concept est un sous-ensemble du précédent (IA englobe ML qui englobe DL). L’échelle des données indique l’ampleur typique requise pour obtenir des performances de pointe. Les forces et limites listées reflètent des tendances générales documentées par la littérature et l’industrie.

Diagramme des relations hiérarchiques

Le diagramme ci-dessus illustre que l’intelligence artificielle (IA) est le concept le plus large, englobant tous les systèmes informatiques « intelligents ». L’apprentissage automatique (Machine Learning) en est un sous-ensemble, fondé sur l’apprentissage à partir de données. À l’intérieur du ML, l’apprentissage profond (Deep Learning) désigne les méthodes reposant sur des réseaux de neurones multicouches. Enfin, les grands modèles de langage (LLM) sont des exemples spécifiques de modèles de Deep Learning appliqués au traitement de textes en très grande échelle. Ce schéma hiérarchique aide à visualiser ces définitions imbriquées et leur évolution historique.

Sources : définitions tirées d’articles de l’Union européenne, de l’Institut du Cerveau et de ressources industrielles comme IBM et Cloudflare, ainsi que de la littérature académique (principes du machine learning). Ces sources privilégient des formulaires français ou bilingues officiels pour garantir la fiabilité des définitions.

Annexe — Sources web et références utiles

Cette annexe regroupe des sources permettant d’approfondir les principales notions présentées dans l’article : intelligence artificielle, apprentissage automatique, deep learning, modèles de langage, LLM, transformers, fine-tuning, RAG, risques et gouvernance.

1. Sources institutionnelles et réglementaires

Union européenne — Règlement IA / AI Act

Le règlement européen sur l’intelligence artificielle, ou AI Act, donne une définition juridique actuelle du « système d’IA ». Il définit un système d’IA comme un système automatisé conçu pour fonctionner avec différents niveaux d’autonomie, pouvant s’adapter après déploiement, et générant des sorties comme des prédictions, du contenu, des recommandations ou des décisions influençant des environnements physiques ou virtuels.

Source : Règlement européen sur l’intelligence artificielle — EUR-Lex

Utilité dans l’article :

définition réglementaire de l’IA ;
distinction entre système d’IA, fournisseur, déployeur, risque ;
cadre européen de confiance, sécurité et droits fondamentaux.

OCDE — Définition d’un système d’IA

L’OCDE propose une définition internationale d’un système d’IA. Elle est utile pour comprendre l’IA au-delà du seul cadre européen, notamment dans les domaines de la gouvernance, de l’économie et des politiques publiques.

Source : OCDE — Definition of an AI system

Utilité dans l’article :

définition générale et internationale de l’IA ;
clarification du périmètre : machine learning, vision par ordinateur, NLP, robotique, aide à la décision.

NIST — AI Risk Management Framework

Le NIST propose un cadre de gestion des risques liés à l’intelligence artificielle. Cette source est particulièrement utile pour aborder les notions de confiance, robustesse, sécurité, gouvernance, transparence et responsabilité.

Source : NIST — AI Risk Management Framework

Utilité dans l’article :

risques liés à l’IA ;
IA digne de confiance ;
gouvernance, documentation, surveillance et responsabilité ;
cycle de vie des systèmes d’IA.

2. Sources techniques et pédagogiques

Google Machine Learning Crash Course — LLM, tokens et contexte

Google propose une introduction pédagogique aux modèles de langage, aux tokens, au contexte et aux grands modèles de langage. C’est une bonne source pour expliquer simplement les bases techniques des LLM.

Source : Google Machine Learning Crash Course — Grands modèles de langage

Utilité dans l’article :

définition de token ;
fonctionnement général d’un modèle de langage ;
notion de contexte ;
différence entre modèles classiques et grands modèles de langage.

3. Articles fondateurs et références académiques

“Attention Is All You Need” — architecture Transformer

L’article Attention Is All You Need, publié en 2017, introduit l’architecture Transformer. Cette architecture repose sur le mécanisme d’attention et constitue la base technique de nombreux modèles modernes de traitement du langage naturel.

Source : Attention Is All You Need — arXiv

Utilité dans l’article :

expliquer les transformers ;
introduire le mécanisme d’attention ;
comprendre pourquoi cette architecture est centrale dans les LLM modernes.

BERT — pré-entraînement bidirectionnel

L’article BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding présente BERT, un modèle fondé sur des représentations bidirectionnelles profondes du langage. Il illustre l’importance du pré-entraînement et du fine-tuning dans le traitement automatique du langage.

Source : BERT — arXiv

Utilité dans l’article :

apprentissage auto-supervisé ;
pré-entraînement ;
fine-tuning ;
compréhension du langage naturel.

GPT-3 — passage à l’échelle des modèles de langage

L’article Language Models are Few-Shot Learners présente GPT-3, un modèle de langage autorégressif de grande taille. Il montre l’importance du passage à l’échelle dans les performances des modèles de langage.

Source : Language Models are Few-Shot Learners — arXiv

Utilité dans l’article :

notion de paramètres ;
passage à l’échelle ;
few-shot learning ;
différence entre entraînement, fine-tuning et prompt.

RAG — Retrieval-Augmented Generation

L’article Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks présente le principe du RAG, qui consiste à combiner un modèle de langage avec une source documentaire externe afin d’améliorer la qualité des réponses sur des sujets nécessitant des connaissances précises.

Source : Retrieval-Augmented Generation — arXiv

Utilité dans l’article :

expliquer le RAG ;
distinguer connaissances internes du modèle et connaissances externes ;
comprendre pourquoi le RAG peut limiter certaines hallucinations ;
introduire la notion de recherche documentaire augmentée.

IA générative — définition académique

L’article Generative AI de Feuerriegel et al. propose une définition générale de l’IA générative comme ensemble de techniques capables de produire du contenu nouveau, comme du texte, des images, de l’audio ou du code.

Source : Generative AI — arXiv

Utilité dans l’article :

définition d’IA générative ;
exemples : texte, image, audio, code ;
distinction entre IA prédictive et IA générative.

4. Source de suivi global

Stanford AI Index

Le rapport AI Index de Stanford suit l’évolution mondiale de l’intelligence artificielle : recherche, économie, matériel, coûts, adoption, gouvernance et impacts sociétaux.

Source : Stanford AI Index Report

‹ Retour aux articles