Intelligence artificielle · Article
Abécédaire de l'IA
LLM, IA, Token, agent, mais qu'est ce que c'est ce charabia ?
IA, LLM, modèles génératifs : les principales définitions à connaître
L’intelligence artificielle est partout, mais le vocabulaire qui l’entoure est souvent flou. On mélange facilement IA, machine learning, deep learning, LLM, ChatGPT, modèle génératif, agent IA, etc.
Pourtant, ces termes ne désignent pas tous la même chose. Certains parlent d’un domaine scientifique, d’autres d’une technique, d’autres encore d’un type de logiciel ou d’un usage.
Cet article propose une clarification simple des principales notions.
1. Intelligence artificielle : IA
L’intelligence artificielle, ou IA, désigne l’ensemble des méthodes permettant à une machine d’effectuer des tâches que l’on associe habituellement à l’intelligence humaine.
Cela peut inclure :
✅ reconnaître une image
✅ comprendre ou produire du langage
✅ jouer aux échecs ou au go
✅ recommander un film
✅ détecter une fraude bancaire
✅ conduire un véhicule
✅ générer du texte, du code, de la musique ou des images.
L’IA n’est donc pas une technologie unique. C’est un grand domaine qui regroupe plusieurs approches.
L’IA consiste à faire accomplir par une machine des tâches qui semblent nécessiter une forme d’intelligence.
Mais attention : une IA ne “pense” pas nécessairement comme un humain. Elle peut produire un résultat intelligent sans avoir de conscience, d’intention ou de compréhension au sens humain.
2. IA faible et IA forte
On distingue souvent deux grandes catégories théoriques.
IA faible
L’IA faible est une IA spécialisée dans une tâche ou une famille de tâches.
Exemples :
✅ un correcteur orthographique
✅ un système de reconnaissance faciale
✅ un moteur de recommandation
✅ un assistant conversationnel
✅ un modèle de traduction automatique.
Même très performante, une IA faible reste limitée à son domaine d’usage.
Aujourd’hui, toutes les IA réellement utilisées sont des IA faibles, même les plus impressionnantes.
IA forte
L’IA forte désigne une intelligence artificielle capable de comprendre, raisonner, apprendre et s’adapter de manière générale, comme un humain ou au-delà.
Elle serait capable de transférer ses compétences d’un domaine à l’autre sans entraînement spécifique massif.
À ce jour, l’IA forte reste une hypothèse théorique. Elle n’existe pas encore de manière démontrée.
3. AGI : intelligence artificielle générale
L’AGI, pour Artificial General Intelligence, signifie intelligence artificielle générale.
C’est une notion proche de l’IA forte, mais souvent utilisée dans un contexte plus technique ou prospectif.
Une AGI serait capable de :
✅ comprendre des situations nouvelles
✅ apprendre de manière autonome
✅ résoudre des problèmes très variés
✅ transférer des connaissances entre domaines
✅ s’adapter à des environnements inconnus.
Les LLM modernes peuvent donner l’impression d’aller dans cette direction, mais ils restent encore limités, notamment par leur manque de compréhension robuste du monde, leur dépendance aux données d’entraînement et leur tendance à produire des erreurs plausibles.
4. Machine Learning : apprentissage automatique
Le machine learning, ou apprentissage automatique, est une sous-discipline de l’IA.
Au lieu de programmer explicitement toutes les règles, on donne à la machine des données, puis elle apprend des régularités statistiques.
Exemple classique :
Au lieu d’écrire manuellement toutes les règles permettant de reconnaître un chat sur une image, on entraîne un modèle avec de nombreuses images de chats et de non-chats. Le modèle apprend progressivement à distinguer les caractéristiques utiles.
Le machine learning repose donc sur trois éléments principaux :
✅ des données
✅ un algorithme d’apprentissage
✅ un modèle entraîné.
Le machine learning consiste à apprendre à partir de données plutôt qu’à suivre uniquement des règles écrites à la main.
5. Modèle
Un modèle est le résultat d’un apprentissage.
Dans le contexte de l’IA, un modèle est une structure mathématique entraînée pour produire des prédictions ou des réponses à partir d’entrées.
| Entrée | Sortie possible |
|---|---|
| Image | “chat”, “chien”, “voiture” |
| Texte | résumé, traduction, réponse |
| Données médicales | probabilité de risque |
| Historique d’achat | recommandation de produit |
| Code source | suggestion de correction |
Un modèle n’est pas une base de données classique. Il ne contient pas simplement des documents rangés proprement. Il encode des régularités apprises pendant l’entraînement.
6. Deep Learning : apprentissage profond
Le deep learning, ou apprentissage profond, est une branche du machine learning fondée sur des réseaux de neurones artificiels comportant de nombreuses couches.
Le terme “profond” vient justement de cette accumulation de couches successives.
Le deep learning est particulièrement efficace pour traiter :
✅ les images
✅ le son
✅ le langage naturel
✅ la vidéo
✅ les données complexes et massives.
Les grands progrès récents de l’IA, notamment dans la vision, la traduction automatique et les LLM, sont largement liés au deep learning.
7. Réseau de neurones artificiels
Un réseau de neurones artificiels est un modèle inspiré de façon très simplifiée du fonctionnement du cerveau.
Il est composé de couches de “neurones” artificiels qui transforment progressivement les données d’entrée.
Par exemple, pour une image :
✅ les premières couches peuvent détecter des formes simples
✅ les couches intermédiaires peuvent reconnaître des motifs
✅ les couches profondes peuvent identifier des objets complexes.
Il ne faut toutefois pas prendre l’analogie biologique trop au pied de la lettre. Un réseau de neurones artificiels n’est pas un cerveau miniature. C’est avant tout une construction mathématique optimisée par calcul.
8. NLP : traitement automatique du langage naturel
Le NLP, pour Natural Language Processing, désigne le traitement automatique du langage naturel.
C’est le domaine de l’IA qui s’intéresse au langage humain.
Il couvre notamment :
✅ la traduction automatique
✅ la correction grammaticale
✅ l’analyse de sentiments
✅ la recherche d’information
✅ le résumé automatique
✅ les assistants conversationnels
✅ la génération de texte.
Les LLM appartiennent au domaine du NLP, même s’ils dépassent aujourd’hui largement la simple manipulation de texte.
9. IA générative
L’IA générative désigne les systèmes capables de produire du contenu nouveau.
Elle peut générer :
✅ du texte
✅ du code
✅ des images
✅ de la musique
✅ de la vidéo
✅ des voix synthétiques
✅ des modèles 3D.
Exemples d’IA générative :
✅ un modèle qui écrit un article
✅ un modèle qui génère une image à partir d’un prompt
✅ un modèle qui compose une musique
✅ un modèle qui produit du code source.
L’IA générative ne se limite donc pas aux chatbots. Les LLM en sont une catégorie importante, mais pas la seule.
10. LLM : Large Language Model
Un LLM, pour Large Language Model, est un grand modèle de langage.
Il s’agit d’un modèle entraîné sur de très grandes quantités de texte afin de prédire, générer et manipuler du langage.
Un LLM peut notamment :
✅ répondre à des questions
✅ résumer un texte
✅ traduire
✅ rédiger un email
✅ expliquer du code
✅ générer du code
✅ reformuler une idée
✅ tenir une conversation
✅ analyser un document.
Le principe de base est relativement simple à formuler :
Un LLM prédit le prochain fragment de texte le plus probable en fonction du contexte.
Mais cette formulation est trompeuse par sa simplicité. À très grande échelle, cette capacité de prédiction produit des comportements complexes : raisonnement apparent, synthèse, style, analogies, explications, programmation, etc.
Un LLM ne fonctionne pas comme un moteur de recherche classique. Il ne va pas forcément chercher une réponse dans une base documentaire. Il génère une réponse à partir de ce qu’il a appris et du contexte fourni.
11. Token
Un token est une unité de texte utilisée par les modèles de langage.
Un token peut correspondre à :
✅ un mot
✅ un morceau de mot
✅ une ponctuation
✅ un espace
✅ une partie de code.
Les LLM ne lisent pas directement les textes comme nous. Ils transforment le texte en tokens, puis manipulent ces tokens sous forme numérique.
Les tokens sont importants car ils servent à mesurer :
✅ la taille d’un prompt
✅ la longueur d’une réponse
✅ le coût d’utilisation d’un modèle
✅ la taille de la fenêtre de contexte.
12. Fenêtre de contexte
La fenêtre de contexte désigne la quantité maximale d’information qu’un modèle peut prendre en compte à un instant donné.
Elle inclut généralement :
✅ le message de l’utilisateur
✅ les messages précédents
✅ les documents fournis
✅ les instructions système
✅ la réponse en cours de génération.
Une grande fenêtre de contexte permet d’analyser des documents plus longs ou de conserver davantage d’éléments dans une conversation.
Mais il ne faut pas confondre fenêtre de contexte et mémoire permanente.
Un modèle peut prendre en compte ce qui est dans son contexte immédiat, mais cela ne signifie pas qu’il “se souvient” durablement de tout.
13. Prompt
Un prompt est l’instruction donnée à un modèle.
Cela peut être une simple question :
Explique-moi ce qu’est un LLM.
Ou une demande plus structurée :
Rédige un article pédagogique en français, avec des exemples simples, sur les différences entre IA, machine learning et LLM.
La qualité du prompt influence fortement la qualité de la réponse.
Un bon prompt précise souvent :
✅ le sujet
✅ le niveau attendu
✅ le format de sortie
✅ le ton
✅ les contraintes
✅ les exemples éventuels.
Le prompt est donc une forme d’interface entre l’humain et le modèle.
14. Hallucination
Une hallucination désigne une réponse produite par une IA qui semble plausible mais qui est fausse, inventée ou non vérifiée.
Exemples :
✅ une fausse citation
✅ une référence inexistante
✅ une date incorrecte
✅ une explication convaincante mais erronée
✅ une fonction de programmation qui n’existe pas
✅ une source inventée.
Le mot “hallucination” est pratique, mais il peut être trompeur. Le modèle ne voit pas des choses imaginaires comme un humain. Il génère simplement une sortie statistiquement plausible qui peut être fausse.
Un LLM peut être très convaincant tout en ayant tort.
15. Embedding
Un embedding est une représentation numérique d’une information.
Un mot, une phrase, un paragraphe ou un document peut être transformé en vecteur, c’est-à-dire en liste de nombres.
Ces vecteurs permettent de comparer le sens approximatif de plusieurs textes.
Par exemple, les phrases suivantes auront probablement des embeddings proches :
✅ “Le chat dort sur le canapé.” ✅ “Un félin se repose sur le sofa.”
Même si les mots sont différents, le sens est proche.
Les embeddings sont très utilisés pour :
✅ la recherche sémantique
✅ le classement de documents
✅ les systèmes de recommandation
✅ le RAG
✅ la détection de similarité.
16. RAG : Retrieval-Augmented Generation
Le RAG, pour Retrieval-Augmented Generation, signifie génération augmentée par récupération d’information.
L’idée est simple :
- l’utilisateur pose une question
- le système recherche des documents pertinents
- les passages trouvés sont fournis au modèle
- le modèle répond en s’appuyant sur ces sources.
Le RAG permet de limiter certaines faiblesses des LLM :
✅ connaissances obsolètes
✅ hallucinations
✅ absence d’accès aux documents internes
✅ besoin de citer des sources
✅ besoin de réponses ancrées dans des données précises.
Exemple :
Une entreprise peut utiliser un RAG pour interroger sa documentation interne, ses procédures, ses tickets ou ses contrats.
Le RAG ne rend pas le modèle infaillible, mais il améliore fortement la traçabilité et la fiabilité des réponses lorsque les documents récupérés sont pertinents.
17. Fine-tuning
Le fine-tuning consiste à réentraîner partiellement un modèle existant sur des données spécifiques.
L’objectif peut être :
✅ adapter le style du modèle
✅ améliorer ses performances sur un domaine précis
✅ lui apprendre un format de réponse
✅ spécialiser son comportement.
Exemple :
Un modèle généraliste peut être fine-tuné sur des documents juridiques, médicaux, techniques ou commerciaux.
Cependant, le fine-tuning n’est pas toujours nécessaire. Pour beaucoup d’usages, un bon prompt, un RAG bien conçu ou des outils externes suffisent.
18. Entraînement et inférence
Il faut distinguer deux phases.
Entraînement
L’entraînement est la phase pendant laquelle le modèle apprend à partir de grandes quantités de données.
C’est une phase coûteuse en :
✅ calcul
✅ énergie
✅ temps
✅ données
✅ infrastructure.
Pour les grands modèles modernes, l’entraînement nécessite souvent des GPU spécialisés et des centres de données importants.
Inférence
L’inférence est la phase d’utilisation du modèle entraîné.
Quand on pose une question à un chatbot IA, on utilise le modèle en inférence.
L’inférence est généralement moins coûteuse que l’entraînement, mais elle peut devenir très consommatrice à grande échelle, surtout avec des millions d’utilisateurs.
19. Transformer
Le Transformer est une architecture de réseau de neurones devenue centrale dans l’IA moderne.
Elle est particulièrement adaptée au traitement du langage grâce à un mécanisme appelé attention.
L’attention permet au modèle de pondérer l’importance des différents éléments d’un texte.
Par exemple, dans une phrase longue, le modèle peut relier un pronom à son sujet ou repérer les mots importants pour comprendre le sens global.
Les LLM modernes reposent très largement sur l’architecture Transformer ou sur des variantes de celle-ci.
20. Modèle multimodal
Un modèle multimodal est un modèle capable de traiter plusieurs types de données.
Par exemple :
✅ texte
✅ image
✅ audio
✅ vidéo
✅ code
✅ documents
✅ tableaux.
Un modèle multimodal peut répondre à des questions sur une image, analyser un graphique, décrire une photo, lire un document ou combiner plusieurs sources d’information.
C’est une évolution importante des IA modernes : elles ne sont plus limitées au texte.
21. Agent IA
Un agent IA est un système qui utilise un modèle pour atteindre un objectif en plusieurs étapes.
Un agent peut éventuellement :
✅ planifier une tâche
✅ appeler des outils
✅ chercher de l’information
✅ écrire du code
✅ exécuter une action
✅ vérifier un résultat
✅ recommencer si nécessaire.
Exemple :
Analyse ce dépôt Git, trouve les problèmes de migration vers .NET 8, propose des corrections et crée un rapport.
La notion d’agent est puissante, mais elle est aussi souvent utilisée de manière marketing. Tous les “agents IA” ne sont pas réellement autonomes ou fiables.
22. Paramètres
Les paramètres sont les valeurs internes apprises par un modèle pendant l’entraînement.
Quand on parle d’un modèle “7B”, “13B” ou “70B”, cela signifie généralement :
✅ 7 milliards de paramètres
✅ 13 milliards de paramètres
✅ 70 milliards de paramètres.
En général, plus un modèle a de paramètres, plus il peut représenter des régularités complexes. Mais la taille ne fait pas tout.
La qualité dépend aussi :
✅ des données d’entraînement
✅ de l’architecture
✅ de la méthode d’entraînement
✅ du fine-tuning
✅ de la taille du contexte
✅ de l’optimisation
✅ de l’usage visé.
Un petit modèle bien entraîné peut être meilleur qu’un gros modèle mal adapté.
23. Quantification
La quantification consiste à réduire la précision numérique des poids d’un modèle afin de diminuer sa taille et sa consommation mémoire.
Par exemple, un modèle peut être stocké en :
✅ 16 bits
✅ 8 bits
✅ 4 bits.
Plus la quantification est forte, plus le modèle est léger et facile à faire tourner localement. En contrepartie, il peut perdre en qualité.
C’est une notion importante pour les modèles locaux, notamment avec des outils comme Ollama, LM Studio ou llama.cpp.
24. Température
La température est un paramètre qui influence le caractère prévisible ou créatif des réponses d’un modèle.
| Température | Effet |
|---|---|
| Basse | Réponse plus précise, stable, conservatrice |
| Moyenne | Bon équilibre |
| Élevée | Réponse plus créative, mais plus risquée |
Pour du code, de l’analyse ou des réponses factuelles, une température basse est souvent préférable.
Pour de la créativité, une température plus élevée peut être utile.
25. Différence entre IA, LLM et ChatGPT
Ces trois notions sont souvent confondues.
| Terme | Définition |
|---|---|
| IA | Domaine général visant à produire des comportements intelligents avec des machines |
| Machine learning | Branche de l’IA fondée sur l’apprentissage à partir de données |
| Deep learning | Branche du machine learning fondée sur des réseaux de neurones profonds |
| LLM | Grand modèle de langage spécialisé dans le traitement et la génération de texte |
| ChatGPT | Produit conversationnel utilisant des modèles d’IA |
| IA générative | IA capable de produire du contenu nouveau |
On peut représenter la relation ainsi :
Intelligence artificielle
└── Machine learning
└── Deep learning
└── Modèles de langage
└── LLM