← tous les articles

LLM : ce que votre assistant IA a vraiment dans le ventre

palier I · fondations · 9 min · article interactif ✦

Vous l'utilisez peut-être déjà tous les jours. Mais si demain, en comité, on vous demande « c'est quoi exactement, un LLM ? », que répondez-vous ? Cet article vous donne la réponse qui tient en une réunion — avec le schéma à redessiner au tableau, et un quiz pour vérifier que c'est acquis.

Un moteur de prédiction, pas une encyclopédie

Un LLM (Large Language Model, grand modèle de langage) est un programme entraîné sur d'immenses volumes de texte pour faire une seule chose : prédire la suite la plus probable d'un texte. Quand il « répond » à votre question, il ne consulte pas une base de connaissances — il génère, mot après mot, la continuation la plus plausible de votre demande.

Vos mots découpés en « tokens » Le modèle prédit le mot suivant le plus probable puis recommence, mot après mot boucle de génération Une réponse plausible — pas garantie
ce qui se passe réellement quand vous appuyez sur Entrée
L'intuition clé : un LLM ne sait pas, il prédit. C'est précisément pour ça qu'il est si fluide — et parfois si confiant dans l'erreur.

Cette mécanique explique ses forces : reformuler, synthétiser, structurer, traduire, rédiger des premiers jets — tout ce qui relève de la forme du langage, il l'exécute à un niveau redoutable. Elle explique aussi sa faiblesse signature : l'hallucination, cette réponse fausse mais parfaitement formulée. Quand le modèle ne « sait » pas, il ne se tait pas : il produit la suite la plus plausible. Avec aplomb.

D'où vient ce qu'il « sait » ?

De son entraînement : des mois de calcul sur des milliards de pages de texte, figés à une date donnée — c'est pour cela qu'un modèle ignore l'actualité récente. Et de sa fenêtre de contexte : tout ce que vous lui donnez dans la conversation (documents, consignes, historique). Entre deux conversations, il ne se souvient de rien. Ce que vous ne lui dites pas, il ne le sait pas — et risque de l'inventer.

Retenez la hiérarchie : ce que vous fournissez dans le contexte > ce qu'il a mémorisé à l'entraînement. Les approches sérieuses en entreprise (comme le RAG, au palier II) exploitent exactement ce levier.

Les trois conséquences pour un cadre

testez-vous — comme dans le parcours
Votre assistant IA vous sort un chiffre de marché précis, avec une source à l'appui. Votre réflexe ?
✓ Exactement. Un LLM peut halluciner un chiffre et la référence qui va avec, avec le même aplomb. La vérification à la source fait partie du métier.
Pas tout à fait — relisez la section sur les hallucinations et réessayez.

Pour aller plus loin

Pourquoi deux réponses différentes à la même question ?
La prédiction est probabiliste : à chaque mot, le modèle tire parmi les suites les plus probables, avec une part de hasard réglable (la « température »). Deux exécutions peuvent diverger. Pour des usages reproductibles (classement, extraction), on réduit cette variabilité ; pour de la créativité, on l'augmente.
GPT, Claude, Gemini, Mistral… c'est quoi la différence ?
Même principe de fond, mais des données d'entraînement, des tailles et des réglages différents — donc des personnalités et des forces différentes. Pour un cadre, le critère de choix n'est pas le classement technique du mois : c'est le contrat (confidentialité des données), l'intégration à vos outils, et la qualité sur VOS cas d'usage, à tester.
La question à poser en réunion
« Sur ce cas d'usage, attend-on du modèle de la forme (résumer, rédiger, reformuler) ou du fait (chiffres, droit, données récentes) ? » Si c'est du fait, il faudra brancher le modèle sur des sources fiables — c'est exactement le rôle du RAG.
Cette notion est un niveau complet du parcours IAPLC.

Dans la formation, vous la pratiquez sur VOTRE contexte : leçons générées pour votre métier, exercices interactifs, progression gamifiée.

Générer mon parcours →