Fenêtre de contexte
Quantité maximale d'information qu'un modèle IA peut traiter en une seule requête, mesurée en tokens (mots ou fragments de mots).
La fenêtre de contexte (context window) détermine combien de texte un modèle peut « voir » simultanément. C'est sa mémoire de travail.
Ordres de grandeur en 2026
- 32K tokens ≈ 50 pages — suffisant pour un document
- 200K tokens ≈ 300 pages — un livre entier
- 1M+ tokens — plusieurs livres, un codebase complet
Impact pratique
Une fenêtre plus grande permet d'analyser des documents longs sans découpage (chunking), de maintenir des conversations longues, et de traiter des projets entiers en une seule passe. Mais attention : plus le contexte est grand, plus le coût et le temps de traitement augmentent.