Les 6 niveaux d'autonomie de l'IA (2026) : un cadre pratique

2026-04-25 · Alex

Cadre pratique en 6 niveaux pour l'autonomie de l'IA en 2026, synthétisant SAE J3016, Levels of AGI de DeepMind, la feuille de route en 5 paliers d'OpenAI, le NIST AI RMF et le Règlement IA UE.

Du chatbot à l'agent autonome, les systèmes IA couvrent désormais une échelle d'indépendance claire. En empruntant aux niveaux SAE de la conduite autonome, aux Levels of AGI de DeepMind et à la feuille de route interne en 5 paliers d'OpenAI, ce guide situe les outils actuels — et explique ce qui change à chaque barreau.

Pourquoi un cadre par niveaux est nécessaire

Quand SAE International a publié J3016 en 2014 (révisé en 2021), il a donné à l'industrie automobile un vocabulaire commun : une Tesla en Autopilot est Niveau 2 (aide à la conduite), un robotaxi Waymo est Niveau 4 (haute autonomie dans une zone définie). Cette taxonomie unique a mis fin à une décennie de marketing confus et permis aux régulateurs d'écrire des règles qui visaient enfin la bonne capacité.

L'IA est aujourd'hui dans le brouillard où était l'automobile vers 2012. Les éditeurs appellent presque tout un *agent*. Certains sont des chatbots réactifs, d'autres exécutent des plans multi-étapes sur des systèmes réels. Le papier Levels of AGI de Google DeepMind (Morris et al., 2024) et la feuille de route en 5 paliers utilisée en interne chez OpenAI (révélée par Bloomberg en juillet 2024) sont les premières tentatives sérieuses de donner à l'IA la clarté que SAE a donnée aux voitures.

Les 6 niveaux, de L0 à L5

En synthétisant SAE J3016, *Levels of AGI* de DeepMind et les taxonomies d'IA agentique issues d'Anthropic, Microsoft et Salesforce, une seule échelle à 6 barreaux décrit la plupart des systèmes réels déployés aujourd'hui. La variable clé à chaque étape n'est pas l'intelligence brute, c'est le degré d'approbation humaine requis avant que le système n'agisse.

La plupart des outils d'entreprise étiquetés *Copilot* ou *Assistant* vivent au L1 ou au L2. La plupart des produits étiquetés *Agent* en 2026 sont honnêtement L3. Les vrais systèmes L4 (long horizon, auto-correctifs, opérant sans approbation à chaque étape) sont rares ; le L5 (ouvert, autodirigé) n'existe pas encore hors démos de recherche. Savoir sur quel barreau votre outil se situe vraiment est ce qui sépare un déploiement sûr d'un procès médiatisé.

Ce qui change juridiquement et opérationnellement à chaque niveau

L'autonomie n'est pas qu'une spécification produit — elle déclenche de la réglementation. Le Règlement européen sur l'IA classe les systèmes par *risque*, mais ses obligations de transparence et de supervision humaine augmentent de fait avec l'autonomie : plus le système agit seul, plus vous devez en informer les gens et plus un humain doit pouvoir le superviser de près. Les standards de sécurité et de gestion des risques pointent dans le même sens, en réclamant une surveillance, une journalisation et des contrôles de retour arrière plus stricts à mesure qu'on monte de L1 vers L4.

La tension centrale est simple : plus l'autonomie est élevée, plus il est difficile de garder le comportement réel de l'agent aligné sur ce que vous voulez vraiment — le problème d'alignement. Au L1 c'est trivial, au L4 cela domine l'effort d'ingénierie. C'est pourquoi les grands laboratoires publient désormais des politiques de sécurité qui conditionnent les déploiements à plus haute autonomie au franchissement de seuils d'évaluation précis, plutôt que de les livrer sur la seule capacité.

Comment choisir votre niveau cible : un test en 4 questions

Alors, comment choisir un barreau pour de vrai ? Quand nous avons construit les contrôles d'autonomie dans Agentys, chaque cas d'usage candidat est passé par le même filtre en quatre questions : réversibilité, rayon d'impact, observabilité, temps de récupération. Les réponses vous disent le niveau le plus haut que vous pouvez livrer en sûreté — pas le plus bas que votre modèle sait techniquement atteindre.

La plupart des équipes prennent le problème à l'envers. Elles partent de *que sait faire le modèle ?* et atterrissent au L4 parce que la démo était impressionnante. La bonne question est *quel mode d'échec suis-je en train de souscrire ?* — et la réponse vous ramène presque toujours au L2 ou au L3. Nous avons vu des dizaines de pilotes échouer ainsi ; ceux qui livrent et tiennent sont ceux qui ont choisi le barreau *défensivement* d'abord, puis n'ont monté que lorsque les journaux d'audit ont prouvé que le barreau inférieur était devenu ennuyeux.

Choisissez le niveau d'autonomie le plus bas qui résout votre problème, pas le plus haut que votre fournisseur sait vendre. La leçon de SAE dans l'automobile se transpose bien : l'essentiel de la valeur se trouve aux L2 et L3, la falaise d'ingénierie et de responsabilité se situe entre L3 et L4, et presque personne en 2026 n'a besoin du L5. Connaître le barreau réel sur lequel votre IA se trouve est le premier audit que quiconque déploie ces systèmes devrait mener.