Auto-correction métacognitive pour systèmes multi-agents via reconstruction guidée par prototype

17 octobre 2025

Les systèmes multi-agents basés sur des modèles de langage de grande taille excellent dans la résolution collaborative de problèmes mais restent fragiles face aux erreurs en cascade, où une seule étape défectueuse peut se propager à travers les agents et perturber l'ensemble du processus. Pour résoudre cette limitation, les chercheurs proposent MASC, un cadre métacognitive qui dote ces systèmes d'une capacité de détection d'erreurs non supervisée et d'auto-correction en temps réel au niveau de chaque étape.

L'approche repose sur deux conceptions complémentaires : la reconstruction de la prochaine exécution, qui prédit l'embedding de l'étape suivante à partir de la requête et de l'historique des interactions pour capturer la cohérence causale, et l'amélioration guidée par prototypes, qui apprend un a priori sur les embeddings des étapes normales pour stabiliser la reconstruction et le scoring d'anomalie dans des contextes épars comme les premières étapes. Lorsqu'une anomalie est détectée, MASC déclenche un agent de correction pour réviser la sortie de l'agent actif avant que l'information ne se propage en aval.

Les évaluations sur le benchmark Who&When montrent que MASC surpasse systématiquement toutes les méthodes de référence, améliorant la détection d'erreurs au niveau des étapes jusqu'à 8,47% en AUC-ROC. Intégré dans divers cadres de systèmes multi-agents, il procure des gains cohérents de bout en bout indépendamment de l'architecture, confirmant que la surveillance métacognitive et la correction ciblée peuvent atténuer la propagation des erreurs avec une surcharge minimale.

Points clés

Détection non supervisée d'erreurs en temps réel
Reconstruction de l'embedding de l'étape suivante
Amélioration guidée par prototypes pour stabiliser la détection
Correction automatique avant propagation des erreurs
Surperformance sur le benchmark Who&When

Pourquoi c'est important

Cette recherche est cruciale car elle adresse un défi fondamental des systèmes multi-agents basés sur LLM : leur vulnérabilité aux erreurs en cascade. La capacité d'auto-correction en temps réel ouvre la voie à des systèmes plus robustes et fiables pour des applications critiques où les erreurs propagées pourraient avoir des conséquences significatives.

Article original : https://arxiv.org/abs/2510.14319

Synthèse éditoriale issue d’une veille et d’outils d’IA. Des erreurs ou approximations peuvent subsister. Référez‑vous à la source originale et à notre disclaimer.