Les systèmes multi-agents basés sur des modèles de langage de grande taille excellent dans la résolution collaborative de problèmes mais restent fragiles face aux erreurs en cascade, où une seule étape défectueuse peut se propager à travers les agents et perturber l'ensemble du processus. Pour résoudre cette limitation, les chercheurs proposent MASC, un cadre métacognitive qui dote ces systèmes d'une capacité de détection d'erreurs non supervisée et d'auto-correction en temps réel au niveau de chaque étape.

L'approche repose sur deux conceptions complémentaires : la reconstruction de la prochaine exécution, qui prédit l'embedding de l'étape suivante à partir de la requête et de l'historique des interactions pour capturer la cohérence causale, et l'amélioration guidée par prototypes, qui apprend un a priori sur les embeddings des étapes normales pour stabiliser la reconstruction et le scoring d'anomalie dans des contextes épars comme les premières étapes. Lorsqu'une anomalie est détectée, MASC déclenche un agent de correction pour réviser la sortie de l'agent actif avant que l'information ne se propage en aval.

Les évaluations sur le benchmark Who&When montrent que MASC surpasse systématiquement toutes les méthodes de référence, améliorant la détection d'erreurs au niveau des étapes jusqu'à 8,47% en AUC-ROC. Intégré dans divers cadres de systèmes multi-agents, il procure des gains cohérents de bout en bout indépendamment de l'architecture, confirmant que la surveillance métacognitive et la correction ciblée peuvent atténuer la propagation des erreurs avec une surcharge minimale.