Les grands modèles de langage (LLMs) montrent des performances impressionnantes dans une variété de tâches, mais ils peinent souvent avec les tâches nécessitant un raisonnement multi-étapes ou une planification dirigée vers un objectif. En s'inspirant des neurosciences cognitives et de l'apprentissage par renforcement, les auteurs proposent une architecture agentique modulaire (MAP) où la planification est réalisée par l'interaction récurrente de modules spécialisés, chacun implémenté avec un LLM. Ces modules incluent la surveillance des conflits, la prédiction d'état, l'évaluation d'état, la décomposition des tâches et l'orchestration. L'architecture MAP améliore la planification en décomposant un problème plus large en plusieurs appels automatisés et brefs au LLM, ce qui permet des améliorations significatives par rapport aux méthodes standard des LLMs et aux baselines compétitives. Les résultats montrent que MAP peut être combiné efficacement avec des LLMs plus petits et plus économiques, tout en affichant une meilleure transférabilité entre les tâches, suggérant ainsi les avantages d'une approche modulaire et multi-agents pour la planification avec les LLMs. L'étude évalue MAP sur trois tâches de planification difficiles, ainsi que sur une tâche de NLP nécessitant un raisonnement multi-étapes, démontrant sa supériorité par rapport aux méthodes existantes.