AgentFold-30B-A3B est un modèle d'IA innovant qui utilise une mémoire dynamique pour condenser le contexte et maintenir des performances élevées sur des centaines d'étapes. Contrairement aux autres modèles qui accumulent ou compressent l'histoire à chaque étape, AgentFold utilise un mécanisme de pliage proactif pour résumer les blocs de mémoire, réduisant ainsi le bruit et préservant les informations pertinentes. Ce modèle structure chaque réponse en réflexion, condensation, explication et appel d'outil, ce qui permet une mise à jour efficace des résumés d'état après chaque observation. Cette approche permet à AgentFold de gérer des scénarios longs et complexes avec une croissance sublinéaire de la longueur du contexte, économisant ainsi de la mémoire et des ressources computationnelles. Les performances d'AgentFold sont impressionnantes, surpassant des modèles plus grands comme o4-mini d'OpenAI et GLM-4.5-355B-A32B sur divers benchmarks. Les auteurs suggèrent que l'apprentissage par renforcement pourrait être la prochaine étape pour améliorer encore les performances et la stratégie de condensation de la mémoire. Cette avancée rapproche l'IA de la capacité à agir sur des horizons de centaines d'étapes dans des scénarios d'affaires réels.
Mémoire dynamique : comment les agents IA apprennent à condenser le contexte et à anticiper sur 100 étapes
Article original : https://habr.com/ru/articles/961774/?utm_campaign=961774&utm_source=habrahabr&utm_medium=rss
Synthèse éditoriale issue d’une veille et d’outils d’IA. Des erreurs ou approximations peuvent subsister. Référez‑vous à la source originale et à notre disclaimer.