MTSQL-R1 : Vers une conversion longue portée de texte en SQL multi-tours via un entraînement agentique

16 octobre 2025

Le Text-to-SQL multi-tours vise à traduire les énoncés conversationnels d'un utilisateur en requêtes SQL exécutables tout en préservant la cohérence du dialogue et l'ancrage au schéma de base de données cible. Cependant, la plupart des systèmes existants traitent cette tâche comme une simple traduction de texte et suivent un paradigme à court horizon, générant une requête par tour sans exécution, vérification explicite ni raffinement, ce qui conduit à des sorties non exécutables ou incohérentes.

MTSQL-R1 propose un cadre d'entraînement agentique pour le Text-to-SQL multi-tours à long horizon, modélisant la tâche comme un processus de décision markovien où un agent interagit avec une base de données pour obtenir un retour d'exécution et avec une mémoire de dialogue persistante pour la vérification de cohérence. L'agent effectue un cycle itératif de proposition d'exécution, vérification et raffinement jusqu'à ce que tous les contrôles soient validés.

Les expériences menées sur les jeux de données COSQL et SPARC démontrent que MTSQL-R1 surpasse systématiquement les modèles de référence, soulignant l'importance de la vérification pilotée par l'environnement et du raffinement guidé par la mémoire pour l'analyse sémantique conversationnelle. Les recettes complètes, incluant le code, les modèles entraînés, les journaux et les trajectoires de raisonnement, seront publiées après révision interne pour contribuer à la recherche communautaire.

Points clés

Cadre d'entraînement agentique pour le Text-to-SQL multi-tours
Intègre vérification par exécution et mémoire de dialogue persistante
Cycle itératif propose-exécute-vérifie-raffine
Surpasse les modèles de référence sur COSQL et SPARC
Publication prévue des ressources complètes après révision

Pourquoi c'est important

Cette recherche est cruciale car elle aborde les limitations des systèmes de Text-to-SQL conversationnel actuels, qui produisent souvent des requêtes non exécutables ou incohérentes. L'approche agentique permet une meilleure fiabilité et cohérence dans les interactions complexes avec les bases de données, avec des implications importantes pour les systèmes d'assistance conversationnelle et l'accès aux données naturelles.

Article original : https://arxiv.org/abs/2510.12831

Synthèse éditoriale issue d’une veille et d’outils d’IA. Des erreurs ou approximations peuvent subsister. Référez‑vous à la source originale et à notre disclaimer.