La rationalisation est un cadre centré sur les données qui vise à construire des modèles auto-explicatifs capables d'expliquer les prédictions en générant un sous-ensemble de parties intelligibles des données d'entrée. Ce processus repose sur un modèle de jeu coopératif où un générateur identifie les éléments les plus compréhensibles (les rationalités) et un prédicteur effectue des prédictions basées sur ces rationalités. Les méthodes conventionnelles imposent généralement des contraintes via des termes de régularisation pour calibrer ou pénaliser les générations indésirables, mais elles souffrent d'un problème fondamental d'effondrement modal où le prédicteur produit des prédictions correctes tandis que le générateur génère systématiquement des rationalités avec des motifs effondrés et non informatifs.

Les auteurs revisitent systématiquement la rationalisation coopérative sous un angle novateur de théorie des jeux et identifient la cause fondamentale de ce problème : le générateur cesse d'explorer de nouvelles stratégies pour découvrir des rationalités informatives, conduisant le système à converger vers un équilibre de jeu sous-optimal. Pour résoudre cette limitation, ils proposent PORAT (Game-theoretic Policy Optimization oriented RATionalization), une approche qui introduit progressivement des interventions politiques pour adresser l'équilibre du jeu dans le processus coopératif, guidant ainsi le modèle vers un état de solution plus optimal.

L'étude comprend une analyse théorique approfondie des causes de cet équilibre sous-optimal et démontre la faisabilité de la méthode proposée. Les validations expérimentales sur neuf jeux de données réels largement utilisés et deux configurations synthétiques montrent que PORAT atteint des améliorations de performance allant jusqu'à 8,1% par rapport aux méthodes état de l'art existantes, confirmant l'efficacité de l'approche pour améliorer la qualité des explications générées tout en maintenant la précision des prédictions.