Incrustations comportementales de programmes : une approche quasi-dynamique pour la prédiction d'optimisation

16 octobre 2025

L'apprentissage de représentations numériques efficaces des programmes constitue un prérequis fondamental pour appliquer le machine learning à l'automatisation et à l'amélioration des optimisations de compilateurs. Les paradigmes actuels présentent un dilemme : les représentations statiques, dérivées du code source ou de la représentation intermédiaire, sont efficaces et déterministes mais offrent une vision limitée du comportement du programme lors de transformations complexes, tandis que les représentations dynamiques, basées sur le profilage d'exécution, fournissent des insights profonds sur les goulots d'étranglement mais sont souvent impraticables à grande échelle en raison de leur surcoût prohibitif et de leur non-déterminisme inhérent.

Cette recherche transcende ce compromis en proposant un cadre quasi-dynamique novateur pour la représentation des programmes. L'idée centrale consiste à modéliser la sensibilité d'un programme aux optimisations via l'introduction du Spectre Comportemental des Programmes, une nouvelle représentation générée en sondant la représentation intermédiaire du programme avec un ensemble diversifié de séquences d'optimisation et en quantifiant les changements résultants dans ses caractéristiques statiques. Pour encoder efficacement ce spectre continu et de haute dimension, les auteurs pionnent une approche d'apprentissage compositionnelle utilisant la quantification par produit pour discrétiser les vecteurs de réaction continus en sous-mots structurés.

Un modèle Transformer multi-tâches, nommé PQ-BERT, est ensuite pré-entraîné pour apprendre la grammaire contextuelle profonde de ces codes comportementaux. Des expériences complètes sur deux tâches représentatives d'optimisation de compilateurs - la prédiction de la meilleure passe et la prédiction du bénéfice de -Oz - démontrent que cette méthode surpasse les approches statiques de pointe, validant ainsi l'efficacité de cette représentation comportementale hybride pour les applications pratiques d'optimisation automatisée.

Points clés

Modélisation de la sensibilité des programmes aux optimisations via un spectre comportemental
Approche compositionnelle utilisant la quantification par produit pour l'encodage
Modèle Transformer multi-tâches PQ-BERT pour l'apprentissage contextuel
Validation sur des tâches d'optimisation de compilateurs avec supériorité démontrée

Pourquoi c'est important

Cette recherche est cruciale car elle résout le dilemme fondamental entre efficacité et précision dans la représentation des programmes pour l'optimisation automatisée. En combinant les avantages des approches statiques et dynamiques, elle ouvre la voie à des systèmes de compilation plus intelligents et adaptatifs, avec des implications significatives pour l'optimisation des performances logicielles à grande échelle.

Article original : https://arxiv.org/abs/2510.13158

Synthèse éditoriale issue d’une veille et d’outils d’IA. Des erreurs ou approximations peuvent subsister. Référez‑vous à la source originale et à notre disclaimer.