La conception d’acides nucléiques, comme l’ADN ou l’ARN, représente un enjeu majeur en biologie synthétique et en médecine, notamment pour développer des thérapies géniques, des vaccins ou des outils de diagnostic. Cependant, prédire avec précision la structure et la fonction de ces molécules reste un défi complexe en raison de leur flexibilité et de leurs interactions dynamiques. Pour répondre à ce besoin, des chercheurs ont mis au point deux outils innovants : NucleoBench et AdaBeam, qui combinent l’apprentissage automatique et la modélisation physique pour optimiser la conception des acides nucléiques.
NucleoBench se présente comme une base de données de référence regroupant des milliers de structures d’ARN et d’ADN, annotées avec des propriétés biophysiques et fonctionnelles. Cette ressource permet aux scientifiques d’entraîner des modèles d’intelligence artificielle en leur fournissant des données standardisées et diversifiées, couvrant un large éventail de séquences et de conformations. En s’appuyant sur des techniques de deep learning, NucleoBench facilite l’identification de motifs structuraux clés et accélère la prédiction des interactions moléculaires, réduisant ainsi le temps et les coûts associés aux expériences en laboratoire. Parallèlement, l’outil intègre des algorithmes capables de simuler les effets des mutations ou des modifications chimiques, offrant une approche plus rationnelle pour concevoir des molécules aux propriétés souhaitées.
Complémentaire à NucleoBench, AdaBeam est un modèle génératif basé sur l’architecture des transformers, spécialement adapté pour concevoir des séquences d’acides nucléiques de novo. Contrairement aux méthodes traditionnelles, qui reposent souvent sur des règles empiriques ou des essais-erreurs, AdaBeam utilise un apprentissage auto-supervisé pour proposer des séquences optimisées en fonction d’objectifs précis, comme une stabilité thermique accrue ou une affinité spécifique pour une cible. Son originalité réside dans sa capacité à ajuster dynamiquement ses prédictions en fonction des retours expérimentaux, grâce à un mécanisme de fine-tuning continu. Cette approche itérative permet d’affiner progressivement les designs, tout en tenant compte des contraintes biophysiques et des limitations synthétiques, comme la longueur des séquences ou leur compatibilité avec les systèmes de livraison in vivo.
Les applications potentielles de ces outils sont vastes. En thérapie génique, par exemple, ils pourraient aider à concevoir des ARN messagers plus stables pour les vaccins, ou des guides CRISPR plus efficaces pour l’édition génomique. Dans le domaine du diagnostic, NucleoBench et AdaBeam pourraient optimiser les sondes d’ARN utilisées dans les tests de détection de pathogènes, en améliorant leur spécificité et leur sensibilité. À plus long terme, ces technologies pourraient même contribuer à la création de nanomatériaux programmables, où les acides nucléiques serviraient de briques de construction pour des structures fonctionnelles à l’échelle nanométrique. Malgré ces avancées, des défis persistent, notamment la nécessité de valider expérimentalement les designs in silico et d’intégrer des données plus diversifiées pour couvrir l’ensemble des variations naturelles des acides nucléiques.
En combinant des données structurées, des modèles prédictifs avancés et une approche itérative, NucleoBench et AdaBeam marquent une étape significative vers une conception plus intelligente et plus accessible des acides nucléiques. Leur développement illustre comment l’intelligence artificielle peut transformer la recherche en biologie, en réduisant les incertitudes et en accélérant l’innovation. Toutefois, leur adoption généralisée dépendra de leur capacité à s’intégrer aux workflows existants et à surmonter les limites actuelles des modèles computationnels, notamment en termes de généralisation et de précision pour des systèmes biologiques complexes.