Ant Group a récemment présenté Ling-1T, un modèle de langage open-source à un billion de paramètres, se positionnant comme une avancée majeure dans l'équilibre entre l'efficacité computationnelle et les capacités de raisonnement avancées. Ce modèle atteint une précision de 70,42 % sur le benchmark AIME 2025, tout en consommant en moyenne plus de 4 000 tokens par problème, ce qui le place parmi les meilleurs modèles d'IA en termes de qualité des résultats. Parallèlement, Ant Group a lancé dInfer, un cadre d'inférence spécialisé pour les modèles de langage par diffusion, reflétant une stratégie de double publication visant à explorer plusieurs approches technologiques plutôt qu'un seul paradigme architectural. Les modèles de langage par diffusion, contrairement aux systèmes autorégressifs, produisent des sorties en parallèle, une approche déjà courante dans la génération d'images et de vidéos mais moins répandue dans le traitement du langage. Les métriques de performance d'Ant Group pour dInfer suggèrent des gains d'efficacité substantiels, avec 1 011 tokens par seconde sur le benchmark HumanEval, contre 91 tokens pour le cadre Fast-dLLM de Nvidia et 294 pour le modèle Qwen-2.5-3B d'Alibaba. Cette stratégie de double publication s'inscrit dans une vision plus large de l'IA comme un bien public, favorisant une avancée ouverte et collaborative dans le domaine de l'intelligence artificielle. Le modèle Ling-1T s'inscrit dans une famille diversifiée de systèmes d'IA développés par Ant Group, incluant des modèles non pensants pour les tâches linguistiques standard, des modèles pensants pour le raisonnement complexe et des modèles multimodaux capables de traiter images, texte, audio et vidéo. Cette approche diversifiée vise à établir Ant Group comme une force significative dans le développement mondial de l'IA, en misant sur l'innovation algorithmique et l'optimisation logicielle pour se différencier dans un environnement concurrentiel contraint.
Le modèle d'IA à un billion de paramètres d'Ant Group cible les benchmarks de raisonnement avec une stratégie de double publication
Article original : https://www.artificialintelligence-news.com/news/trillion-parameter-ai-model-ant-group-ling-1t/
Synthèse éditoriale issue d’une veille et d’outils d’IA. Des erreurs ou approximations peuvent subsister. Référez‑vous à la source originale et à notre disclaimer.