La société DeepSeek poursuit le développement de sa gamme de modèles linguistiques ouverts avec le lancement de la version expérimentale V3.2-Exp. Cette nouvelle itération se concentre particulièrement sur l'optimisation du traitement des contextes étendus grâce à l'implémentation d'un mécanisme innovant d'attention éparse. Cette approche technique permet d'améliorer significativement les performances lors du traitement de documents longs ou de conversations complexes, tout en réduisant la consommation de ressources computationnelles.
Le modèle est désormais disponible sur les plateformes Hugging Face et GitHub sous une licence ouverte, facilitant son accès tant pour la communauté scientifique que pour les développeurs souhaitant l'intégrer dans des applications commerciales. Cette accessibilité renforcée s'accompagne d'une accélération notable des performances et d'une réduction des coûts associés à l'utilisation de l'API, rendant la technologie plus abordable pour un public élargi.
Cette évolution s'inscrit dans la stratégie de DeepSeek de démocratiser l'accès aux modèles linguistiques avancés tout en maintenant des standards élevés de performance. L'optimisation des coûts et des performances ouvre de nouvelles perspectives pour les startups et les chercheurs disposant de budgets limités, tout en favorisant l'innovation dans le domaine du traitement automatique du langage.