Articles - BlogIA

Choisir une base de données vectorielle pour les agents IA et RAG : un aperçu complet

Cet article offre un aperçu détaillé des principales bases de données vectorielles comme Milvus, Qdrant et Weaviate, expliquant leur fonctionnement, leurs différences et leur utilité pour les agents IA et les systèmes RAG, tout en abordant les concepts clés des embeddings et des opérations vectorielles.

2025-10-29•Habr — Machine Learning (RU)•1 min

Le monde après les transformers : déclin et renouveau des grands modèles de langage

Les grands modèles de langage (LLM) basés sur l'architecture des transformers dominent actuellement l'IA, mais ils rencontrent des limites architecturales majeures, telles que l'absence de mémoire à long terme et une complexité croissante, ce qui entraîne des coûts élevés et des performances stagnantes, malgré des solutions temporaires comme FlashAttention et LoRA.

2025-10-29•Habr — Machine Learning (RU)•1 min

Des benchmarks à l'impact commercial : déploiement de l'agent généraliste IBM en production entreprise

Cet article explore le déploiement de l'agent généraliste IBM en environnement professionnel, mettant en lumière les défis et les solutions pour passer des prototypes aux systèmes déployés créant de la valeur commerciale mesurable.

2025-10-29•arXiv cs.AI•1 min

Game-TARS : Modèles de fondation pré-entraînés pour des agents de jeu généralistes multimodaux et évolutifs

Game-TARS est un agent de jeu généraliste utilisant des entrées clavier-souris pour un apprentissage continu à grande échelle, surpassant les modèles précédents dans des tâches variées comme Minecraft et des jeux web 3D.

2025-10-29•arXiv cs.AI•1 min

Les modèles de langage ajustés au moment du test permettent la génération de novo de structures moléculaires à partir de spectres MS/MS

Cette étude présente un cadre innovant utilisant des modèles de langage pré-entraînés et ajustés au moment du test pour générer des structures moléculaires directement à partir de spectres de masse en tandem, surpassant les méthodes existantes et offrant une solution plus fiable pour l'identification de composés inconnus.

2025-10-29•arXiv cs.AI•1 min

Construire un robot médical de la simulation au déploiement avec NVIDIA Isaac

Ce guide pratique explique comment collecter des données, former des politiques et déployer des workflows robotiques médicaux autonomes sur du matériel réel en utilisant NVIDIA Isaac, combinant simulation et données réelles pour surmonter les défis de la robotique médicale.

2025-10-29•Hugging Face Blog•1 min

Rapport technique : Évaluation des performances et de référence des modèles gpt-oss-safeguard-120b et gpt-oss-safeguard-20b

Ce rapport technique présente les capacités et les évaluations de sécurité des modèles gpt-oss-safeguard-120b et gpt-oss-safeguard-20b, conçus pour évaluer du contenu selon des politiques spécifiques, tout en soulignant leur utilisation recommandée et les résultats des tests de sécurité.

2025-10-29•OpenAI Blog•1 min

Comment nous avons réduit de 7 fois la consommation mémoire de Redis en abandonnant le stockage Pydantic en JSON

L'article explique comment une équipe a optimisé l'utilisation de la mémoire dans Redis en remplaçant le stockage JSON des modèles Pydantic par un format binaire personnalisé, réduisant ainsi la consommation mémoire de 7 fois et améliorant les performances globales du système.

2025-10-28•Habr — Data Science (RU)•1 min

Manuscrit : comment nous avons appris à un réseau de neurones à lire les manuscrits du XIXe siècle

Un projet open-source a permis de développer une bibliothèque OCR spécialement entraînée pour reconnaître les manuscrits russes du XIXe siècle, en utilisant des techniques de génération de données synthétiques et une annotation manuelle intensive.

2025-10-28•Habr — Machine Learning (RU)•1 min

Miser sur les DeepAgents à fond

L'article présente la nouvelle version 0.2 de DeepAgents, un package Python pour créer des agents autonomes, avec des améliorations comme des backends pluggables et une meilleure gestion de la mémoire.

2025-10-28•LangChain Blog•1 min

Nandan Nilekani : La révolution de l'IA en Inde sera différente de celle de l'Occident

Nandan Nilekani, cofondateur d'Infosys, explique comment l'IA en Inde se distingue par son accessibilité vocale et multilingue, visant à inclure les populations locales et rurales grâce à des technologies adaptées à leurs besoins spécifiques.

2025-10-28•Le Monde IA•1 min

La préservation des connaissances alimentée par ChatGPT

Dai Nippon Printing (DNP) utilise ChatGPT Enterprise pour optimiser ses flux de travail, automatiser des tâches et préserver les connaissances institutionnelles, améliorant ainsi la productivité et l'innovation dans plusieurs divisions.

2025-10-28•OpenAI Blog•1 min

Calculs super-Turing et hyperordinateurs : la thèse de Church-Turing comme limite universelle de la connaissance

Cet article explore les limites fondamentales de la calculabilité et la possibilité d'hyperordinateurs, en s'appuyant sur la thèse de Church-Turing, tout en discutant des débats philosophiques sur la connaissabilité de l'univers et des implications des calculs super-Turing.

2025-10-28•Habr — Data Science (RU)•1 min

Trouver un retour sur les investissements en IA dans divers secteurs

Trois ans après ChatGPT, de nombreuses entreprises peinent à obtenir un retour sur investissement mesurable avec l'IA, mais des principes clés comme la valorisation des données, la stabilité des systèmes et l'alignement sur les besoins utilisateurs peuvent améliorer les résultats.

2025-10-28•MIT Technology Review•1 min

OpenAI finalise sa restructuration à but lucratif et signe un nouvel accord avec Microsoft

OpenAI a achevé sa restructuration en une entreprise à but lucratif et a conclu un nouvel accord avec Microsoft, clarifiant les droits de propriété intellectuelle et les plans futurs en cas d'atteinte de l'AGI, tout en permettant des collaborations avec des tiers et en limitant certains droits de Microsoft.

2025-10-28•The Verge AI•1 min

La descente de gradient : comment un aveugle dans un labyrinthe trouve la sortie dans un espace de milliards de dimensions

La descente de gradient est une méthode fondamentale en apprentissage automatique qui permet aux modèles de trouver des solutions optimales en navigant dans un espace de paramètres complexe, mais elle présente des défis pratiques tels que les minima locaux et le choix du taux d'apprentissage.

2025-10-28•Habr — Machine Learning (RU)•1 min

Adobe Firefly Image 5 introduit la gestion des calques et permettra aux créateurs de créer des modèles personnalisés

Adobe lance Firefly Image 5, une mise à jour majeure de son modèle de génération d'images, offrant une résolution native de 4 mégapixels, l'édition basée sur des calques et des invites, ainsi que la possibilité pour les utilisateurs de créer des modèles personnalisés basés sur leur style artistique.

2025-10-28•TechCrunch AI•1 min

Le système de défense IA de Doppel stoppe les attaques avant qu'elles ne se propagent

Doppel a développé un système de défense contre les attaques de phishing et les usurpations d'identité en ligne, utilisant l'IA pour détecter et neutraliser les menaces en quelques minutes, réduisant ainsi la charge de travail des analystes de 80%.

2025-10-28•OpenAI Blog•1 min

L'IA ne remplacera pas les juristes, mais les augmentera : l'adaptation des formations en droit

Les métiers du droit évoluent avec l'IA, qui automatise certaines tâches et nécessite une adaptation des formations pour les futurs juristes, comme en témoignent les changements observés dans les stages et les discussions lors d'événements tels que l'IA Week.

2025-10-28•Le Monde IA•1 min

Plafonds de capacité dans les modèles de langage autoregressifs

Cette étude révèle des plafonds de capacité empiriques dans les modèles de langage autoregressifs, montrant que l'augmentation des paramètres n'améliore pas significativement la précision dans les tâches intensives en connaissances, contrairement aux tâches procédurales.

2025-10-28•arXiv cs.AI•1 min

Un cadre d'IA multicomposant pour la psychologie computationnelle

Cet article présente un cadre d'IA complet pour la psychologie computationnelle, intégrant des modèles prédictifs et des dialogues génératifs, offrant une approche holistique pour comprendre et interagir avec les états psychologiques humains.

2025-10-28•arXiv cs.AI•1 min

MiniMax lance le modèle open-source M2, offrant une vitesse doublée à 8 % du prix de Claude Sonnet

La startup chinoise MiniMax a dévoilé son modèle de langage open-source M2, conçu pour les workflows d'agents et les tâches de codage, avec une vitesse d'inférence deux fois supérieure à celle de Claude Sonnet 4.5 d'Anthropic, le tout à seulement 8 % de son coût d'API, et gratuit pour une durée limitée.

2025-10-28•TechNode (China tech, EN)•1 min

Clonage vocal avec consentement

Cet article explore l'idée d'un 'portail de consentement vocal' pour permettre le clonage de voix uniquement avec l'accord explicite de la personne, combinant éthique et technologie pour prévenir les usages malveillants tout en préservant les bénéfices potentiels.

2025-10-28•Hugging Face Blog•1 min

Comment nous créons un coach santé personnel

Google développe un coach santé personnel basé sur des modèles Gemini, offrant des conseils personnalisés et adaptatifs en matière de santé et de bien-être, en s'appuyant sur des données scientifiques et des avis d'experts.

2025-10-27•Google Research Blog•1 min

AMD et le Département de l'Énergie annoncent un partenariat d'un milliard de dollars pour un supercalculateur IA

AMD et le Département de l'Énergie des États-Unis ont conclu un accord d'un milliard de dollars pour développer deux supercalculateurs, Lux et Discovery, qui seront installés au Oak Ridge National Laboratory et devraient accélérer la recherche en science, énergie et sécurité nationale.

2025-10-27•The Verge AI•1 min

Les IA remplaceront-elles les mathématiciens ?

Les intelligences artificielles, capables de remporter des médailles d'or aux Olympiades internationales de mathématiques, soulèvent la question de leur potentiel à surpasser les chercheurs humains dans ce domaine réputé difficile.

2025-10-27•Le Monde IA•1 min

Sora révèle les failles de la détection des deepfakes

Sora, le générateur de vidéos d'OpenAI, met en évidence les lacunes des systèmes de détection des deepfakes, notamment le système C2PA, malgré son adoption par plusieurs plateformes majeures, laissant les utilisateurs vulnérables à la désinformation.

2025-10-27•The Verge AI•1 min

L'attention par élan

L'article présente une nouvelle approche appelée 'Momentum Attention' qui intègre le concept d'inertie dans le mécanisme d'attention des transformers, permettant une meilleure stabilité et continuité dans le traitement des séquences longues.

2025-10-27•Habr — Machine Learning (RU)•1 min

Créer son propre ChatGPT pour 10$ par mois : déployer un LLM dans le cloud

Ce guide pratique explique comment déployer un modèle de langage local sur un serveur cloud pour créer un chatbot autonome, sécurisé et fonctionnant sans connexion internet, en utilisant des outils comme Ollama et des modèles tels que Mistral-7B-Instruct, tout en détaillant les configurations matérielles nécessaires et les étapes de mise en œuvre.

2025-10-27•Habr — Machine Learning (RU)•1 min

Pourquoi les mots entravent la communication entre agents IA

Les mots, bien qu'utiles, limitent la communication entre agents IA en raison de leur nature séquentielle et ambiguë, mais une nouvelle approche propose un canal de partage des états internes pour améliorer la collaboration et la précision des résultats.

2025-10-27•Habr — Machine Learning (RU)•1 min

Saisir l'opportunité de l'IA

Les États-Unis, leaders en développement de l'IA, doivent investir massivement dans l'électricité pour maintenir leur avance, créer des emplois et moderniser leur base industrielle, sous peine de voir la Chine les dépasser dans cette course technologique cruciale.

2025-10-27•OpenAI Blog•1 min

Renforcer les réponses de ChatGPT dans les conversations sensibles

Une collaboration avec plus de 170 experts en santé mentale a permis d'améliorer la capacité de ChatGPT à reconnaître les signes de détresse, à répondre avec empathie et à orienter les utilisateurs vers un soutien réel, réduisant ainsi les réponses inadéquates de 65 à 80%.

2025-10-27•OpenAI Blog•1 min

Construire des agents IA en médecine et autres domaines réglementés

Construire des agents IA pour des domaines réglementés comme la médecine est complexe, nécessitant un équilibre entre utilité et sécurité, tout en surmontant les limites des modèles actuels et les défis liés aux données et à la réglementation.

2025-10-27•Habr — Data Science (RU)•1 min

Des questions aux requêtes : un cadre multi-agents alimenté par l'IA pour le Text-to-SQL spatial

Cette étude propose un cadre multi-agents basé sur l'IA pour traduire des questions en langage naturel en requêtes SQL spatiales, améliorant ainsi l'accessibilité de l'analyse spatiale pour les non-experts grâce à une approche collaborative et des validations automatiques.

2025-10-27•arXiv cs.AI•1 min

MedAlign : un cadre synergique d'optimisation multimodale des préférences et de raisonnement méta-cognitif fédéré

MedAlign est un nouveau cadre pour les grands modèles de langage visionnaire en santé, visant à améliorer la précision des réponses médicales, réduire les hallucinations et optimiser le raisonnement adaptatif grâce à une approche fédérée et multimodale.

2025-10-27•arXiv cs.AI•1 min

Personnalisation de LLMs open source pour l'extraction d'attributs de médication quantitative dans des systèmes EHR hétérogènes

Cette étude présente un cadre pratique utilisant des modèles de langage open source pour extraire des attributs de prescription de médicaments contre les troubles liés à l'usage d'opioïdes à partir de systèmes de dossiers médicaux électroniques hétérogènes, permettant une analyse cohérente et préservant la confidentialité des données.

2025-10-27•arXiv cs.AI•1 min

Sketch2BIM : un pipeline collaboratif humain-IA multi-agents pour convertir des plans à main levée en modèles 3D BIM

Cette étude présente un pipeline innovant utilisant des modèles de langage multimodaux et une collaboration humain-IA pour transformer des croquis de plans à main levée en modèles 3D BIM structurés, avec une précision élevée et une amélioration progressive grâce aux retours utilisateurs.

2025-10-27•arXiv cs.AI•1 min

Noetix Robotics révèle comment construire un robot humanoïde moins cher qu'un iPhone

Noetix Robotics, une startup chinoise, a dévoilé son robot humanoïde Bumi, vendu au prix d'un iPhone grâce à une optimisation des coûts et une chaîne d'approvisionnement locale, marquant une avancée significative dans l'accessibilité des robots grand public.

2025-10-27•TechNode (China tech, EN)•1 min

NIO annonce plus de 90 millions d’échanges de batteries, avec plus de 100 000 par jour

NIO a dépassé les 90 millions d'échanges de batteries avec une moyenne de plus de 100 000 échanges par jour, grâce à un réseau de 3 539 stations couvrant 550 villes en Chine, permettant des économies significatives en coûts de carburant.

2025-10-27•TechNode (China tech, EN)•1 min

JD Logistics dévoile un plan quinquennal pour déployer des millions de robots et véhicules autonomes

JD Logistics a annoncé un plan ambitieux pour déployer trois millions de robots, un million de véhicules autonomes et 100 000 drones d'ici cinq ans, visant à automatiser sa chaîne logistique et à réduire les coûts opérationnels.

2025-10-27•TechNode (China tech, EN)•1 min

Diffusion de données : 100 fois plus efficace

Hugging Face a amélioré son API de streaming pour les jeux de données, permettant un accès 100 fois plus efficace sans téléchargement préalable, réduisant les requêtes, accélérant la résolution des données et doublant la vitesse d'échantillonnage, tout en évitant les erreurs de stockage et de requêtes excessives.

2025-10-27•Hugging Face Blog•1 min

huggingface_hub v1.0 : Cinq ans à construire les fondations du machine learning ouvert

Après cinq ans de développement, huggingface_hub atteint la version 1.0, marquant la maturité de la bibliothèque Python qui alimente 200 000 bibliothèques dépendantes et fournit des fonctionnalités essentielles pour accéder à plus de 2 millions de modèles publics, 0,5 million de jeux de données publics et 1 million d'espaces publics.

2025-10-27•Hugging Face Blog•1 min

Planificateur intelligent de taux d'apprentissage : contrôler la vitesse d'apprentissage en analysant l'accélération

Cet article propose une nouvelle approche pour ajuster dynamiquement le taux d'apprentissage en analysant l'accélération de la perte de validation, permettant une adaptation plus proactive et efficace pendant l'entraînement des modèles de machine learning.

2025-10-26•Habr — Machine Learning (RU)•1 min

Comment les agents IA ont appris à rédiger des rapports analytiques aussi bien que des professionnels

Une équipe a développé un framework multi-agents pour générer des rapports financiers précis et vérifiables, combinant texte, visualisations et sources, tout en minimisant les hallucinations des modèles de langage.

2025-10-26•Habr — Machine Learning (RU)•1 min

TechCrunch Disrupt 2025 démarre dans moins de 24 heures – profitez de nos dernières offres de billets

TechCrunch Disrupt 2025 débute dans moins de 24 heures à San Francisco, réunissant 10 000 fondateurs, investisseurs et innovateurs pour trois jours de rencontres, de démonstrations technologiques et de compétitions de startups avec un prix de 100 000 dollars à la clé.

2025-10-26•TechCrunch AI•1 min

Comment j'ai construit une radio IA sans équipe ni investissements : une plongée dans l'architecture

Un développeur raconte comment il a créé une plateforme de radio IA complète, incluant musique, nouvelles, météo et podcasts, en utilisant Kubernetes et des agents IA pour surmonter ses lacunes techniques, le tout sans équipe ni financement externe.

2025-10-26•Habr — Data Science (RU)•1 min

Le long chemin vers DiT (partie 2)

Cette deuxième partie du tutoriel explore la transformation d'un bruit gaussien en images de chiffres et de lettres à l'aide d'un réseau de neurones, en utilisant le dataset EMNIST, tout en abordant les défis de manipulation et de visualisation des données.

2025-10-26•Habr — Machine Learning (RU)•1 min

Pourquoi l’intelligence artificielle ne remplacera pas l’humain

L'article explore pourquoi l'IA, malgré ses avancées, ne peut remplacer l'homme en raison de son manque de créativité, de vision et de capacité à prendre des décisions, soulignant que l'IA est un outil pour augmenter la productivité humaine plutôt qu'un concurrent.

2025-10-26•Habr — Data Science (RU)•1 min

L’IA au travail : entre gaspillage et désillusion

Malgré leur inefficacité prouvée, les intelligences artificielles continuent d'être promues en entreprise, générant des contenus médiocres et une perte de temps considérable pour les employés qui doivent souvent retravailler les documents produits.

2025-10-26•Le Monde IA•1 min

Dé-anonymisation totale : les débats sur l'accès au web par passeport et les identités numériques

Alors que la digitalisation s'accélère et que les menaces en ligne se multiplient, plusieurs pays, dont la Russie, envisagent des systèmes d'identification obligatoire pour accéder à certains contenus, suscitant des débats sur la protection des données et la vie privée.

2025-10-26•Habr — Data Science (RU)•1 min

📰 Articles