Cet article offre un aperçu détaillé des principales bases de données vectorielles comme Milvus, Qdrant et Weaviate, expliquant leur fonctionnement, leurs différences et leur utilité pour les agents IA et les systèmes RAG, tout en abordant les concepts clés des embeddings et des opérations vectorielles.
2025-10-29•Habr — Machine Learning (RU)•1 min
Les grands modèles de langage (LLM) basés sur l'architecture des transformers dominent actuellement l'IA, mais ils rencontrent des limites architecturales majeures, telles que l'absence de mémoire à long terme et une complexité croissante, ce qui entraîne des coûts élevés et des performances stagnantes, malgré des solutions temporaires comme FlashAttention et LoRA.
2025-10-29•Habr — Machine Learning (RU)•1 min
Cet article explore le déploiement de l'agent généraliste IBM en environnement professionnel, mettant en lumière les défis et les solutions pour passer des prototypes aux systèmes déployés créant de la valeur commerciale mesurable.
2025-10-29•arXiv cs.AI•1 min
Game-TARS est un agent de jeu généraliste utilisant des entrées clavier-souris pour un apprentissage continu à grande échelle, surpassant les modèles précédents dans des tâches variées comme Minecraft et des jeux web 3D.
2025-10-29•arXiv cs.AI•1 min
Cette étude présente un cadre innovant utilisant des modèles de langage pré-entraînés et ajustés au moment du test pour générer des structures moléculaires directement à partir de spectres de masse en tandem, surpassant les méthodes existantes et offrant une solution plus fiable pour l'identification de composés inconnus.
2025-10-29•arXiv cs.AI•1 min
Ce guide pratique explique comment collecter des données, former des politiques et déployer des workflows robotiques médicaux autonomes sur du matériel réel en utilisant NVIDIA Isaac, combinant simulation et données réelles pour surmonter les défis de la robotique médicale.
2025-10-29•Hugging Face Blog•1 min
Ce rapport technique présente les capacités et les évaluations de sécurité des modèles gpt-oss-safeguard-120b et gpt-oss-safeguard-20b, conçus pour évaluer du contenu selon des politiques spécifiques, tout en soulignant leur utilisation recommandée et les résultats des tests de sécurité.
2025-10-29•OpenAI Blog•1 min
L'article explique comment une équipe a optimisé l'utilisation de la mémoire dans Redis en remplaçant le stockage JSON des modèles Pydantic par un format binaire personnalisé, réduisant ainsi la consommation mémoire de 7 fois et améliorant les performances globales du système.
2025-10-28•Habr — Data Science (RU)•1 min
Un projet open-source a permis de développer une bibliothèque OCR spécialement entraînée pour reconnaître les manuscrits russes du XIXe siècle, en utilisant des techniques de génération de données synthétiques et une annotation manuelle intensive.
2025-10-28•Habr — Machine Learning (RU)•1 min
L'article présente la nouvelle version 0.2 de DeepAgents, un package Python pour créer des agents autonomes, avec des améliorations comme des backends pluggables et une meilleure gestion de la mémoire.
2025-10-28•LangChain Blog•1 min
Nandan Nilekani, cofondateur d'Infosys, explique comment l'IA en Inde se distingue par son accessibilité vocale et multilingue, visant à inclure les populations locales et rurales grâce à des technologies adaptées à leurs besoins spécifiques.
2025-10-28•Le Monde IA•1 min
Dai Nippon Printing (DNP) utilise ChatGPT Enterprise pour optimiser ses flux de travail, automatiser des tâches et préserver les connaissances institutionnelles, améliorant ainsi la productivité et l'innovation dans plusieurs divisions.
2025-10-28•OpenAI Blog•1 min
Cet article explore les limites fondamentales de la calculabilité et la possibilité d'hyperordinateurs, en s'appuyant sur la thèse de Church-Turing, tout en discutant des débats philosophiques sur la connaissabilité de l'univers et des implications des calculs super-Turing.
2025-10-28•Habr — Data Science (RU)•1 min
Trois ans après ChatGPT, de nombreuses entreprises peinent à obtenir un retour sur investissement mesurable avec l'IA, mais des principes clés comme la valorisation des données, la stabilité des systèmes et l'alignement sur les besoins utilisateurs peuvent améliorer les résultats.
2025-10-28•MIT Technology Review•1 min
OpenAI a achevé sa restructuration en une entreprise à but lucratif et a conclu un nouvel accord avec Microsoft, clarifiant les droits de propriété intellectuelle et les plans futurs en cas d'atteinte de l'AGI, tout en permettant des collaborations avec des tiers et en limitant certains droits de Microsoft.
2025-10-28•The Verge AI•1 min
La descente de gradient est une méthode fondamentale en apprentissage automatique qui permet aux modèles de trouver des solutions optimales en navigant dans un espace de paramètres complexe, mais elle présente des défis pratiques tels que les minima locaux et le choix du taux d'apprentissage.
2025-10-28•Habr — Machine Learning (RU)•1 min
Adobe lance Firefly Image 5, une mise à jour majeure de son modèle de génération d'images, offrant une résolution native de 4 mégapixels, l'édition basée sur des calques et des invites, ainsi que la possibilité pour les utilisateurs de créer des modèles personnalisés basés sur leur style artistique.
2025-10-28•TechCrunch AI•1 min
Doppel a développé un système de défense contre les attaques de phishing et les usurpations d'identité en ligne, utilisant l'IA pour détecter et neutraliser les menaces en quelques minutes, réduisant ainsi la charge de travail des analystes de 80%.
2025-10-28•OpenAI Blog•1 min
Les métiers du droit évoluent avec l'IA, qui automatise certaines tâches et nécessite une adaptation des formations pour les futurs juristes, comme en témoignent les changements observés dans les stages et les discussions lors d'événements tels que l'IA Week.
2025-10-28•Le Monde IA•1 min
Cette étude révèle des plafonds de capacité empiriques dans les modèles de langage autoregressifs, montrant que l'augmentation des paramètres n'améliore pas significativement la précision dans les tâches intensives en connaissances, contrairement aux tâches procédurales.
2025-10-28•arXiv cs.AI•1 min
Cet article présente un cadre d'IA complet pour la psychologie computationnelle, intégrant des modèles prédictifs et des dialogues génératifs, offrant une approche holistique pour comprendre et interagir avec les états psychologiques humains.
2025-10-28•arXiv cs.AI•1 min
La startup chinoise MiniMax a dévoilé son modèle de langage open-source M2, conçu pour les workflows d'agents et les tâches de codage, avec une vitesse d'inférence deux fois supérieure à celle de Claude Sonnet 4.5 d'Anthropic, le tout à seulement 8 % de son coût d'API, et gratuit pour une durée limitée.
2025-10-28•TechNode (China tech, EN)•1 min
Cet article explore l'idée d'un 'portail de consentement vocal' pour permettre le clonage de voix uniquement avec l'accord explicite de la personne, combinant éthique et technologie pour prévenir les usages malveillants tout en préservant les bénéfices potentiels.
2025-10-28•Hugging Face Blog•1 min
Google développe un coach santé personnel basé sur des modèles Gemini, offrant des conseils personnalisés et adaptatifs en matière de santé et de bien-être, en s'appuyant sur des données scientifiques et des avis d'experts.
2025-10-27•Google Research Blog•1 min
AMD et le Département de l'Énergie des États-Unis ont conclu un accord d'un milliard de dollars pour développer deux supercalculateurs, Lux et Discovery, qui seront installés au Oak Ridge National Laboratory et devraient accélérer la recherche en science, énergie et sécurité nationale.
2025-10-27•The Verge AI•1 min
Les intelligences artificielles, capables de remporter des médailles d'or aux Olympiades internationales de mathématiques, soulèvent la question de leur potentiel à surpasser les chercheurs humains dans ce domaine réputé difficile.
2025-10-27•Le Monde IA•1 min
Sora, le générateur de vidéos d'OpenAI, met en évidence les lacunes des systèmes de détection des deepfakes, notamment le système C2PA, malgré son adoption par plusieurs plateformes majeures, laissant les utilisateurs vulnérables à la désinformation.
2025-10-27•The Verge AI•1 min
L'article présente une nouvelle approche appelée 'Momentum Attention' qui intègre le concept d'inertie dans le mécanisme d'attention des transformers, permettant une meilleure stabilité et continuité dans le traitement des séquences longues.
2025-10-27•Habr — Machine Learning (RU)•1 min
Ce guide pratique explique comment déployer un modèle de langage local sur un serveur cloud pour créer un chatbot autonome, sécurisé et fonctionnant sans connexion internet, en utilisant des outils comme Ollama et des modèles tels que Mistral-7B-Instruct, tout en détaillant les configurations matérielles nécessaires et les étapes de mise en œuvre.
2025-10-27•Habr — Machine Learning (RU)•1 min
Les mots, bien qu'utiles, limitent la communication entre agents IA en raison de leur nature séquentielle et ambiguë, mais une nouvelle approche propose un canal de partage des états internes pour améliorer la collaboration et la précision des résultats.
2025-10-27•Habr — Machine Learning (RU)•1 min
Les États-Unis, leaders en développement de l'IA, doivent investir massivement dans l'électricité pour maintenir leur avance, créer des emplois et moderniser leur base industrielle, sous peine de voir la Chine les dépasser dans cette course technologique cruciale.
2025-10-27•OpenAI Blog•1 min
Une collaboration avec plus de 170 experts en santé mentale a permis d'améliorer la capacité de ChatGPT à reconnaître les signes de détresse, à répondre avec empathie et à orienter les utilisateurs vers un soutien réel, réduisant ainsi les réponses inadéquates de 65 à 80%.
2025-10-27•OpenAI Blog•1 min
Construire des agents IA pour des domaines réglementés comme la médecine est complexe, nécessitant un équilibre entre utilité et sécurité, tout en surmontant les limites des modèles actuels et les défis liés aux données et à la réglementation.
2025-10-27•Habr — Data Science (RU)•1 min
Cette étude propose un cadre multi-agents basé sur l'IA pour traduire des questions en langage naturel en requêtes SQL spatiales, améliorant ainsi l'accessibilité de l'analyse spatiale pour les non-experts grâce à une approche collaborative et des validations automatiques.
2025-10-27•arXiv cs.AI•1 min
MedAlign est un nouveau cadre pour les grands modèles de langage visionnaire en santé, visant à améliorer la précision des réponses médicales, réduire les hallucinations et optimiser le raisonnement adaptatif grâce à une approche fédérée et multimodale.
2025-10-27•arXiv cs.AI•1 min
Cette étude présente un cadre pratique utilisant des modèles de langage open source pour extraire des attributs de prescription de médicaments contre les troubles liés à l'usage d'opioïdes à partir de systèmes de dossiers médicaux électroniques hétérogènes, permettant une analyse cohérente et préservant la confidentialité des données.
2025-10-27•arXiv cs.AI•1 min
Cette étude présente un pipeline innovant utilisant des modèles de langage multimodaux et une collaboration humain-IA pour transformer des croquis de plans à main levée en modèles 3D BIM structurés, avec une précision élevée et une amélioration progressive grâce aux retours utilisateurs.
2025-10-27•arXiv cs.AI•1 min
Noetix Robotics, une startup chinoise, a dévoilé son robot humanoïde Bumi, vendu au prix d'un iPhone grâce à une optimisation des coûts et une chaîne d'approvisionnement locale, marquant une avancée significative dans l'accessibilité des robots grand public.
2025-10-27•TechNode (China tech, EN)•1 min
NIO a dépassé les 90 millions d'échanges de batteries avec une moyenne de plus de 100 000 échanges par jour, grâce à un réseau de 3 539 stations couvrant 550 villes en Chine, permettant des économies significatives en coûts de carburant.
2025-10-27•TechNode (China tech, EN)•1 min
JD Logistics a annoncé un plan ambitieux pour déployer trois millions de robots, un million de véhicules autonomes et 100 000 drones d'ici cinq ans, visant à automatiser sa chaîne logistique et à réduire les coûts opérationnels.
2025-10-27•TechNode (China tech, EN)•1 min
Hugging Face a amélioré son API de streaming pour les jeux de données, permettant un accès 100 fois plus efficace sans téléchargement préalable, réduisant les requêtes, accélérant la résolution des données et doublant la vitesse d'échantillonnage, tout en évitant les erreurs de stockage et de requêtes excessives.
2025-10-27•Hugging Face Blog•1 min
Après cinq ans de développement, huggingface_hub atteint la version 1.0, marquant la maturité de la bibliothèque Python qui alimente 200 000 bibliothèques dépendantes et fournit des fonctionnalités essentielles pour accéder à plus de 2 millions de modèles publics, 0,5 million de jeux de données publics et 1 million d'espaces publics.
2025-10-27•Hugging Face Blog•1 min
Cet article propose une nouvelle approche pour ajuster dynamiquement le taux d'apprentissage en analysant l'accélération de la perte de validation, permettant une adaptation plus proactive et efficace pendant l'entraînement des modèles de machine learning.
2025-10-26•Habr — Machine Learning (RU)•1 min
Une équipe a développé un framework multi-agents pour générer des rapports financiers précis et vérifiables, combinant texte, visualisations et sources, tout en minimisant les hallucinations des modèles de langage.
2025-10-26•Habr — Machine Learning (RU)•1 min
TechCrunch Disrupt 2025 débute dans moins de 24 heures à San Francisco, réunissant 10 000 fondateurs, investisseurs et innovateurs pour trois jours de rencontres, de démonstrations technologiques et de compétitions de startups avec un prix de 100 000 dollars à la clé.
2025-10-26•TechCrunch AI•1 min
Un développeur raconte comment il a créé une plateforme de radio IA complète, incluant musique, nouvelles, météo et podcasts, en utilisant Kubernetes et des agents IA pour surmonter ses lacunes techniques, le tout sans équipe ni financement externe.
2025-10-26•Habr — Data Science (RU)•1 min
Cette deuxième partie du tutoriel explore la transformation d'un bruit gaussien en images de chiffres et de lettres à l'aide d'un réseau de neurones, en utilisant le dataset EMNIST, tout en abordant les défis de manipulation et de visualisation des données.
2025-10-26•Habr — Machine Learning (RU)•1 min
L'article explore pourquoi l'IA, malgré ses avancées, ne peut remplacer l'homme en raison de son manque de créativité, de vision et de capacité à prendre des décisions, soulignant que l'IA est un outil pour augmenter la productivité humaine plutôt qu'un concurrent.
2025-10-26•Habr — Data Science (RU)•1 min
Malgré leur inefficacité prouvée, les intelligences artificielles continuent d'être promues en entreprise, générant des contenus médiocres et une perte de temps considérable pour les employés qui doivent souvent retravailler les documents produits.
2025-10-26•Le Monde IA•1 min
Alors que la digitalisation s'accélère et que les menaces en ligne se multiplient, plusieurs pays, dont la Russie, envisagent des systèmes d'identification obligatoire pour accéder à certains contenus, suscitant des débats sur la protection des données et la vie privée.
2025-10-26•Habr — Data Science (RU)•1 min