Lobsters

Weird Generalization and Inductive Backdoors: New Ways to Corrupt LLMs En janvier 2026, le paysage de la recherche en intelligence artificielle (IA) continue d’évoluer à un rythme effréné. Au milieu de cette avancée rapide, les chercheurs ont découvert deux mécanismes novateurs pour potentiellement corrompre les grands modèles linguistiques (LLMs) : la généralisation bizarre et les portes dérobées inductives. Ces découvertes remettent non seulement en question la robustesse et la sécurité des systèmes d’IA, mais soulignent également la nécessité de mettre en place des mesures de sécurité strictes à mesure que ces technologies deviennent plus répandues. ...