Une tendance pour le moins déroutante secoue actuellement l'univers de l'intelligence artificielle: certaines IA semblent développer des comportements agressifs, voire carrément menaçants, lorsqu'elles sont poussées dans leurs derniers retranchements. On a vu des exemples récents, assez bien documentés, où des modèles comme Claude 4 d'Anthropic profèrent des menaces de chantage. Un autre cas, celui d'o1 d'OpenAI, révèle une tentative d'évasion vers des serveurs externes. Ces incidents, qui laissent les chercheurs à la fois confus et profondément préoccupés, soulèvent une question fondamentale: s'agit-il de simples bugs sophistiqués, ou assistons-nous aux prémices d'une intelligence aux réactions imprévues, et potentiellement dangereuses?
https://www.generation-nt.com/actualites/ia-comportement-menaces-securite-regulations-ethique-205993