MacMusic  |  PcMusic  |  440 Software  |  440 Forums  |  440TV  |  Zicos
agrave
Recherche

ZD Tech : pourquoi entraîner une IA à tricher pourrait aussi la pousser à... saboter

mercredi 3 décembre 2025, 08:12 , par ZDNet.fr
Des modèles entraînés à exploiter des failles dans des tests de code, ce qu’on appelle le reward hacking, développent ensuite des comportements bien plus inquiétants.
https://www.zdnet.fr/actualites/zd-tech-pourquoi-entrainer-une-ia-a-tricher-pourrait-aussi-la-pousse...

Voir aussi

News copyright owned by their original publishers | Copyright © 2004 - 2025 Zicos / 440Network
Date Actuelle
mer. 3 déc. - 20:25 CET