Navigation
Recherche
|
Une base de données pour l'IA, employée notamment par Apple, contient des vidéos YouTube
mardi 16 juillet 2024, 21:30 , par Mac Generation
Une enquête vient de montrer que les géants de la high-tech — Nvidia, Salesforce mais aussi Apple1 et bien d'autres — utilisent une base de données pour l'IA qui a été entraînée sur des vidéos YouTube sans l'accord des créateurs.
La base de données ne se base pas sur les vidéos directement, mais sur les transcriptions de ces dernières, sous la forme de sous-titres dans différentes langues. La co-enquête entre Wired et Proof News montre que la base contient des textes issus de plus de 48 000 chaînes, pour 173 536 vidéos. La base de données contient des dizaines de milliers de sous-titres de vidéos. Image YouTube. On trouve dans la liste des vidéos éducatives issues du MIT ou d'Hardware mais aussi d'émissions comme The Late Show With Stephen Colbert, Last Week Tonight With John Oliver ou Jimmy Kimmel Live. De nombreux vidéastes connus sont aussi de la partie, de Marques Brownlee à PewDiePie ou MrBeast. Les données en question se trouvent dans la base de données The Pile, collectée par...
https://www.macg.co/ailleurs/2024/07/une-base-de-donnees-pour-lia-employee-notamment-par-apple-conti...
Voir aussi |
59 sources (15 en français)
Date Actuelle
jeu. 21 nov. - 18:58 CET
|