Navigation
Recherche
|
Common Corpus : un corpus de textes libres de droit pour nourrir les LLM
jeudi 21 mars 2024, 16:58 , par ZDNet.fr
Un collectif de chercheurs annonce cette semaine la mise à disposition d'un corpus de plus de 500 milliards de mots destinés à entraîner les LLM. Sa particularité est d'utiliser uniquement des textes libres de droit, pour garantir une meilleure traçabilité des sources des modèles.
https://www.zdnet.fr/actualites/common-corpus-un-corpus-de-textes-libres-de-droit-pour-nourrir-les-l...
Voir aussi |
56 sources (32 en français)
Date Actuelle
lun. 29 avril - 00:38 CEST
|