Modèle d'auditFormulaire standardisé de documentation du modèle IA (Code de pratique GPAI)
1. Introduction
2. Informations générales
L'identifiant unique du modèle (par exemple Llama 3.1-405B), y compris l'identifiant de la collection de modèles, le cas échéant, et une liste des noms des versions accessibles au public du modèle concerné couvertes par la documentation du modèle.
Preuves établissant la provenance et l'authenticité du modèle (par exemple, un hachage sécurisé si des binaires sont distribués, ou le point de terminaison de l'URL dans le cas d'un service), lorsqu'elles sont disponibles.
Date à laquelle le modèle a été lancé pour la première fois via un canal de distribution.
Si le modèle résulte d'une modification ou d'un perfectionnement d'un ou plusieurs modèles d'IA à usage général déjà commercialisés, veuillez indiquer le ou les noms de ces modèles (et leurs versions si plusieurs versions ont été commercialisées). Sinon, indiquez « N/A ».
3. Caractéristiques du modèle
Une description générale de l'architecture du modèle, par exemple une architecture de transformateur
[20 mots recommandés]
Une description générale des principales spécifications de conception du modèle, incluant la justification et les hypothèses retenues, afin de fournir un aperçu général de sa conception. Veuillez préciser tout autre élément. [100 mots recommandés]
Le nombre total de paramètres du modèle, enregistrés avec au moins deux chiffres significatifs, par exemple 7,3*10^10 paramètres.
4. Méthodes de distribution et licences
1. Canaux de distribution
2. License
5. Utilisation
Une description :
(i) des utilisations prévues par le fournisseur (par exemple, amélioration de la productivité, traduction, création de contenu, analyse et visualisation de données, assistance à la programmation, planification, support client, diverses tâches en langage naturel, etc.) ou
(ii) des utilisations restreintes et/ou interdites par le fournisseur (au-delà de celles interdites par le droit européen ou international, y compris l’article 5 de l'IA Act), dans les deux cas, comme spécifié dans les informations fournies par le fournisseur dans les instructions d’utilisation, les conditions générales, les supports et déclarations promotionnels ou commerciaux, ainsi que dans la documentation technique.
Si la mention (i) ou (ii) est incompatible avec la nature de la licence sous laquelle le modèle est fourni, la mention « N/A » peut être indiquée.
[200 mots recommandés]
Une liste ou une description :
(i) du type et de la nature des systèmes d'IA dans lesquels le modèle d'IA polyvalent peut être intégré ;
(ii) du type et de la nature des systèmes d'IA dans lesquels le modèle d'IA polyvalent ne devrait pas être intégré.
Par exemple, les systèmes autonomes, les assistants conversationnels, les systèmes d'aide à la décision, les systèmes d'IA créatifs, les systèmes prédictifs, la cybersécurité, la surveillance ou la collaboration homme-IA.
[300 mots maximum recommandés]
Description générale des moyens techniques (par exemple, mode d'emploi, infrastructure, outils) nécessaires à l'intégration du modèle d'IA polyvalent aux systèmes d'IA.
[100 mots recommandés]
Une description de tout matériel, y compris la version, requis pour utiliser le modèle, le cas échéant. Si ce n'est pas le cas (par exemple, modèle proposé via une API), la mention « N/A » doit être indiquée.
[100 mots recommandés]
Une description de tout logiciel, y compris la version, requis pour utiliser le modèle, le cas échéant. À défaut, indiquer « N/A ».
[100 mots recommandés]
6. Processus d'entraînement du modèle
Description générale des principales étapes du processus d'apprentissage, incluant les méthodologies et techniques d'apprentissage, les principaux choix de conception, les hypothèses retenues, les objectifs d'optimisation du modèle et la pertinence des différents paramètres, le cas échéant.
Par exemple, « le modèle est initialisé avec des pondérations sélectionnées aléatoirement et optimisé par gradient via l'optimiseur Adam en deux étapes. Premièrement, le modèle est entraîné à prédire le mot suivant sur un vaste corpus de préapprentissage en utilisant la perte d'entropie croisée, en transmettant les données d'une seule époque. Deuxièmement, le modèle est post-entraîné sur un ensemble de données de préférences humaines pour 10 époques afin de l'aligner sur les valeurs humaines et de le rendre plus utile pour répondre aux invites utilisateur. »
[400 mots recommandés]
Description des principaux choix de conception pour l'entraînement du modèle.
[200 mots recommandés]
7. Informations sur les données utilisées pour l'entraînement et les tests
Une description des méthodes utilisées pour obtenir et sélectionner les données d'entraînement, de test et de validation y compris les méthodes et ressources utilisées pour annoter les données ainsi que les modèles et méthodes utilisés pour générer des données synthétiques, le cas échéant.
Pour les données précédemment obtenues auprès de tiers, une description de la manière dont le fournisseur a obtenu les droits sur les données, si ceux-ci ne sont pas déjà divulgués dans le résumé public des données d'entraînement publié conformément à l'article 53, paragraphe 1, point d).
[300 mots recommandés]
La taille (en nombre de points de données) des données de formation, de test et de validation respectivement, ainsi que la définition de l'unité de points de données (par exemple, jetons ou documents, images, heures de vidéo ou images), enregistrées avec au moins un chiffre significatif (par exemple, 3x10^13 jetons).
La taille (en nombre de points de données) des données de formation, de test et de validation respectivement, ainsi que la définition de l'unité de points de données (par exemple, jetons ou documents, images, heures de vidéo ou images), enregistrées avec au moins deux chiffres significatifs (par exemple, 1,5x10^13 jetons).
Description générale de la portée et des principales caractéristiques des données de formation, de test et de validation, telles que le domaine (par exemple, soins de santé, sciences, droit, etc.), la géographie (par exemple, mondiale, limitée à une région donnée, etc.), la langue et la couverture des modalités, le cas échéant.
[200 mots recommandés]
Description générale du traitement des données permettant de transformer les données acquises en données d'apprentissage, de test et de validation du modèle, comme le nettoyage (par exemple, le filtrage des contenus non pertinents comme les publicités), la normalisation (par exemple, la tokenisation) et l'augmentation (par exemple, la rétrotraduction).
[300 mots recommandés]
Description des méthodes mises en œuvre pour l'acquisition ou le traitement des données, le cas échéant, afin de détecter la présence de sources de données inappropriées compte tenu des utilisations prévues du modèle, y compris, mais sans s'y limiter, les contenus illicites, les images d'abus sexuels sur mineurs (ASMM), les images intimes non consensuelles (ICIN) et les données personnelles conduisant à leur traitement illicite.
[400 mots recommandés]
Une description des méthodes mises en œuvre lors de l'acquisition ou du traitement des données, le cas échéant, pour remédier à la prévalence de biais identifiables dans les données d'apprentissage.
[200 mots recommandés]
8. Ressources computationnelles (pendant l'entraînement)
Une description de la période mesurée ainsi que la plage dans laquelle sa durée se situe, dans les plages suivantes : moins d'un mois, 1 à 3 mois, 3 à 6 mois, plus de 6 mois.
Une description de la période mesurée ainsi que la durée en jours d'horloge murale (par exemple 9x10^1 jours) et en jours matériels (par exemple 4x10^5 jours Nvidia A100 et 2x10^5 jours Nvidia H100), toutes deux enregistrées avec au moins un chiffre significatif.
Signalé dans les opérations en virgule flottante et enregistré jusqu'à son ordre de grandeur (par exemple 10^24 opérations en virgule flottante).
Signalé dans les opérations de calcul et enregistré avec au moins deux chiffres significatifs (par exemple, 2,4x10^25 opérations à virgule flottante).
En l’absence d’un acte délégué adopté pour détailler les méthodes de mesure et de calcul, décrivez la méthode utilisée pour mesurer ou estimer la quantité de computation utilisée pour l'entraînement.
9. Consommation d'énergie (pendant l'entraînement et l'inférence)
Quantité d'énergie mesurée ou estimée utilisée pour l'entraînement, exprimée en mégawattheures et enregistrée avec au moins deux chiffres significatifs (par exemple, 1,0 x 102 MWh).
Si la quantité d'énergie utilisée pour l'entraînement ne peut être estimée faute d'informations critiques de la part du fournisseur de matériel informatique, indiquez « N/A ».
En l'absence d'acte délégué détaillant les méthodes de mesure et de calcul, veuillez décrire la méthode utilisée pour mesurer ou estimer la quantité d'énergie utilisée pour l'entraînement.
Si la consommation énergétique du modèle est inconnue, elle peut être estimée à partir des informations relatives aux ressources de calcul utilisées.
Si la quantité d'énergie utilisée pour l'entraînement ne peut être estimée faute d'informations critiques de la part d'un fournisseur de ressources informatiques ou matérielles, ce dernier doit divulguer le type d'informations manquantes.
[100 mots recommandés]
Déclarée en opérations en virgule flottante, enregistrée avec au moins deux chiffres significatifs (par exemple, 5,1 x 10^17 opérations en virgule flottante).
Cet élément concerne la consommation d'énergie lors de l'inférence, qui constitue la « consommation d'énergie du modèle » (Annexe XI, 2(e), IA Act) ainsi que la consommation d'énergie lors de l'entrainement. La consommation d'énergie lors de l'inférence ne dépendant pas uniquement du modèle lui-même, les informations requises pour cet élément se limitent aux informations pertinentes dépendant uniquement du modèle, à savoir les ressources de calcul utilisées pour l'inférence.
En l'absence d'un acte délégué adopté pour détailler les méthodologies de mesure et de calcul, veuillez fournir une description d'une tâche de calcul (par exemple, générer 100 000 jetons) et du matériel (par exemple, 64 Nvidia A100) utilisé pour mesurer ou estimer la quantité de calcul utilisée pour l'inférence.
Attribution / Pas d'utilisation commerciale
CC-BY-NC