Javascript is required
logo-dastralogo-dastra

Modèle d'auditFormulaire standardisé de documentation du modèle IA (Code de pratique GPAI)

IA
Ce formulaire comprend toutes les informations devant être documentées dans le cadre de la Mesure 1.1 du chapitre Transparence du Code de conduite GPAI. Il permet aux fournisseurs GPAI de compiler et de maintenir les informations techniques et de conformité requises de manière cohérente et structurée.

1. Introduction

2. Informations générales

2.1. Raison sociale du fournisseur du modèle
2.2. Nom du modèle

L'identifiant unique du modèle (par exemple Llama 3.1-405B), y compris l'identifiant de la collection de modèles, le cas échéant, et une liste des noms des versions accessibles au public du modèle concerné couvertes par la documentation du modèle.

2.3. Authenticité du modèle

Preuves établissant la provenance et l'authenticité du modèle (par exemple, un hachage sécurisé si des binaires sont distribués, ou le point de terminaison de l'URL dans le cas d'un service), lorsqu'elles sont disponibles.

2.4. Date de lancement

Date à laquelle le modèle a été lancé pour la première fois via un canal de distribution.

2.5. Date de mise sur le marché de l'Union
2.6. Dépendances du modèle

Si le modèle résulte d'une modification ou d'un perfectionnement d'un ou plusieurs modèles d'IA à usage général déjà commercialisés, veuillez indiquer le ou les noms de ces modèles (et leurs versions si plusieurs versions ont été commercialisées). Sinon, indiquez « N/A ».

3. Caractéristiques du modèle

3.1. Décrivez l'architecture du modèle

Une description générale de l'architecture du modèle, par exemple une architecture de transformateur

[20 mots recommandés]

3.2. Décrivez les spécifications de conception du modèle

Une description générale des principales spécifications de conception du modèle, incluant la justification et les hypothèses retenues, afin de fournir un aperçu général de sa conception. Veuillez préciser tout autre élément. [100 mots recommandés]

3.3. Quelles sont les modalités de saisie ?
3.4. Si autre, veuillez préciser
3.5. Pour chaque modalité sélectionnée, veuillez préciser la taille d'entrée maximale ou écrire « N/A » si elle n'est pas définie
3.6. Quelles sont les modalités de sortie ?
3.7. Si autre, veuillez préciser
3.8. Pour chaque modalité sélectionnée, veuillez préciser la taille de sortie maximale ou écrire « N/A » si elle n'est pas définie
3.9. Indiquez la taille totale du modèle

Le nombre total de paramètres du modèle, enregistrés avec au moins deux chiffres significatifs, par exemple 7,3*10^10 paramètres.

3.10. Indiquez la fourchette dans laquelle se situe le nombre total de paramètres

4. Méthodes de distribution et licences

1. Canaux de distribution

1.1. Sélectionnez les méthodes de distribution par lesquelles le modèle a été mis à disposition pour distribution ou utilisation sur le marché de l’Union
1.2. S'il y en a, indiquez les autres méthodes de distribution
1.3. Pour chaque méthode de distribution répertoriée, veuillez indiquer un lien vers des informations sur la manière dont le modèle est accessible, le cas échéant, et le niveau d'accès au modèle (par exemple, accès au niveau des pondérations, accès à la boîte noire).

2. License

2.1. Sélectionnez les méthodes de distribution par lesquelles le modèle peut être mis à disposition des fournisseurs en aval :
2.2. Veuillez fournir un lien vers les licences des modèles (sinon fournir une copie des licences sur demande de l'OAI) ou indiquer qu'aucune licence du modèle n'existe
2.3. Sélectionnez le type ou la catégorie de licence(s) sous laquelle/lesquelles le modèle peut être mis à disposition des fournisseurs en aval :
2.4. Décrivez comment l’accès au modèle est fourni pour une utilisation en aval, par exemple via les conditions de service.
2.5. Actifs supplémentaires

5. Utilisation

5.1. Veuillez fournir un lien vers la politique d'utilisation acceptable applicable ou indiquer qu'il n'en existe aucune
5.2. Veuillez fournir une description des utilisations prévues

Une description :

(i) des utilisations prévues par le fournisseur (par exemple, amélioration de la productivité, traduction, création de contenu, analyse et visualisation de données, assistance à la programmation, planification, support client, diverses tâches en langage naturel, etc.) ou

(ii) des utilisations restreintes et/ou interdites par le fournisseur (au-delà de celles interdites par le droit européen ou international, y compris l’article 5 de l'IA Act), dans les deux cas, comme spécifié dans les informations fournies par le fournisseur dans les instructions d’utilisation, les conditions générales, les supports et déclarations promotionnels ou commerciaux, ainsi que dans la documentation technique.

Si la mention (i) ou (ii) est incompatible avec la nature de la licence sous laquelle le modèle est fourni, la mention « N/A » peut être indiquée.

[200 mots recommandés]

5.3. Veuillez fournir une description du type et de la nature des systèmes d'IA dans lesquels le modèle d'IA à usage général peut être intégré

Une liste ou une description :

(i) du type et de la nature des systèmes d'IA dans lesquels le modèle d'IA polyvalent peut être intégré ;

(ii) du type et de la nature des systèmes d'IA dans lesquels le modèle d'IA polyvalent ne devrait pas être intégré.

Par exemple, les systèmes autonomes, les assistants conversationnels, les systèmes d'aide à la décision, les systèmes d'IA créatifs, les systèmes prédictifs, la cybersécurité, la surveillance ou la collaboration homme-IA.

[300 mots maximum recommandés]

5.4. Décrivez les moyens techniques d'intégration du modèle

Description générale des moyens techniques (par exemple, mode d'emploi, infrastructure, outils) nécessaires à l'intégration du modèle d'IA polyvalent aux systèmes d'IA.

[100 mots recommandés]

5.5. Décrivez le matériel requis

Une description de tout matériel, y compris la version, requis pour utiliser le modèle, le cas échéant. Si ce n'est pas le cas (par exemple, modèle proposé via une API), la mention « N/A » doit être indiquée.

[100 mots recommandés]

5.6. Décrivez le logiciel requis

Une description de tout logiciel, y compris la version, requis pour utiliser le modèle, le cas échéant. À défaut, indiquer « N/A ».

[100 mots recommandés]

6. Processus d'entraînement du modèle

6.1. Décrivez les spécifications de conception du processus d'entrainement

Description générale des principales étapes du processus d'apprentissage, incluant les méthodologies et techniques d'apprentissage, les principaux choix de conception, les hypothèses retenues, les objectifs d'optimisation du modèle et la pertinence des différents paramètres, le cas échéant.

Par exemple, « le modèle est initialisé avec des pondérations sélectionnées aléatoirement et optimisé par gradient via l'optimiseur Adam en deux étapes. Premièrement, le modèle est entraîné à prédire le mot suivant sur un vaste corpus de préapprentissage en utilisant la perte d'entropie croisée, en transmettant les données d'une seule époque. Deuxièmement, le modèle est post-entraîné sur un ensemble de données de préférences humaines pour 10 époques afin de l'aligner sur les valeurs humaines et de le rendre plus utile pour répondre aux invites utilisateur. »

[400 mots recommandés]

6.2. Veuillez fournir une description de la justification de la décision

Description des principaux choix de conception pour l'entraînement du modèle.

[200 mots recommandés]

7. Informations sur les données utilisées pour l'entraînement et les tests

7.1. Sélectionnez le type/la modalité de données qui s'applique :
7.2. Si autre, veuillez préciser
7.3. Sélectionnez la provenance des données qui s'applique :
7.4. Si autre, veuillez préciser
7.5. Décrivez comment les données ont été obtenues et sélectionnées

Une description des méthodes utilisées pour obtenir et sélectionner les données d'entraînement, de test et de validation y compris les méthodes et ressources utilisées pour annoter les données ainsi que les modèles et méthodes utilisés pour générer des données synthétiques, le cas échéant.

Pour les données précédemment obtenues auprès de tiers, une description de la manière dont le fournisseur a obtenu les droits sur les données, si ceux-ci ne sont pas déjà divulgués dans le résumé public des données d'entraînement publié conformément à l'article 53, paragraphe 1, point d).

[300 mots recommandés]

7.6. Veuillez fournir un certain nombre de points de données

La taille (en nombre de points de données) des données de formation, de test et de validation respectivement, ainsi que la définition de l'unité de points de données (par exemple, jetons ou documents, images, heures de vidéo ou images), enregistrées avec au moins un chiffre significatif (par exemple, 3x10^13 jetons).

7.7. Veuillez fournir un certain nombre de points de données (au moins deux chiffres significatifs)

La taille (en nombre de points de données) des données de formation, de test et de validation respectivement, ainsi que la définition de l'unité de points de données (par exemple, jetons ou documents, images, heures de vidéo ou images), enregistrées avec au moins deux chiffres significatifs (par exemple, 1,5x10^13 jetons).

7.8. Décrivez la portée et les principales caractéristiques

Description générale de la portée et des principales caractéristiques des données de formation, de test et de validation, telles que le domaine (par exemple, soins de santé, sciences, droit, etc.), la géographie (par exemple, mondiale, limitée à une région donnée, etc.), la langue et la couverture des modalités, le cas échéant.

[200 mots recommandés]

7.9. Décrivez les méthodologies de conservation des données

Description générale du traitement des données permettant de transformer les données acquises en données d'apprentissage, de test et de validation du modèle, comme le nettoyage (par exemple, le filtrage des contenus non pertinents comme les publicités), la normalisation (par exemple, la tokenisation) et l'augmentation (par exemple, la rétrotraduction).

[300 mots recommandés]

7.10. Décrivez les mesures permettant de détecter l’inadéquation des sources de données

Description des méthodes mises en œuvre pour l'acquisition ou le traitement des données, le cas échéant, afin de détecter la présence de sources de données inappropriées compte tenu des utilisations prévues du modèle, y compris, mais sans s'y limiter, les contenus illicites, les images d'abus sexuels sur mineurs (ASMM), les images intimes non consensuelles (ICIN) et les données personnelles conduisant à leur traitement illicite.

[400 mots recommandés]

7.11. Décrivez les mesures permettant de détecter les biais identifiables

Une description des méthodes mises en œuvre lors de l'acquisition ou du traitement des données, le cas échéant, pour remédier à la prévalence de biais identifiables dans les données d'apprentissage.

[200 mots recommandés]

8. Ressources computationnelles (pendant l'entraînement)

8.1. Décrivez le temps de l'entraînement

Une description de la période mesurée ainsi que la plage dans laquelle sa durée se situe, dans les plages suivantes : moins d'un mois, 1 à 3 mois, 3 à 6 mois, plus de 6 mois.

8.2. Veuillez fournir une description de la période mesurée

Une description de la période mesurée ainsi que la durée en jours d'horloge murale (par exemple 9x10^1 jours) et en jours matériels (par exemple 4x10^5 jours Nvidia A100 et 2x10^5 jours Nvidia H100), toutes deux enregistrées avec au moins un chiffre significatif.

8.3. Quelle est la quantité mesurée ou estimée de computation utilisé pour l'entraînement

Signalé dans les opérations en virgule flottante et enregistré jusqu'à son ordre de grandeur (par exemple 10^24 opérations en virgule flottante).

8.4. Quelle est la quantité mesurée ou estimée de computation utilisé pour l'entraînement (au moins deux chiffres significatifs) ?

Signalé dans les opérations de calcul et enregistré avec au moins deux chiffres significatifs (par exemple, 2,4x10^25 opérations à virgule flottante).

8.5. Quelle est la méthode de mesure ?

En l’absence d’un acte délégué adopté pour détailler les méthodes de mesure et de calcul, décrivez la méthode utilisée pour mesurer ou estimer la quantité de computation utilisée pour l'entraînement.

9. Consommation d'énergie (pendant l'entraînement et l'inférence)

9.1. Quelle est la quantité d’énergie utilisée pour l’entraînement ?

Quantité d'énergie mesurée ou estimée utilisée pour l'entraînement, exprimée en mégawattheures et enregistrée avec au moins deux chiffres significatifs (par exemple, 1,0 x 102 MWh).

Si la quantité d'énergie utilisée pour l'entraînement ne peut être estimée faute d'informations critiques de la part du fournisseur de matériel informatique, indiquez « N/A ».

9.2. Quelle est votre méthode de mesure ?

En l'absence d'acte délégué détaillant les méthodes de mesure et de calcul, veuillez décrire la méthode utilisée pour mesurer ou estimer la quantité d'énergie utilisée pour l'entraînement.

Si la consommation énergétique du modèle est inconnue, elle peut être estimée à partir des informations relatives aux ressources de calcul utilisées.

Si la quantité d'énergie utilisée pour l'entraînement ne peut être estimée faute d'informations critiques de la part d'un fournisseur de ressources informatiques ou matérielles, ce dernier doit divulguer le type d'informations manquantes.

[100 mots recommandés]

9.3. Quelle est la quantité de calcul référencée utilisée pour l’inférence ?

Déclarée en opérations en virgule flottante, enregistrée avec au moins deux chiffres significatifs (par exemple, 5,1 x 10^17 opérations en virgule flottante).

Cet élément concerne la consommation d'énergie lors de l'inférence, qui constitue la « consommation d'énergie du modèle » (Annexe XI, 2(e), IA Act) ainsi que la consommation d'énergie lors de l'entrainement. La consommation d'énergie lors de l'inférence ne dépendant pas uniquement du modèle lui-même, les informations requises pour cet élément se limitent aux informations pertinentes dépendant uniquement du modèle, à savoir les ressources de calcul utilisées pour l'inférence.

9.4. Quelle est la méthodologie de mesure ?

En l'absence d'un acte délégué adopté pour détailler les méthodologies de mesure et de calcul, veuillez fournir une description d'une tâche de calcul (par exemple, générer 100 000 jetons) et du matériel (par exemple, 64 Nvidia A100) utilisé pour mesurer ou estimer la quantité de calcul utilisée pour l'inférence.

Créé le:16/08/2025

Mis à jour le :20/00/2026

Licence : © Creative commons :
Attribution / Pas d'utilisation commerciale
CC-BY-NC AttributionPas d'utilisation commerciale

Auteur :
Jérôme de Mercey
Jérôme de Mercey

Nombre d'utilisations :15


Accédez à tous nos modèles d'audit

Essayez Dastra dès maintenant pour accéder à la totalité de nos modèles d'audit que vous pourrez adapter à votre organisation. C'est gratuit et sans engagement les 30 premiers jours (pas de carte bleue requise)

Utiliser ce modèle d'audit
Inscrivez-vous à notre newsletter

Nous vous enverrons quelques emails pour vous tenir informé de notre actualité et des nouveautés de notre solution

* Vous pourrez toujours vous désinscrire sur chaque newsletter.