Voici les termes français qu'il convient officiellement d'utiliser en lieu et place de termes anglais couramment employés dans le domaine de l'intelligence artificielle (Journal Officiel du 6 septembre 2024).
Adversarial machine learning (AML) => Apprentissage antagoniste
Domaine : Informatique.
Définition : Apprentissage automatique qui consiste à entraîner un modèle à partir d'un jeu de données comprenant des données trompeuses ou ambiguës, de manière qu'il apprenne à discerner de telles données.
Notes :
1. Les données trompeuses ou ambiguës sont souvent produites par un autre modèle.
2. L'apprentissage antagoniste sert par exemple à améliorer la reconnaissance d'infox vidéo, ou d'images et de textes falsifiés.
Transfer learning => Apprentissage par transfert
Domaine : Informatique.
Définition : Apprentissage automatique qui consiste à soumettre un modèle préentraîné à une nouvelle phase d'entraînement sur un volume réduit de données relatives à un domaine cible afin que le modèle ainsi obtenu génère des réponses pertinentes pour ce domaine.
Note : L'apprentissage par transfert réduit la durée et le coût de l'apprentissage automatique dans un domaine cible, notamment lorsque le volume de données disponibles dans ce domaine est faible.
Voir aussi : apprentissage automatique, modèle préentraîné.
AI audio generation (ou audio generative AI) => Génération automatique d'audio
Domaine : Informatique.
Définition : Opération qui consiste à produire ou à modifier des contenus audio, en réponse à une instruction générative, le plus souvent en utilisant un modèle à bruit statistique.
Note : La génération automatique d'audio est notamment employée pour composer des œuvres musicales en imitant un style donné ou pour produire un énoncé oral en imitant une voix particulière.
Voir aussi : infox vidéo, instruction générative, modèle à bruit statistique.
AI text generation, ou automatic text generation, ou text generation => Génération automatique de texte
Domaine : Informatique.
Définition : Opération par laquelle un grand modèle de langage, en réponse à une instruction générative, produit, modifie ou complète automatiquement des textes.
Note :
1.
La génération automatique de texte en langue naturelle peut être
employée, par exemple, pour répondre à une simple question, pour
produire un résumé, un rapport, une traduction, voire une œuvre
littéraire.
2. La génération automatique de texte en langage de
programmation est notamment employée à des fins d'écriture ou de
correction de codes sources.
AI image generation, automatic image generation, image2image, image-to-image, text2image, text-to-image => Génération automatique d'image
Domaine : Informatique.
Définition : Opération qui consiste à produire ou à modifier des images, en réponse à une instruction générative, le plus souvent en utilisant un modèle à bruit statistique.
Note : La génération automatique d'image peut être appliquée aux images animées. On parle alors de « génération automatique de vidéo ».
Voir aussi : infox vidéo, instruction générative, modèle à bruit statistique.
Large language model (LLM) => Grand modèle de langage (GML)
Domaine : Informatique.
Définition : Modèle génératif qui, à partir de grands volumes de données textuelles, calcule des probabilités des enchaînements de jetons textuels en vue de la génération automatique de texte ou de code informatique.
Notes :
1. Les
données textuelles du jeu d'entraînement d'un grand modèle de langage
sont généralement moissonnées au préalable sur la toile et traitées par
des transformeurs.
2. Les grands modèles de langage sont notamment
employés dans les dialogueurs, la transcription automatique de la parole
et la synthèse vocale.
Prompt => Instruction générative (ou instruction)
Domaine : Informatique.
Définition : Consigne donnée par un utilisateur à un modèle génératif, généralement formulée en langue naturelle, qui décrit la tâche à accomplir.
Notes :
1.
L'instruction générative peut prendre la forme d'un texte à compléter,
d'une question, d'une consigne à respecter dans la production de la
réponse, voire d'un ou de plusieurs exemples de résultats attendus.
2. On trouve aussi le terme « invite », qui est déconseillé dans ce sens.
GenAI, generative AI, generative artificial intelligence => Intelligence artificielle générative ou, en forme abrégée : IA générative.
Définition : Branche de l'intelligence artificielle mettant en œuvre des modèles génératifs, qui vise à produire des contenus textuels, graphiques ou audiovisuels.
Voir aussi : génération automatique d'audio, génération automatique de texte, génération automatique d'image, intelligence artificielle, modèle génératif.
Text token, token => Jeton textuel
Définition : Donnée élémentaire d'un grand modèle de langage, qui est constituée d'une suite de caractères obtenue par la segmentation automatique d'un texte.
Notes :
1. La segmentation en jetons
textuels est utilisée aussi bien dans la phase d'apprentissage
automatique que dans la phase de traitement d'une instruction
générative.
2. Le nombre de jetons textuels sert à mesurer la taille
d'un grand modèle de langage ; il permet aussi d'estimer et de facturer
le coût de fonctionnement des grands modèles de langage commerciaux.
Diffusion model, diffusion probabilistic model, latent diffusion model (LDM), score-based generative model => Modèle à bruit statistique
Domaine : Informatique-Audiovisuel/Infographie.
Définition : Modèle génératif qui est obtenu par un apprentissage automatique, au cours duquel est éliminé le bruit statistique préalablement ajouté aux données du jeu d'entraînement et qui produit des contenus graphiques ou audio nouveaux.
Note : L'instruction générative donnée à un modèle à bruit statistique peut être une image assortie d'un texte spécifiant par exemple l'application d'un style ou l'ajout d'un élément dans la composition du contenu à produire.
Voir aussi : apprentissage automatique, génération automatique d'audio, génération automatique d'image, instruction générative, modèle génératif.
Deep generative model, foundation model, generative model => Modèle génératif
Domaine : Informatique.
Définition : Résultat d'un apprentissage automatique destiné à être appliqué à une tâche de génération de données comparables à celles de son jeu de données d'entraînement.
Notes :
1. Un modèle génératif est généralement obtenu par l'application d'un apprentissage supervisé à un modèle préentraîné.
2.
Un modèle génératif est notamment utilisé dans la génération
automatique de texte, la génération automatique d'image et la génération
automatique d'audio.
3. On trouve aussi, dans le langage professionnel, le terme « modèle de fondation », qui est déconseillé.
Pretrained model => Modèle préentraîné (ou, en forme développée : modèle d'apprentissage préentraîné).
Domaine : Informatique.
Définition : Résultat d'un apprentissage automatique généraliste réalisé sur un grand volume de données, qui est destiné à être réutilisé dans une grande variété de tâches, généralement à l'issue d'un apprentissage par transfert.
Note : Un modèle préentraîné est accompagné d'une notice.
Voir aussi : apprentissage automatique, apprentissage par transfert, notice de modèle préentraîné.
Model card => Notice de modèle préentraîné (ou, en forme développée : notice de modèle d'apprentissage préentraîné).
Domaine : Informatique.
Définition : Ensemble des informations qui accompagnent un modèle préentraîné et qui définissent les caractéristiques de son jeu de données d'entraînement, son paramétrage et le cadre de son utilisation.
Voir aussi : modèle préentraîné.
Transformer => Transformeur, n.m.
Domaine : Informatique.
Définition : Réseau de neurones artificiels qui réalise un traitement parallèle des données d'entraînement d'un apprentissage autosupervisé afin de développer un modèle génératif.
Notes :
1. Le traitement parallèle permet
d'accélérer l'apprentissage et ainsi d'exploiter à faible coût des jeux
de données hétérogènes, peu ou pas structurées.
2. Le transformeur
est notamment utilisé dans la génération automatique de texte, la
génération automatique d'image et la génération automatique d'audio.
Source : Commission d'enrichissement de la langue française, Journal Officiel du 6 septembre 2024.