vendredi 6 septembre 2024

Intelligence artificielle (IA) : les termes français à utiliser en lieu et place des termes anglais

Voici les termes français qu'il convient officiellement d'utiliser en lieu et place de termes anglais couramment employés dans le domaine de l'intelligence artificielle (Journal Officiel du 6 septembre 2024).

Adversarial machine learning (AML) => Apprentissage antagoniste

Domaine : Informatique. 

Définition : Apprentissage automatique qui consiste à entraîner un modèle à partir d'un jeu de données comprenant des données trompeuses ou ambiguës, de manière qu'il apprenne à discerner de telles données. 

Notes :

1. Les données trompeuses ou ambiguës sont souvent produites par un autre modèle.
2. L'apprentissage antagoniste sert par exemple à améliorer la reconnaissance d'infox vidéo, ou d'images et de textes falsifiés.

Voir aussi : apprentissage automatique, infox vidéo.

Transfer learning => Apprentissage par transfert

Domaine : Informatique. 

Définition : Apprentissage automatique qui consiste à soumettre un modèle préentraîné à une nouvelle phase d'entraînement sur un volume réduit de données relatives à un domaine cible afin que le modèle ainsi obtenu génère des réponses pertinentes pour ce domaine. 

Note : L'apprentissage par transfert réduit la durée et le coût de l'apprentissage automatique dans un domaine cible, notamment lorsque le volume de données disponibles dans ce domaine est faible.

Voir aussi : apprentissage automatique, modèle préentraîné.

AI audio generation (ou audio generative AI) => Génération automatique d'audio

Domaine : Informatique.

Définition : Opération qui consiste à produire ou à modifier des contenus audio, en réponse à une instruction générative, le plus souvent en utilisant un modèle à bruit statistique.

Note : La génération automatique d'audio est notamment employée pour composer des œuvres musicales en imitant un style donné ou pour produire un énoncé oral en imitant une voix particulière.

Voir aussi : infox vidéo, instruction générative, modèle à bruit statistique.

AI text generation, ou automatic text generation, ou text generation => Génération automatique de texte

Domaine : Informatique.

Définition : Opération par laquelle un grand modèle de langage, en réponse à une instruction générative, produit, modifie ou complète automatiquement des textes.

Note :

 1. La génération automatique de texte en langue naturelle peut être employée, par exemple, pour répondre à une simple question, pour produire un résumé, un rapport, une traduction, voire une œuvre littéraire.
2. La génération automatique de texte en langage de programmation est notamment employée à des fins d'écriture ou de correction de codes sources.

Voir aussi : grand modèle de langage, instruction générative.

AI image generation, automatic image generation, image2image, image-to-image, text2image, text-to-image => Génération automatique d'image

Domaine : Informatique.

Définition : Opération qui consiste à produire ou à modifier des images, en réponse à une instruction générative, le plus souvent en utilisant un modèle à bruit statistique.

Note : La génération automatique d'image peut être appliquée aux images animées. On parle alors de « génération automatique de vidéo ».

Voir aussi : infox vidéo, instruction générative, modèle à bruit statistique.

Large language model (LLM) => Grand modèle de langage (GML)

Domaine : Informatique.

Définition : Modèle génératif qui, à partir de grands volumes de données textuelles, calcule des probabilités des enchaînements de jetons textuels en vue de la génération automatique de texte ou de code informatique.

Notes :

 1. Les données textuelles du jeu d'entraînement d'un grand modèle de langage sont généralement moissonnées au préalable sur la toile et traitées par des transformeurs.
2. Les grands modèles de langage sont notamment employés dans les dialogueurs, la transcription automatique de la parole et la synthèse vocale.

Voir aussi : dialogueur, génération automatique de texte, jeton textuel, modèle génératif, moissonnage de données, synthèse vocale de texte, transcription automatique de la parole, transformeur.

Prompt => Instruction générative (ou instruction)

Domaine : Informatique.

Définition : Consigne donnée par un utilisateur à un modèle génératif, généralement formulée en langue naturelle, qui décrit la tâche à accomplir.

Notes :

1. L'instruction générative peut prendre la forme d'un texte à compléter, d'une question, d'une consigne à respecter dans la production de la réponse, voire d'un ou de plusieurs exemples de résultats attendus.
2. On trouve aussi le terme « invite », qui est déconseillé dans ce sens.

Voir aussi : génération automatique d'audio, génération automatique de texte, génération automatique d'image, grand modèle de langage, modèle génératif.

GenAI, generative AI, generative artificial intelligence => Intelligence artificielle générative ou, en forme abrégée : IA générative.

Définition : Branche de l'intelligence artificielle mettant en œuvre des modèles génératifs, qui vise à produire des contenus textuels, graphiques ou audiovisuels.

Voir aussi : génération automatique d'audio, génération automatique de texte, génération automatique d'image, intelligence artificielle, modèle génératif.

Text token, token => Jeton textuel

Définition : Donnée élémentaire d'un grand modèle de langage, qui est constituée d'une suite de caractères obtenue par la segmentation automatique d'un texte.

Notes :

1. La segmentation en jetons textuels est utilisée aussi bien dans la phase d'apprentissage automatique que dans la phase de traitement d'une instruction générative.
2. Le nombre de jetons textuels sert à mesurer la taille d'un grand modèle de langage ; il permet aussi d'estimer et de facturer le coût de fonctionnement des grands modèles de langage commerciaux.

Voir aussi : apprentissage automatique, grand modèle de langage, instruction générative.

Diffusion model, diffusion probabilistic model, latent diffusion model (LDM), score-based generative model => Modèle à bruit statistique

Domaine : Informatique-Audiovisuel/Infographie.

Définition : Modèle génératif qui est obtenu par un apprentissage automatique, au cours duquel est éliminé le bruit statistique préalablement ajouté aux données du jeu d'entraînement et qui produit des contenus graphiques ou audio nouveaux.

Note : L'instruction générative donnée à un modèle à bruit statistique peut être une image assortie d'un texte spécifiant par exemple l'application d'un style ou l'ajout d'un élément dans la composition du contenu à produire.

Voir aussi : apprentissage automatique, génération automatique d'audio, génération automatique d'image, instruction générative, modèle génératif.

Deep generative model, foundation model, generative model => Modèle génératif

Domaine : Informatique.

Définition : Résultat d'un apprentissage automatique destiné à être appliqué à une tâche de génération de données comparables à celles de son jeu de données d'entraînement.

Notes :

1. Un modèle génératif est généralement obtenu par l'application d'un apprentissage supervisé à un modèle préentraîné.
2. Un modèle génératif est notamment utilisé dans la génération automatique de texte, la génération automatique d'image et la génération automatique d'audio.
3. On trouve aussi, dans le langage professionnel, le terme « modèle de fondation », qui est déconseillé.

Voir aussi : apprentissage automatique, apprentissage supervisé, génération automatique d'audio, génération automatique de texte, génération automatique d'image, instruction générative, modèle préentraîné, transformeur.

Pretrained model => Modèle préentraîné (ou, en forme développée : modèle d'apprentissage préentraîné).

Domaine : Informatique.

Définition : Résultat d'un apprentissage automatique généraliste réalisé sur un grand volume de données, qui est destiné à être réutilisé dans une grande variété de tâches, généralement à l'issue d'un apprentissage par transfert.

Note : Un modèle préentraîné est accompagné d'une notice.

Voir aussi : apprentissage automatique, apprentissage par transfert, notice de modèle préentraîné.

Model card => Notice de modèle préentraîné (ou, en forme développée : notice de modèle d'apprentissage préentraîné).

Domaine : Informatique.

Définition : Ensemble des informations qui accompagnent un modèle préentraîné et qui définissent les caractéristiques de son jeu de données d'entraînement, son paramétrage et le cadre de son utilisation.

Voir aussi : modèle préentraîné.

Transformer => Transformeur, n.m.

Domaine : Informatique.

Définition : Réseau de neurones artificiels qui réalise un traitement parallèle des données d'entraînement d'un apprentissage autosupervisé afin de développer un modèle génératif.

Notes :

1. Le traitement parallèle permet d'accélérer l'apprentissage et ainsi d'exploiter à faible coût des jeux de données hétérogènes, peu ou pas structurées.
2. Le transformeur est notamment utilisé dans la génération automatique de texte, la génération automatique d'image et la génération automatique d'audio.

Voir aussi : génération automatique d'audio, génération automatique de texte, génération automatique d'image, modèle génératif, réseau de neurones artificiels.

Source : Commission d'enrichissement de la langue française, Journal Officiel du 6 septembre 2024.