Leçons
Les fondamentaux de l'IA en anglais
Avant de plonger dans les sous-domaines, il y a une poignée de termes que tout le monde utilise dès qu'on parle d'intelligence artificielle en anglais. Ce sont les mots que vous retrouverez dans un article du MIT Technology Review, dans une réunion produit ou dans un podcast tech. Le problème, c'est que beaucoup de francophones confondent artificial intelligence, machine learning et deep learning alors que ces trois termes désignent des choses différentes.
Termes généraux (General AI terms)
| Anglais | Phonétique | Français |
|---|---|---|
| Artificial intelligence (AI) | /ˌɑːr.tɪˈfɪʃ.əl ɪnˈtel.ɪ.dʒəns/ | Intelligence artificielle (IA) |
| Machine learning (ML) | /məˈʃiːn ˈlɜːr.nɪŋ/ | Apprentissage automatique |
| Deep learning | /diːp ˈlɜːr.nɪŋ/ | Apprentissage profond |
| Algorithm | /ˈæl.ɡə.rɪð.əm/ | Algorithme |
| Model | /ˈmɒd.əl/ | Modèle |
| Dataset | /ˈdeɪ.tə.set/ | Jeu de données |
| Training | /ˈtreɪ.nɪŋ/ | Entraînement (d'un modèle) |
| Inference | /ˈɪn.fər.əns/ | Inférence (prédiction en production) |
| Neural network | /ˈnjʊr.əl ˈnet.wɜːrk/ | Réseau de neurones |
| Automation | /ˌɔː.təˈmeɪ.ʃən/ | Automatisation |
| Prediction | /prɪˈdɪk.ʃən/ | Prédiction |
| Classification | /ˌklæs.ɪ.fɪˈkeɪ.ʃən/ | Classification |
"We trained the model on a dataset of two million labeled images. During inference, it classifies new images in under 50 milliseconds. The accuracy on our test set is 94.3%."
« On a entraîné le modèle sur un jeu de données de deux millions d'images étiquetées. En inférence, il classe les nouvelles images en moins de 50 millisecondes. La précision sur notre jeu de test est de 94,3 %. »
Notez la différence entre training (phase d'apprentissage) et inference (utilisation en production). C'est la distinction la plus importante à maîtriser quand on parle d'IA en anglais.
Vocabulaire du machine learning en anglais
Le machine learning a son propre jargon, et il évolue vite. Les termes ci-dessous sont ceux que vous croiserez dans la documentation de scikit-learn, dans les articles de recherche et dans les discussions entre data scientists. Si vous travaillez dans la tech ou si vous collaborez avec des équipes techniques anglophones, ce vocabulaire est indispensable.
Types d'apprentissage (Learning paradigms)
| Anglais | Phonétique | Français |
|---|---|---|
| Supervised learning | /ˈsuː.pər.vaɪzd ˈlɜːr.nɪŋ/ | Apprentissage supervisé |
| Unsupervised learning | /ˌʌn.ˈsuː.pər.vaɪzd ˈlɜːr.nɪŋ/ | Apprentissage non supervisé |
| Reinforcement learning | /ˌriː.ɪnˈfɔːrs.mənt ˈlɜːr.nɪŋ/ | Apprentissage par renforcement |
| Semi-supervised learning | /ˌsem.i ˈsuː.pər.vaɪzd ˈlɜːr.nɪŋ/ | Apprentissage semi-supervisé |
| Self-supervised learning | /ˌself ˈsuː.pər.vaɪzd ˈlɜːr.nɪŋ/ | Apprentissage auto-supervisé |
| Transfer learning | /ˈtræns.fɜːr ˈlɜːr.nɪŋ/ | Apprentissage par transfert |
Concepts clés du ML (Key ML concepts)
| Anglais | Phonétique | Français |
|---|---|---|
| Feature | /ˈfiː.tʃər/ | Variable / Caractéristique |
| Label | /ˈleɪ.bəl/ | Étiquette (donnée annotée) |
| Training set | /ˈtreɪ.nɪŋ set/ | Jeu d'entraînement |
| Test set | /test set/ | Jeu de test |
| Validation set | /ˌvæl.ɪˈdeɪ.ʃən set/ | Jeu de validation |
| Overfitting | /ˌoʊ.vərˈfɪt.ɪŋ/ | Surapprentissage |
| Underfitting | /ˌʌn.dərˈfɪt.ɪŋ/ | Sous-apprentissage |
| Hyperparameter | /ˌhaɪ.pərˈpær.əm.ɪ.tər/ | Hyperparamètre |
| Loss function | /lɒs ˈfʌŋk.ʃən/ | Fonction de perte |
| Gradient descent | /ˈɡreɪ.di.ənt dɪˈsent/ | Descente de gradient |
| Epoch | /ˈep.ɒk/ | Époque (un passage complet sur les données) |
| Batch size | /bætʃ saɪz/ | Taille du lot |
| Learning rate | /ˈlɜːr.nɪŋ reɪt/ | Taux d'apprentissage |
| Cross-validation | /krɒs ˌvæl.ɪˈdeɪ.ʃən/ | Validation croisée |
| Accuracy | /ˈæk.jʊr.ə.si/ | Précision (taux de bonnes prédictions) |
| Precision | /prɪˈsɪʒ.ən/ | Précision (parmi les positifs prédits) |
| Recall | /rɪˈkɔːl/ | Rappel (taux de vrais positifs détectés) |
| F1 score | /ef wʌn skɔːr/ | Score F1 (moyenne harmonique) |
Vocabulaire du deep learning en anglais
Le deep learning est la branche du machine learning qui a fait exploser les performances en vision par ordinateur, en traitement du langage et en génération de contenu. Si vous travaillez avec des équipes qui utilisent TensorFlow, PyTorch ou des modèles pré-entraînés, ces termes reviennent en permanence.
| Anglais | Phonétique | Français |
|---|---|---|
| Neuron | /ˈnjʊr.ɒn/ | Neurone (artificiel) |
| Layer | /ˈleɪ.ər/ | Couche (d'un réseau) |
| Input layer | /ˈɪn.pʊt ˈleɪ.ər/ | Couche d'entrée |
| Hidden layer | /ˈhɪd.ən ˈleɪ.ər/ | Couche cachée |
| Output layer | /ˈaʊt.pʊt ˈleɪ.ər/ | Couche de sortie |
| Activation function | /ˌæk.tɪˈveɪ.ʃən ˈfʌŋk.ʃən/ | Fonction d'activation |
| Backpropagation | /ˌbæk.prɒp.əˈɡeɪ.ʃən/ | Rétropropagation |
| Convolutional neural network (CNN) | /ˌkɒn.vəˈluː.ʃən.əl/ | Réseau de neurones convolutif |
| Recurrent neural network (RNN) | /rɪˈkʌr.ənt/ | Réseau de neurones récurrent |
| Transformer | /trænsˈfɔːr.mər/ | Transformeur (architecture) |
| Attention mechanism | /əˈten.ʃən ˈmek.ə.nɪz.əm/ | Mécanisme d'attention |
| Dropout | /ˈdrɒp.aʊt/ | Dropout (régularisation) |
| Weight | /weɪt/ | Poids (d'une connexion) |
| Bias | /ˈbaɪ.əs/ | Biais |
| Embedding | /ɪmˈbed.ɪŋ/ | Plongement / Vecteur de représentation |
"The transformer architecture uses self-attention to weigh the importance of each token in the input sequence. Unlike RNNs, it processes all tokens in parallel, which makes training much faster on GPUs."
« L'architecture transformer utilise l'auto-attention pour pondérer l'importance de chaque token dans la séquence d'entrée. Contrairement aux RNN, elle traite tous les tokens en parallèle, ce qui rend l'entraînement beaucoup plus rapide sur GPU. »
Vocabulaire du NLP en anglais
Le traitement du langage naturel (NLP) est le domaine de l'IA qui a le plus changé ces dernières années, notamment grâce aux grands modèles de langage. Si vous utilisez ChatGPT, Google Translate ou un assistant vocal, vous utilisez du NLP. Voici les termes que vous rencontrerez dans les articles, les documentations et les conversations professionnelles.
| Anglais | Phonétique | Français |
|---|---|---|
| Natural language processing (NLP) | /ˈnætʃ.ər.əl ˈlæŋ.ɡwɪdʒ ˈprəʊ.ses.ɪŋ/ | Traitement du langage naturel |
| Token | /ˈtoʊ.kən/ | Token (unité de texte) |
| Tokenization | /ˌtoʊ.kə.naɪˈzeɪ.ʃən/ | Tokenisation (découpage en tokens) |
| Corpus | /ˈkɔːr.pəs/ | Corpus (ensemble de textes) |
| Sentiment analysis | /ˈsen.tɪ.mənt əˈnæl.ə.sɪs/ | Analyse de sentiment |
| Named entity recognition (NER) | /neɪmd ˈen.tɪ.ti ˌrek.əɡˈnɪʃ.ən/ | Reconnaissance d'entités nommées |
| Text classification | /tekst ˌklæs.ɪ.fɪˈkeɪ.ʃən/ | Classification de texte |
| Machine translation | /məˈʃiːn trænsˈleɪ.ʃən/ | Traduction automatique |
| Speech recognition | /spiːtʃ ˌrek.əɡˈnɪʃ.ən/ | Reconnaissance vocale |
| Text-to-speech (TTS) | /tekst tə spiːtʃ/ | Synthèse vocale |
| Word embedding | /wɜːrd ɪmˈbed.ɪŋ/ | Plongement de mots |
| Context window | /ˈkɒn.tekst ˈwɪn.doʊ/ | Fenêtre de contexte |
Vocabulaire de l'IA générative en anglais
Depuis l'arrivée de ChatGPT fin 2022, l'IA générative est partout. Les termes de cette section sont ceux que vous lirez dans les communiqués de presse d'OpenAI, Google DeepMind ou Anthropic, et ceux que vos collègues utiliseront en réunion quand ils parleront de prompts, de fine-tuning ou de hallucinations.
| Anglais | Phonétique | Français |
|---|---|---|
| Generative AI (GenAI) | /ˈdʒen.ər.ə.tɪv eɪ aɪ/ | IA générative |
| Large language model (LLM) | /lɑːrdʒ ˈlæŋ.ɡwɪdʒ ˈmɒd.əl/ | Grand modèle de langage |
| Prompt | /prɒmpt/ | Prompt (instruction donnée au modèle) |
| Prompt engineering | /prɒmpt ˌen.dʒɪˈnɪr.ɪŋ/ | Ingénierie de prompt |
| Fine-tuning | /faɪn ˈtjuː.nɪŋ/ | Ajustement fin / Affinage |
| Pre-trained model | /priː treɪnd ˈmɒd.əl/ | Modèle pré-entraîné |
| Foundation model | /faʊnˈdeɪ.ʃən ˈmɒd.əl/ | Modèle de fondation |
| Hallucination | /həˌluː.sɪˈneɪ.ʃən/ | Hallucination (réponse inventée) |
| Retrieval-augmented generation (RAG) | /rɪˈtriː.vəl ˌɔːɡˈmen.tɪd/ | Génération augmentée par la recherche |
| Temperature | /ˈtem.prə.tʃər/ | Température (paramètre de créativité) |
| Zero-shot | /ˈzɪr.oʊ ʃɒt/ | Zero-shot (sans exemple préalable) |
| Few-shot | /fjuː ʃɒt/ | Few-shot (avec quelques exemples) |
| Chain of thought | /tʃeɪn əv θɔːt/ | Chaîne de raisonnement |
| Multimodal | /ˌmʌl.tiˈmoʊ.dəl/ | Multimodal (texte + image + audio) |
| Chatbot | /ˈtʃæt.bɒt/ | Agent conversationnel |
"We implemented a RAG pipeline to reduce hallucinations. The system retrieves relevant documents from our knowledge base, then the LLM generates an answer grounded in those sources. We also fine-tuned the model on our domain-specific data to improve accuracy."
« On a mis en place un pipeline RAG pour réduire les hallucinations. Le système récupère les documents pertinents dans notre base de connaissances, puis le LLM génère une réponse fondée sur ces sources. On a aussi affiné le modèle sur nos données métier pour améliorer la précision. »
Vocabulaire de la vision par ordinateur en anglais
La vision par ordinateur (computer vision) est le domaine de l'IA qui permet aux machines de comprendre les images et les vidéos. De la reconnaissance faciale à la conduite autonome, ce vocabulaire est utilisé quotidiennement par les équipes qui travaillent sur le traitement d'image.
| Anglais | Phonétique | Français |
|---|---|---|
| Computer vision | /kəmˈpjuː.tər ˈvɪʒ.ən/ | Vision par ordinateur |
| Image recognition | /ˈɪm.ɪdʒ ˌrek.əɡˈnɪʃ.ən/ | Reconnaissance d'images |
| Object detection | /ˈɒb.dʒekt dɪˈtek.ʃən/ | Détection d'objets |
| Image segmentation | /ˈɪm.ɪdʒ ˌseɡ.menˈteɪ.ʃən/ | Segmentation d'images |
| Facial recognition | /ˈfeɪ.ʃəl ˌrek.əɡˈnɪʃ.ən/ | Reconnaissance faciale |
| Bounding box | /ˈbaʊn.dɪŋ bɒks/ | Boîte englobante |
| Pixel | /ˈpɪk.səl/ | Pixel |
| Data augmentation | /ˈdeɪ.tə ˌɔːɡ.menˈteɪ.ʃən/ | Augmentation de données |
| Optical character recognition (OCR) | /ˈɒp.tɪ.kəl ˈkær.ɪk.tər/ | Reconnaissance optique de caractères |
| Autonomous driving | /ɔːˈtɒn.ə.məs ˈdraɪ.vɪŋ/ | Conduite autonome |
Éthique et biais en IA : le vocabulaire anglais
L'éthique de l'IA est devenue un sujet central dans les entreprises et dans les médias. Les termes ci-dessous sont ceux que vous retrouverez dans les rapports de l'Union européenne, dans les chartes d'entreprise et dans les débats publics sur la régulation de l'intelligence artificielle.
| Anglais | Phonétique | Français |
|---|---|---|
| Bias | /ˈbaɪ.əs/ | Biais |
| Fairness | /ˈfer.nəs/ | Équité |
| Explainability | /ɪkˌspleɪ.nəˈbɪl.ɪ.ti/ | Explicabilité |
| Transparency | /trænsˈpær.ən.si/ | Transparence |
| Accountability | /əˌkaʊn.təˈbɪl.ɪ.ti/ | Responsabilité |
| Black box | /blæk bɒks/ | Boîte noire |
| Interpretability | /ɪnˌtɜːr.prɪ.təˈbɪl.ɪ.ti/ | Interprétabilité |
| Deepfake | /ˈdiːp.feɪk/ | Deepfake (contenu synthétique trompeur) |
| Responsible AI | /rɪˈspɒn.sɪ.bəl eɪ aɪ/ | IA responsable |
| AI governance | /eɪ aɪ ˈɡʌv.ən.əns/ | Gouvernance de l'IA |
| Data privacy | /ˈdeɪ.tə ˈprɪv.ə.si/ | Confidentialité des données |
| Consent | /kənˈsent/ | Consentement |
Infrastructure et outils de l'IA en anglais
Derrière chaque modèle d'IA, il y a une infrastructure technique. Les termes ci-dessous sont ceux que vous entendrez quand on parle de déploiement, de puissance de calcul ou d'outils de développement. Même si vous n'êtes pas ingénieur, les connaître vous permettra de suivre les conversations techniques sans décrocher.
| Anglais | Phonétique | Français |
|---|---|---|
| GPU (Graphics Processing Unit) | /dʒiː piː juː/ | Processeur graphique |
| TPU (Tensor Processing Unit) | /tiː piː juː/ | Unité de traitement tensoriel |
| Cloud computing | /klaʊd kəmˈpjuː.tɪŋ/ | Informatique en nuage |
| API (Application Programming Interface) | /eɪ piː aɪ/ | Interface de programmation |
| Framework | /ˈfreɪm.wɜːrk/ | Cadre logiciel / Framework |
| Open source | /ˈoʊ.pən sɔːrs/ | Code source ouvert |
| Deployment | /dɪˈplɔɪ.mənt/ | Déploiement |
| Scalability | /ˌskeɪ.ləˈbɪl.ɪ.ti/ | Évolutivité / Passage à l'échelle |
| Latency | /ˈleɪ.tən.si/ | Latence (temps de réponse) |
| Pipeline | /ˈpaɪp.laɪn/ | Pipeline (chaîne de traitement) |
| Edge computing | /edʒ kəmˈpjuː.tɪŋ/ | Calcul en périphérie |
| Model compression | /ˈmɒd.əl kəmˈpreʃ.ən/ | Compression de modèle |
Expressions et verbes courants de l'IA en anglais
Au-delà du vocabulaire technique, il y a des verbes et des expressions que les professionnels de l'IA utilisent tous les jours. Les connaître vous permettra de participer aux conversations sans avoir l'impression de parler une autre langue que vos collègues anglophones.
| Expression anglaise | Français | Exemple d'utilisation |
|---|---|---|
| To train a model | Entraîner un modèle | We trained the model on 10TB of data. |
| To fine-tune | Affiner / Ajuster | We fine-tuned GPT on our customer data. |
| To deploy | Déployer | The model was deployed in production last week. |
| To scale | Mettre à l'échelle | We need to scale the infrastructure. |
| To iterate | Itérer / Améliorer par cycles | Let's iterate on the prompt to get better results. |
| To label data | Étiqueter des données | We hired annotators to label the dataset. |
| To converge | Converger | The loss function converged after 50 epochs. |
| State of the art (SOTA) | État de l'art / Meilleur niveau actuel | This model achieves state-of-the-art results. |
| Out of the box | Prêt à l'emploi / Sans configuration | The API works out of the box. |
| Garbage in, garbage out | Données mauvaises, résultats mauvais | If the data is noisy, the model won't work well. |
"I spent yesterday fine-tuning the model on our labeled dataset. The accuracy improved from 87% to 92%, but I noticed some overfitting on the validation set. Today I'll add dropout and try reducing the learning rate. If the results hold, we can deploy to staging by Friday."
« J'ai passé la journée d'hier à affiner le modèle sur notre jeu de données étiquetées. La précision est passée de 87 % à 92 %, mais j'ai remarqué du surapprentissage sur le jeu de validation. Aujourd'hui je vais ajouter du dropout et essayer de réduire le taux d'apprentissage. Si les résultats tiennent, on peut déployer en pré-production d'ici vendredi. »
Flash cards
Cartes (8)
À retenir
Quiz — Vocabulaire anglais de l'IA
Quiz interactif disponible avec JavaScript activé. Voici les questions et leurs réponses correctes :
-
1. Quelle est la relation entre AI, ML et deep learning ?
- Ce sont trois synonymes
- AI est le domaine général, ML en est une branche, deep learning est une sous-branche du ML ✓
- Deep learning englobe AI et ML
- ML est plus large que AI
Réponse : l'intelligence artificielle est le domaine général. Le machine learning en est une branche. Le deep learning est une sous-branche du ML qui utilise des réseaux de neurones profonds.
-
2. Que désigne le terme « hallucination » en IA ?
- Un bug dans le code du modèle
- Un problème de connexion au serveur
- Une réponse générée qui semble correcte mais est factuellement fausse ✓
- Une image générée de mauvaise qualité
Réponse : une hallucination, c'est quand un LLM génère une réponse convaincante mais inventée ou fausse. C'est l'un des défis majeurs de l'IA générative.
-
3. Quelle est la différence entre « training » et « inference » ?
- Training = prédiction, inference = apprentissage
- Training = phase d'apprentissage, inference = utilisation en production ✓
- Ce sont deux synonymes
- Training concerne le NLP, inference concerne la vision
Réponse : le training est la phase où le modèle apprend à partir des données. L'inference est la phase où le modèle entraîné est utilisé pour faire des prédictions sur de nouvelles données.
-
4. Que signifie RAG (Retrieval-Augmented Generation) ?
- Un type de réseau de neurones
- Un langage de programmation pour l'IA
- Une technique combinant recherche documentaire et génération par LLM ✓
- Un format de données pour l'entraînement
Réponse : RAG combine la recherche de documents pertinents dans une base de connaissances avec la génération de réponses par un LLM, pour réduire les hallucinations et ancrer les réponses dans des sources fiables.
-
5. Que veut dire l'expression « garbage in, garbage out » ?
- Il faut nettoyer son code régulièrement
- Les modèles d'IA produisent toujours des erreurs
- Si les données d'entrée sont mauvaises, les résultats le seront aussi ✓
- Il faut supprimer les anciens modèles
Réponse : « garbage in, garbage out » signifie que la qualité des résultats d'un modèle dépend directement de la qualité des données utilisées pour l'entraîner.
Articles similaires :
Articles à la une :
Télécharger des cours d’anglais gratuit : comparatif complet
Les 5 meilleures techniques pour apprendre l’anglais débutant gratuitement
Les Meilleures Formules de Politesse en Anglais pour Vos Mails !
Top 11 des meilleures applications mobiles pour apprendre l’anglais
Progressez enfin en anglais grâce à une formation qui s'adapte à votre vie !
4,8/5
+10 000 apprenants accompagnés
Découvrir la méthode
Une méthode simple, guidée et 100 % personnalisée, pensée pour des résultats concrets.


