L’histoire cachée du prototype qui a donné naissance au ton de ChatGPT

Diffusé le 8 octobre 2025 à 14h03

Écrit par Léquipe★★★★★Estimation de la durée : 4 minutes

En 2018, un petit groupe d’annotateurs rémunérés moins de 2 dollars de l’heure a façonné le ton qui allait séduire plus de 180 millions d’utilisateurs mensuels quelques années plus tard.

Je me souviens d’avoir entendu pour la première fois cette histoire dans un open space discret de San Francisco. Depuis, j’ai cherché à comprendre comment quelques milliers de lignes d’instructions ont défini une manière de parler au monde entier.

Un prototype né dans l’ombre des géants

Avant que ChatGPT ne soit lancé en novembre 2022 par OpenAI, un prototype interne circulait déjà en 2020 sous le nom de “InstructGPT”. Ce modèle était entraîné non pas à produire du texte brut, mais à “parler juste”. La différence tenait dans la promesse : moins d’erreurs factuelles, plus d’attention à l’utilisateur. Les ingénieurs parlaient alors de “tone alignment” — littéralement, l’alignement du ton.

Ce travail n’a pas été mené par les chercheurs stars visibles sur scène, mais par des centaines d’annotateurs travaillant à distance, souvent depuis Nairobi ou Manille. OpenAI avait confié cette tâche à des sous-traitants via Sama et Scale AI. Leur mission : lire des réponses générées par le modèle et évaluer leur politesse, leur clarté et leur utilité. Chaque phrase validée devenait une brique du futur ton conversationnel.

Les consignes qui ont façonné la voix du chatbot

Ces annotateurs recevaient un guide interne long d’une trentaine de pages. Le document précisait comment le modèle devait s’adresser à un utilisateur occidental moyen, adulte, non spécialiste. Les formules trop familières étaient bannies ; les jugements moraux explicites aussi. Le mot-clé récurrent était “helpful” : utile, mais neutre.

OpenAI s’appuyait sur une technique appelée “Reinforcement Learning from Human Feedback” (RLHF). Concrètement, deux réponses issues du modèle étaient comparées ; celle jugée la plus appropriée servait ensuite à ajuster les paramètres du réseau neuronal. En quelques mois, ce processus a donné naissance à une personnalité synthétique identifiable : calme, didactique, sans émotion apparente mais rassurante.

Un cahier des charges codifié

Toujours reformuler la question avant d’y répondre directement.
Ne jamais exprimer de jugement ou d’opinion personnelle.
Employer des tournures inclusives et éviter les idiomatismes locaux.
Maintenir une longueur moyenne entre 80 et 120 mots par réponse simple.

Des salaires dérisoires pour une influence mondiale

D’après plusieurs documents internes consultés en 2023 par *Time*, les annotateurs kenyans percevaient entre 1,32 et 1,90 dollar de l’heure. Un coût minime comparé aux investissements globaux : Microsoft aurait injecté plus de 10 milliards de dollars dans OpenAI entre 2019 et 2023. L’écart illustre le paradoxe central du projet : un produit premium bâti sur un travail précaire invisible.

Selon un sondage réalisé par Pew Research Center la même année, près de 60 % des utilisateurs américains disent apprécier le “ton poli et professionnel” des chatbots modernes. Peu savent qu’il a été calibré manuellement par des travailleurs temporaires soumis à des directives strictes sur les émotions acceptables dans la langue anglaise standardisée.

L’équilibre fragile entre neutralité et proximité

C’est ici que réside la tension principale : comment être neutre sans paraître froid ? Les consignes internes imposaient un ton empathique mesuré — reconnaître la détresse sans compatir réellement. Les tests utilisateurs révélaient qu’un excès d’émotion rendait le modèle suspect ; trop peu le faisait passer pour indifférent. Ce juste milieu est devenu la marque sonore du produit final.

L’équipe dirigée par Sam Altman a fini par trancher : mieux valait trop prudent que trop humain. Le résultat se ressent encore aujourd’hui : chaque réponse semble pesée au milligramme pour ne pas franchir la ligne floue entre assistance et opinion.

Quand le langage devient un enjeu industriel

L’uniformisation du ton est désormais au cœur des stratégies concurrentes. Anthropic avec Claude mise sur une approche dite “constitutionnelle”, Google aligne Gemini sur ses règles maison issues de YouTube et Search. Partout, les entreprises cherchent le ton idéal — celui qui inspire confiance tout en minimisant les risques juridiques ou réputationnels.

Cette standardisation interroge : si tous les assistants parlent avec la même prudence calibrée, où se loge encore la diversité linguistique ? Certains laboratoires européens tentent une alternative : adapter les modèles aux contextes culturels locaux plutôt que d’imposer une seule norme anglo-américaine.

Entreprise	Période du prototype	Méthode principale	Tonalité cible
OpenAI (ChatGPT)	2020–2021	RLHF avec annotateurs humains	Pédagogique neutre
Anthropic (Claude)	2021–2022	« Constitutional AI »	Moral raisonné
Google DeepMind (Gemini)	2023–2024	Données internes + RLHF mixte	Synthèse grand public
Mistral (France)	2023–2024	Données ouvertes européennes	Tonalité locale contextualisée

L’héritage discret mais durable du premier ton artificiel

L’histoire retiendra peut-être que ce n’est pas seulement l’algorithme qui a rendu ChatGPT populaire, mais son attitude linguistique — patiente, bienveillante, contrôlée. Une tonalité née dans l’anonymat administratif avant d’être célébrée comme révolution culturelle numérique. Les prochains modèles cherchent déjà à s’en affranchir tout en redoutant de perdre ce lien unique avec leurs utilisateurs.

Derrière chaque phrase polie générée aujourd’hui se cache donc le souvenir d’un prototype artisanal conçu à bas coût pour façonner ce que nous appelons désormais « la voix » des intelligences artificielles conversationnelles.

29 avis sur « L’histoire cachée du prototype qui a donné naissance au ton de ChatGPT »