Les grands modèles de langage à la recherche d’une sanction démocratique
Derrière l’objectif de « neutralité » politique, les équipes d’Elon Musk semblent surtout, à en croire un récent article du New York Times, prédisposées à tordre le bâton dans leur sens[1]. Les « tendances de centre-gauche » des grands modèles de langage ont très tôt été identifiées et commentées aux États-Unis[2]. Quoi qu’on puisse penser de ces « biais politiques » et de leur influence possible sur l’opinion, les modèles massifs de langage, qui s’imposent de plus en plus comme des intermédiaires génériques pour la recherche d’information, en plus d’un grand nombre de médiations communicationnelles et cognitives, altèrent par vocation le contexte démocratique.

Cette intervention souhaite explorer la manière dont les géants de la Tech américains ont posé et imposé les données du « problème de l’alignement[3] », ce que cet état de fait comporte de problématique, et comment on peut espérer y remédier.
L’alignement : d’un problème de maîtrise à une question de finalités
Parmi les initiés de l’éthique de l’intelligence artificielle, dans les équipes de recherche et d’ingénierie du domaine, vous verrez souvent ce mot courir sur les lèvres : l’alignement. Comment s’assurer qu’une technologie si porteuse (le machine learning) entre pleinement au service de la société ? La question devient redoutable une fois admis que l’« intelligence » prêtée aux machines réside ici dans leur (auto-)apprentissage des moyens propres à produire, en sortie, l’effet escompté.
De fait, le problème de l’alignement a d’abord été formulé comme relevant du contrôle. Dans le cas de l’apprentissage par renforcement, quelle structure de récompense est-elle apte à susciter le comportement désiré ? Comment éviter les brèches et autres détournements de la fonction récompense, comme lorsqu’une IA gagne une course en exploitant une faille du jeu, donne simplement l’impression convaincante d’effectuer la tâche assignée ou tend à complaire à l’utilisateur à l’encontre de ses intérêts de long terme