Numérique

Le grand modèle de langage, l’outil et la machine

Chercheur, artiste et programmeur

Les grands modèles de langage, agents de « disruption » radicale, semblent accompagnés d’un sentiment d’urgence et d’exceptionnalité, coche qu’il ne faudrait surtout pas manquer. Ils n’en demeurent pas moins une innovation technologique, qu’il faut observer avec un peu de distance critique. Quelques éléments d’analyse et de recontextualisation pour y voir plus clair.

Il semble toujours compliqué d’anticiper les effets d’une nouvelle technologie. La télévision portait en elle des promesses d’éducation et a fini par contribuer à la superficialisation des discours politiques ; la voiture allait nous débarrasser des montagnes de purin qui accompagnaient les transports équestres et a fini par remodeler notre rapport à la ville ; le Coca-Cola devait nous soulager des maux de ventre et il contribue à l’obésité.

publicité

La dernière itération en date de cette progression technologique consiste en la prouesse d’ingénierie que sont les grands modèles de langage (Large Language Models, LLM) et se trouve en plein milieu du genre de controverses qui accompagne toute innovation. Est-ce que ces grands modèles vont remplacer toute la classe créative ? Est-ce qu’ils vont déchaîner une vague de productivité économique sans précédent ? Est-ce qu’il s’agit des prémisses d’un nouvel âge de la suprématie de la machine, culminant en un Skynet plutôt qu’en un Terminator ? Cet article propose quelques pistes pour démêler ces interrogations.

Il n’est pas si facile d’y voir clair. D’une part, les entreprises à l’origine de ces grands modèles, étant également des acteurs majeurs du capitalisme spéculatif (selon l’expression de Pierre-Yves Gomez), ont tout intérêt à surjouer leurs implications eschatologiques et ne facilitent donc pas la tâche de considérer calmement ce nouveau type d’artefact. D’autre part, l’impératif d’innovation (autrefois appelé progrès) qui parcourt nos sociétés implique une adhésion au projet ; qu’elle soit avec réserve ou sans condition, elle demeure une adhésion. Comme l’analysait Jacques Ellul, la technique rend possible quelque chose de nouveau, et ce qui devient possible techniquement exerce une pression de nécessité (si ma voiture peut aller vite, j’ai besoin d’aller vite)[1].

Les LLM nous semblent une nouveauté, et d’une certaine manière c’est vrai. Ils méritent donc d’être analysés en tant que tels. Il s’agit de savoir comment certaines de leurs propriétés vont redéfinir (ou non) les notions d’intelligence, de créativité, d’agentivité et d’humanité. Mais d’une autre manière, ce n’est qu’une technique de plus. Les modèles de langage sont une innovation, certes, mais n’en demeurent pas moins la dernière d’une longue série de manières technologiques de faire sur lesquelles nous avons tour à tour projeté nos craintes et nos espoirs.

Lorsque Platon considère l’innovation technologique de son époque – l’écriture – comme un problème qui va engendrer une perte de mémoire et une dégradation du discours, il emploie le terme de pharmakon. Celui-ci peut être interprété comme une indétermination ou une ambiguïté quant à ses effets (bénéfiques ou maléfiques). Bernard Stiegler reprend cette idée pour souligner qu’il y a toujours, au sein de toute technique, quelque chose à gagner et quelque chose à perdre. Les grands modèles de langage ne sont pas une exception[2].

Comment, alors, considérer ces deux aspects, de gain et de perte ? Ce qu’on peut gagner nous semble évident, c’est la vitesse d’exécution. Être rapide va nous permettre d’être plus productif, à moindre coût, dit-on. Cette productivité n’est pas nouvelle : Joseph Carl Robnett Licklider, le directeur du projet qui allait devenir l’Internet, en parlait déjà. Psycho-acousticien de formation, il rêvait, dès 1960, d’un monde où un ordinateur gèrerait les interminables suites de chiffres de ses données empiriques et lui laisserait le temps de réfléchir. De nos jours, cette efficacité de la technique s’est doublée d’une velléité néolibérale de la performance. L’ordinateur, comme le moteur avant lui, s’est retrouvé à l’intersection de la nature de l’entreprise privée, à vouloir être profitable, et de la nature de la machine, à vouloir être efficace. Quant à ce qu’on peut perdre en adoptant aveuglément une technologie, on peut l’appréhender de deux manières : par le rapport extension-substitution et par le rapport dépendance-indépendance.

Délégation et substitution

De manière générale, l’objet technique va étendre nos capacités d’action, et l’ordinateur va étendre spécifiquement notre capacité à se souvenir, à additionner et à multiplier, à lire et à écrire. Cette extension de nos capacités se fait donc forcément par une modification de nos capacités : on va complémenter une capacité (limitée) par un procédé technique (plus avancé). Au cours de ce processus d’extension, il y a un moment où notre utilisation d’une technologie va affecter des capacités qui n’étaient pas supposées être visées au début (en voiture, on gagne en vitesse ce qu’on perd en agilité, mais on n’a jamais inventé la voiture dans le but de devenir plus gauche). Dans toute technique se pose la question de l’étendue de ces modifications de l’action – de la délégation ou de la substitution de certaines capacités d’agir.

On délègue quand on demande à autrui de faire pour nous ce qu’on sait déjà faire mais qu’on ne peut pas faire pour des raisons pratiques et ce qu’on considère comme non-essentiel[3]. Le peuple délègue son pouvoir au représentant, mais en conserve (théoriquement) l’autorité ; en aucun cas le représentant doit se substituer au peuple. La délégation est aussi limitée dans le temps, implique qu’on puisse se ressaisir de son agentivité et reprendre les rênes de la tâche que l’on accomplissait. Je vais déléguer à un bout de papier et à un crayon l’action de se souvenir de ce que je dois faire aujourd’hui.

On substitue quand on remplace une entité qui n’a plus besoin d’être et dont l’essentiel ne subsiste même pas, ne rentre plus dans l’équation. La substitution se fait sur le long terme et est plus difficilement réversible. Si le peuple se substitue au roi, ce n’est pas pour lui rendre, un jour, un pouvoir qui aurait toujours appartenu au monarque. Un objet technique peut également se substituer en remplaçant intégralement la personne ou la chose : un algorithme de recommandation de biens culturels va se substituer à d’autres manières de choisir quoi voir, quoi écouter, quoi lire.

Cette modification de l’action et cette possible rétractation de l’action se remarquent aussi dans la forme des verbes en elle-même : je délègue quelque chose à quelqu’un tandis que je substitue quelqu’un/quelque chose à quelqu’un/quelque chose (possiblement même se substituer soi-même). La réflexivité de se substituer n’existe pas pour déléguer. Le sujet ne s’affecte pas véritablement, il reste l’agent, et l’objet reste l’actant. En revanche, substituer peut se reformuler se substituer et le sujet devient l’objet, effaçant ce dernier.

Ces questions de délégation et de substitution sont importantes pour comprendre comment une technique peut nous permettre d’appréhender notre rapport à notre humanité. C’est ce que proposait Bernard Stiegler à la radio quand il envisageait l’expansion de la technique comme un moyen de déterminer d’autant plus précisément ce que la technique ne peut pas faire, mais que l’humain peut faire, et donc ce qui constituerait l’essence de notre humanité, ce à quoi il faudrait tenir.

Cet essentiel, dont le développement constituerait une vie active plutôt que passive, pour reprendre les termes d’Arendt, n’est pourtant pas forcément un donné fixe, même si la distinction entre l’essentiel et l’adjacent est une constante. À un certain moment de notre scolarité, l’essentiel n’est pas d’écrire un commentaire de texte tel que le désire notre enseignante, mais plutôt de pratiquer l’exercice d’une pensée. À un moment plus tardif de sa carrière, cet exercice de pensée ne va pas forcément passer par la rédaction d’un rapport, mais plutôt dans la mise en articulation d’une problématique qui sera ensuite rédigée et développée dans ce rapport. Si on enlève le rapport, le bénéfice de la mise en relation critique d’informations demeure ; si on enlève le format du commentaire de texte, le bénéfice de l’exercice de l’externalisation par l’écrit demeure.

La technologie ayant tendance à étendre son champ d’application[4], il faut donc rester vigilant afin de ne pas se retrouver, après coup, dans une configuration imprévue. Le domaine d’application originel d’une technologie peut, sur le court terme, sembler essentiel et positif, n’avoir que des conséquences indéterminées mais néanmoins minimisées parce que s’effectuant sur des aspects adjacents. La mécanisation de l’agriculture comptait s’occuper de l’essentiel : optimiser la production d’une récolte, avant qu’on ne se rendre compte qu’un autre essentiel a disparu (l’activité collective d’un vivre ensemble rural). Ce qu’on gagne quelque part, on le perd autre part. Et il est toujours possible d’identifier ce qu’on risque de perdre et ce qu’on risque de gagner et de décider de l’adoption d’une technologie en conséquence.

Revenons aux grands modèles de langage. Si on gagne de la vitesse (et donc de la productivité économique), que peut-on perdre ? En termes de lecture, la possibilité de résumer de l’information en des termes extrêmement génériques[5] nous fait perdre la concentration qui découle de la lecture concentrée. Elle nous fait aussi perdre le sentiment de friction politique, compris au sens large de coexistence avec l’autre, qui découle du besoin de demander à quelqu’un quand on ne sait pas et d’être patient quand quelqu’un nous demande quelque chose. Les grands modèles de langage sont loin d’inaugurer ces tendances, mais ils les renforcent certainement. Alors, évidemment, ces effets sont toujours réversibles, mais le confort d’utilisation à tendance à s’insinuer sur le long terme. Les LLM facilitent beaucoup de choses, mais, pour paraphraser Albus Dumbledore, nous avons tous, un jour, à choisir entre ce qui est facile et ce qui est bien.

Réseaux de dépendances

Un autre aspect de la technologie est celui des réseaux de dépendances. C’est ce que Simondon appelle le milieu de l’objet technologique : les ressources nécessaires à la création de l’objet, à son fonctionnement, les agents qui sont impliqués dans son usage et les entités qui sont affectées par son utilisation. La technologie – comme tout le reste, d’ailleurs – n’agit pas dans un vide. Ces relations, qui passent à travers l’objet technique, sont aussi des relations de dépendances. Qu’on ait choisit de déléguer ou de se laisser substituer, le fait que les dépendances de notre environnement soient reconfigurées par une technologie est largement transversal. Mais comment identifier ces relations, pour ensuite mieux pouvoir les juger ?

On peut d’abord aborder cette notion par la comparaison entre un outil et une machine, qui va révéler la différence importante entre système ouvert et système fermé.

Jacques Ellul pose la distinction entre outil et machine ainsi. L’outil a pour caractéristique d’accroître l’efficacité de l’action en observant des phénomènes imperceptibles ou en multipliant l’intensité de ses efforts. Un outil accroît la capacité d’un individu lorsqu’il est directement manœuvré par l’individu (comme un marteau). À l’inverse, la machine tend à l’autotélisme en ce qu’elle peut fonctionner par elle-même sans intervention directe et continue de l’individu ; elle va faire des choses que l’individu ne peut pas faire (comme un transformateur électrique).

En ce qui concerne la relation de dépendance, l’outil et l’individu sont directement dépendants tandis que l’individu et la machine sont indirectement dépendants. À première vue, la machine propose donc une plus grande autonomie à l’individu (et c’est ce que la modernité nous a promis : la libération des tâches ingrates par le biais de machines qui nous remplaceraient et qui nous permettraient, enfin, de nous épanouir – même si la modernité ne nous a pas précisé quelle forme aurait cet épanouissement, autre que la consommation de biens manufacturés).

Inspectons donc de plus près la nature de ces dépendances. L’outil permet de faire une chose que notre corps ne nous permet pas ou avec grande difficulté. Il y a donc une dépendance physique immédiate. Mais, en revanche, il est plus facile de comprendre comment l’outil fonctionne, donc il n’y a pas de dépendance cognitive, et de quoi il est fait, donc il n’y a pas de dépendance matérielle.

La dépendance cognitive, c’est l’incapacité de concevoir par soi-même comment un système technique opère et ce qui peut faire la fortune de certaines entreprises, par exemple de plomberie. Une difficulté à concevoir une canalisation comme une articulation matérielle plutôt que comme un domaine inconnu peut nous faire dépendre de l’intervention d’un tiers qui possède la connaissance du système qui dysfonctionne. La dépendance matérielle est donc impliquée dans cette dépendance cognitive : comprendre comment un système technique fonctionne, c’est comprendre comment les différentes composantes sont agencées, quel(s) rôle(s) elles jouent et quels sont les aspects importants de leur conception (pour un joint de plomberie, le diamètre est plus important que l’épaisseur). La dépendance physique est la nécessité d’exercer une action pour accomplir une tâche ; la dépendance cognitive est la nécessité de l’acquisition d’un savoir pour comprendre ce avec quoi on interagit ; et la dépendance matérielle est la nécessité de la disponibilité de matériaux pour accomplir cette interaction.

Ces trois dépendances vont varier lorsque l’individu utilise une machine. La machine peut être composée de parties qui fonctionnent sans intervention directe de l’humain et minimise donc la dépendance physique de l’humain (il faut désormais appuyer sur un bouton plutôt qu’utiliser plusieurs capacités sensori-motrices). En revanche, pour ce qui est de la dépendance cognitive, il y a une dépendance à un tiers (un manuel, avec un peu de chance, ou bien, avec moins de chance, une entreprise qui promeut des experts, un Genius Bar ou un abonnement premium à un accès préférentiel de remplacement de la machine défaillante), pour que ce tiers comprenne à notre place, ou qu’on n’ait pas à comprendre.

Ces deux premiers rapports de dépendance, une indépendance physique et une dépendance cognitive, vont alors fortement influencer la dépendance matérielle : il n’y a pas besoin de connaître la machine d’un point de vue physiologique et il n’y a pas besoin de saisir comment elle fait ce qu’elle fait, donc ne se pose pas la question d’où viennent les composantes, ni de comment se les procurer[6].

Le passage de l’outil à la machine n’est pas strictement binaire, mais peut se faire de manière subtile. Prenons l’exemple du tracteur. Quand un tracteur tombe en panne, on dévisse le capot et on inspecte les différentes composantes pour diagnostiquer le problème. On peut alors se retrouver face à un système ouvert ou face à un système fermé, comme les distinguait Gilbert Simondon[7]. Est-ce qu’on peut voir toutes les composantes, est-ce qu’on peut facilement y avoir accès, est-ce que cette conception a été détaillée dans un manuel qui a été livré avec le tracteur (système ouvert) ou est-ce qu’il a plutôt été remplacé par une notice d’avertissement de brèche de garantie si l’usagère touche une pièce non-autorisée (système fermé) ? Cette différence, issue de la conception même du moteur, peut alors influencer notre niveau de dépendance cognitive. Un tracteur réparable tendra vers l’outil. Un tracteur non-réparable tendra vers la machine.

La machine va donc créer un réseau de dépendances moins immédiat, plus diffus que celui de l’outil. Ces conditions d’existence, et de fonctionnement, reposent sur un faisceau d’autres machines, dont le fonctionnement se doit d’être synchrone et permanent. Si ce faisceau disparaît, la machine disparaît elle aussi. Assurer l’existence et le fonctionnement d’une machine, c’est donc aussi assurer l’existence d’autres machines, qui elles-mêmes vont demander le maintien d’autres machines, dans un effet de ruissellement se concluant toujours par une extraction de matériaux. Ce réseau diffus risque alors de se transformer en une autre sorte de dépendance, la dépendance au sentier, qui conditionne aux décisions (techniques) passées les possibilités de décision (technique et politique) futures. Choisir une configuration technique actuelle, c’est risquer de la voir perdurer pendant des siècles.

Ce (long) détour à travers les concepts d’outil et de machine, de délégation et de substitution, de dépendance et d’indépendance, nous permet néanmoins d’y voir un peu plus clair. Les grands modèles de langage sont donc bien plus des machines que des outils. Ils n’ont besoin que d’un petit coup de pouce (un prompt) pour dérouler des prouesses d’organisation syntactique sans effort apparent, sans que l’individu ne soit trop impliqué. Leurs réseaux de dépendances impliquent la connexion permanente à l’Internet, l’agrégation exponentielle de contenu, l’annotation manuelle de ce contenu expansif par des travailleuses sous-payées, ou encore la livraison de sources d’énergies toujours plus puissantes[8], et donc de la continuation de ces grandes tendances contemporaines du complexe techno-économique globalisé que représentent aujourd’hui les GAFAM, de la soumission du politique au technologique, et de la mise à l’échelle de l’exploitation de ressources minières pour des bénéfices qui sont encore incertains. Il me semble qu’il y ait plus à perdre qu’à gagner

Qu’est-ce qui sera aux grands modèles de langage ce que l’embouteillage a été à la voiture ? Comment vont-ils évoluer si on déplace notre attention du court terme au long terme ? Quel est le prix qu’il va falloir payer demain pour passer, aujourd’hui, un peu moins de temps à chercher une information, à écrire un bout de texte, à réfléchir avec une entité à mi-chemin entre un bloc-notes et une stagiaire prodige, à grappiller des minutes de productivité douteuse pour la grande majorité d’entre nous ? Puisque, à long terme, les sociétés humaines finissent toujours par se reconfigurer à la suite de l’introduction d’une nouvelle technologie et que cette reconfiguration n’est jamais assurée d’être un net positif.


[1] Jacques Ellul, Le Système technicien, Le Cherche Midi, 2012.

[2] Bernard Stiegler, « Memory », in Critical Terms for Media Studies (dir. William J. T. Mitchell et Mark B. N. Hansen), The University of Chicago Press, 2010.

[3] On se dévoue aux choses essentielles.

[4] On entend ici un écho du fameux « There’s an app for everything! »

[5] On passera outre, ici, une discussion pourtant passionnante sur la stylistique des LLM.

[6] Même si, en pratique, la réponse à ces deux questions est probablement Shenzhen.

[7] Gilbert Simondon, Du mode d’existence des objets techniques, Aubier, 2012.

[8] On construit des réacteurs et on assèche des rivières pour nous aider à écrire.

Pierre Depaz

Chercheur, artiste et programmeur, Enseignant à la New York University de Berlin

Mots-clés

IA

Le continuum raciste

Par

À l’heure de la montée des partis xénophobes et des défilés pronazis en Europe et outre-Atlantique, il est crucial de prendre conscience du continuum de la violence raciste dans nos sociétés, des remarques et... lire plus

Notes

[1] Jacques Ellul, Le Système technicien, Le Cherche Midi, 2012.

[2] Bernard Stiegler, « Memory », in Critical Terms for Media Studies (dir. William J. T. Mitchell et Mark B. N. Hansen), The University of Chicago Press, 2010.

[3] On se dévoue aux choses essentielles.

[4] On entend ici un écho du fameux « There’s an app for everything! »

[5] On passera outre, ici, une discussion pourtant passionnante sur la stylistique des LLM.

[6] Même si, en pratique, la réponse à ces deux questions est probablement Shenzhen.

[7] Gilbert Simondon, Du mode d’existence des objets techniques, Aubier, 2012.

[8] On construit des réacteurs et on assèche des rivières pour nous aider à écrire.