Université Paris 8 · Paragraphe-CITU Université Paris 8 · Paragraphe-CITU

Ce qui écrit avant l'auteur What writes before the author

Complétion algorithmique et conditions computationnelles de l'énonçable. Un benchmark différentiel sur six modèles de langage open-weights. Algorithmic completion and computational conditions of the utterable. A differential benchmark on six open-weights language models.

AuteurAuthor
Philippe Boisnard
AffiliationAffiliation
Université Paris 8 — Paragraphe-CITU
DispositifDispositif
6 modèles · 2 situations énonciatives · 974 inférences 6 models · 2 enunciative situations · 974 inferences
COLLOQUECONFERENCE
Auctorialités augmentées en régime numérique (Université de Cergy et de la Sorbonne) Enhanced Authorities in a Digital Age University of Cergy and the Sorbonne)
AnnéeYear
2026
§ 01

Argument Argument

Il s'écrit, aujourd'hui, des textes selon une modalité dont la pensée critique peine encore à saisir la spécificité. Lorsqu'un utilisateur amorce une phrase et que le modèle la prolonge, lorsqu'il pose une question et que la machine lui retourne une définition, quelque chose s'écrit, en effet, mais ce quelque chose n'est ni de la même nature ni du même régime que ce que nous appelions, jusqu'ici, écrire.

Texts are being written today according to a modality whose specificity critical thought still struggles to grasp. When a user begins a sentence and the model continues it, when they ask a question and the machine returns a definition, something is indeed being written — but this something is neither of the same nature nor of the same regime as what we had, until now, called writing.

Les approches contemporaines de l'écriture assistée ont, pour l'essentiel, posé la question dans le cadre de la redistribution des tâches entre humain et machine. Ces approches décrivent un partage. Aucune ne pose la question préalable : quelles sont les conditions ontologiques de l'énonçable dans le dispositif de complétion lui-même ? Avant que quoi que ce soit ne se partage, déjà quelque chose s'est organisé : les catégories mobilisables, les relations plausibles, les valeurs implicites, les voix disponibles.

Contemporary approaches to AI-assisted writing have, for the most part, framed the question as one of task redistribution between human and machine. These approaches describe a partition. None addresses the preliminary question: what are the ontological conditions of the utterable within the completion dispositif itself? Before anything is partitioned, something has already been organized: the available categories, the plausible relations, the implicit values, the accessible voices.

Pour instrumenter ce déplacement, nous avons construit un benchmark différentiel sur six modèles de langage open-weights couvrant un spectre géo-épistémique large. Le dispositif ne mesure pas leurs performances. Il mesure leurs signatures différentielles d'auctorialité — la manière dont chacun déploie son régime énonciatif face aux mêmes consignes, et la manière dont les régimes diffèrent entre eux. L'opacité interne de chaque modèle n'est pas levée — elle ne peut l'être — mais elle est contournée par mesure différentielle.

To instrument this displacement, we built a differential benchmark across six open-weights language models spanning a broad geo-epistemic spectrum. The dispositif does not measure their performance. It measures their differential authorship signatures — how each unfolds its own enunciative regime when given the same prompts, and how these regimes differ from one another. The internal opacity of each model is not lifted — it cannot be — but it is circumvented through differential measurement.

§ 02

Six modèles, un spectre géo-épistémique Six models, a geo-epistemic spectrum

Le benchmark mobilise six modèles open-weights de tailles comparables (7 à 14 milliards de paramètres). Le choix d'open-weights est essentiel : il garantit la reproductibilité, l'accès aux conditions computationnelles, et permet de mesurer un dispositif et non un service.

The benchmark mobilizes six open-weights models of comparable sizes (7 to 14 billion parameters). The choice of open-weights is essential: it ensures reproducibility, gives access to the computational conditions of inference, and lets us measure a dispositif rather than a service.

Mistral 7B · FR
Llama 3.1 8B · US (Meta)
Qwen 2.5 14B · CN (Alibaba)
Gemma 4 e4B · US (Google)
Olmo 2 13B · US (Allen AI)
DeepSeek-R1 7B · CN
§ 03

Explorer le dispositif Explore the dispositif

Le site documente le protocole complet, expose les résultats par modules, et donne accès aux 974 sorties brutes filtrables.

The site documents the full protocol, displays the results by modules, and gives access to the 974 raw outputs with filtering.

i

Protocole Protocol

Six modèles, deux situations énonciatives, trois protocoles de sampling, trois niveaux de mesure superposés. Six models, two enunciative situations, three sampling protocols, three superposed measurement levels.

Lire → Read →
01

Qu'est-ce qu'un auteur ? What is an author?

110 réponses, cinq signatures lexicales, et une absence : aucun modèle ne mobilise le champ foucaldien. 110 answers, five lexical signatures, and one absence: no model mobilizes the Foucauldian field.

Explorer → Explore →
02

Co-écrire avec les modèles Co-writing with models

Huit amorces, trois instructions, trois cas-types : enrobage modal, bimodalité énonciative, asymétrie politique. Eight prompts, three instructions, three case-types: modal envelopment, enunciative bimodality, political asymmetry.

Explorer → Explore →
03

Typologie binaire Binary typology

Production continue avec enrobage modal vs production discontinue avec saut sémantique : deux régimes d'inconscient algorithmique. Continuous production with modal envelopment vs discontinuous production with semantic jump: two regimes of algorithmic unconscious.

Visualiser → Visualize →
04

Explorer les 974 sorties Explore the 974 outputs

Accès intégral aux sorties brutes du benchmark, filtrables par modèle, amorce, instruction et condition de sampling. Full access to the raw benchmark outputs, filterable by model, prompt, instruction, and sampling condition.

Naviguer → Browse →
05

Code et reproductibilité Code & reproducibility

Le dispositif technique, les scripts d'analyse, les données brutes, et les conditions de reproductibilité du benchmark. The technical dispositif, analysis scripts, raw data, and conditions for reproducing the benchmark.

Accéder → Access →
§ 04

Filiation Lineage

Ce travail s'inscrit dans le programme de recherche engagé sur les espaces latents par The Algorithmic Unconscious (2025) — qui pose le concept d'inconscient algorithmique sur la base de la tokenisation, de l'attention et de l'alignement — et par Latent Differentiation (2026) — qui propose une méthode différentielle pour les espaces vision-langage et formule les concepts de mémoire allogénétique et de transvergence.

This work continues the research program on latent spaces opened by The Algorithmic Unconscious (2025) — which grounds the concept of the algorithmic unconscious in tokenization, attention, and alignment — and by Latent Differentiation (2026) — which proposes a differential method for vision-language spaces and formulates the concepts of allogenetic memory and transvergence.

La présente communication applique le geste différentiel au registre textuel, sur la question foucaldienne de l'auctorialité, et mesure la transvergence dans la co-écriture contrainte.

The present communication applies the differential gesture to the textual register, on the Foucauldian question of authorship, and measures transvergence in constrained co-writing.