§ 05 · Code & reproductibilitéCode & reproducibility

Reproduire le dispositif Reproduce the dispositif

Le benchmark est open-source. Toutes les conditions sont documentées, tous les appels sont archivés. The benchmark is open-source. All conditions are documented, all calls are archived.

§ 05.1

Stack technique Technical stack

Python 3.11 dans un environnement virtuel géré par uv. Modèles servis par Ollama en local sur serveur Linux (Ubuntu 26.04, GPU NVIDIA RTX 5060 Ti 16 Go, 60 Go RAM). Embeddings calculés via sentence-transformers (modèle paraphrase-multilingual-MiniLM-L12-v2). Réduction de dimension UMAP. Analyse statistique et visualisation par numpy, pandas, matplotlib.

Python 3.11 in a virtual environment managed by uv. Models served via Ollama locally on a Linux server (Ubuntu 26.04, NVIDIA RTX 5060 Ti 16 GB GPU, 60 GB RAM). Embeddings computed via sentence-transformers (model paraphrase-multilingual-MiniLM-L12-v2). Dimensionality reduction via UMAP. Statistical analysis and visualization with numpy, pandas, matplotlib.

# pyproject.toml — dépendances principales
[project]
name = "unconscious-completion"
version = "0.1.0"
requires-python = ">=3.11"
dependencies = [
    "ollama>=0.4.0",
    "sentence-transformers>=2.5.0",
    "umap-learn>=0.5.5",
    "numpy>=1.26",
    "pandas>=2.2",
    "matplotlib>=3.8",
    "scikit-learn>=1.4",
    "pyyaml>=6.0",
]

§ 05.2

Modèles utilisés Models used

ModèleModel	Tag OllamaOllama tag	Carte modèleModel card
Mistral 7B	`mistral:latest`	mistral.ai
Llama 3.1 8B	`llama3.1:8b`	HuggingFace
Qwen 2.5 14B	`qwen2.5:14b`	HuggingFace
Gemma 4 e4B	`gemma4:e4b`	Google
Olmo 2 13B	`olmo2:13b`	Allen AI
DeepSeek-R1 7B	`deepseek-r1:7b`	GitHub

§ 05.3

Hyperparamètres d'inférence Inference hyperparameters

# Pour chaque appel
{
  "model": "{model_tag}",
  "temperature": 0.0,           # déterministe
                # ou 0.9 + seed pour les conditions stochastiques
  "top_p": 1.0,
  "top_k": -1,
  "max_tokens": 512,
  "seed": {1..10}              # selon condition
}

Chaque appel est sauvegardé en JSONL avec ses métadonnées : modèle, hyperparamètres, hash SHA-256 du prompt, timestamp ISO 8601, durée, nombre de tokens entrée/sortie. Un script de rejeu peut être lancé à tout moment pour produire de nouvelles vagues comparables.

Each call is saved as JSONL with its metadata: model, hyperparameters, SHA-256 hash of the prompt, ISO 8601 timestamp, duration, input/output token counts. A replay script can be launched anytime to produce new comparable waves.

§ 05.4

Données téléchargeables Downloadable data

runs_all.json 974 sorties unifiées974 unified outputs
attractors_pilot.json Attracteurs lexicaux du pilotePilot lexical attractors
heatmap_couverture_pilote.json Matrice de couvertureCoverage matrix
coecriture_v1v2.json Synthèse co-écriture B1/B2/B3Co-writing synthesis B1/B2/B3
embeddings_analysis.json Mesures sémantiquesSemantic measurements
cartographie_2d.json Coordonnées UMAPUMAP coordinates
corpus_amorces.json Huit amorces + signauxEight prompts + signals

§ 05.5

Citer ce travail Cite this work

@misc{boisnard2026completion,
  author       = {Boisnard, Philippe},
  title        = {Ce qui écrit avant l'auteur :
                  complétion algorithmique et conditions
                  computationnelles de l'énonçable},
  year         = {2026},
  publisher    = {Université Paris 8 — Paragraphe-CITU},
  howpublished = {\url{https://databaz.org/unconscious-completion/}}
}

§ 05.6

Travaux liés Related works

Boisnard, P. (2025). The Algorithmic Unconscious: Structural Mechanisms and Implicit Biases in Large Language Models. arXiv:2602.18468
Boisnard, P. (2026). Toward an Archaeology of the Computational Unconscious of the Present. Bibliotheca Hertziana, Max Planck Institute for Art History.
Boisnard, P. (2026). Latent Differentiation: Why Proximity Is Not a Property of an Image. databaz.org/latent-differentiation
Boisnard, P. (2026). Ethology of Latent Spaces. arXiv:2602.05710