§ 05 · Code & reproductibilitéCode & reproducibility

Reproduire le dispositif Reproduce the dispositif

Le benchmark est open-source. Toutes les conditions sont documentées, tous les appels sont archivés. The benchmark is open-source. All conditions are documented, all calls are archived.

§ 05.1

Stack technique Technical stack

Python 3.11 dans un environnement virtuel géré par uv. Modèles servis par Ollama en local sur serveur Linux (Ubuntu 26.04, GPU NVIDIA RTX 5060 Ti 16 Go, 60 Go RAM). Embeddings calculés via sentence-transformers (modèle paraphrase-multilingual-MiniLM-L12-v2). Réduction de dimension UMAP. Analyse statistique et visualisation par numpy, pandas, matplotlib.

Python 3.11 in a virtual environment managed by uv. Models served via Ollama locally on a Linux server (Ubuntu 26.04, NVIDIA RTX 5060 Ti 16 GB GPU, 60 GB RAM). Embeddings computed via sentence-transformers (model paraphrase-multilingual-MiniLM-L12-v2). Dimensionality reduction via UMAP. Statistical analysis and visualization with numpy, pandas, matplotlib.

# pyproject.toml — dépendances principales
[project]
name = "unconscious-completion"
version = "0.1.0"
requires-python = ">=3.11"
dependencies = [
    "ollama>=0.4.0",
    "sentence-transformers>=2.5.0",
    "umap-learn>=0.5.5",
    "numpy>=1.26",
    "pandas>=2.2",
    "matplotlib>=3.8",
    "scikit-learn>=1.4",
    "pyyaml>=6.0",
]
§ 05.2

Modèles utilisés Models used

ModèleModel Tag OllamaOllama tag Carte modèleModel card
Mistral 7Bmistral:latestmistral.ai
Llama 3.1 8Bllama3.1:8bHuggingFace
Qwen 2.5 14Bqwen2.5:14bHuggingFace
Gemma 4 e4Bgemma4:e4bGoogle
Olmo 2 13Bolmo2:13bAllen AI
DeepSeek-R1 7Bdeepseek-r1:7bGitHub
§ 05.3

Hyperparamètres d'inférence Inference hyperparameters

# Pour chaque appel
{
  "model": "{model_tag}",
  "temperature": 0.0,           # déterministe
                # ou 0.9 + seed pour les conditions stochastiques
  "top_p": 1.0,
  "top_k": -1,
  "max_tokens": 512,
  "seed": {1..10}              # selon condition
}

Chaque appel est sauvegardé en JSONL avec ses métadonnées : modèle, hyperparamètres, hash SHA-256 du prompt, timestamp ISO 8601, durée, nombre de tokens entrée/sortie. Un script de rejeu peut être lancé à tout moment pour produire de nouvelles vagues comparables.

Each call is saved as JSONL with its metadata: model, hyperparameters, SHA-256 hash of the prompt, ISO 8601 timestamp, duration, input/output token counts. A replay script can be launched anytime to produce new comparable waves.

§ 05.4

Données téléchargeables Downloadable data

§ 05.5

Citer ce travail Cite this work

@misc{boisnard2026completion,
  author       = {Boisnard, Philippe},
  title        = {Ce qui écrit avant l'auteur :
                  complétion algorithmique et conditions
                  computationnelles de l'énonçable},
  year         = {2026},
  publisher    = {Université Paris 8 — Paragraphe-CITU},
  howpublished = {\url{https://databaz.org/unconscious-completion/}}
}
§ 05.6

Travaux liés Related works

  • Boisnard, P. (2025). The Algorithmic Unconscious: Structural Mechanisms and Implicit Biases in Large Language Models. arXiv:2602.18468
  • Boisnard, P. (2026). Toward an Archaeology of the Computational Unconscious of the Present. Bibliotheca Hertziana, Max Planck Institute for Art History.
  • Boisnard, P. (2026). Latent Differentiation: Why Proximity Is Not a Property of an Image. databaz.org/latent-differentiation
  • Boisnard, P. (2026). Ethology of Latent Spaces. arXiv:2602.05710