Archive for article
December 21, 2022 · category article, intelligence artificielle, photographie, [théorie], [une]
Suivre les flux "stable diffusion", "Dall-e 2" ou bien "mid-journey", amène à ce constat simple : les IA sont utilisées selon des logiques anthropomorphiques qui imposent une ontologie de la forme humaine. Les prompts utilisés sont corrélatifs de modèles statistique qui amènent qu cela prédiction (le résultat produit par l’IA) soit corrélatif de moyennes de données fournies dans le dataset. C’est pour cela que domine à ce point la représentation du visage, du portrait, du personnage, mais aussi du paysage, de la ville, de l’objet. Certes, les variations imaginaires sont multiples, mais elles respectent les lois de composition des corps, des êtres et des objets (ce qui est recherché est la variation stylistique dans les prompts). Les IA par la logique des prompts imitent un réel : qu’il soit photo-réaliste, qu’il soit fantastique, ou de SF, ou encore de manga, ou calqué sur des imitations ou des hybridations de style. Les variations sont infinies, mais l’ontologie des corps et de la représentation est toujours la même que celle de la perception.
Ici, il ne faut pas y voir une critique, mais cela note l’attachement de l’être humain à sa perception et à un ordre perceptif du monde qui définit phénoménalement son réel. L’IA est en ce sens ramenée quant à sa possibilité de composition à un possible conformé, mimétique. Den ce sens ce qui domine est bien le réalisme, ou bien une forme de surréalisme : à savoir un sur-réel pour celui qui a l’intention de création, c’est-à-dire l’homme.
Depuis plus un an et demi que je travaille avec des IA graphiques, je n’ai de cesse de m’interroger sur un autre ordre de composition. Qui serait surprenant justement ontologiquement, ou encore au niveau de la logique de la perception. Un ordre de composition, qui pourrait se créer dans une relation de dialogue entre l’homme et l’IA, faisant que l’espace latent où se produit l’induction statistique laisse émerger des formes inattendues. C’est ce que j’ai appelé souvent : l’impossibilité du corps. Cette recherche ne se bâtit pas sur des impositions de prompt, des descriptions de restructuration, mais recherche par la compréhension des processus algorithmiques de l’IA à laisser émerger certaines aberrations, certaines formes de difformités.
« Nouvel organisme » est le résultat pour moi très surprenant d’un travail qui cherche une expression de l’IA qui se détache de tout attendu. Le prompt, je l’ai généré au cours d’une discussion avec chatgpt :
" PB : Peut-on imaginer des entrelacements de bras et de mains ?
CGPT : Il est tout à fait possible d’imaginer des entrelacements de bras et de mains dans une histoire ou une description. Les bras et les mains sont des parties du corps très expressives et symboliques, et ils peuvent être utilisés de différentes manières pour montrer les émotions et les relations entre les personnages.
Voici quelques exemples d’entrelacements de bras et de mains que vous pourriez inclure dans votre histoire ou votre description : * Un couple qui s’enlace tendrement, les bras de l’un enroulés autour de l’autre et leurs mains entrelacées. Cela pourrait symboliser l’amour et la tendresse qui les unissent.
* Deux amis qui se tiennent par les bras, leurs mains unies en signe de solidarité et de soutien. Cela pourrait montrer l’amitié et la confiance qui les lient.
PB : Oui mais peut-on imaginer des phrases surréalistes et absurdes faites d’entrelacements de bras et de mains
CGPT : Il est tout à fait possible d’imaginer des phrases surréalistes et absurdes faites d’entrelacements de bras et de mains. La poésie et la fiction ont souvent recours à des images et des métaphores étranges et surprenantes pour exprimer des émotions ou des idées de manière originale et poétique.
Voici quelques exemples de phrases surréalistes et absurdes que vous pourriez inclure dans votre écriture :
* "Les bras et les mains s’enroulaient en spirale, comme des lianes de folie."
* "Les mains se tendaient vers le ciel, comme si elles voulaient attraper les étoiles." * "Les bras s’étiraient comme des serpents, s’entrelaçant en un ballet étrange et hypnotisant."
* "Les mains se tordaient et se mêlaient, comme si elles voulaient créer un nouveau langage secret."
Je vous encourage à explorer votre imagination et à trouver des phrases surréalistes et absurdes qui correspondent à l’histoire ou à la description que vous souhaitez raconter. N’hésitez pas à jouer avec les mots et les images pour créer quelque chose de unique et de poétique.
PB : En allant plus loi, en transgressant un peu la grammaire peut on imaginer un corps impossible à partir d’entrelacements de bras et de mains
CGPT : Il est possible d’imaginer un corps impossible à partir d’entrelacements de bras et de mains en transgressant un peu la grammaire et en utilisant l’imagination de manière créative. La poésie et la fiction ont souvent recours à des images et des métaphores étranges et surprenantes pour exprimer des émotions ou des idées de manière originale et poétique.
Voici quelques exemples de phrases qui pourraient vous aider à imaginer un corps impossible à partir d’entrelacements de bras et de mains :
* "Le corps se tordait et se mêlait, comme si les bras et les mains étaient des tentacules pris dans un nœud inextricable."
* "Les bras et les mains se mêlaient en un enchevêtrement de chair et de os, créant une forme indéfinissable et étrange."
* "Le corps se tordait et se contorsionnait, comme s’il était fait de bras et de mains en perpétuel mouvement."
* "Les bras et les mains se mêlaient en un amas de chair et de os, créant une créature
PB / peux tu développer encore plus et aller plus loin dans la transgression de la grammaire avec Le corps se tordait et se mêlait, comme si les bras et les mains étaient des tentacules pris dans un nœud inextricable.
CGPT : Voici quelques façons de développer davantage la phrase "Le corps se tordait et se mêlait, comme si les bras et les mains étaient des tentacules pris dans un nœud inextricable" et de transgresser un peu la grammaire en utilisant l’imagination de manière créative : * "Les bras et les mains ondulaient et s’entrelaçaient, comme des algues sous l’eau, formant une masse informe et mouvante."
* "Les bras et les mains se tordaient et se mêlaient, comme des serpents enragés, créant un corps étrange et indéfinissable."
* "Le corps se tordait et se mêlait, comme s’il était fait de milliers de bras et de mains, unis en un nœud inextricable de chair et de os."
* "Les bras et les mains se mêlaient et s’entrelaçaient, comme des branches d’arbre, formant une structure étrange et inhumaine."
J’espère que ces exemples vous aideront à imaginer un corps impossible à partir d’entrelacements de bras et de mains et à transgresser un peu la grammaire de manière créative. N’hésitez pas à laisser libre cours à votre imagination et à jouer avec les mots et les images pour créer quelque chose de unique et de poétique.
PB : pourrais tu imaginer une histoire absurde d’un homme avec des bras et des mains multiples qui lui échappent ?
CGPT : Voici une histoire absurde que j’ai imaginée d’un homme avec des bras et des mains multiples qui lui échappent :
Il était une fois un homme nommé Paul, qui avait la particularité d’avoir de nombreux bras et mains supplémentaires. Cela avait toujours été un peu gênant pour lui, mais il avait appris à vivre avec cette particularité et à s’en servir de manière utile.
Un jour, alors qu’il se promenait dans les rues de la ville, ses bras et ses mains se mirent à bouger de manière incontrôlable. Ils s’enroulèrent autour de lui comme des serpents, essayant de s’échapper de son corps. Paul se retrouva bientôt enveloppé dans une masse informe de bras et de mains, qui se tortillaient et se mêlaient en un amas indéfinissable.
Il se mit à paniquer et à crier, attirant l’attention des passants effrayés. Mais personne ne semblait savoir quoi faire pour lui venir en aide. Les bras et les mains continuaient de se tordre et de se mêler, comme s’ils voulaient s’échapper de son corps. Finalement, Paul réussit à se débarrasser de ses bras et de ses mains supplémentaires et à rentrer chez lui. Il se blottit sous sa couette, épuisé par cette expérience étrange et effrayante. Il se promit de ne plus jamais sortir de chez lui, de peur que cela ne lui arrive à nouveau.
J’espère que cette histoire absurde vous a plu et vous a donné quelques idées pour imaginer un personnage avec des bras et des mains multiples qui lui échappent."
À partir de ce dernier texte, j’ai demandé à dall-e 2 d’imaginer (de produire l’image, de ce que chatGPT avait décrit). En ce sens, il s’est agi de libérer l’imagination artificielle d’une projection mimétique du sujet humain. Comme si l’IA était une machine célibataire, produisant par elle-même, dans une sorte d’auto-référentialité son propre monde. Ce qui ressort, c’est que dès qu’on s’interroge sur les processus de liaison internes qui se déroulent dans les processus de construction de l’IA, et donc qui sont au coeur de l’induction, on s’aperçoit, que l’imagination artificielle n’est pas mimétique mais produit un monde qui pour l’homme est aberrant, où ne sont respectés ni les lignes ou points de fuite, ni les logiques organiques ou corporelles, ni les perspectives ou les proportions.
Ce qui signifie que le flux d’images que nous suivons et qui sont faites par les IA sont le résultat de stéréotypes promptologiques et ontologiques qui brident les émergences de l’espace latent et réduisent le possible à la mémoire de nos images.
August 1, 2022 · category article, intelligence artificielle, photographie, [théorie], [une]
The happening est une série de photographies réalistes que j’ai réalisée avec l’IA DALL-E 2, à laquelle j’ai eu accès en juillet 2022. Beaucoup de questions surgissent avec son emploi, que je compte poser régulièrement à l’aide de ces petits articles que je rédige.
Ici ce qui m’interroge, c’est la relation entre le photo-réalisme et la question de la causalité. Dans notre réel, toute image que nous captons, donc toute photographie, est liée à une chaine de causalité. Lorsque je vois par exemple une rue de Paris, de San Paolo ou de L.A avec des passants, chaque être, chaque objet est impliqué dans la photographie selon un schème temporel et causal. Avec les réseaux sociaux, et la multiplication des micro-vidéos type tik-tok, nous sommes submergés par des images qui reposent sur des micro-actions. Même un paysage, lorsqu’il est photographié est lié à une causalité : celle qui dot que celui qui photographie est en voyage, en vacances, en week-end, etc…
The happening est une série de photographies réalistes d’un événement. Mais quelle est la causalité dans l’image. Nous voyons une foule photographier quelque chose, mais nous ne savons pas quoi. Il y a une causalité qui est celle du prompt (le texte qui est donné à DALL-E 2), prompt que je tords toujours pour que le résultat déborde l’attendu descriptif, mais il n’y a pas de causalité interne à l’image. En travaillant sur une imprévisibilité du rendu, je brise la possibilité référentielle et réelle dans le rendu. Ceci peut se faire en interrogeant les limites des possibles de rendu de DALL-E 2. Si Etienne Mineur par exemple, a très bien vu en quel sens certaines catégories sont hyper stéréotypées et faciles à représenter pour DALL-E 2, il est possible de faire l’inverse questionner les limites du rendu d’objets, d’associations. Ce qui demande de questionner tout à la fois la logique d’assemblage grammatical du moteur, la nature des banques d’images ayant servi pour le dataset et enfin les restrictions introduites moralement par l’équipe de open-ai.
L’événement dont nous avons une trace n’a ni passé ni futur, car l’image n’a pas de causalité historique, ou encore toute causalité narrative de l’image est extérieure à sa fabrication. The happening met le spectateur de l’image face à une temporalité en suspension du point de vue de la causalité temporelle. L’IA ne construisant aucunement
Ce point est une différence majeure avec la photographie ou bien encore avec l’illustration, au sens où justement la production de l’image étant déléguée à un processus technique, celui-ci n’implique pas la construction du sens de l’image. Ou encore la mémoire sémiotique liée à la liaison image/texte n’est pas de l’ordre de la causalité narrative et historique, mais de la relation esthétique par contiguité, pour reprendre une distinction de Hume très utile.
Dès lors l’image produite par une IA est du point de vue de celle-ci, celle d’un présent pur de la contiguité des éléments, le temps de l’image ne se déploie pas dans le temps de l’action, mais seulement dans le temps de la relation. C’est le spectateur humain qui, selon la causalité temporelle, et la mémoire événementielle ou narrative, va s’interroger sur un chainage de l’événement.
_______________________________________
[ENGLISH]
The happening is a series of realistic photographs that I made with the DALL-E 2 AI, to which I had access in July 2022. Many questions arise with its use, which I intend to ask regularly using of these little articles that I write.
Here what questions me is the relationship between photo-realism and the question of causality. In our reality, any image we capture, therefore any photograph, is linked to a chain of causality. When I see, for example, a street in Paris, San Paolo or L.A with passers-by, each being, each object is involved in the photograph according to a temporal and causal scheme. With social networks, and the proliferation of tik-tok type micro-videos, we are overwhelmed by images that are deposited on micro-actions. Even a landscape, when it is photographed, is linked to a causality: the one that points out that the photographer is on a trip, on vacation, on a weekend, etc…
The happening is a series of realistic photographs of an event. But what is the causality in the picture. We see a crowd photographing something, but we don’t know what. There is a causality which is that of the prompt (the text which is given to DALL-E 2), a prompt which I always twist so that the result overflows the descriptive expectation, but there is no internal causality to the prompt. ‘image. By working on an unpredictability of rendering, I break down the referential and real possibility in rendering. This can be done by questioning the limits of the possible rendering of DALL-E 2. If Etienne Mineur for example, has seen very well in what sense certain categories are hyper stereotyped and easy to represent for DALL-E 2, it is possible to doing the opposite questioning the limits of the rendering of objects, of associations. This requires questioning both the grammatical assembly logic of the engine, the nature of the image banks used for the dataset and finally the restrictions morally introduced by the open-ai team.
The event of which we have a trace has neither past nor future, because the image has no historical causality, or any narrative causality of the image is external to its fabrication. The happening puts the spectator of the image in front of a temporality in suspension from the point of view of temporal causality. AI not building at all
This point is a major difference with photography or even with illustration, in the sense that precisely the production of the image being delegated to a technical process, this one does not imply the construction of the meaning of the image. Or again, the semiotic memory linked to the image/text link is not of the order of narrative and historical causality, but of the aesthetic relationship by contiguity, to take up a very useful distinction from Hume.
Therefore the image produced by an AI is from its point of view, that of a pure present of the contiguity of the elements, the time of the image does not unfold in the time of the action, but only in the time of the relationship. It is the human spectator who, according to temporal causality, and event or narrative memory, will wonder about a chaining of the event.
July 6, 2022 · category article, intelligence artificielle, [texte], [théorie], [une]
Cela fait maintenant un an que se répandent sur internet et surtout les réseaux sociaux, des créations visuelles générées par IA (Intelligence artificielle) selon le modèle du CLIP (Contrastive Language–Image Pre-training), à savoir, d’un énoncé (prompt) générant une image. Plusieurs types de logiciels on été donnés de VQGAN-clip,à pitty, de disco-diffusion à Dall.
Il est possible maintenant de réfléchir à une forme de typologie des emplois. Notamment, parce que des créateurs comme Grégory Chatonsky, Yann Minh ou bien Etienne Mineur, entre autres, ont eux-même définis les usages qu’ils en faisaient.
L’usage majeur qui est fait de ce type d’IA fait ne tient pas tant à la recherche de l’imprédictibilité du résultat, mais comme l’exprime parfaitement Yann Minh, à la substitution d’une incompétence par une compétence ordonnée à la génération de l’IA. L’IA vient remplacer une praxis que ne possède pas le créateur afin de permettre une poiesis de l’image : la capacité à illustrer. L’IA est pensée dès lors comme prothèse, augmentation, médiation. La recherche tend à créer le plus possible selon ce que recherche l’imagination du créateur : l’IA est déterminée comme illustratrice, exécutante. C’est en ce sens que Yann Minh crée les personnages de ses romans, leur donne visage.
Dans cette démarche l’imprédictibilité de ce qui survient n’est pas recherchée pour elle-même, elle n’est pas questionnée en tant que processus, même si elle n’est pas non plus ignorée, elle est considérée comme un moyen qui doit tout à la fois surprendre et obéir à l’horizon fixé par le prompt. La puissance propre à l’IA doit correspondre à une attente conceptuelle (celle du prompt) du créateur. Certes, il y a coopération, mais le créateur reste dans la logique du pilotage qui commande une exécution. L’IA est alors un instrument, dont on est pas interrogél’être propre. On est dans une logique proprement cybernétique, au sens que lui confère Aristote originellement : celle du commandement.
Une seconde démarche, parait être davantage celle de Grégory Chatonsky par exemple : celle de l’imprédictibilité du résultat du à l’espace latent de l’IA. Dans le prolongement de ses recherches, ce qu’il questionne n’est pas tant la représentation ou le résultat surréaliste (même si ce terme a été présent et déterminant dans ses premières recherches) que certaines formes de mutation de la forme propres à l’imagination machine plus que l’imaginaire machine. Cette distinction à mon sens est nécessaire. La première démarche recherche l’imaginaire machine, à savoir le résultat du processus. Alors que cette deuxième démarche dans laquelle, je me situe aussi, questionne l’imagination artificielle ou plus précisément l‘imaginer artificiel : le processus et les mécanismes de la machine en tant qu’elle génère de l’image. Comment est constitué un dataset ? Comment se fabrique à partir de bruit de perlin ou bien d’autres images par exemple une image par un processus de GAN (Generative adversarial networks) ? Quelle différence y a t il entre recombiner des formes et constituer une forme par approximation statistique ? Il ne s’agit plus seulement d’utiliser l’IA en tant qu’outil, mais de se questionner en relation à ce qu’elle pose comme réalité algorithmique.
Pour ma part c’est ce qui m’avait amener – à partir de mes propres recherches – à réfléchir sur la question de la différence de la mémoire entre celle de l’IA et celle de l’être humain et à réfléchir sur l’impossibilité du corps ou encore une nouvelle forme d’organologie, au sens où la mémoire la machine ne me semblait aucunement liée à une expérience de corps (Leib) mais à une la computation statistique de l’apprentissage profond. C’est en ce sens que je posais davantage la question du pararéalisme de la création de l’IA, que celle du surréalisme. Ce sur que semble aussi indiqué Grégory Chatonsky par exemple dans cet article où il insiste sur la question du parallélisme des mondes.
Cet horizon, où une forme de dialogue avec les possibles du logiciel est instauré entre le créateur humain et l’ensemble des possibles algorithmiques, est alors ouvert à l’imprédictible de la forme en tant qu’imprédictible pour notre mémoire de monde. La notion de prompt se détache du premier usage. Le prompt ne sera plus prescription, au sens d’une intention qui commande et doit décider, mais par approximation, il questionnera la constitution tout à la fois de la réalité latente possible par le dataset (liaison entre images et catégories linguistiques), mais aussi la manière dont algorithmiquement « l’induction statistique » (Chatonsky) opère. Car en effet, il n’y a qu’à expérimenter avec un même prompt : VQGAN, DISCO ou DALL, pour s’apercevoir qu’il y a des différences spécifiques entre les trois IA, quant à la génération.
Une troisième voie de recherche peut être établie, et elle constitue une part importante de mon travail : celle d’une accidentlité ontologique de la matière générée par l’IA. Lorsque l’on regarde les images générées, et d’autant plus avec les différents logiciels DALL qui circulent depuis peu à la suite d’open-AI, il y a une forme d’homogénéité matérielle qui n’exclue aucunement d’ailleurs une imprédictibilité de la forme. Les images se révèlent dans une forme d’unité ontologique de la matière. Certes elles peuvent être surréalistes, ou bien heroic Fantasy ou SF, mais il y a toujours une forme de simplicité ontologique de la matière, une réduction de la différence. Je n’ai quasi jamais observé de complexité ontologique de la matière dans les créations faites par les IA. Chaque image semble obéir à une détermination qui commande l’ensemble du rendu. C’est ce qui ressort d’ailleurs parfaitement avec les lettrages d’Etienne Mineur et qu’il a lui-même remarqué : chaque lettrage est fait dans un style : mais ce style est d’abord et avant tout une forme d’homogénéité de la matière, de la texture.
Cette homogénéité à mon sens provient de deux spécificités : la forme est privilégiée par rapport à la matière au niveau du prompt. Et deuxièmement, l’IA n’est pensée que comme un simple outil d’exécution, une application, et non pas selon une forme d’expérimentation de ses possibles de texture. C’est en ce sens que beaucoup de création par IA vont même spécifier la référence à un artiste ou bien un mouvement artistique pour créer le rendu. Ce qui est permis spécifiquement avec VQGAN, Disco Diffusion ou bien Pitty entre autres.
Il est évident que pour créer au sein d’une seule image une variation matérielle créant une véritable hétérogénéité, il s’agit de penser l’IA non plus comme une simple application, mais comme un ensemble de potentialités au niveau programmation avec lesquelles il faut entrer en dialogue afin d’en comprendre certains mécanismes, notamment quant à son travail de rendu. Il s’agit de comprendre comment ’opèrent entre autres les différents settings de matrice de rendus (vitB32, vitB16, RN50), de jouer avec, la notion de récurrence, etc… Mais aussi comment s’établit la logique de prompt, non plus du point de vue de la forme mais du possible de la texture et ainsi de laisser apparaître dans ce dialogue avec les potentialités de la machine des possibles, non pas de formes mais de matières. C’est en grande partie la direction que je tente de suivre en la liant la deuxième démarche décrite.
——————————————————————————————————————
It’s been a year now that visual creations generated by AI (Artificial Intelligence) according to the CLIP (Contrastive Language–Image Pre-training) model have been spreading on the Internet and especially on social networks, namely, a statement (prompt ) generating an image. Several kinds of software were donated from VQGAN-clip, to pitty, from disco-diffusion to Dall. It is now possible to think about a form of job typology. In particular, because creators like Grégory Chatonsky, Yann Minh or even Etienne Mineur, among others, have themselves defined the uses they made of it.
The major use that is made of this type of AI is not so much the search for the unpredictability of the result, but as Yann Minh perfectly expresses it, the substitution of an incompetence by a skill ordered to the generation of AI. AI comes to replace a praxis that the creator does not have in order to allow a poiesis of the image: the ability to illustrate. AI is therefore thought of as a prosthesis, augmentation, mediation. Research tends to create as much as possible according to what the creator’s imagination seeks: AI is determined as an illustrator, an executor. It is in this sense that Yann Minh creates the characters of his novels, gives them a face.
In this approach, the unpredictability of what happens is not sought for itself, it is not questioned as a process, even if it is not ignored either, it is considered as a means which must both surprising and obeying the horizon fixed by the prompt. The power specific to the AI must correspond to a conceptual expectation (that of the prompt) of the creator. Admittedly, there is cooperation, but the creator remains in the logic of piloting which commands an execution. AI is then an instrument, whose very being we are not questioned. We are in a strictly cybernetic logic, in the sense originally given to it by Aristotle: that of command.
A second approach, seems to be more that of Grégory Chatonsky for example: that of the unpredictability of the result due to the latent space of AI. In the extension of his research, what he questions is not so much the representation or the surrealist result (even if this term was present and determining in his first research) as certain forms of mutation of the form specific to the machine imagination more than machine imagination. This distinction, in my opinion, is necessary. The first approach seeks the machine imaginary, namely the result of the process. While this second approach in which I also find myself, questions the artificial imagination or more precisely the artificial imagination: the process and the mechanisms of the machine as it generates the image. How is a dataset made? How is it made from pearl noise or other images, for example an image by a GAN process (Generative adversarial networks)? What is the difference between recombining shapes and constituting a shape by statistical approximation? It is no longer just a question of using AI as a tool, but of questioning oneself in relation to what it poses as algorithmic reality.
For my part, this is what led me – from my own research – to reflect on the question of the difference in memory between that of AI and that of human beings and to reflect on the impossibility of the body or even a new form of organology, in the sense that the memory the machine seemed to me in no way linked to an experience of the body (Leib) but to a statistical computation of deep learning. It is in this sense that I posed more the question of the pararealism of the creation of AI, than that of surrealism. This is what Grégory Chatonsky also seems to indicate, for example in this article where he insists on the question of the parallelism of the worlds.
This horizon, where a form of dialogue with the possibilities of the software is established between the human creator and all the algorithmic possibilities, is then open to the unpredictability of the form as unpredictable for our memory of the world. The notion of prompt stands out from the first use. The prompt will no longer be a prescription, in the sense of an intention that commands and must decide, but by approximation, it will question the constitution both of the latent reality possible by the dataset (link between images and linguistic categories), but also the way in which algorithmically “statistical induction” (Chatonsky) operates. Because indeed, you only have to experiment with the same prompt: VQGAN, DISCO or DALL, to realize that there are specific differences between the three AIs, as far as generation is concerned.
A third way of research can be established, and it constitutes an important part of my work: that of an ontological accidentality of matter generated by AI. When we look at the images generated, and all the more so with the various DALL software programs which have recently been circulating following open-AI, there is a form of material homogeneity which in no way excludes a unpredictability of form. The images are revealed in a form of ontological unity of matter. Certainly they can be surreal, or heroic fantasy or SF, but there is always a form of ontological simplicity of matter, a reduction of difference. I have almost never observed any ontological complexity of matter in the creations made by AIs. Each image seems to obey a determination that controls the whole rendering. This is what comes out perfectly with the lettering of Etienne Mineur and which he himself noticed: each lettering is done in a style: but this style is first and foremost a form of homogeneity material, texture.
This homogeneity in my opinion comes from two specificities: the form is privileged compared to the material at the level of the prompt. And secondly, AI is only thought of as a simple execution tool, an application, and not as a form of experimentation with its possible textures. It is in this sense that many AI creations will even specify the reference to an artist or an artistic movement to create the rendering. What is allowed specifically with VQGAN, Disco Diffusion or Pitty among others.
It is obvious that to create within a single image a material variation creating a real heterogeneity, it is a question of thinking of AI no longer as a simple application, but as a set of potentialities at the programming level with which it is necessary to enter into a dialogue in order to understand certain mechanisms, in particular with regard to its rendering work. It is a question of understanding how the different rendering matrix settings (vitB32, vitB16, RN50) operate, among other things, to play with, the notion of recurrence, etc… But also how the logic of prompt is established, either from the point of view of the form but of the possible of the texture and thus to let appear in this dialogue with the potentialities of the machine of the possibilities, not of forms but of materials. This is largely the direction I am trying to follow by linking it to the second approach described.
May 15, 2022 · category article, intelligence artificielle, [texte], [une]
Tous les jours 350 millions de photos sont publiés sur facebook. Plus de 240 milliards d’images ont été ainsi accumulées par la plateforme depuis sa création. Les réseaux sociaux ont accéléré à la fois la production des images numériques et d’autre par leur publication, leur partage, leur diffusion, leur duplication.
Dans leur article publié dans AOC, Gwenola Wagon et Stéphane Degouttin soulignent avec pertinence en quel sens les imaginaires des images diffusées, de l’open-space à l’image érotico-porno, du portrait à la vue d’ensemble, correspondent à des imaginaires reliés à des stocks d’image, à « une hygiène de l’image », « une stratégie d’évidage de l’image ». Ainsi les images viendraient recouvrir le réel par leur esthétique clean, par leur codification apriori, effaçant les aspérités du réel, et ce qu’elles engagent comme problématiques (sociales, politiques, etc) en faveur d’une vision édulcorée, adoucie, anesthésiée.
Se pose cependant la question de savoir pour qui sont destinées ces images ? En quel sens, les réseaux sociaux demandent que soient postées des images, sachant que les images stockées exigent de la place sur des servers donc des coûts réels et de la place matérielle.
Mon hypothèse, c’est que l’image prise dans une dialectique qui définit sa fin, ne correspond plus réellement à ce qu’elle était traditionnellement, mais qu’elle est immédiatement autre chose, à savoir un déchet qui est conçu médiatement pour être recyclé.
Intentionnellement, du point de vue de la conscience humaine, lorsque l’on poste une image, c’est pour qu’elle soit vue. C’est ce qui tient au désir. Et c’est ce désir de reconnaissance médiatisée de soi que stimulent les stratégies relationnelles des réseaux sociaux. J’appelle la profondeur de l’image, ce qui amène une image à nous retenir dans son temps, dans ses plis, dans sa matérialité, dans son apparaître (aiesthesis). La profondeur d’une image n’est pas ainsi une dimension matérielle, mais temporelle.
Ce que le créateur d’une image, par exemple d’un tableau peut souhaiter c’est que son image retienne l’attention. La dimension du regard tient au temps et c’est dans ce temps que l’image affecte.
Or, les réseaux sociaux ont développé une logique de flux tendu pour les informations ou images qui leur sont envoyées. L’image n’est plus pensée selon une logique de profondeur mais de transmissibilité et de stimuli rapides. Ce n’est plus la qualité de l’image qui est primordiale, mais la quantité de partage et de like. Le like et le partage ne reposent pas sur une analyse qualitative mais sur d’autres logiques liées à des processus algorithmiques : la fréquence de post, le réseau interconnecté avec celui qui poste. Dès lors l’image est pensée en tant que potentialité de like et elle exige immédiatement d’être dépassée dans la prochaine image postée. La reconnaissance n’existe que dans l’enchainement des publications. Les publications ne sont pas pensées comme liées, mais à chaque fois comme des objets autonomes. Cela se voit aussi bien par des traits spécifiques dans les créations vidéos : des mini-scénarios, d’une durée courte, sans lien avec les précédentes créations. Les réseaux sociaux sont ainsi des flux de points qui doivent se succéder indéfiniment. L’épaisseur temporelle doit être réduite le plus possible.
La logique de flux fait, et ici nous je rejoins totalement GW SD que l’image doit correspondre avec une esthétique du réseau. Cette logique de mimétisme, de mème (Dawkins), est une des clés pour réussir à augmenter la fréquence de like et de transmissibilité d’une image. Se développe ainsi une forme d’académisme de l’image, de modalité de la répétition dans une différence qui doit se nier d’une certaine manière.
L’image n’attire plus l’attention, elle entre en écho avec un déjà vu.
Ce que j’appelle l’image-déchet, est ainsi l’image conçue selon l’intentionnalité des promoteurs des réseau sociaux non plus comme devant avoir une forme d’épaisseur temporelle, mais étant immédiatement pensée selon sa logique de recyclage. Le but des réseaux sociaux tient à l’accélération des publications, en vue d’un stockage-recyclage de données.
Nous le savons, nos informations, qu’elles soient textuelles, picturales, vidéos ou audios, entrent toutes dans des bases de données (big data) qui elles-mêmes servent à alimenter des processus d’apprentissage pour des intelligences artificielles.
Le but des réseaux sociaux n’est pas l’attention portée par les humains. Cette attention n‘est qu’une médiation, en vue d’une autre fin. L’attention humaine doit même être la plus courte possible pour une image, quelqu’elle soit. En effet nous pourrions imaginer d’une manière absurde, une image qui retiendrait absolument l’attention, qui impossibiliserait toute autre image, cela anéantirait toute logique de réseau social. Nous serions alors dans une perspective à la Borgès plus qu’à la Meta ou la Google.
Au contraire les images doivent être suffisamment volatiles, pour qu’elles se succèdent sans que nous nous y arrêtions. Certes, stratégiquement, il est toujours utile pour cette logique de mettre en évidence des flux qui se démarquent. Mais ils ne sont publicitairement conçus que comme des stimuli pour inciter tout un chacun à poster.
Les images ne nous sont plus vraiment adressées. Elles ne sont plus destinées au regard humain, mais elles sont envoyées à des IA. Là aussi l’image n’est pas pensée dans une logique d’hyper-production comme réalité, mais elle est médiation pour saisir à partir d’intelligences artificielles, des informations qui ne concernent pas l’image en propre. L’image-déchet est ainsi une image qui sert de matière à recycler pour des stratégies aussi bien commerciales, politiques, sociologiques qu’esthétique. Ce qui compte n’est pas l’image en tant qu’entité, mais l’image en tant que multiplicité de données exploitables.
Lorsque l’on crée avec une IA (par exemple les systèmes CLIP), la création de l’image est le résultat du recyclage de nos images qui ont été injectées dans des datasets et analysées grâce à du deep learning. La création à l’aide d’IA se caractérise ainsi comme une forme qui se constitue à partir de potentialités qui sont tirées de l’image-déchet. Ce que nous voyons comme résultat est ainsi tout à la fois ressemblant (car issu de données élémentaires d’images pré-existantes) et dissemblabes (au sens où l’IA n’est pas dans une mimésis de perception, mais dans une mimésis par statistique à partir d’analyses de données).
_______________________________________________
Every day 350 million photos are published on facebook. More than 240 billion images have been accumulated by the platform since its creation. Social networks have accelerated both the production of digital images and others through their publication, sharing, dissemination, duplication.
In their article published in AOC, Gwenola Wagon and Stéphane Degouttin pertinently underline the sense in which the imaginaries of the images disseminated, from the open-space to the erotic-porn image, from the portrait to the overview, correspond to imaginaries related to image stocks, to "an image hygiene", "a strategy of hollowing out the image". Thus the images would come to cover the real by their clean aesthetics, by their a priori codification, erasing the roughness of the real, and what they involve as problematic (social, political, etc.) in favor of a watered down, softened, anesthetized vision.
However, the question arises, for whom are these images intended? In what sense, social networks require images to be posted, knowing that the stored images require space on servers and therefore real costs and material space.
My hypothesis is that the image taken in a dialectic that defines its end, no longer really corresponds to what it traditionally was, but that it is immediately something else, namely a waste that is mediately designed to be recycled.
Intentionally, from the point of view of human consciousness, when we post an image, it is to be seen. This is what comes down to desire. And it is this desire for mediated self-recognition that the relational strategies of social networks stimulate. I call the depth of the image, which leads an image to retain us in its time, in its folds, in its materiality, in its appearing (aiesthesis). The depth of an image is thus not a material dimension, but a temporal one.
What the creator of an image, for example of a painting, may wish is that his image attract attention. The dimension of the gaze depends on time and it is in this time that the image affects.
However, social networks have developed a tight flow logic for the information or images sent to them. The image is no longer conceived according to a logic of depth but of transmissibility and rapid stimuli. It is no longer the quality of the image that is essential, but the quantity of shares and likes. The like and the sharing are not based on a qualitative analysis but on other logics linked to algorithmic processes: the frequency of posting, the network interconnected with the one who posts. From then on the image is thought of as a potentiality of like and it immediately demands to be exceeded in the next image posted. Recognition only exists in the chain of publications. The publications are not thought of as linked, but each time as autonomous objects. This can also be seen by specific features in the video creations: mini-scenarios, of short duration, unrelated to previous creations. Social networks are thus flows of points that must follow one another indefinitely. The temporal thickness must be reduced as much as possible.
The flow logic does, and here we totally agree with GW SD that the image must correspond with the aesthetics of the network. This logic of mimicry, of meme (Dawkins), is one of the keys to successfully increasing the frequency of likes and the transmissibility of an image. Thus develops a form of academicism of the image, of modality of repetition in a difference that must be denied in a certain way.
The image no longer attracts attention, it echoes with a deja vu.
What I call the image-waste, is thus the image conceived according to the intentionality of the promoters of the social networks no longer as having to have a form of temporal thickness, but being immediately thought out according to its logic of recycling. The purpose of social networks is to accelerate publications, with a view to storing and recycling data.
We know that our information, whether textual, pictorial, video or audio, all enters databases (big data) which are themselves used to feed learning processes for artificial intelligence.
On the contrary, the images must be sufficiently volatile, so that they follow one another without our stopping there. Certainly, strategically, it is always useful for this logic to highlight flows that stand out. But they are only advertised as stimuli to encourage everyone to post.
The images are no longer really addressed to us. They are no longer intended for the human gaze, but they are sent to AIs. Here too the image is not thought of in a logic of hyper-production as reality, but it is mediation to seize from artificial intelligence, information that does not concern the image itself. The waste-image is thus an image that serves as material to be recycled for commercial, political, sociological and aesthetic strategies. What counts is not the image as an entity, but the image as a multiplicity of exploitable data.
When creating with an AI (for example with CLIP systems), the creation of the image is the result of the recycling of the broadcast images that have been injected into datasets and analyzed using deeplearning. Creation using AI is thus characterized as a form that is constituted from potentialities that are drawn from the waste-image. What we see as a result is thus both resembling (because stemming from elementary data of pre-existing images) and dissimilar (in the sense that the AI is not in a mimesis of perception, but in a mimesis by statistics from data analysis).
April 5, 2022 · category article, intelligence artificielle, [texte], [une]
Depuis quelques années, mon travail est hanté par la destruction et la trace. Celle de l’humanité. Les paysages que je crée numériquement (installations programmées, photographies numériques) sous le nom générique de paysage de la catastrophe, se répandent en étendues désolées, en lieu de ruines, d’où l’homme a disparu. Paysages qui ne se donnent plus du point de vue de l’unité perceptive de l’homme contemplant la nature, mais comme espace non-humain, échappé de sa perception. Mes dernières séries réalisées par intelligence artificielle (IA) Our Wealth (2022), Materiality’s Virtuality (2021) Disaster Landscape (2021), et d’autres encore, poursuivent cet horizon.
La ruine n’est pas nouvelle en art, elle en est à la fois un motif esthétique et une possibilité miroir pour l’homme lui-même, pour son sens. Dès la Renaissance elle vient définir une forme esthétique par exemple chez Mantegna.
Mais c’est avec le XVIIIème siècle que la ruine et notamment Piranèse et Hubert Robert, que se constitue une esthétique de la ruine, qu’elle n’est plus en arrière plan, support, mais devient le premier plan du tableau, son motif central, qu’elle correspond à une mise en abyme de l’humanité de son temps, de son histoire.
La ruine hante l’art car elle fait apparaitre tout à la fois la destruction et sa trace. Elle se donne comme témoignage de ce qui a eu lieu et qui n’est plus. La ruine est une restance. Elle est en ce sens l’indice d’un passé qui insiste dans le temps. Par la ruine, il y a en quelque sorte un refus du silence, de l’irreprésentable. La trace est la marque que l’art est lieu de la représentation, de ce qui aurait disparu, un refus de l’effacement.
La ruine peut se donner comme l’effondrement du présent : Ludwig Meidner, et ses paysages de l’apocalypse peints entre 1913 et 1915. La douleur de la guerre n’implose pas, mais donne lieu à la représentation expressionniste.
L’esthétique de la ruine cependant avec la fin du XXème siècle n’est plus venue marquée un moment de destruction : mais bien plus une forme d’épuisement du monde et de sa logique tel qu’il fonctionne, le monde comme espace de ruine. Si Hubert Robert dépassait la simple esthétique de la ruine en représentant le Louvre et sa grande galerie en ruine, ceci afin de montrer la fin d’un temps : la fragilité de ce qui se donnait symboliquement par l’architecture, Cyprien Gaillard au début du XXIème siècle pose de même la finitude de la modernité du XXème siècle à travers une création qui porte sur la ruine. Que cela soit les gravures de Belief in The Age of Disbelief (2003), Swiss Ruins (2005) ou de Geographical Analogies.
Toutefois, mon travail, s’il est habité par cette esthétique, par ce qu’elle véhicule quant à la question de la trace, il envisage la ruine non pas du point de vue du présent mais du futur. Ce ne sont pas les ruines environnantes et les traces du passé que je tente de représenter, mais notre présent comme ruine d’un avenir inéluctable.
Mais se pose la question de celui qui observe. Que cela soit dans les oeuvres citées, ou bien dans les films post-apocalyptiques (de loin le lieu où la ruine future est le plus présente), la représentation est toujours liée à la persistance de la conscience humaine. La destruction de l’homme, ne réussit jamais à s’affranchir du dernier témoin. Le cinéma notamment ne parvient jamais à poser la radicalité de la finitude humaine. Les décombres sont toujours le lieu d’une humanité restante et dans sa possible résilience et d’une conscience qui est là pour être témoin. Pour ma part, mes créations sur la post-humanité s’affrontent à la radicalité de l’effacement de l’humain, à sa disparition, et delà se confronte à la possibilité d’un regard extra-humain comme constitutif de la perception.
En 2015, dans la première version de Paysage de la catastrophe, j’indiquais que le paysage était généré par un algorithme, une forme d’intelligence artificielle qui en analysant les hashtags sur Fukushima, générait des reliefs, le paysage. Parallèlement, un deuxième algorithme tentait de refaire un récit de cette catastrophe à partir de millions de twits. Le déplacement se faisait selon une automatisation. Il était important de souligner cette disjonction entre une intention humaine et un observateur extra-humain.
Cette disjonction entre l’homme et la possibilité de la perception est dans l’horizon de ce qu’a revendiqué Vertov dans le manifeste Kinok : l’automatisation du kinoglaz. Un oeil de la caméra qui s’émanciperait en tant que voir, en tant que perception, de la sensibilité humaine. Ce qui chez Vertov aboutit à cette scène finale fantastique : une caméra autonome. En 2015 : c’est ce que je poursuivais : constituer un témoin de la fin de l’homme, qui ne tiendrait plus à la persistance de l’homme, mais qui serait une perception extra-humaine, obéissant à sa propre logique.
La ruine si j’essaie de la penser à partir du futur, et donc d’une archéologie d’un avenir où l’homme ne serait plus, je tente de constituer la génération de l’image par IA comme cette possibilité d’un voir anticipant, comme la constitution d’une perception qui n’est plus humaine. L’IA n’est pas d’abord un outil, mais la présence d’une imagination artificielle et technique et d’une forme de représentation déctachée de l’homme et qui pourrait lui succéder. Je la pense d’abord et avant tout ontologiquement comme présence et pas selon sa réduction instrumentale. L’IA construirait ces visions du futur (la ruine) à partir de la matérialité qui lui est donnée (les stocks d’images) et de sa logique. Ainsi, nos images qui lui sont données et qui constituent son dataset seraient en quelque sort les décombres, lui permettant tout à la fois esthétique et logiquement de produire l’image de la ruine future.
Une partie de mes images repose sur des énoncés que je ne décide pas initialement. Une première IA travaille sur des ensembles d’articles d’actualités portant sur l’anthropocène, la crise écologique etc. et de là génère des énoncés, que l’on pourrait estimer prédictif : des descriptions d’un futur possible, potentiel, probable… Ces énoncés sont ensuite utilisés par d’autres IA pour générer des images (chaque image est issue de plusieurs processus de génération). En quelque sorte, ces créations correspondent à ce que peut souligner Pierre Huyghe à propos de ses dernières créations en 2018 : « Quand ce qui est fait n’est pas nécessairement dû à l’artiste en tant qu’opérateur unique, le seul à générer des intentions et que c’est plutôt un ensemble d’intelligences, d’entités biotiques ou abiotiques, hors de portée humaine, et que la situation présente n’a pas de durée, ne s’adresse à personne, est indifférente, à ce moment-là, peut-être que le rituel de l’exposition peut s’auto-présenter ».
January 8, 2022 · category article, intelligence artificielle, [texte], [théorie], [une]
"Le mythe des machines célibataires signifie l’empire simultanéité du machinisme et du monde de la terreur" Michel Carrouges, 1954.
En 1981, David Cronenberg, avec Videodrome, émettait l’hypothèse d’une transformation de notre réel à partir de l’image télévisuelle. Le leitmotiv était celui de "la nouvelle chair".
Cette nouvelle chair, étrangement, n’était pas dépendante des hommes, mais, dans une sorte de spirale horrifique, elle se fondait sur une autonomisation de la technique. Celle-ci s’émancipant des causalité humaines, agissant sur Max (James Wood) sans qu’il y ait d’intentionnalité pré-existante. La scène de la télévision vivante, animée d’un circuit vasculaire, avec à l’écran Niky appelant Max puis le gobant en était l’une des séquences symboliques. Entre eros et thanatos, Videodrome montre une technologie qui produit de l’image incontrôlable.
Pour David Cronenberg, il y aurait une forme d’extension du règne de l’image sur l’imaginaire, produisant une transformation de la chair du réel. L’imaginaire étant produit par la machine elle-même. Cette transformation serait analogiquement organique et terrifiante, mais désirable, d’où la fascination de Max pour l’organisme TV autonome et posé sexuellement.
Avec la production d’image par les IA, nous sommes entrés pleinement dans cette ère de la nouvelle chair, nous faisons face à des écrans qui génèrent de plus en plus d’images produites par les machines elles-même.
Il y aurait une extension d’images non produites par l’humain et delà un imaginaire qui n’aurait plus comme source l’imagination humaine, mais l’imagination machine. Une forme de contamination de l’image par les productions de l’IA.
Il y a là en quelque sorte une inversion dans la constitution de l’image telle qu’elle a été pensée traditionnellement en art, mais aussi un déplacement par rapport à l’usage de la médiation technique.
L’oeuvre est encore souvent définie à partir de l’artiste, qui en serait le créateur, « la singularité créatrice » pour reprendre Nathalie Heinich. Non seulement il en serait la source intentionnel, mais il en serait aussi par son imaginaire, son émotion le créateur de la plasticité. Le créateur serait ainsi central, sa vocation, ses dons, son exception, son inspiration. De même, si prendre une photographie, comme l’a parfaitement expliqué Vilem Flusser, cela implique de saisir le cadre déterminant de la technique, cela suppose néanmoins qu’il y ait encore un réel à capter et un certain nombre d’intentions et d’actions du photographe, notamment une forme de sensibilité à ce qui est vu et donc dans l’acte du voir technique. La création par IA suppose une rupture dans l’acte de création, au sens où si l’intention de création repose encore sur la décision humaine, les procédures de production de l’image se sont détachées de son imaginaire et de sa subjectivité, nous avons à faire à un imaginaire machine. Une partie des causalités de la création, comme l’explique très bien Grégory Chatonsky, s’échappe de la maîtrise humaine. Certes, les règles de création sont des algorithmes pensés dans leur processus par des humains, toutefois l’algorithme n’est pas la chose produite, il y a là un écart entre le code et l’image. L’imaginaire machine se détache de l’intention du sujet humain. Cet imaginaire semble rétiscent à toute appréhension comme s’il était "une boîte noire".
On aurait ainsi une incarnation de « la machine célibataire », en écho à Duchamp, Carrouges ou Tinguelly. Selon Deleuze et Guattari, pour une machine célibataire « l’ essentiel est l’ établissement d’ une surface enchantée d’ inscription ou d’ enregistrement qui s’ attribue toutes les forces productives et les organes de production, et qui agit comme quasi-cause en leur communiquant le mouvement apparent ».
L’IA apparaît comme une machine célibataire, car elle s’autonomise. Causa formalis, causa materialis et causa efficiens – pour reprendre les causalités aristotéliciennes, ne sont plus humaines, mais détachées de son intentionnalité, elles sont appropriées par l’IA à laquelle le créateur délègue la quasi totalité du processus. La création s’échappe des opérations du sujet humain que je suis en tant que créateur de la plasticité. En quelque sorte, le sujet humain serait comme le maître hegelien, il n’exercerait aucune forme de négativité dans le processus de création. Il serait une intention purement en soi, sans jamais être du côté de l’existence. Le sujet humain aurait en lui, dans le processus une pure idée vide sans substance. L’imaginaire machine serait à l’oeuvre, se produirait abandonnant le sujet. C’est là sans doute la terreur de Michel Carrouges, mêlant à la machine célibataire la pensée du Golem. Michel Carrouges, voyant des machines proliférés dans le monde entier, s’inquiète de leur possible autonomie. Créature née de l’homme et devenant antagoniste à lui alors qu’elle le fascine. C’est cet écart terreur/fascination que mes créations appelées Single machine – machine célibataire, conçue avec une IA, questionne. Dans chacune d’elle, le corps féminin mis à nu, nous regarde. Il est comme Niky, il nous interpelle.
La prolifération des images produites par un imaginaire extra-humain doit alors questionner. En quel sens il produit une transformation de notre rapport au réel au sens où justement Cronenberg l’avait envisagé dans Videodrome ? Comment penser l’entre-deux de la fascination et de la terreur ? N’y aurait-il pas des modifications, une forme de contamination de notre manière de penser l’imaginaire de l’image selon ce processus ? Les images techniques n’étant plus le résultat d’une mimétique de notre imaginaire, mais au contraire notre imaginaire devenant mimétique d’un imaginaire de l’image technique ?
« Previous entries ·
Next entries »