Geben Sie dieser KI ein paar Worte zur Beschreibung und sie produziert ein atemberaubendes Bild – aber ist es Kunst?

Ein Bild mag mehr als tausend Worte sagen, aber dank eines künstlichen Intelligenzprogramms namens DALL-E 2können Sie mit weit weniger ein professionell aussehendes Image erzielen.

DALL-E 2 ist ein neues neuronales Netz Algorithmus, der aus einem von Ihnen bereitgestellten kurzen Satz oder Satz ein Bild erstellt. Das Programm, das im April 2022 vom Forschungslabor für künstliche Intelligenz OpenAI angekündigt wurde, wurde nicht für die Öffentlichkeit freigegeben. Aber eine kleine und wachsende Zahl von Menschen – mich eingeschlossen – hat Zugang erhalten, um damit zu experimentieren.

Als Forscher, der die Verbindung von Technologie und Kunst untersucht, Ich war gespannt, wie gut das Programm funktioniert. Nach stundenlangen Experimenten ist klar, dass DALL-E – obwohl nicht ohne Mängel – der bestehenden Bilderzeugungstechnologie sprunghaft voraus ist. Es wirft unmittelbare Fragen auf, wie diese Technologien die Art und Weise verändern werden, wie Kunst gemacht und konsumiert wird. Es wirft auch Fragen darüber auf, was es bedeutet, kreativ zu sein, wenn DALL-E 2 so viel des kreativen Prozesses selbst zu automatisieren scheint.

Eine erstaunliche Bandbreite an Stilen und Themen

OpenAI-Forscher bauten DALL-E 2 aus einer riesigen Bildersammlung mit Bildunterschriften. Sie haben einige der Bilder online und lizenziert andere gesammelt.

Die Verwendung von DALL-E 2 ähnelt stark der Suche nach einem Bild im Internet: Sie geben einen kurzen Satz in ein Textfeld ein und erhalten sechs Bilder.

Aber anstatt aus dem Internet gezogen zu werden, erstellt das Programm sechs brandneue Bilder, von denen jedes eine Version des eingegebenen Satzes widerspiegelt. (Bis vor kurzem produzierte das Programm 10 Bilder pro Eingabeaufforderung.) Als beispielsweise einige Freunde und ich DALL-E 2 die Texteingabeaufforderung „Katzen in Devo-Hüten“ gaben, es produzierte 10 Bilder das kam in verschiedenen Stilen.

Fast alle von ihnen könnten als professionelle Fotografien oder Zeichnungen durchgehen. Während der Algorithmus „Devo-Hut“ nicht ganz erfasst hat – die seltsamen Helme getragen von der New-Wave-Band Devo – die Kopfbedeckung in den von ihr produzierten Bildern kam dem nahe.

In den letzten Jahren hat eine kleine Gemeinschaft von Künstlern neuronale Netzwerkalgorithmen verwendet, um Kunst zu produzieren. Viele dieser Kunstwerke haben unverwechselbare Eigenschaften, die fast wie echte Bilder aussehen, aber mit seltsamen Raumverzerrungen – eine Art Cyberpunk-Kubismus. Die neuesten Text-to-Image-Systeme produzieren oft verträumte, fantastische Bilder das kann entzückend sein, sieht aber selten echt aus.

DALL-E 2 bietet einen deutlichen Sprung in Qualität und Realismus der Bilder. Es kann auch bestimmte Stile mit bemerkenswerter Genauigkeit nachahmen. Wenn Sie Bilder wünschen, die wie echte Fotos aussehen, werden sechs lebensechte Bilder erzeugt. Wenn Sie prähistorische Höhlenmalereien von Shrek möchten, werden sechs Bilder von Shrek erstellt, als wären sie von einem prähistorischen Künstler gezeichnet worden.

Es ist erstaunlich, dass ein Algorithmus dies tun kann. Die Generierung jedes Bildsatzes dauert weniger als eine Minute. Nicht alle Bilder sehen angenehm aus und spiegeln auch nicht unbedingt das wider, was Sie sich vorgestellt haben. Aber trotz der Notwendigkeit, viele Ausgaben zu sichten oder verschiedene Texteingabeaufforderungen auszuprobieren, gibt es keine andere Möglichkeit, so schnell so viele großartige Ergebnisse zu erzielen – nicht einmal durch die Einstellung eines Künstlers. Und manchmal sind die unerwarteten Ergebnisse die besten.

Grundsätzlich, Jeder mit genügend Ressourcen und Fachwissen kann ein solches System erstellen. Google-Forschung kürzlich ein beeindruckendes, ähnliches Text-zu-Bild-System angekündigtund ein unabhängiger Entwickler entwickelt öffentlich seine eigene Version davon Jeder kann es jetzt im Internet versuchenobwohl es noch nicht so gut ist wie DALL-E oder Googles System.

Man kann sich leicht vorstellen, dass diese Tools die Art und Weise verändern, wie Menschen Bilder machen und kommunizieren, sei es über Memes, Grußkarten, Werbung – und, ja, Kunst.

Wo ist die Kunst darin?

Ich hatte früh einen Moment, als ich DALL-E 2 verwendete, um verschiedene Arten von Gemälden in allen verschiedenen Stilen zu erstellen – wie “Odilon Redon Malerei von Seattle“ – als mir klar wurde, dass dies besser ist als jeder Malalgorithmus, den ich je entwickelt habe. Dann wurde mir klar, dass es in gewisser Weise ein besserer Maler ist als ich.

Tatsächlich kann kein Mensch das tun, was DALL-E 2 kann: in Sekundenschnelle eine so hochwertige und vielfältige Palette von Bildern erstellen. Wenn Ihnen jemand sagen würde, dass eine Person all diese Bilder gemacht hat, würden Sie natürlich sagen, dass sie kreativ war.

Ziel das macht DALL-E 2 nicht zu einem Künstler. Auch wenn es sich manchmal wie Magie anfühlt, ist es unter der Haube immer noch ein Computeralgorithmus, der strikt den Anweisungen der Autoren des Algorithmus bei OpenAI folgt.

Wenn diese Bilder als Kunst erfolgreich sind, sind sie Produkte davon, wie der Algorithmus entworfen wurde, mit welchen Bildern er trainiert wurde und – was am wichtigsten ist – wie Künstler ihn verwenden.

Sie sind vielleicht geneigt zu sagen, dass ein Bild, das durch ein paar Tastenanschläge erzeugt wird, wenig künstlerischen Wert hat. Aber aus meiner Sicht schwingt diese Denkweise mit die klassische aufnahme dass Fotografie keine Kunst sein kann, weil eine Maschine die ganze Arbeit gemacht hat. Heutzutage werden die menschliche Urheberschaft und das Handwerk künstlerischer Fotografie anerkannt, und Kritiker verstehen, dass die beste Fotografie viel mehr beinhaltet, als nur einen Knopf zu drücken.

Trotzdem diskutieren wir Kunstwerke oft so, als ob sie direkt aus der Absicht des Künstlers entstünden. Der Künstler beabsichtigte, etwas zu zeigen oder eine Emotion auszudrücken, und so schufen sie dieses Bild. DALL-E 2 scheint diesen Prozess vollständig abzukürzen: Sie haben eine Idee und geben sie ein, und Sie sind fertig.

Aber wenn ich auf altmodische Weise male, habe ich festgestellt, dass meine Bilder aus dem Erkundungsprozess stammen, nicht nur aus der Umsetzung meiner ursprünglichen Ziele. Und das gilt für viele Künstler.

Nehmen Sie Paul McCartney, der sich den Track ausgedacht hat.Komm zurück” während einer Jam-Session. Er begann nicht mit einem Plan für den Song, sondern fing einfach an zu tüfteln und zu experimentieren und die Band hat es von dort aus entwickelt.

Picasso beschrieb seinen Prozess ähnlich: „Ich weiß nicht im Voraus, was ich auf die Leinwand bringen werde, genauso wenig wie ich vorher entscheide, welche Farben ich verwenden werde … Jedes Mal, wenn ich mich an ein Bild mache, habe ich das Gefühl, in den Weltraum zu springen.“

Im meine eigenen Erkundungen mit DALL-E 2eine Idee führte zur nächsten, die wiederum zur nächsten führte, und schließlich fand ich mich in einem völlig unerwarteten, magischen neuen Terrain wieder, sehr weit entfernt von meinem Ausgangspunkt.

Prompt als Kunst

Ich würde argumentieren, dass die Kunst bei der Verwendung eines Systems wie DALL-E 2 nicht nur aus der endgültigen Texteingabe stammt, sondern aus dem gesamten kreativen Prozess, der zu dieser Eingabe führte. Unterschiedliche Künstler folgen unterschiedlichen Prozessen und enden mit unterschiedlichen Ergebnissen, die ihre eigenen Herangehensweisen, Fähigkeiten und Obsessionen widerspiegeln.

Ich begann, meine Experimente als eine Reihe von Serien zu sehen, von denen jede ein konsequentes Eintauchen in ein einzelnes Thema darstellt, und nicht als eine Reihe unabhängiger, verrückter Bilder.

Ideen für diese Bilder und Serien kamen von überall her, oft verbunden durch eine Reihe von Ideen Trittsteine. An einem Punkt, als ich Bilder basierend auf Werken zeitgenössischer Künstler machte, wollte ich ein Bild von ortsspezifischer Installationskunst im Stil des zeitgenössischen japanischen Künstlers erzeugen Yayoi Kusama. Nachdem ich einige unbefriedigende Standorte ausprobiert hatte, kam ich auf die Idee, es dort zu platzieren Die Mezquita, eine ehemalige Moschee und Kirche in Córdoba, Spanien. ich fühle das Bild an einen Architektenkollegen, Manuel Ladron de Guevara, der aus Córdoba stammt, und wir begannen, gemeinsam an anderen architektonischen Ideen zu arbeiten.

Daraus wurde eine Serie über imaginäre Neubauten in unterschiedlichen Architekturstilen.

Also habe ich begonnen, das, was ich mit DALL-E 2 mache, sowohl als eine Form der Erforschung als auch als eine Form der Kunst zu betrachten, auch wenn es oft Amateurkunst ist, wie die Zeichnungen, die ich auf meinem iPad mache.

In der Tat einige Künstler, wie Ryan Murdoch, haben sich dafür eingesetzt, dass die prompt-basierte Bilderzeugung als Kunst anerkannt wird. Er zeigt auf die erfahrene KI-Künstlerin Helena Sarin als Beispiel.

„Wenn ich mir die meisten Sachen ansehe Zwischendurch“ – ein weiteres beliebtes Text-zu-Bild-System – „vieles davon wird interessant oder lustig sein“, sagte mir Murdoch in einem Interview. „Aber mit [Sarin’s] Arbeit, es gibt eine Durchgangsleitung. Es ist leicht zu erkennen, dass sie viel darüber nachgedacht und an dem Handwerk gearbeitet hat, weil das Ergebnis optisch ansprechender und interessanter ist und ihrem Stil kontinuierlich folgt.”

Mit DALL-E 2 oder einem der neuen Text-to-Image-Systeme zu arbeiten, bedeutet, seine Macken zu lernen und Strategien zu entwickeln, um häufige Fallstricke zu vermeiden. Es ist auch wichtig, darüber Bescheid zu wissen seine potenziellen Schäden, wie die Abhängigkeit von Stereotypen, und potenzielle Verwendungen für Desinformation. Mit DALL-E 2 entdecken Sie auch überraschende Korrelationen, wie die Art und Weise, wie alles altmodisch wird, wenn Sie den Stil eines alten Malers, Filmemachers oder Fotografen verwenden.

Wenn ich etwas ganz Bestimmtes machen möchte, kann DALL-E 2 das oft nicht. Die Ergebnisse würden danach eine Menge schwieriger manueller Bearbeitungen erfordern. Wenn meine Ziele vage sind, ist der Prozess am reizvollsten, da er Überraschungen bietet, die zu neuen Ideen führen, die wiederum zu mehr Ideen führen und so weiter.

Neue Realitäten erschaffen

Diese Text-zu-Bild-Systeme können Benutzern auch dabei helfen, sich neue Möglichkeiten vorzustellen.

Künstleraktivistin Danielle Baskin erzählte mir, dass sie immer daran arbeite, „alternative Realitäten durch ‚reale‘ Beispiele zu zeigen: entweder durch das Aufstellen von Szenarien in der physischen Welt oder durch akribische Arbeit in Photoshop“. DALL-E 2 jedoch „ist eine erstaunliche Abkürzung, weil es so realistisch ist. Und das ist der Schlüssel, um anderen zu helfen, mögliche Zukünfte zum Leben zu erwecken – ob es sich um Satire, Träume oder Schönheit handelt.“

Sie hat es benutzt, um sich vorzustellen ein alternatives Transportsystem und Rohrleitungen, die Nudeln statt Wasser transportierendie beide widerspiegeln ihre Künstler-Provokateur-Sensibilität.

Ebenso die des Künstlers Mario Klingemann Architekturdarstellungen mit den Zelten von Obdachlosen könnte als Join genommen werden meine architektonischen Darstellungen von ausgefallenen Traumhäusern.

Es ist noch zu früh, um die Bedeutung dieser Kunstform zu beurteilen. Ich denke immer wieder an einen Satz aus dem ausgezeichneten Buch “Kunst in der Nachkultur” – “Die vorherrschende KI-Ästhetik ist Neuheit.”

Sicherlich würde dies bis zu einem gewissen Grad für jede neue Technologie gelten, die für die Kunst verwendet wird. Die ersten Filme der Licht Brüder in den 1890er Jahren waren Neuheiten, keine filmischen Meisterwerke; es erstaunte die Leute, überhaupt Bilder zu sehen, die sich bewegten.

KI-Kunstsoftware entwickelt sich so schnell, dass es ständig technische und künstlerische Neuerungen gibt. Es scheint, als gäbe es jedes Jahr die Gelegenheit, eine aufregende neue Technologie zu erforschen – jede leistungsfähiger als die vorherige und jede scheinbar bereit, Kunst und Gesellschaft zu verändern.

Leave a Reply

Your email address will not be published.