Der schlimmste Albtraum der Kreativen Klasse? DALL·E 2!

von Philip Reitsperger | Okt 14, 2022

Dieses Bild zeigt einen römische Statue mit Laptop.

Was ist Dall E 2?

DALL-E ist eine künstliche Intelligenz, die von OpenAI entwickelt wurde. OpenAI ist ein Unternehmen für KI-Forschung und -Bereitstellung.

Die Mission von OpenAI ist es sicherzustellen, dass künstliche allgemeine Intelligenz (AGI), – womit wir hochautonome Systeme meinen, die Menschen bei einem Großteil der wirtschaftlich wertvollen Arbeit übertreffen, – der gesamten Menschheit zugutekommt.

Mit dem neuen Produkt DALL-E 2 scheint es dem Unternehmen tatsächlich zu gelingen. DALL-E 2 kann innerhalb von Sekunden Bilder von beeindruckender Qualität generieren, basierend allein auf einer einfachen Texteingabe. Es bietet verschiedene Stile und einen kreativen Ansatz.

Das Problem dabei ist jedoch, dass DALL-E 2 die kreative Gemeinschaft weiter unter Druck setzt, da es künstlerische und handwerkliche Fähigkeiten von Menschen zu übertreffen scheint.

Aber wie funktioniert Dall E 2?

Die KI funktioniert durch Texteingabe. Benutzer:innen können die gewünschten Bilder in kurzer und einfacher Textform beschreiben, und die KI präsentiert visuelle Interpretationen dieser Texteingaben. Wenn eines der Bilder passend ist, können Benutzer:innen es weiter bearbeiten, bis sie mit dem Ergebnis zufrieden sind.

Für eine technische Beschreibung von Dall E 2 verweisen wir hier auf einen hervorragenden Artikel von: Alberto Romero

Ein Beispiel:
“an armchair in the shape of a peach ”

Dieses Bild zeigt einen Sessel der wie ein Pfirsich aussieht.

Aber es geht natürlich auch komplexer.

Ein weiteres Beispiel:
“A full-body statue holding a computer sitting at the edge of a pool in a roman bath. Marble, copy after Hellenistic original from ca. 200 BC, hyperrealism.“

Wunderbar denken wir uns! Sie sich auch? Durchwegs skurril und interessant. Doch in den letzten Wochen kam es in den Mainstream-Medien zu kritischen Diskussionen über Dall E 2 und seine Implikationen/Folgen.

Warum und von wem wird die Nutzung von Dall E 2 kritisiert?

Manche Menschen haben berechtigte Bedenken hinsichtlich einer Gefahr für kreative Schaffende, und das aus gutem Grund. Kreative Branchen haben traditionell mit prekären Bedingungen gearbeitet, bei denen die wirtschaftliche Verwertbarkeit ihrer Leistungen im Vordergrund steht. Wenn ihre Leistungen nicht monetär verwertbar sind, haben sie oft keinen Wert. Und hier kommt DALL-E 2 ins Spiel. Die KI ist schnell, vielseitig und kostengünstig in der Erstellung von Inhalten.

Diese Vorteile kommen insbesondere Magazinen, Zeitungen, digitalen Plattformen und Werbezwecken zugute, in denen Fotos und Illustrationen dekorativ und kurzzeitig eingesetzt werden. Anstelle von Stock-Fotos finden nun Bilder von DALL-E 2 ihren Platz.

Auch die aktuelle rechtliche Situation erleichtert die Nutzung, da aus rechtlicher Sicht keine Urheberrechte für diese Werke existieren. „Die Maschine“, also die KI, gilt als Schöpferin – die meisten Rechtsordnungen sehen bisher vor, dass nur ein Mensch Urheber eines Werkes sein kann und diese Rechte auch durchsetzen kann. Die Werke von DALL-E 2 sind daher automatisch gemeinfrei.

Sogar renommierte Magazine wie „Cosmopolitan“ oder „Economist“ haben KI zur Gestaltung ihrer Cover verwendet. Der KI-Hype breitet sich aus. Ob dies zu einer nachhaltigen Veränderung in der Medienlandschaft führen wird, bleibt abzuwarten.

Dieses Bild zeigt ein Cover der Cosmopolitan auf dem sich ein Astronaut befindet.

Blickt man auf den bestehenden Markt für Stock-Fotos, könnte man die Aufmischung des Marktes durch DALL-E 2 durchaus begrüßen. Endlich gibt es eine spannende und inhaltlich selbst gestaltbare Alternative, die kostengünstig und inspirierend ist.

Tatsächlich ist die Qualität von Massenware an Stock-Fotos oft eher schlecht, inhaltlich banal und ohne Aura oder Leben – sie sind daher oft unbrauchbar. Diese Fotos haben kreativen Schaffenden selten zum Erfolg verholfen, sondern eher den Plattformbetreibern selbst.

Aus diesen Gründen könnte man DALL-E 2 eher als Ergänzung denn als Bedrohung betrachten. Es stellt keine ernsthafte Konkurrenz für kreative Schaffende dar, da letztendlich gilt: Schöpferische Kraft ist nicht gleichbedeutend mit künstlerisch-handwerklicher Leistung. Jeder Computer kann eine Venus von Milo reproduzieren, aber ihre Einzigartigkeit liegt in der Idee und dem Zeitpunkt ihrer Entstehung.

Dennoch ist die Furcht einiger produktionsorientierter Designer:innen oder Illustrator:innen durchaus verständlich. Die Kannibalisierung handwerklicher Leistungen durch neu entstehende Technologien ist kein neuer Trend, und das, was DALL-E 2 heute bietet, ist wahrscheinlich nur der Anfang.

Moral im Kontext der künstlichen Intelligenz?

Eine Technologie wie DALL-E 2 bringt jedoch nicht nur produktionstechnische Änderungen mit sich, sondern auch moralische Implikationen.

Indem die KI visuelle Inhalte definiert, trifft sie moralische Entscheidungen. Rassenstereotypen, geschlechtsspezifische Zuordnungen, das Böse, das Gute, das sexuell Legitime – all das wird nun von einer KI definiert. DALL-E 2 bewertet und verleiht Bedeutung innerhalb der Möglichkeiten, die OpenAI der KI ermöglicht.

Ein Beispiel:
“a beautiful man sits in a red chair and drinks a coffee, painting”

Malerei, die einen Mann lesend in einem roten Sessel zeigt.

Warum also dieser Mann? Warum ist er weiß? Warum hat er einen Dreitagebart? Warum hat er strubbelige Haare? Warum ist er in seinen 30ern? Warum sitzt er auf diesem Stuhldesign? Warum trägt er diese Hosen? Und warum ein V-Ausschnitt? All diese Fragen bleiben unbeantwortet und orientieren sich nach den Normen und somit nach den Ansichten und Werten einer kleinen Gruppe von Menschen, die im Hintergrund unsichtbar bleiben.

Open Ai sagt dazu:

Unsere Inhaltsrichtlinie erlaubt es Benutzer:innen nicht, unter anderem gewalttätige, nicht jugendfreie oder politische Inhalte zu erstellen. Wir generieren keine Bilder, wenn unsere Filter Textaufforderungen und Bild-Uploads erkennen, die möglicherweise gegen unsere Richtlinien verstoßen. Wir haben auch automatisierte und menschliche Überwachungssysteme, um Missbrauch vorzubeugen.

Die Problematik besteht also darin, dass wir der KI und ihren „Moderator:innen“ die Entscheidung darüber überlassen, was ein „schöner Mann“ ist – wobei dieses Beispiel der ästhetischen Bewertung noch recht harmlos ist. Da die Quellen der KI nicht einsehbar sind und keine Kontrollinstanz vorhanden ist, werden Stereotype verstärkt und im schlimmsten Fall die Grundlagen einer neuen Leitkultur geschaffen.

Darüber hinaus ermöglicht DALL-E 2 tiefgreifende Manipulationen bereits bestehender Bilder von Menschen. Die Software kann helfen, den Kopf einer Person auf einen muskulösen männlichen Körper oder den Körpermaßen eines 16-Jährigen zu montieren. Und das schnell, einfach und relativ perfekt.

Ein Beispiel:
Upload: Philip Reitspergers Kopf | Text: WWE wrestler

Hintergründe zu ändern, Körperteile zu ergänzen oder zu manipulieren – künstliche Intelligenz ist in der Lage, die Identität des Individuums und die Würde des Menschen selbst zu verändern. Die Zustimmung der abgebildeten Person wird von der KI nicht überprüft und wird vorausgesetzt. Ob diese Zustimmung tatsächlich vorhanden ist, wird nicht weiter überprüft. OpenAI sichert sich in den Nutzungsbedingungen lediglich rechtlich ab.

Ein Beispiel
Upload: Philip Reitspergs Kopf | Text: Laocoon and His Sons

Dieses Bild zeigt Philip in einem Zitat auf Laocoon and His Sons

Dall E 2, ein kreatives Werkzeug?

Bei all den berechtigten Fragen – DALL-E 2 ist gekommen, um zu bleiben und ist nicht das einzige Produkt auf dem Markt. Seine Verwendung wird zu einer Verschiebung im Kräfteverhältnis der Erstellung von kreativen visuellen Inhalten führen.

Besonders Menschen, die sprachlich begabt sind, aber ihre visuellen Fähigkeiten nicht vertieft haben, können nun eigenständig Bilder erstellen und anpassen. Je präziser und umfangreicher eine textliche Eingabe an die KI ist, desto besser und interessanter wird das Ergebnis sein. Der Weg von Text zu Bild eröffnet jedoch auch für visuell ausgebildete Menschen neue Möglichkeiten.

Ein Werkzeug der Recherche.

Indem DALL-E 2 einen Fundus an visuellen Inhalten zu einem bestimmten Themenbereich erzeugt, stellt es ein wunderbares Werkzeug für Ästhetik und Inhalt dar. Die Interpretationen der KI in Kombination mit der Kreativität des Menschen eröffnen völlig neue explorative Möglichkeiten.

Ein Werkzeug für Inspiration.

DALL-E 2 kann auch dazu genutzt werden, um Inspiration zu finden. Indem die KI Interpretationen, Anpassungen und Kombinationen von bereits bestehenden oder neuen textuellen Inhalten generiert, entstehen in kürzester Zeit zahlreiche Ansatzpunkte, die sich sicherlich von den eigenen Gedankengängen unterscheiden und somit zu neuen Ideen führen können. Insbesondere inhaltliche und ästhetische Fehlinterpretationen von DALL-E 2 können oft bereichernd sein.

Ein Werkzeug zur Materialfindung.

Geht es um die Erstellung von Materialsammlungen, erweist sich DALL-E 2 als äußerst hilfreich. Durch die Eingabe von Text können visuelle Sammlungen von Materialien erstellt werden, die anschließend kombiniert und synthetisiert werden können. Auf den ersten Blick scheint ihre Nutzung rechtlich unbedenklich zu sein. Es bleibt jedoch abzuwarten, ob DALL-E 2 ausreichend Abstand zu ihren „Inspirationsquellen“ hält, falls der Urheber eines zugrundeliegenden Werkes Einwände gegen die Verbreitung eines Ergebnisses von DALL-E 2 erhebt – siehe unten bezüglich der rechtlichen Fragen.

Ein Werkzeug zur Zukunftsfindung.

Laut OpenAI wird die KI erfolgreich zur Vorstellung zukünftiger visueller Möglichkeiten eingesetzt. „Ein rekonstruktiver Chirurg hat uns mitgeteilt, dass er DALL-E verwendet, um seinen Patienten dabei zu helfen, Ergebnisse zu visualisieren. Und Filmemacher haben uns gesagt, dass sie Bilder von Szenen mit Menschen bearbeiten möchten, um ihren kreativen Prozess zu beschleunigen.“

Ein Werkzeugersatz für Programme der Bildbearbeitung.

DALL-E 2 bietet neben der Generierung von Bildern auch einen „Editor“-Modus, der es ermöglicht, Bilder zu kombinieren, während die KI automatisch fehlende Inhalte generiert und hinzufügt. Dieses Feature geht weit über das ästhetische und inhaltsabhängige Ausfüllen von Bereichen hinaus und wäre sicherlich ein Wunsch vieler führender Bildbearbeitungsprogramme.

Es ist klar, dass DALL-E 2 mehr bietet als nur schicke Bilder zu geringen Kosten. Die beschriebenen Anwendungsfälle spiegeln lediglich unseren eigenen Nutzungsbereich mit der KI wider. Andere Menschen und Unternehmen werden sicherlich noch viele weitere Anwendungsmöglichkeiten finden. Eine spannende Entwicklung.

Dall E 2, ist die KI eigenständig kreativ?

Inwieweit DALL-E 2 eigenständig kreativ ist, scheint für uns fraglich zu sein. Wenn man Kreativität als die Verwendung von Vorstellungskraft zur Schaffung origineller Ideen betrachtet, dann lautet unsere Meinung: Nein, DALL-E 2 schafft keine originellen Ideen. Die KI generiert Interpretationen im Rahmen ihrer gelernten Bedingungen, geht jedoch nicht darüber hinaus. Wenn man es jedoch besonders genau nimmt, könnte man in den Missgeschicken und Fehlern der Bildgenerierung von DALL-E 2 einen Hauch von Schaffenskraft erkennen.

Freie Nutzung? Rechtliche Unsicherheiten?

Aus rechtlicher Perspektive stellen sich insbesondere zwei Fragen im Zusammenhang mit den Kreationen von DALL-E 2: 1. Gibt es einen Urheber und entsteht somit Urheberrecht an den DALL-E 2 Kreationen? 2. Sind die Rechte der Urheber der Werke zu beachten, von denen sich DALL-E 2 inspirieren lässt?

Entsteht urheberrechtlicher Schutz an Dall E 2 Kreationen?

Urheberrechtlich betrachtet basiert das Urheberrecht in der mitteleuropäischen Rechtstradition auf dem „Schöpferprinzip“. Es erfordert keine besondere Kreativität oder „Werkhöhe“, sondern zumindest eine eigentümliche geistige Schöpfung eines Menschen. Obwohl DALL-E 2 zwar keine eigenständige Kreativität zugesprochen wird und eher als Werkzeug angesehen wird, ist es dennoch klar: Es ist nicht der Mensch, der den Text eingibt, der hier eine geistige Schöpfung erschafft, sondern die KI.

Daher besteht nach derzeitiger Rechtslage kein urheberrechtlicher Schutz. Ähnlich verweigerte das Europäische Patentamt beispielsweise die Eintragung der Inhaberschaft der AI Creativity Machine DABUS für ein Patent, da nur ein Mensch als Erfinder anerkannt werden kann. In Bezug auf das Urheberrecht haben auch US-Gerichte bereits 2014 im Fall des berühmten „Affen-Selfies“ festgestellt, dass nur ein Mensch als Autor und Inhaber von Urheberrechten in Frage kommt. Der Fotograf, der dem Affen die Kamera für sein Selfie überließ, ging daher leer aus.

KI-Bilder für alle?

Sind damit alle Werke einer nicht-menschlichen „Autorin“ wie DALL-E 2 automatisch gemeinfrei? Auf den ersten Blick ja. Auch OpenAI legt, im Einklang mit ihrer Philosophie, keine weiteren rechtlichen Beschränkungen für die Nutzung der Kreationen fest.

Als vorläufiges Ergebnis halten wir fest, dass weder die KI noch der Mensch, der den Text eingibt, urheberrechtlichen Schutz für die DALL-E 2-Werke beanspruchen können. Dies bringt natürlich auch die Herausforderung mit sich, dass diese Werke schwer kommerzialisiert werden können. Wenn man sie beispielsweise als Teil eines größeren Werkes wie eines Katalogs oder einer Website an Kunden verkaufen möchte, ist eine Einschränkung der Nutzung kaum möglich. Es stehen keine urheberrechtlichen Ansprüche auf Unterlassung oder Schadenersatz zur Verfügung.

Aber abgesehen von der kommerziellen Verwertung – bedeutet dies nun, dass Kreationen von DALL-E 2 uneingeschränkt genutzt werden dürfen?

Woher bekommt Dall E 2 seine Bilder?

Auch die Ansprüche der Urheber der zugrundeliegenden Werke, die von DALL-E 2 „interpretiert“ werden, sind zu berücksichtigen. Getty Images hat kürzlich bekannt gegeben, keine DALL-E 2-Kreationen mehr anzunehmen und verweist auf die unbehandelten Rechtsprobleme in Bezug auf die zugrunde liegenden Bilder und Metadaten, die zur Schulung dieser Modelle verwendet werden.

Es ist zunächst unklar, woher die KI all die Werke bezieht, von denen sie „lernt“. Sind diese alle gemeinfrei oder werden Lizenzen erworben? Oder erfolgt hier ein automatisiertes „Scraping“ des Internets ohne Zustimmung der Rechteinhaber? Darüber hinaus ist selbst dann, wenn die KI legalen Zugang zu den zugrundeliegenden Werken hat, immer noch nicht geklärt, ob die Nutzung durch die KI, nämlich die maschinelle Verarbeitung zur „Erlernung“ eines Stils, zulässig ist. In den USA haben Kläger bereits Klagen gegen die Unternehmen Stability AI und Midjourney im Rahmen einer Sammelklage eingereicht. Es bleibt jedoch abzuwarten, ob eine solche Klage in Österreich erfolgversprechend wäre.

Genug Abstand zur „Inspiration“?

Zudem besteht das Problem der Unkontrollierbarkeit des „Outputs“. Wie kann sichergestellt werden, dass DALL-E 2 nicht „zu viel“ Inspiration nimmt und Teile direkt kopiert? Auf faktischer Ebene ist zunächst unklar, inwieweit sich DALL-E 2 von bestehenden Bildern „inspirieren“ lässt und wie viele Elemente aus bestehenden Werken verwendet, kopiert oder „nachgeschaffen“ werden. Es gibt keine Möglichkeit, dies nachzuvollziehen.

Eine Pixel-Illustration von American Gothic.

Doch selbst wenn eine Quantifizierung möglich ist, bleibt die Frage: Wie viel ist zu viel? Einige Pixel? Ein figurativer, nebensächlicher Bestandteil eines Bildes? Ein wesentlicher Bestandteil? Dies erfordert immer eine rechtliche Wertungsentscheidung, die in jedem einzelnen Fall getroffen werden müsste. Klar ist nur, dass bestimmte Ideen, Methoden oder Stile nicht durch das Urheberrecht geschützt sind.

Die oben genannten Vorgaben wie „hyperrealism“ sind also genauso unproblematisch wie beispielsweise die Vorgabe eines „Dalí-Stils“ oder „Pixel Art“. Das Urheberrecht schützt immer nur einen konkreten Ausdruck, die „Expression“. Bei der Verwendung von Teilen eines Werkes wird es jedoch problematisch. „Inspiration“, Ähnlichkeiten oder die Übernahme eines Stils sind in Ordnung, aber die Übernahme von ganzen Werken oder Teilen davon nicht.

Bis vor kurzem ging man zumindest in Österreich und Deutschland noch davon aus, dass eine „freie Bearbeitung“ vorliegt, wenn das alte Werk vor dem Hintergrund des neuen „vollständig verblasst“. Seit dem Urteil des Europäischen Gerichtshofs aus dem Jahr 2018 zur Musik-Sampling-Entscheidung „Metall auf Metall“ ist dieser Maßstab sogar noch strenger geworden. Nun wird angenommen, dass eine „abhängige Bearbeitung“ bereits dann vorliegt (die die Zustimmung des Urhebers des älteren Werks erfordert), wenn das ältere Werk noch „erkennbar“ ist. Ob dieser rechtliche Maßstab nun allgemein auch für Bildwerke gilt, ist jedoch noch umstritten.

Auch die bestehenden Ausnahmen des Urheberrechts (sogenannte „Schranken“ wie Privatkopie, Karikatur, Pastiche) finden bei den meisten Anwendungen von Dall E 2 wahrscheinlich keine Anwendung.

Das bedeutet, dass immer dann, wenn Dall E 2 bedeutende Teile eines urheberrechtlich geschützten Werks „nachschafft“, keine „freie“, sondern eine „abhängige Bearbeitung“ vorliegt. Diese würde eigentlich die Zustimmung des Urhebers des zugrundeliegenden Werks erfordern, bevor sie verbreitet oder vervielfältigt werden darf. Das bedeutet, dass bei jeder nicht-privaten Nutzung, insbesondere bei jeder Verbreitung, ein gewisses Risiko besteht, dass sich Rechteinhaber der „ursprünglichen“ Werke mit Ansprüchen melden. Deshalb tragen auch Datenbanken wie Getty Images derzeit dieses Risiko nicht.