Website-Icon Bilder aus Strom – Fotografie

AI (Artificial Intelligence) und KI in der Fotografie? Ein Selbstversuch mit dem Deep Dream Generator

Artifical Intelligence AI und künstliche Intelligenz KI in der Bildkomposition und Fotografie nehmen zu. Im September hat ein erstes, mit KI (künstlicher Intelligenz) errechnetes Bild, einen Kunstwettbewerb gewonnen (Heise.de). Ein drohendes Schreckensszenario für Fotografen?

Was bedeutet dies für Fotografen, Künstler, für Revenuemodelle, Auftragsmarkt und Recht am eigenen Bild?

Was ändert sich durch AI und KI für Fotografen?

Schon heute unterstützen Technologien in Smartphone, Kamera oder in der Bildbearbeitungssoftware Optimierung, Austausch oder Beseitigung von Bildstörungen. Apps wie TikTok oder Lensa aber auch Software wie Photoshop leben vom Remixen, Zusammenfügen und Lernen aus bestehenden Bildern. Erstellen neu Bilder und Bildstile aus Gelerntem Verhalten und auf Basis eines antrainiertem Algorithmus.

Werden schon bald AI und KI das Ruder übernehmen? Verlieren wir die Hoheit über unser kreatives Arbeiten? Sind wir schon bald überflüssig und übernehmen KI-basierte Apps das Ruder?

Ich denke ganz so schlimm wird es (hoffentlich) nicht kommen. Auch die Digitalisierung und die damit verbundende Disruption des Fotomarktes (Kodak, Agfa, Polaroid) hat vor gut zwei Jahrzehnten zu einem – wenn auch rasantem – Umdenken und geändertem Fotoverhalten geführt. Schnell, vielmehr viel schneller als gedacht, hatten sich digitale Kameras, gegen die Prognose der Fotoindustrie und ein digitaler Workflow durchgesetzt. Große Giganten wie Kodak und Agfa verschwanden fast über Nacht aus den Märkten. Fast kaum zu glauben, dass die erste digitale Kamera, die ich 1996 in den Händen hielt eine Kodak Kamera war. Weil sie nicht vorbereitet waren? Weil sie den transformativen Prozess falsch eingeschätzt hatten und zu lange auf angestammte Revenuemodelle und -märkte gesetzt hatten?

Die Einführung der Smartphones beschleunigte dies noch einmal um ein Vielfaches. Geräte waren von nun an auch noch vernetzt und durch Apps wurde die Fotografie mobil nutz- und teilbar. Negativ ist sicherlich zu sehen, dass die damit einhergehenden Bilderflut zu einer inflationären Kurzlebigkeit von Inhalten geführt hat. Positiv zu bewerten ist aber die gleichzeitige Demokratisierung von Tools und günstigen Kreativwerkzeugen im Foto- Film und Musikbereich. Darüber hinaus haben kompakte und vernetzte Devices zu einer Beschleunigung der Prozesse (analoge Bildentwicklung vs. digitale Adhoc-Sichtbarkeit und Nutzbarkeit) geführt.

Digitalisierung und Bilderflut stellten letztendlich aber auch die Frage, was ist ein Bild „wert“? Die Öffnung des Fotomarktes für Stock-Images hat vor einigen Jahren ein ganzes Berufsbild und eine Prozesskette (Fotograf, Agenturen, Werbeindustrie, Kunden) ins Wanken gebracht.

Die gute Nachricht: gute Bilder sind immer noch gefragt – die Wertigkeit steht allerdings immer im Kontext zur geplanten Nutzung. Aber war dies bei Reklamezetteln, Katalogen und Werbefotos der 80iger nicht auch schon so?


Das Headerimage ist mit dem Deep Dream Generator und Adobe Express entstanden. Zeitaufwand 10 Minuten. Kosten bis auf die Adobe-Lizenz „gering bis vernachlässigbar“.

Sowohl Grafik als auch Bild (Foto) sind AI-generiert bzw. AI-unterstützt (Recommendation Library). Ist dies dies bereits die AI-Realität in der wir heute leben und die wir praktizieren?


AI-basierte Technik oder visuelle Kompetenz des Menschen

Geht es um primär um Technik oder doch vielmehr um visuelle und konzeptionelle Fähigkeiten? Und welche Rolle spielt dabei die zunehmend computergestützte, intelligente Fotografie? Wie stark wird uns AI in den kommenden Jahren beeinflußen? Und was sind die Kernelemente der Fotografie?

Neben der ethischen Komponente einer sich wandelnden, durch AI-unterstützten Bildwahrnehmung hin zum überperfektionierten, makellosen Menschen und der sich selbst darstellenden Eigenperspektive Jugendlicher in den Sozialen Medien interessiert auch die Rolle von AI als „Kreativer“ als eigenständig schaffende Komponente. Ist es mehr als reine Technik?



AI- (Text to Image) im Selbstversuch

Um selbst das Potenzial kostenloser, frei zugänglicher AI-Bildgenerator (Text to Image) auszuloten, habe ich den frei verfügbaren Deep Dream Generator getestet. Auf Basis eines eingegebenen Textes erzeugt dieser in Sekundenschnelle ein Ai-generiertes Bild.

Für das erste Beispiel mit dem Deep Dream Generator und für ein erstes Bild habe ich lediglich „Metropolis“ eingegeben. Das Bild einer New-York ähnlichen Metropole wurde erzeugt. Für das zweite Bild wurde neben „Metropolis“ noch „Fritz Lang“ und „Future“ als Begriffe eingegeben. Verblüffend, wie sofort Fritz Langs Bildsprache und futuristische Kameraperspektiven in ein kombiniertes AI-Composing eingerechnet wurden. Für Bild 3 wurde zusätzlich noch der Begriff „Blade Runner“ hinzugefügt. Alle Bilder wurden in weniger als 10Sekunden von der KI gerendert. Schnell wird klar, je klarer die Textinformation an die AI gestellt wird, desto mehr kann diese auf vorhandene und gelernte Informationen zurückgreifen und diese kombinieren.


Beim zweiten Beispiel mit dem Deep Dream Generator hab ich einmal „Sunset Sardegna“ und einmal „The Arch, Big Sur, Sunset, Winter“ eingegeben.

Fast fotorealistisch wurden wieder in Sekundenschnelle die Bilder erzeugt. Was mich dann aber etwas verwunderte, das zweite Bild zeigt unten rechts eine kleine Signatur. Was den Rückschluss zulässt, dass sich die AI hier geladener Bilder bedient, um neue Bilder auf Basis von Text-Tags zu generieren. Die Signatur wurde hier wohl nicht als solche erkannt und in das neue Bild mit einberechnet.

Ob diese Bilder mit Wissen des Fotografen in die AI gewandert sind? Und füttern wir nicht alle mit Instagram, 500px, Lightroom, Facebook,… unwissentlich AI-Plattformen mit unseren Bildern, Keywords, GPS-Ortsangaben und Tagging?


Für das dritte Beispiel mit dem Deep Dream Generator habe ich bewusst zwei bekannte Künstler (Van Gogh und Vermeer) im Text hinzugefügt, um zu sehen, wie stark die AI den jeweiligen Künstler und deren Bildstil einfließen lässt bzw. kopiert.

Die Eingabe war jeweils Van Gogh, Blonde, Portrait bzw. Girl, Pearl Earring, Vermeer. Im Kunstmarkt würden beide Bilder wohl als dreiste Kopie bewertet werden. Im Falle der AI-Generierung des Van Gogh ähnelnden Bildes wurde der Look kopiert, beim Vermeer Image wurde das komplette Bild in Aufbau und Perspektive zu 100% kopiert. es wirkt eher, als wäre ein Effekt über das Orginalbild gelegt worden.



Was steht bei der Fotografie im Fokus? Wie entsteht ein gutes Bild?

Diese Fragen hat der britische Fotograf und Autor Michael Freeman Bilderausstrom.com beantwortet – hier nachfolgend Auszüge aus dem Interview vom Januar 2021.

Michael, du hast Bücher wie „The Photographer’s Mind“ und „The Photographers Vision“ veröffentlicht. Die scheinbar einen ganz anderer Ansatz verfolgen. Was macht deine Bücher aus? Was ist dir dabei wichtig zu vermitteln?

Mit „einem völlig anderen Ansatz“ meinst Du vermutlich im Gegensatz zu den meisten anderen Bücher über Fotografie, richtig? Es ist mir bereits bei meinem ersten Buch, als ich es geschrieben hatte, aufgefallen, dass es einen wesentlichen Unterschied macht, wenn ein Profi-Fotograf seine Erfahrung und sein Spannungsfeld mit einfließen lässt – als wenn ein Autor schreibt, der keine direkte, und unmittelbare Verbindung zur Fotografie hat.

Insbesondere der technischen Seite wurde aus meiner Sicht viel zu viel Aufmerksamkeit geschenkt. Das hat sich leider nicht geändert. Sicherlich ja, man sollte alles über die Werkzeuge wissen, mit denen man arbeitet, egal ob ein Fotograf, Schreiner oder Musiker ist, aber sie sind nur als Mittel zum Zweck da. Sie sind nicht der Dreh- und Angelpunkt. Und auch die diesjährigen neuen Kameramodelle werden niemanden zwangsläufig helfen, per se bessere Bilder zu machen.

Früher habe ich ein wenig über das Technische geschrieben, aber jetzt überlasse ich diese Rubrik lieber den technischen Redakteuren, die das besser machen, als ich es könnte. Ich spreche immer von drei Skill-Sets in der Fotografie, die man beherrschen und an denen man arbeiten sollte: die technischen Fähigkeiten, die visuellen Fähigkeiten und die konzeptionellen Fähigkeiten.

Ich konzentriere mich dabei lieber auf die visuellen und konzeptionellen Fähigkeiten, wie Komposition, Lichtgestaltung und der Zielsetzung, was das eigentliche Ergebnis deines Bildes sein soll. Dies fordert einen oft ziemlich heraus und ist aus meiner Sicht oft der viel wichtigere Aspekt. Natürlich lege ich, wie jeder Profi, außerordentlichen Wert auf die technische Seite, ob Hardware oder Software.  Aber dies ist nur die gründliche Vorbereitung auf das Hauptereignis, bei dem es darum geht, zu fotografieren und sich mit der Welt vor der Kamera unmittelbar auseinanderzusetzen.


Ich bin derzeit beratend in Projekten für einen Big-Tech Player (das Unternehmen darf ich leider nicht nennen) zum Thema Computational Photography (computergestützte Fotografie) tätig. Das ist einerseits für mich absolut neuer Bereich, der wiederum andererseits aber ganz gut zu den Dingen passt, über die ich schreibe. Im Grunde können Software-Entwickler für Bildbearbeitungs-Software so ziemlich ziemlich alles mit Bildern anstellen, was von der Aufnahme bis zur Post-Production und Bearbeitung notwendig ist. Dieser Prozess rückt immer näher zusammen und verschmilzt, stellt aber gleichzeitig die grundlegende Frage, wie Fotografien aussehen sollten. Hier komme dann ich ins Spiel, mit angewandter (quantifizierter) Ästhetik und dem Versuch Dinge wie Licht, Belichtung, Komposition, Farbe mit Zahlen und Werten zu versehen. Das ist wirklich ein sehr interessanter Aspekt und einige der Früchte & Ergebnisse davon werden nächstes Jahr Teil meiner neuen Büchern sein.

Technologie und sogar KI entwickeln sich immer weiter und KI wird Teil von Kameras und der Fotografie im Allgemeinen. Im Gegensatz, in deinen Büchern beschreibst du „Sehen“, „Licht“ und „Grafik“ als grundlegende Elemente zum Erstellen einzigartiger Bilder. Was ist wirklich der Schlüssel zu kreative Fotografie? Und ist die Technologie vielleicht sogar ein limitierender Faktor für Kreativität?

Wundersamerweise steht das, was ich beschreibe, nicht „im Gegensatz“. Wie gesagt, ich arbeite für Teams im Computational Bereich (was übrigens die technische Zukunft jegliche Fotografie sein wird, auch wenn sie derzeit auf Smartphone-Kameras beschränkt ist). Und es geht dabei um das das rigorose Analysieren und Nachdenken über „Sehen“, „Licht“ und die „Grafik“ eines Bildes.

Unklarheit und fehlende Trennschärfe ist dabei nutzlos, und ich möchte die Leute dazu ermutigen, zu verstehen, was dazu beiträgt, Fotos sinnvoll, effektiv und manchmal sogar zu mächtig zu machen.

Beim ersten Titel der neuen Buchreihe habe ich beispielsweise eines der weltweit führenden Unternehmen für menschliche Verhaltenssoftware iMotions  in Anspruch genommen. iMotions  hat dabei untersucht, wie Betrachter Fotos im Detail ansehen, und zu verstehen, wie ein Fotograf auf intelligente Art und Weise versuchen könnte, dies zu beeinflussen. Faszinierende Ergebnisse.

Der Schlüssel zur kreativen Fotografie liegt darin, sich mit diesen konzeptionellen und visuelle Fähigkeiten auszustatten, um Bilder zu verfolgen, die DICH letztendlich glücklich machen. Und NICHT Bilder, die andere kopieren und schon gar nicht, die müden alten Rezepten und gedankenlosen Klischees folgen. Ich hoffe, nie wieder von der „Drittelregel“ zu hören – was für ein dumme und wenig originelle Idee.

Leider werde ich wahrscheinlich weiter davon hören, aber ich tue mein Bestes, um eine frischere Denk- und Herangehensweise  über Bilder anzustoßen. Wie oben bereits zur Technologie teilweise beantwortet, ist Technik im Grunde dazu da, das Fotografieren einfacher und effizienter zu machen. Und wenn sie diese Aufgabe erfüllt und sich mit der Zeit verbessert, dann brauchen wir dies.

Der Motor in meinem BMW ist ein ausgezeichnetes Stück Ingenieurskunst, einfach deshalb weil er funktioniert und ich Fahren kann.

Michael Freeman,
ist ein international bekannter britischer Fotograf und Autor, der sich auf Reise, Architektur und asiatische Kunst spezialisiert hat. Er arbeitet für renommierte Magazine wie National Geographic und TimeLife und hat mehr als 40 Fotografie-Bücher verfasst.

Das vollständige Interview mit Michael aus dem Jahr 2021 ist hier zu finden: Michael Freeman – Fotograf und Autor – 7 Fragen zu Fotografie, Bildbearbeitung und Artificial Intelligence



Fazit

Vielleicht ist dies (vorerst) die Antwort, inwieweit uns KI bzw AI in den nächsten Jahren in der Fotografie begleiten wird? Unterstützend in unserer kreativen Arbeit, in Kameras und Software-Tools und weniger ein Ersatz für bestehende Rollen und Stakeholder im Kreativprozess. Es bleibt zu hoffen, aber zeigen wird es die nahe Zukunft. Ein schwacher Trost, dass dies nicht nur das Profil des Fotografen und Kreativschaffenden betrifft.

Die Schnelligkeit und die Kombinationsfähigkeit AI-Tools wie dem Deep Dream Generator auf Basis von Schlüsselwörtern hat mich beeindruckt. ABER unklar bleibt die rechtliche Komponente und die Grundlage für diese neu erstellten, AI-generierten Bilder. Gerade das Van Gogh und Vermeer Beispiel zeigen das Dilema auf: wie stark wird die ursprüngliche , künstlerische Idee und der Bild-Stil des Orginal-Künstler berücksichtigt? Worauf beruht der Input in das System und das Lernen von diesen Künstlern? Gab es eine Einwilligung seitens derer oder kann jeder einfach Bilder dieser Künstler hochladen bzw. deren Bildsprache kopieren? Wo findet Schutz von geistigem Eigentum und Wertschöpfungsketten statt?

Bei den Landschaftsfotos war das Ergebnis des Deep Dream Generator ebenfalls beeindruckend. ABER ist Fotografieren nicht mehr, als nur das reine Abbilden einer Landschaft? Was ist mit „vor Ort Präsenz“, „Erarbeiten (Licht, Perspektive, Moment) eines Bildes“, „Eindrücke“, „Erlebnisse“, Kreativwissen“, „eigener Stil“,“Emotionen“ und „Lernen“. Zumindest sind dies Komponenten, die ich in meinen Fotografien als wichtig empfinde. Ob AI dies komplett abdecken kann? Lernfähig ist sie auf jeden Fall.

Die mobile Version verlassen