Warum KI die klassische Fotografie so bald nicht ersetzen wird

Ein Essay über Authentizität, Handwerk und menschliche Hände

0

Die Fortschritte der Künstlichen Intelligenz in der Bildgenerierung sind beeindruckend. Innerhalb weniger Jahre haben sich die Ergebnisse von experimentellen, oft bizarren Versuchen zu täuschend echten Bildern entwickelt. Mit Tools wie Midjourney, DALL·E oder Stable Diffusion lassen sich heute Porträts, Landschaften und ganze Fantasiewelten erschaffen. SIe sind auf den ersten Blick kaum noch von echten Fotografien zu unterscheiden sind. Doch so faszinierend die Technik auch ist – sie hat ihre Grenzen. Und gerade dort, wo es um Authentizität, Emotion und die feinen Details menschlicher Körper geht, zeigt sich, dass KI-generierte Bilder der klassischen Fotografie noch lange nicht das Wasser reichen können.

KI 2 Blonde Frau mit Kamera
Der KI KI-Prompt macht zwar ein Bild einer “blnden rau mit Nikon F3 Kamera”, aber das ist keine Nikon F3.
Die abgebildete Kamera gibt es gar nicht.

Das Fundament echter Fotografie: Begegnung und Wirklichkeit

Fotografie ist mehr als das bloße Abbilden eines Motivs. Sie ist eine Begegnung – zwischen Fotograf und Motiv, zwischen Mensch und Moment. Der Fotograf muss Licht verstehen, Geduld haben und im richtigen Augenblick den Auslöser drücken. Dieses Wechselspiel aus Technik und Intuition kann eine KI nicht ersetzen.

Ein Porträtfoto ist nicht nur eine Sammlung von Pixeln. Es ist das Ergebnis einer Interaktion, eines Blicks, eines Gefühls, das zwischen zwei Menschen entsteht. Wer je erlebt hat, wie ein Porträtshooting abläuft – das vorsichtige Herantasten, das gemeinsame Lachen, das Vertrauen, das wachsen muss – weiß: Diese menschliche Komponente fehlt der künstlichen Intelligenz völlig. KI „fühlt“ nicht, sie „sieht“ nicht. Sie berechnet Wahrscheinlichkeiten.

Und genau das macht den Unterschied. Echte Fotografien erzählen Geschichten, die auf Erfahrungen beruhen. KI-Bilder dagegen erzählen oft nur, was Menschen gern sehen würden.

Die Schwachstelle der KI: Hände und Finger

Ein Paradebeispiel für die Grenzen der KI ist dabei die Darstellung menschlicher Hände. Selbst in den neuesten Versionen der bekanntesten Bildgeneratoren sind Hände und Finger die Achillesferse des Systems. Aber warum ist das so?

Hände sind extrem komplexe Strukturen. Sie bestehen schließlich aus mehr als zwanzig Knochen, zahlreichen Gelenken, Muskeln, Sehnen und Adern – und sie sind unglaublich beweglich. Schon eine kleine Veränderung im Winkel oder in der Haltung kann eine Hand folglich völlig anders aussehen lassen. Für das menschliche Auge ist das selbstverständlich; wir sehen und erkennen Hände unser ganzes Leben lang. Für eine KI hingegen ist jede Hand nur eine statistische Kombination aus Millionen von Bildern.

Wenn ein neuronales Netz lernt, wie eine Hand aussieht, greift es auf Datensätze zurück, die Milliarden von Bildern enthalten – viele davon mit verdeckten oder abgeschnittenen Händen, andere mit unnatürlichen Posen oder ungewöhnlichen Perspektiven. Die KI lernt also kein „Verständnis“ von Anatomie, sondern nur Muster. Und Muster können trügen.

Deshalb entstehen immer wieder diese berüchtigten „KI-Hände“ mit sechs Fingern, verschmolzenen Gliedmaßen oder unnatürlich verdrehten Gelenken. Manchmal sind die Finger also zu lang, manchmal zu kurz, manchmal verschmelzen sie mit dem Hintergrund. Selbst wenn der Rest des Bildes täuschend echt wirkt – die Hände verraten den Ursprung. Sie wirken fremd, wie aus einem Traum oder Albtraum entnommen.

Dieses Phänomen ist mehr als ein technischer Makel. Es zeigt, dass die KI zwar imitieren, aber nicht verstehen kann. Sie weiß nicht, warum eine Hand so aussieht, wie sie aussieht. Sie kann sie nur erraten.

KI Fehler

KI-Bilder sind fehlerhaft.

Sehen wir uns das folgende Beispiel an.
Prompt: Blonde Frau, 30 Jahre alt, mit Nikon F3 Kamera

KI 1 Blonde Frau mit Kamera
KI 1: Blonde Frau mit Kamera

Wir sehen eine blonde Frau von 30, soweit ist das erst einmal richtig.
Aber was ist das für eine Kamera? Das ist weder eine Nikon F3 noch eine andere bekannte Kamera von Nikon. Und was ist vor dem Objektiv zu sehen? Hier wächst ein zweites Objektiv heraus, das in eine andere Richtung blickt. Das KI-Bild ist voller Fehler.

Begeisterte KI-Künstler werden argumentieren, dass die Realität das Uninteressanteste ist, was man mit einem KI-Generator schaffen kann, und das ist ein berechtigter Einwand – sie können gut, klar und einfach Spaß machen. Aber die Verwendung von KI zur Erstellung lebensechter Bilder, ohne dass deren Verwendung offengelegt wird, und schlimmer noch, zur Manipulation der Betrachter, ist bedenklich. 

Die Verwendung von KI zur Erstellung lebensechter Bilder zur Manipulation der Betrachter ist bedenklich. 

Nikon F3H
Die echte Nikon F3 (als F3H Variante)

Meine Erfahrungen mit dem derzeit leistungsfähigsten KI-Kunstgenerator für realistische Ergebnisse – der Discord-Webanwendung von Midjourney – sind gemischt. Durch die Verfeinerung meiner Wortvorgaben zu „fotorealistisch, Fensterlichtporträt, schwarz-weiß, Frau, 85-mm-F1,2-Objektiv“ usw. habe ich irgendwann bessere Ergebnisse bei der Erstellung von Kopf- und Schulterporträts erzielt. Aber Discord und andere Generatoren können auch geradezu lächerliche Ergebnisse produzieren. 

Fügt man weitere Eingaben hinzu, wie Alter, Haarfarbe und mehr, erhält man eine berechnete Darstellung einer Frau, die eine Kamera hält. Wer weiß, wie viele Finger die Person haben wird, ob sie einen Daumen haben wird, ob die Kamera richtig gehalten wird oder ob das Bild überhaupt noch wie ein Foto aussieht.

Gleicher Prompt, anderes Ergebnis – auch keine F3:

KI 3 Blonde Frau mit Kamera
KI 2: gleicher Prompt, anderes Bild.
Halttung scheint verkrampft, weder Kamera oder Objektiv gibt es in Wirklichkeit.

Dieses Beispiel ist nur die Spitze des KI-Eisbergs. Wie wäre es mit „Mann, der mit Hund am Strand spazieren geht“ … Moment mal, er läuft auf dem Wasser, und warum sind da so viele Hunde? KI scheint auch nicht in der Lage zu sein, Glück darzustellen.

Fotografie ist Beobachtung, nicht Simulation

Ein weiterer wichtiger Punkt: Fotografie ist eine Kunst des Sehens. Der Fotograf beobachtet, interpretiert und wählt bewusst einen Ausschnitt aus der Realität. KI dagegen ist keine Fotografie, sondern simuliert eine Realität, die nie existiert hat.

Das mag kreativ und inspirierend sein – und das ist es auch –, aber es ist keine Fotografie im eigentlichen Sinn. Ein Foto dokumentiert einen realen Moment, einen Ort, eine Person. Es hat einen zeitlichen und räumlichen Bezug. Eine KI dagegen erzeugt Illusionen. Sie schafft eine Welt ohne Ursprung.

Gerade für Fotografen, die das Echte, das Unverfälschte zeigen wollen, bleibt das entscheidend. Authentizität ist ein Wert, der durch Künstliche Intelligenz nicht reproduzierbar ist. Eine echte Fotografie kann ein Gefühl von Gegenwart erzeugen: Ich war da, das ist wirklich passiert. Ein KI-Bild kann das nicht – es ist nur ein Produkt der Wahrscheinlichkeiten.

Emotion und Zufall: Die Magie des Ungeplanten

Wer fotografiert, weiß, dass nicht jedes Bild planbar ist. Ein Windstoß verändert die Richtung der Haare, ein unerwartetes Lächeln verwandelt eine Pose in einen Moment. Gerade diese kleinen, unvorhersehbaren Zufälle machen den Reiz der Fotografie aus.

KI-Bilder hingegen sind immer das Ergebnis von Kontrolle – eines Textprompts, einer gezielten Anweisung. Sie wirken perfekt, aber gerade diese Perfektion kann steril wirken. Sie fehlt an Leben, an Ecken und Kanten.

Fotografen wissen: Ein gutes Foto entsteht oft trotz der Umstände, nicht wegen ihnen. Eine KI kennt diesen Widerstand nicht. Sie kennt keine Müdigkeit, kein wechselndes Licht, keine Emotion, die im richtigen Moment aufblitzt.

Hände als Symbol der Menschlichkeit

Zurück zu den Händen – sie sind nicht nur ein technisches Problem, sondern auch ein Symbol. Hände sind Ausdruck von Menschlichkeit. Sie berühren, schaffen, heilen, kommunizieren. In der Fotografie erzählen sie Geschichten: von Arbeit, Zärtlichkeit, Alter, Erfahrung.

Wenn eine KI eine Hand nicht richtig darstellen kann, dann, weil sie nie eine berührt hat. Sie weiß nicht, was Berührung bedeutet. Sie hat keine Empfindung dafür, wie Haut auf Haut reagiert, wie Hände zittern oder zupacken. In diesem Detail offenbart sich der vielleicht wichtigste Unterschied zwischen Mensch und Maschine.

Fazit: Die Zukunft der Fotografie ist hybrid, aber nicht durch KI ersetzt

Natürlich wird KI die Fotografie beeinflussen – das tut sie schon jetzt. Viele Fotografen nutzen sie als Werkzeug, um Ideen zu visualisieren oder Stimmungen zu planen. Doch das Herz der Fotografie bleibt menschlich.

Solange Menschen sich nach echten Momenten sehnen, nach Berührung, nach Authentizität, wird die klassische Fotografie ihren Platz behalten. KI kann Bilder erschaffen, aber keine Erlebnisse. Sie kann Schönheit simulieren, aber keine Wahrheit einfangen.

Und solange eine KI Schwierigkeiten hat, etwas so Alltägliches und zugleich Ausdrucksstarkes wie eine menschliche Hand korrekt darzustellen, braucht sich die Fotografie keine Sorgen zu machen. Denn wo die Maschine stolpert, beginnt der Mensch zu sehen.

Auch interessant:

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein