KI-generierte Bilder zu bearbeiten, indem man sie neu generiert, führt oft zu unerwünschten Änderungen. Wenn Sie ein Modell auffordern, eine Figur nach links zu verschieben oder einen LKW zu entfernen, ändern sich nicht nur die gewünschten Elemente, sondern auch Lichtverhältnisse, architektonische Strukturen oder Texturen im Hintergrund. Alles, was nicht durch den ursprünglichen Seed festgelegt wurde, wird neu berechnet. Das ist ineffizient und frustrierend.
Photografen und Concept Artists arbeiten anders: Sie arbeiten mit Ebenen, die sie unabhängig voneinander verschieben, anpassen oder entfernen können. Diese Flexibilität fehlte bisher in der KI-gestützten Bildbearbeitung. Doch nun gibt es eine Lösung – und sie verändert die Art und Weise, wie wir KI-generierte Bilder bearbeiten.
Der Workflow: Von der Analyse zur wiederverwendbaren Komposition
Der Ansatz basiert auf einer klaren Pipeline, die ein Bild in einzelne, bearbeitbare Ebenen zerlegt. Der Prozess beginnt mit einer zentralen Arbeitsfläche in Melius, einer Plattform für KI-basierte Bildbearbeitung. Ein Analysesystem, das auf einem LLM (Large Language Model) basiert, analysiert das Eingabebild und erstellt ein JSON-Blaupause. Diese Blaupause definiert sieben mögliche Ebenen: Hintergrund, Mittelgrund, Vordergrund sowie bis zu vier separate Objekte oder Subjekte.
Anschließend werden sieben parallel arbeitende Extraktoren eingesetzt, die jeweils eine Isolation-Aufforderung für die entsprechende Ebene generieren. Diese Aufforderungen enthalten präzise Anweisungen, wie die jeweilige Ebene aus dem Originalbild extrahiert werden soll. Im nächsten Schritt kommen sieben NanoBanana Pro-Knoten zum Einsatz, die jede Ebene auf einem Chroma-Grün-Hintergrund regenerieren. Dabei werden Position, Größe und Beleuchtung des Originals beibehalten.
Nach der Regeneration werden die grünen Hintergründe entfernt, sodass nur die transparenten Ebenen übrig bleiben. Im finalen Schritt werden alle sieben Ebenen zu einem kohärenten Bild zusammengeführt. Der entscheidende Vorteil: Jede Ebene kann vor der finalen Zusammenführung unabhängig voneinander verschoben, skaliert oder ausgetauscht werden. Dies ermöglicht eine bisher unerreichte Präzision und Flexibilität bei der Bildbearbeitung.
Warum dieser Ansatz revolutionär ist
Die klassische Methode, KI-Bilder zu bearbeiten, behandelt das Bild als eine unteilbare Einheit. Selbst Techniken wie Inpainting oder Referenzbedingung bieten nur teilweise Lösungen. Wenn Sie beispielsweise einen LKW in einem Bild entfernen und das darunterliegende Schneefeld verschieben möchten, muss das Modell die fehlenden Bereiche neu generieren. Dies führt oft zu Inkonsistenzen in Licht, Textur und Perspektive.
Der vorgestellte Workflow vermeidet genau dieses Problem. Indem das Bild von Anfang an in separate Ebenen zerlegt wird, bleibt die ursprüngliche Information erhalten. Die Ebenen werden erst im letzten Schritt kombiniert, nachdem sie optimal angeordnet wurden. Dies entspricht der Arbeitsweise von Grafikdesignern und Photografen, die ihre Projekte ebenfalls in Schichten aufbauen.
Ein weiterer Vorteil ist die Wiederverwendbarkeit der Ebenen. Sobald ein Bild in seine Bestandteile zerlegt wurde, können diese Ebenen für andere Projekte wiederverwendet werden. Dies spart nicht nur Zeit, sondern ermöglicht auch eine konsistente visuelle Sprache über mehrere Bilder hinweg.
Was der detaillierte Leitfaden bietet
Wer diesen Workflow selbst umsetzen möchte, findet eine vollständige Anleitung auf Scopeful Pro. Dort werden alle Schritte detailliert beschrieben: von der Einrichtung der Knoten über die verwendeten Systemprompts bis hin zu den Extraktoren. Der Leitfaden enthält auch eine Übersicht über häufige Fehler und Verbesserungsvorschläge für eine mögliche zweite Version.
Wer Zugang zu den genauen Prompts, der schrittweisen Erklärung der Knoten und der Arbeitsfläche selbst benötigt, findet alle Ressourcen in der vollständigen Version. Ein kurzes Video-Demo, das die Aufteilung der Ebenen in Echtzeit zeigt, ist zudem auf dem X-Account des Autors verfügbar.
Die Zukunft der KI-gestützten Bildbearbeitung liegt in modularen, wiederverwendbaren Komponenten. Mit dieser Methode wird es möglich, Bilder nicht nur schneller, sondern auch präziser und flexibler zu bearbeiten. Wer bisher mit den Einschränkungen klassischer KI-Bildgenerierung kämpfte, sollte diesen Ansatz unbedingt ausprobieren.
KI-Zusammenfassung
AI ile oluşturulan görüntüleri katmanlara ayırarak yeniden düzenleyin. Melius’un sunduğu bu yenilikçi yöntemle unsurları dilediğiniz gibi hareket ettirin ve nihai kompozisyonu oluşturun.