Skip to content
AI & Machine Learning

Diffusionsmodell

Eine Art generative KI, die Bilder erstellt, indem sie ausgehend von erlernten Mustern schrittweise Rauschen von einem zufälligen Ausgangspunkt entfernt.

Diffusionsmodelle funktionieren, indem sie lernen, einen rauscherzeugenden Prozess umzukehren. Während des Trainings werden saubere Bilder zunehmend verfälscht, indem bei jedem Schritt Gaußsches Rauschen hinzugefügt wird, bis nur noch zufälliges Rauschen übrig bleibt. Das Modell lernt dann, das Rauschen bei jedem Schritt vorherzusagen und zu entfernen und lernt so effektiv, Bilder aus Rauschen zu rekonstruieren. Bei der Generierung beginnt der Prozess mit reinem Zufallsrauschen und entrauscht es iterativ in ein kohärentes, detailliertes Bild. Jeder Entrauschungsschritt verfeinert das Bild weiter und geht von breiten Formen und Farben bis hin zu feinen Details und Texturen über.\n\nEin Architekt kann mithilfe eines auf Diffusionsmodellen basierenden Tools fotorealistische Innenarchitekturkonzepte erstellen. Ausgehend von einer Textbeschreibung einer modernen Küche mit Marmorarbeitsplatten beginnt das Modell mit zufälligen Geräuschen und löst diese schrittweise in eine detaillierte Architekturvisualisierung auf. Der iterative Charakter des Prozesses ermöglicht es dem Modell, die globale Kohärenz (richtige Perspektive, konsistente Beleuchtung) beizubehalten und gleichzeitig in späteren Schritten lokale Details (Marmormaserung, Schrankbeschläge, Fliesenfugen) hinzuzufügen.\n\nDiffusionsmodelle stellen einen erheblichen Fortschritt gegenüber früheren generativen Ansätzen dar. Generative Adversarial Networks (GANs), der bisherige Stand der Technik, führten manchmal zu einem Moduskollaps (was zu einer begrenzten Vielfalt führte) oder zu Trainingsinstabilität. Diffusionsmodelle trainieren stabiler, erzeugen eine höhere Diversität und bieten eine bessere Kontrolle über den Generierungsprozess. Sie unterstützen natürlich auch Bearbeitungsvorgänge wie Inpainting und Outpainting, indem sie den Entrauschungsprozess auf vorhandene Bildbereiche konditionieren.\n\nDie KI-Funktionen von Magic Eraser basieren auf der Diffusionsmodelltechnologie. Wenn das Tool Bereiche nach dem Entfernen von Objekten füllt, neuen Hintergrundinhalt generiert oder Bilderweiterungen erstellt, verwendet es iterative Rauschunterdrückung, um Inhalte zu erzeugen, die fotorealistisch sind und kontextuell mit dem umgebenden Bild übereinstimmen. Der iterative Verfeinerungsprozess ermöglicht es dem Modell, bei jedem Schritt seine eigenen Fehler zu korrigieren und so die Kohärenz und Detailgenauigkeit des generierten Inhalts schrittweise auf eine Weise zu verbessern, die Single-Pass-Generierungsmethoden nicht erreichen können, weshalb diffusionsbasierte Ansätze deutlich weniger visuelle Artefakte und konsistentere Ergebnisse erzeugen.

Verwandte Tools