Skip to content
AI & Machine Learning

Bildsynthese

Die Generierung völlig neuer Bilder durch auf großen Datensätzen trainierte KI-Modelle, die aus Rauschen, Text oder anderen Eingaben fotorealistische oder künstlerische Bilder erzeugen.

Die Bildsynthese umfasst alle KI-Techniken, die neue visuelle Inhalte erstellen, anstatt vorhandene Bilder zu modifizieren. Das Feld entwickelte sich von frühen GANs (Generative Adversarial Networks), die Gesichter und Texturen erzeugten, zu modernen Diffusionsmodellen, die komplexe Szenen aus Textbeschreibungen generieren. Zu den wichtigsten Architekturen gehören latente Diffusion (Stable Diffusion), autoregressive Transformatoren und auf Geschwindigkeit optimierte Konsistenzmodelle. Die Anwendungen umfassen die Erstellung kreativer Inhalte, die Datenerweiterung zum Trainieren anderer KI-Modelle, virtuelle Anproben für Mode und Architekturvisualisierung. Die Qualität synthetisierter Bilder besteht nun regelmäßig Tests zur menschlichen Diskriminierung, was sowohl kreative Möglichkeiten als auch ethische Überlegungen zu Deepfakes und der Authentizität von Inhalten erhöht.

Verwandte Tools