Skip to content
AI & Machine Learning

Tiefenschätzung

Eine KI-Technik, die aus einem einzelnen zweidimensionalen Foto den dreidimensionalen Abstand von Objekten in einer Szene ableitet.

Bei der monokularen Tiefenschätzung werden neuronale Netze verwendet, die auf gepaarten Bildtiefendaten trainiert werden, um aus einem einzelnen Foto eine Tiefenkarte vorherzusagen. Das Modell lernt, visuelle Hinweise zu interpretieren, die Menschen für die Tiefenwahrnehmung nutzen – relative Größe, Okklusion, Texturgradient, atmosphärischer Dunst und perspektivische Konvergenz. Die resultierende Tiefenkarte weist jedem Pixel einen Abstandswert zu und ermöglicht so 3D-fähige Bearbeitungsvorgänge. Zu den Anwendungen gehören die Erzeugung synthetischen Bokehs (Hintergrundunschärfe, die dem realen Tiefenabfall folgt), die Erstellung von Parallaxeneffekten für soziale Medien, die Ermöglichung der Platzierung von AR-Objekten und die Verbesserung der KI-Segmentierungsgenauigkeit. Smartphone-Porträtmodi nutzen die Tiefenschätzung, um Motive vom Hintergrund zu trennen und Unschärfeeffekte in Echtzeit zu erzielen.

Verwandte Tools