Photogrammetrie, 3D aus Fotos

Photogrammetrie ist ein Messverfahren, das aus einer Vielzahl überlappender Fotografien mittels Structure-from-Motion (SfM) und Multi-View-Stereo (MVS) exakte 3D-Geometrien und fotorealistische Texturen rekonstruiert.

Rubrik: Animation & VFX · Unterrubrik: VFX-Techniken · Niveau: Fortgeschritten

Synonyme / Auch bekannt als: Reality Capture, Photo Scanning, 3D-Scanning via Fotos, Image-Based Modeling (IBM), SfM Scanning

Was ist Photogrammetrie?

Photogrammetrie (griech. photos = Licht, gramma = Zeichnung, metrein = messen) berechnet aus geometrisch überlappenden Fotos eines Objekts oder Ortes ein dreidimensionales Modell mit Textur. Im Film- und VFX-Kontext wird sie eingesetzt, um physische Objekte, Kulissen, Fahrzeuge oder ganze Außenlocations in exakte digitale 3D-Assets zu verwandeln, deutlich schneller und präziser als manuelles 3D-Modellieren.

Bekannte Einsatzbereiche: Scan von Schauspielerkörpern und -gesichtern (Digital Doubles), Scan von Requisiten für CGI, Scan von Drehorten für Virtual Production und Erweiterung, sowie die Erstellung von Game-Assets aus realen Objekten.

Erklärung

Structure from Motion (SfM)

SfM ist der Kernalgorithmus: Aus Bildpaaren werden korrespondierende Feature-Punkte extrahiert (SIFT, ORB), und über Epipolargeometrie wird die relative Kameraposition berechnet. Durch Bundle Adjustment werden alle Kamerapositionen und 3D-Punkte global optimiert (Minimierung des Reprojektionsfehlers).

Resultat: eine Sparse Point Cloud (wenige Millionen Punkte) mit Kamerabewegungen.

Multi-View Stereo (MVS)

MVS verdichtet die Sparse Cloud zu einer Dense Point Cloud (Hunderte Millionen Punkte) durch dichte Pixel-Korrespondenz zwischen alle Bildpaaren. Algorithmen: PatchMatch MVS (Bleyer et al., CVPR 2011), OpenMVS.

Mesh-Rekonstruktion und Texturierung

Dense Cloud → Mesh durch Poisson Surface Reconstruction (Kazhdan et al., 2006) oder Delaunay-Triangulierung. Textur-Baking: Alle Original-Fotos werden auf das Mesh projiziert und zu einer oder mehreren UV-Texturkarten gebacken.

Genauigkeit und Auflösung

Faktor	Einfluss auf Qualität
Bildanzahl	mehr = besser; Überlappung ≥ 60 %
Brennweite / Sensorauflösung	höher = feinere Details
Beleuchtung	diffuses Licht bevorzugt (kein harter Schatten, keine Reflexe)
Tiefenschärfe	möglichst alles scharf; f/8–f/11
Textur der Oberfläche	glatte/spiegelnde Flächen sind problematisch

Typische Genauigkeit professioneller Setups: 0,1–1 mm bei kleinen Objekten; 1–5 cm bei Außenumgebungen.

Software-Vergleich

Software	Technologie	Preis	Typ
Reality Capture (Epic Games)	SfM + MVS, GPU-beschleunigt	kostenpflichtig (Credit-System)	Professionell
Agisoft Metashape	SfM + MVS	ca. 3.500 € (Professional)	Professionell
Meshroom	AliceVision, Open Source	kostenlos	Indie/Forschung
Apple OBJ Scan (iOS)	LiDAR + Foto-Fusion	kostenlos	Rapid Prototyping
Polycam	iOS/Android	Abo-Modell	Rapid Prototyping

Beispiele

The Jungle Book (Jon Favreau, 2016), Alle Tier-Assets und Environments durch Kombination von Photogrammetrie-Scans realer Orte und 3D-Modellierung erstellt; MPC und Weta Digital; Oscar für beste VFX.
The Revenant, Der Rückkehrer (Iñárritu, 2015), Location-Scans der Wildnis via Photogrammetrie für Hintergrundextensionen und Matte Paintings.
Assassin's Creed: Unity (Ubisoft, 2014), Photogrammetrie-Scans von Notre-Dame de Paris für ein spielerisch exaktes digitales Modell, das nach dem Brand 2019 für Restaurierungsarbeiten herangezogen wurde.
Avengers: Endgame (Russo Brothers, 2019), Digitale Doubles aller Hauptdarsteller via Multi-Camera-Photogrammetrie-Rig (ca. 300 Kameras synchronisiert).
Mid90s (Jonah Hill, 2018), Indie-Produktion nutzte Photogrammetrie zur kostengünstigen Erstellung von Straßenszenen für digitale Extensions.

Schritt-für-Schritt Workflow

Vorbereitung: Objekt wenn nötig mattieren (matte Sprühfarbe auf spiegelnde Oberflächen). Diffuses Licht sicherstellen (bedeckter Himmel oder Lichtzelt).
Fotografieren: Objekt ringförmig umkreisen; Überlappung ≥ 60 %; mehrere Höhenwinkel (untere, mittlere, obere Ebene). Bei großen Objekten: Drohne oder Kranshoting.
Import in Software: Alle Fotos in Reality Capture / Metashape importieren.
Ausrichten (Align Photos): SfM berechnet Kamerapositionen und Sparse Cloud. Ausreißer-Kameras manuell korrigieren.
Dense Cloud berechnen: MVS-Phase; GPU-intensiv (30 Min. bis mehrere Stunden je nach Bildmenge).
Mesh erstellen: Poisson-Rekonstruktion; Detailstufe je nach Verwendung (High Detail für CU-Shots, Medium für Background-Assets).
Textur backen: Alle Quellenfotos auf UV-Karten projizieren; Auflösung 4K–16K je nach Asset.
Cleanup in ZBrush/Blender: Überflüssige Geometrie entfernen (Bodenfläche, Stützflächen); Löcher füllen; Retopologisierung für Animation.
Export und Integration: FBX oder Alembic Export → in Houdini/Maya/Blender integrieren; UDIM-Texturkarten.

In der Praxis

Reality Capture (Epic / Capturing Reality): Schnellste Verarbeitungszeit durch GPU-Parallelisierung; präziseste Ergebnisse; von ILM, Weta Digital, DNEG für Asset-Scanning eingesetzt. Seit 2023 in Unreal Engine integriert.

Agisoft Metashape: Professionelle Alternative; besonders stark bei geographischen/archäologischen Anwendungen; Python-API für Batch-Prozesse.

Meshroom (AliceVision): Vollständig quelloffen; für Bildungsbereich und Indie-Produktionen geeignet; node-basierter Workflow.

Blender + BLENDerscans: Photogrammetrie-Meshes direkt in Blender via BpaS-Add-on für Material-Splitting.

Vergleich & Abgrenzung

Technik	Auflösung	Kosten	Bewegende Objekte
Photogrammetrie	sehr hoch	gering (Hardware)	nur statische Objekte
LiDAR-Scan	sehr hoch	hoch (Hardware)	nur statische Objekte
Multi-Kamera-Rig	sehr hoch	sehr hoch	möglich (Augenblick)
Structured Light Scan	extrem hoch	hoch	statisch
KI-3D aus Einzelbild (NeRF)	mittel	Software-Lizenz	statisch

Häufige Fragen (FAQ)

Warum werden spiegelnde Oberflächen zum Problem? MVS-Algorithmen suchen in Bildpaaren nach korrespondierenden Pixeln. Spiegelnde Oberflächen reflektieren die Umgebung winkelabhängig: das gleiche Oberflächenpunkt sieht aus verschiedenen Kamerapositionen völlig unterschiedlich aus, wodurch keine korrespondierenden Features gefunden werden. Abhilfe: Oberfläche mattieren, polarisierende Filter oder strukturiertes Licht.

Kann Photogrammetrie bewegende Personen scannen? Für einen einzigen Moment: Ja, mit synchronisiertem Multi-Kamera-Rig (z. B. 300-Kamera-Setups wie 4DViews). Für kontinuierliche Bewegung: Nein, Photogrammetrie braucht ein statisches Objekt aus mehreren Winkeln.

Weiterführend

Szeliski, R. (2010). Computer Vision: Algorithms and Applications. Springer. Kapitel 7: Structure from Motion.
Schoenberger, J.L. & Frahm, J.-M. (2016). Structure-from-Motion Revisited. CVPR 2016.
Capturing Reality GmbH. (2022). RealityCapture Documentation.
Agisoft. (2023). Metashape User Manual.

Was ist Photogrammetrie?

Erklärung

Structure from Motion (SfM)

Multi-View Stereo (MVS)

Mesh-Rekonstruktion und Texturierung

Genauigkeit und Auflösung

Software-Vergleich

Beispiele

Schritt-für-Schritt Workflow

In der Praxis

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

Photogrammetrie, 3D aus Fotos

Was ist Photogrammetrie?

Erklärung

Structure from Motion (SfM)

Multi-View Stereo (MVS)

Mesh-Rekonstruktion und Texturierung

Genauigkeit und Auflösung

Software-Vergleich

Beispiele

Schritt-für-Schritt Workflow

In der Praxis

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.