Photogrammetrie ist ein Messverfahren, das aus einer Vielzahl überlappender Fotografien mittels Structure-from-Motion (SfM) und Multi-View-Stereo (MVS) exakte 3D-Geometrien und fotorealistische Texturen rekonstruiert.
Rubrik: Animation & VFX · Unterrubrik: VFX-Techniken · Niveau: Fortgeschritten
Synonyme / Auch bekannt als: Reality Capture, Photo Scanning, 3D-Scanning via Fotos, Image-Based Modeling (IBM), SfM Scanning
Was ist Photogrammetrie?
Photogrammetrie (griech. photos = Licht, gramma = Zeichnung, metrein = messen) berechnet aus geometrisch überlappenden Fotos eines Objekts oder Ortes ein dreidimensionales Modell mit Textur. Im Film- und VFX-Kontext wird sie eingesetzt, um physische Objekte, Kulissen, Fahrzeuge oder ganze Außenlocations in exakte digitale 3D-Assets zu verwandeln – deutlich schneller und präziser als manuelles 3D-Modellieren.
Bekannte Einsatzbereiche: Scan von Schauspielerkörpern und -gesichtern (Digital Doubles), Scan von Requisiten für CGI, Scan von Drehorten für Virtual Production und Erweiterung, sowie die Erstellung von Game-Assets aus realen Objekten.
Erklärung
Structure from Motion (SfM)
SfM ist der Kernalgorithmus: Aus Bildpaaren werden korrespondierende Feature-Punkte extrahiert (SIFT, ORB), und über Epipolargeometrie wird die relative Kameraposition berechnet. Durch Bundle Adjustment werden alle Kamerapositionen und 3D-Punkte global optimiert (Minimierung des Reprojektionsfehlers).
Resultat: eine Sparse Point Cloud (wenige Millionen Punkte) mit Kamerabewegungen.
Multi-View Stereo (MVS)
MVS verdichtet die Sparse Cloud zu einer Dense Point Cloud (Hunderte Millionen Punkte) durch dichte Pixel-Korrespondenz zwischen alle Bildpaaren. Algorithmen: PatchMatch MVS (Bleyer et al., CVPR 2011), OpenMVS.
Mesh-Rekonstruktion und Texturierung
Dense Cloud → Mesh durch Poisson Surface Reconstruction (Kazhdan et al., 2006) oder Delaunay-Triangulierung. Textur-Baking: Alle Original-Fotos werden auf das Mesh projiziert und zu einer oder mehreren UV-Texturkarten gebacken.
Genauigkeit und Auflösung
| Faktor | Einfluss auf Qualität |
|---|---|
| Bildanzahl | mehr = besser; Überlappung ≥ 60 % |
| Brennweite / Sensorauflösung | höher = feinere Details |
| Beleuchtung | diffuses Licht bevorzugt (kein harter Schatten, keine Reflexe) |
| Tiefenschärfe | möglichst alles scharf; f/8–f/11 |
| Textur der Oberfläche | glatte/spiegelnde Flächen sind problematisch |
Typische Genauigkeit professioneller Setups: 0,1–1 mm bei kleinen Objekten; 1–5 cm bei Außenumgebungen.
Software-Vergleich
| Software | Technologie | Preis | Typ |
|---|---|---|---|
| Reality Capture (Epic Games) | SfM + MVS, GPU-beschleunigt | kostenpflichtig (Credit-System) | Professionell |
| Agisoft Metashape | SfM + MVS | ca. 3.500 € (Professional) | Professionell |
| Meshroom | AliceVision, Open Source | kostenlos | Indie/Forschung |
| Apple OBJ Scan (iOS) | LiDAR + Foto-Fusion | kostenlos | Rapid Prototyping |
| Polycam | iOS/Android | Abo-Modell | Rapid Prototyping |
Beispiele
- The Jungle Book (Jon Favreau, 2016) – Alle Tier-Assets und Environments durch Kombination von Photogrammetrie-Scans realer Orte und 3D-Modellierung erstellt; MPC und Weta Digital; Oscar für beste VFX.
- The Revenant – Der Rückkehrer (Iñárritu, 2015) – Location-Scans der Wildnis via Photogrammetrie für Hintergrundextensionen und Matte Paintings.
- Assassin's Creed: Unity (Ubisoft, 2014) – Photogrammetrie-Scans von Notre-Dame de Paris für ein spielerisch exaktes digitales Modell, das nach dem Brand 2019 für Restaurierungsarbeiten herangezogen wurde.
- Avengers: Endgame (Russo Brothers, 2019) – Digitale Doubles aller Hauptdarsteller via Multi-Camera-Photogrammetrie-Rig (ca. 300 Kameras synchronisiert).
- Mid90s (Jonah Hill, 2018) – Indie-Produktion nutzte Photogrammetrie zur kostengünstigen Erstellung von Straßenszenen für digitale Extensions.
Schritt-für-Schritt Workflow
- Vorbereitung: Objekt wenn nötig mattieren (matte Sprühfarbe auf spiegelnde Oberflächen). Diffuses Licht sicherstellen (bedeckter Himmel oder Lichtzelt).
- Fotografieren: Objekt ringförmig umkreisen; Überlappung ≥ 60 %; mehrere Höhenwinkel (untere, mittlere, obere Ebene). Bei großen Objekten: Drohne oder Kranshoting.
- Import in Software: Alle Fotos in Reality Capture / Metashape importieren.
- Ausrichten (Align Photos): SfM berechnet Kamerapositionen und Sparse Cloud. Ausreißer-Kameras manuell korrigieren.
- Dense Cloud berechnen: MVS-Phase; GPU-intensiv (30 Min. bis mehrere Stunden je nach Bildmenge).
- Mesh erstellen: Poisson-Rekonstruktion; Detailstufe je nach Verwendung (High Detail für CU-Shots, Medium für Background-Assets).
- Textur backen: Alle Quellenfotos auf UV-Karten projizieren; Auflösung 4K–16K je nach Asset.
- Cleanup in ZBrush/Blender: Überflüssige Geometrie entfernen (Bodenfläche, Stützflächen); Löcher füllen; Retopologisierung für Animation.
- Export und Integration: FBX oder Alembic Export → in Houdini/Maya/Blender integrieren; UDIM-Texturkarten.
In der Praxis
Reality Capture (Epic / Capturing Reality): Schnellste Verarbeitungszeit durch GPU-Parallelisierung; präziseste Ergebnisse; von ILM, Weta Digital, DNEG für Asset-Scanning eingesetzt. Seit 2023 in Unreal Engine integriert.
Agisoft Metashape: Professionelle Alternative; besonders stark bei geographischen/archäologischen Anwendungen; Python-API für Batch-Prozesse.
Meshroom (AliceVision): Vollständig quelloffen; für Bildungsbereich und Indie-Produktionen geeignet; node-basierter Workflow.
Blender + BLENDerscans: Photogrammetrie-Meshes direkt in Blender via BpaS-Add-on für Material-Splitting.
Vergleich & Abgrenzung
| Technik | Auflösung | Kosten | Bewegende Objekte |
|---|---|---|---|
| Photogrammetrie | sehr hoch | gering (Hardware) | nur statische Objekte |
| LiDAR-Scan | sehr hoch | hoch (Hardware) | nur statische Objekte |
| Multi-Kamera-Rig | sehr hoch | sehr hoch | möglich (Augenblick) |
| Structured Light Scan | extrem hoch | hoch | statisch |
| KI-3D aus Einzelbild (NeRF) | mittel | Software-Lizenz | statisch |
Häufige Fragen (FAQ)
Warum werden spiegelnde Oberflächen zum Problem? MVS-Algorithmen suchen in Bildpaaren nach korrespondierenden Pixeln. Spiegelnde Oberflächen reflektieren die Umgebung winkelabhängig: das gleiche Oberflächenpunkt sieht aus verschiedenen Kamerapositionen völlig unterschiedlich aus, wodurch keine korrespondierenden Features gefunden werden. Abhilfe: Oberfläche mattieren, polarisierende Filter oder strukturiertes Licht.
Kann Photogrammetrie bewegende Personen scannen? Für einen einzigen Moment: Ja – mit synchronisiertem Multi-Kamera-Rig (z. B. 300-Kamera-Setups wie 4DViews). Für kontinuierliche Bewegung: Nein – Photogrammetrie braucht ein statisches Objekt aus mehreren Winkeln.
Verwandte Einträge
- LIDAR für Film und Virtual Production
- 3D Camera Tracking / Match Moving
- LED-Volume / Virtual Production
Weiterführend
- Szeliski, R. (2010). Computer Vision: Algorithms and Applications. Springer. Kapitel 7: Structure from Motion.
- Schoenberger, J.L. & Frahm, J.-M. (2016). Structure-from-Motion Revisited. CVPR 2016.
- Capturing Reality GmbH. (2022). RealityCapture Documentation.
- Agisoft. (2023). Metashape User Manual.
