Heatmap ist eine Visualisierungsform, die numerische Werte in einer zweidimensionalen Matrix durch Farbabstufungen codiert und damit Muster, Häufungen und Ausreißer in großen Datensätzen auf einen Blick sichtbar macht.
Rubrik: Mediendesign & Digitale Medien · Unterrubrik: Infografik & Datenvisualisierung · Niveau: Einsteiger Synonyme / Auch bekannt als: Wärmekarte, Heat Map, Korrelationsmatrix (Sonderfall), Aktivitäts-Heatmap
Was ist eine Heatmap?
Die Heatmap stellt Daten als farbkodierte Rechtecke oder Zellen in einem zweidimensionalen Raster dar. Je nach zugrunde liegender Variable reicht die Farbe von kalt (niedrige Werte, oft blau oder gelb) bis heiß (hohe Werte, oft rot oder dunkelorange). Der Begriff leitet sich von der Analogie zu Temperaturkarten ab. Heatmaps sind besonders leistungsfähig, wenn sehr viele Datenpunkte in einer kompakten Matrix dargestellt werden sollen, bei der ein konventionelles Diagramm schlicht zu unübersichtlich würde.
Erklärung
Heatmaps eignen sich für drei Hauptanwendungsbereiche:
1. Kalender-Heatmaps (Aktivitäts-Heatmaps): Die bekannteste Form ist die GitHub-Beitragsübersicht – ein ganzes Jahr Aktivität in einer kompakten, grün abgestuften Kalenderdarstellung. Jede Zelle entspricht einem Tag, die Farbe gibt die Intensität der Aktivität an. Varianten: Saisonschwankungen im Einzelhandel, Redaktionsaktivität nach Wochentag und Uhrzeit.
2. Korrelationsmatrizen: In der Statistik werden Heatmaps verwendet, um Korrelationskoeffizienten zwischen mehreren Variablen darzustellen. Ein Datensatz mit 20 Variablen hat 190 mögliche Korrelationspaare – eine Heatmap macht diese auf einen Blick lesbar, während eine Tabelle mit Zahlen weit weniger intuitiv wäre.
3. Web-Analytics- und UX-Heatmaps: Tools wie Hotjar oder Microsoft Clarity zeigen, wo Nutzer auf einer Webseite klicken, wie weit sie scrollen oder wo sie ihre Maus bewegen. Diese Heatmaps überlagem einen Screenshot der Seite mit Farbabstufungen.
Farbskalenauswahl: Die Wahl der Farbskala ist kritisch. Sequentielle Skalen (z. B. von weiß zu dunkelblau) eignen sich, wenn alle Werte positiv sind. Divergierende Skalen (z. B. rot-weiß-blau) sind ideal, wenn Werte sowohl positiv als auch negativ sein können (z. B. Temperaturabweichungen vom Mittelwert). Die Regenbogenpalette (Jet) ist zu vermeiden, da sie Gradienten verzerrt und für farbenblinde Menschen unbrauchbar ist (vgl. Barrierefreiheit in Datenvisualisierungen und Farbwahl in der Datenvisualisierung).
Sortierung: Die Reihenfolge von Zeilen und Spalten beeinflusst massiv, welche Muster sichtbar werden. Eine hierarchische Clusterung sortiert ähnliche Zeilen und Spalten zusammen und macht verborgene Gruppierungen sichtbar.
Beispiele
- Sportanalyse: Torschussstatistiken im Fußball – welche Zonen auf dem Spielfeld haben die höchste Torwahrscheinlichkeit?
- Klimaforschung: Abweichungen der Oberflächentemperatur vom Jahresdurchschnitt, dargestellt über 12 Monate und 140 Jahre.
- UX-Research: Klick-Heatmap einer Nachrichtenwebsite – Redakteure erkennen, welche Artikel und Call-to-Actions ignoriert werden.
- Bioinformatik: Genexpressionsmatrizen, bei denen Tausende Gene gegen Hunderte Gewebeproben dargestellt werden.
- Redaktionsplanung: Heatmap der Leserzahlen nach Wochentag und Uhrzeit – wann erschienen Artikel haben die meisten Abrufe?
In der Praxis
Datawrapper bietet einfache Heatmap-Vorlagen für Kalenderdarstellungen und einfache Matrizen. Flourish hat interaktive Heatmap-Templates, bei denen Nutzer über Zellen hovern können. Tableau eignet sich für komplexe, datenbankgestützte Korrelationsmatrizen. Python (Seaborn, Matplotlib) und R (ggplot2) sind die Werkzeuge der Wahl für wissenschaftliche Heatmaps mit Clusteranalyse.
Workflow-Tipp: Die Farbskala immer explizit angeben (Legende mit Mindest- und Maximalwert). Fehlendes Datenpunkte (NaN) sollten klar als Grau oder mit Schraffur markiert sein – nicht mit Weiß, das mit echten Nullwerten verwechselt werden kann.
Vergleich & Abgrenzung
| Situation | Empfehlung |
|---|---|
| Muster in einer zweidim. Matrix | Heatmap ✓ |
| Geografische Verteilung | Choropleth-Karte |
| Korrelation zweier Variablen | Scatter Plot |
| Zeitliche Häufung | Heatmap (Kalenderform) ✓ |
| Einzelwerte präzise ablesen | Heatmap ungeeignet → Tabelle |
Häufige Fragen (FAQ)
Wann sollte man eine Heatmap verwenden? Eine Heatmap ist ideal, wenn der Fokus auf Mustern und Häufungen liegt, nicht auf präzisen Einzelwerten. Sie funktioniert besonders gut bei größeren Datensätzen (mehr als 20 × 20 Zellen), bei denen andere Diagrammtypen zu überladen wären. Für wenige Kategorien ist oft eine einfachere Alternative besser geeignet.
Welche häufigen Fehler gibt es bei Heatmaps? Ungeeignete Farbskalen (besonders Regenbogenpaletten), fehlende Legenden, keine Beschriftung der Achsen und mangelnde Kontrastsicherheit für farbenblinde Nutzer. Auch die Sortierung wird oft vernachlässigt – eine ungeordnete Heatmap zeigt keine Muster, obwohl die Daten welche enthalten.
Verwandte Einträge
- Choropleth-Karte
- Scatter Plot
- Farbwahl in der Datenvisualisierung
- Barrierefreiheit in Datenvisualisierungen
- Dashboard Design
Weiterführend
- Wilkinson, Leland / Friendly, Michael (2009): The History of the Cluster Heat Map. In: The American Statistician, 63 (2), S. 179–184.
- Cairo, Alberto (2016): The Truthful Art. San Francisco: New Riders.
- ColorBrewer 2.0 (Cynthia Brewer): colorbrewer2.org – Farbpaletten für Karten und Matrizen.
