Datenvisualisierungen sind ein machtvolles Instrument. Denn kaum etwas überzeugt uns so schnell wie ein Blick auf ein Chart oder ein Diagramm. In diesem Blog-Artikel befassen wir uns umfassend mit den wichtigsten Aspekten und Anforderungen von Datenvisualisierungen.
Es ist keine Selbstverständlichkeit, dass uns Daten und Analyseergebnisse in der Form von Datenvisualisierungen begegnen. Datenanalysen sind in der Regel abstrakt und nicht selten liegen die wertvollsten Ergebnisse in Form von relativ unanschaulichen Excel-Tabellen vor. Im Vergleich dazu haben Datenvisualisierungen zwei Vorteile:
- Die zentralen Aussagen und Zusammenhänge lassen sich meist in wenigen Augenblicken erfassen.
- Wir können dem Dargestellten vertrauen, weil Datenvisualisierungen auf Zahlen und Fakten basieren.
Inhaltsverzeichnis
Vermittlung von Datenanalysen an Nicht-IT-Fachleute
Die digitale Transformation in Unternehmen führt vermehrt dazu, dass auch immer mehr Nicht-IT-Fachleute mit Datenanalysen konfrontiert sind. Beispielsweise stellen die Analysen zielgruppenspezifischen Einkaufsverhaltens oder regionaler Einkaufsmuster eine wichtige Grundlage für den Einkauf oder die Personalplanung dar. Wie sagt der Volksmund:
„Das richtige Bild ist mehr wert als tausend Worte.“
Da von Datenvisualisierungen heute zum Teil viel abhängt, müssen sie natürlich nicht nur gut lesbar sein, sondern die zugrundeliegenden Daten müssen vor allem korrekt und plausibel sein. Mit anderen Worten: Die Datenqualität muss hoch sein. Nur so kann gewährleistet werden, dass Datenvisualisierungen eine belastbare Grundlage für weitreichende Entscheidungen sind.
Linktipp: Datenqualität ist eine der zentralen Herausforderungen in Unternehmen. In unserem Blog-Artikel haben wir fünf Maßnahmen für optimale Datenqualität zusammengestellt.
Anforderungen und Regeln für Datenvisualisierungen
Die wichtigsten Anforderungen und Regeln für Datenvisualisierungen dienen zur Sicherstellung einer klaren Kommunikation. Da der visuelle Anteil der Kommunikation von so enormer Bedeutung ist, sind die entsprechenden Anforderungen daran hoch. Datenvisualisierungen müssen ebenso strengen Regeln folgen wie die Sprache, bei der Grammatik, Rechtschreibung und logische Strukturierung für das Verständnis wichtig sind.
Prof. Rolf Hichert, Experte für visuelle Kommunikation, hat Regeln für Datenvisualisierungen aufgestellt. Dabei beruht eine gelungene Darstellung auf sieben Regeln:
- SAY
- UNIFY
- CONDENSE
- CHECK
- ENABLE
- SIMPLIFY
- STRUCTURE
Die 7 Regeln für Datenvisualisierungen
Datenvisualisierungen müssen eine klare Botschaft haben, einheitlichen Darstellungsregeln folgen sowie einfach und schnell erfassbar sein. Gleichzeitig müssen die Visualisierungen eine hohe Informationsdichte haben, um die Komplexität der Sachverhalte nicht zu stark zu reduzieren und sich dennoch auf das Wesentliche konzentrieren. Datenvisualisierungen müssen zudem konkrete Handlungsoptionen aufzeigen, damit die Interpretation nicht zu stark von subjektiven Faktoren abhängig oder der Inhalt irrelevant ist.
Lesetipp: Von der Theorie in die Praxis: Hier schreibt unsere Expertin Elena Danchyshyna wie man in 4 Schritten zum perfekten Dashboard gelangt und welche 10 Tipps bei der Entwicklung eines Analytics-Dashboards helfen.
Neurologische, psychologische und kulturelle Aspekte bei Datenvisualisierungen
Visualisierungen sind eine faszinierende und machtvolle Angelegenheit. Allein aufgrund der neurologischen Veranlagung des Menschen stellen Bilder und Grafiken einen wichtigen Bestandteil bei der Informationsvermittlung dar. Wir behalten etwa 80 Prozent von dem, was wir bildlich dargestellt vermittelt bekommen. Bei gelesenen Inhalten sind es nur 20 Prozent und nur noch 10 Prozent bei Gehörtem.
Auch die Psychologie darf bei bildlichen Darstellungen nicht außer Acht gelassen werden. Spitze Winkel, steil ansteigende Kurven oder bestimmte auffällige Farben können zu einer Wahrnehmung führen, die nicht exakt mit den Datenbefunden übereinstimmen. Hier besteht die Gefahr – bewusst oder unbewusst – Botschaften zu verfälschen. Diese Erkenntnis ist für Entwickler und Anwender gleichermaßen wichtig.
Bei Farben kommt ein weiterer Faktor hinzu, der insbesondere im internationalen und globalen Kontext beachtet werden muss. Denn die Bedeutung von Farben ist kulturabhängig und hat zum Teil sehr unterschiedliche Prägungen.
Im deutschen Kulturraum wird die Farbe Rot beispielsweise als Warnfarbe wahrgenommen. In China hingegen ist rot positiv belegt und wird mit Erfolg und Wärme assoziiert. Die folgende Darstellung zeigt wie groß das Spektrum der unterschiedlichen Bedeutungszuschreibung ist:
Herausforderungen bei der Visualisierung von Daten
Auch aufgrund anderer äußerer Umstände kann es zu Verzerrungen und zu Fehlinterpretationen bei Datenvisualisierungen kommen. Allein, weil es weniger Standards und viel weniger Übung bei der Interpretation von Visualisierungen als bei der Interpretation von Texten gibt.
Aber auch bloß äußere Umstände können die Bewertung einer grafischen Darstellung beeinflussen: Schon das Format des Displays, auf dem ein Diagramm dargestellt wird, kann die Interpretation verändern. Auf einem Smartphone verkürzt sich automatisch die x-Achse, sodass Kurven, die eine Entwicklung anzeigen, sehr viel dramatischer aussehen können. Im Vergleich dazu würde ein Diagramm auf dem Bildschirm eines Laptops eine mehr in die Breite gehende x-Achse haben und weniger dramatisch erscheinen.
Ebenso wichtig ist der Kontext, in dem Datenvisualisierungen eingebettet sind. Da Datenvisualisierungen stets mit einem bestimmten Zweck erstellt werden – in der Regel, um von einem bestimmten Sachverhalt zu überzeugen – ist es wichtig darauf zu achten, dass es zu keinen bewussten oder unbewussten Manipulationen kommt.
Wenn der Zusammenhang komplex ist, kann eine einzelne Visualisierung nicht die einzige Wahrheit darstellen. Dies ist einer der Gründe, warum wir bei der Alexander Thamm GmbH auf interaktive Dashboards setzen. Während es bei einzelnen Datenvisualisierungen zu Begrenzungen kommen kann, fließen in einem interaktiven Dashboard verschiedene Aspekte eines Sachverhalts ein. So werden typische Fehlerquellen bei der Darstellung minimiert.
Datenvisualisierungen als Treiber der digitalen Transformation
Insbesondere in Situationen, in denen beispielsweise Führungskräfte schnell Entscheidungen treffen müssen, ist keine Zeit für lange und ausführliche Datenauswertungen. Hier helfen Datenvisualisierungen, weil sie – im besten Fall in Echtzeit – auf einen Blick einen Überblick über die relevanten Key-Insights liefern können.
Ein Dashboard hat hier den Vorteil, sowohl alles auf einen Blick sichtbar zu machen und zugleich den Kontext mitzuliefern. Datenvisualisierungen eignen sich auch sehr gut, um die Ergebnisse von komplexen Projekten zusammenzufassen und zu präsentieren, v.a. gegenüber der Geschäftsführung. Daher ist das auch in unserem Datenkompass der letzte Schritt.
Richtig aufbereitet können Datenvisualisierungen auch von Nicht-IT-Fachleuten gelesen werden. Weil sie so die Integration von Data Science in Unternehmen erheblich erleichtern, stellen sie ein wertvolles Instrument von datengetriebenen Projekten dar. Sie sind damit ein Schlüssel für die digitale Transformation von Unternehmen, weil sie in vielen Bereichen eines Unternehmens wirken können.
3 Ansätze für gute Big Data Datenvisualisierung
Das Problem der Visualisierung großer Datenmengen ist allerdings nicht neu. In der Wissenschaft wurde zu diesem Thema bereits geforscht und es wurden Methoden und Möglichkeiten entwickelt, um Big Data zu visualisieren und durch Big Data zu navigieren. Überblickend lassen sie sich in drei Kategorien zusammenfassen:
- Datenreduktion
- aggregierte Visualisierungstechniken
- fortgeschrittene Interaktionsmöglichkeiten
ANSATZ 1: DATENREDUKTION
Datenreduktion beinhaltet die Reduzierung der Datenmenge und der Dimensionen bzw. Attribute. Denkt man an eine Datentabelle, bezeichnet ersteres die Reduzierung der Zeilen und letzteres die der Spalten. Methoden der Datenreduktion beinhalten Sampling-Methoden mit deren Hilfe Teilmengen der Daten und Filter gebildet werden.
Dimensionsreduktion erfolgt mithilfe spezieller Verfahren, wie z.B. der Hauptkomponentenanalyse, wodurch besonders aussagekräftige Dimensionen berechnet werden. Sowohl mit Datenreduktion wie auch mit Dimensionsreduktion wird der Datensatz verkleinert, sodass in der Visualisierung wieder Zusammenhänge erkennbar werden. Allerdings birgt die Datenreduktion auch die Gefahr des Informationsverlustes.
ANSATZ 2: AGGREGIERTE VISUALISIERUNGSTECHNIKEN
Aggregierte Visualisierungen fassen Datenpunkte in der Darstellung zusammen. Ein aggregierter Scatter Plot stellt z.B. Punktecluster anstelle jedes einzelnen Punktes dar. Die Punktdichte wird dabei über den Farbton abgebildet. Beispielhaft hierfür ist die Smart Data Compression von Qlik Sense.
Außerdem können aggregierte Visualisierungen multiple Auflösungen beinhalten. Relevante Daten (z.B. aktuelle Daten) können hochaufgelöst im Zentrum dargestellt werden, wohingegen weniger relevante Daten (z.B. die Daten von vor fünf Jahren) aggregiert am Rande abgebildet werden. Auf diese Weise kann Überlappung vermieden und der Fokus auf relevante Daten verlagert werden. Mithilfe von Datenreduktion und Aggregation wird die visuelle Überlappung reduziert und große Datenmengen somit wieder darstellbar.
ANSATZ 3: FORTGESCHRITTENE INTERAKTIONSMÖGLICHKEITEN
Fokus und Kontext können durch Interaktionen verbessert werden. Neben Zoom und Filter bieten Lupentechniken die Möglichkeit einzelne Daten genauer zu betrachten und dennoch den Überblick zu behalten. Lupentechniken sind Verzerrungstechniken, zu denen auch bifokale Displays und perspektivische Wände zählen. Alle Verzerrungstechniken rücken einen ausgewählten Datenausschnitt in den Fokus, während der restliche Datensatz verkleinert angezeigt wird.
Big-Data-Datenvisualisierung in bestehenden Visualisierungstools
Qlik Sense, Tableau oder Microsoft Power BI setzen diese Techniken teilweise schon um. Zoomen und Filtern ist in diesen Tools mittlerweile Standard geworden, aber auch im Bereich der Datenreduktion werden einige Möglichkeiten angeboten. Dazu gehören aggregierte Dimensionen und die Einbindung von R-Skripts.
Aggregierte Visualisierungen werden jedoch lediglich über Erweiterungen, sogenannte Extensions, ermöglicht. Für diese Extensions wird auf populäre Programmiersprachen, wie JavaScript und R zurückgegriffen. In Qlik Sense können mithilfe von JavaScript maßgeschneiderte Visualisierungen erstellt werden, wohingegen Tableau erweiterte Möglichkeiten der Datenreduktion mit R Skripten bietet. Power BI ermöglicht sowohl die Einbindung von JavaScript, als auch von R-Skripten.
Auch wenn es noch kein Tool gibt, das alle vorgestellten Methoden zur Datenvisualisierung von Big Data integriert, ist es dennoch möglich, diese Methoden mit den notwendigen Programmierkenntnissen zu implementieren. Datenvisualisierung von Big Data ist immer noch ein in der Entwicklung steckendes Feld, in dem noch viel Potenzial steckt – allerdings gibt es erste Fortschritte, die auch in Visualisierungstools sichtbar werden.
0 Kommentare