Data Governance: Grundlagen, Herausforderungen und Lösungen im Bereich Data Management

von | 19. Juni 2020 | Grundlagen

Im Zusammenhang mit Big Data fällt in der Regel eine Flut an Begrifflichkeiten wie Data Mining, Predictive Analytics oder Machine Learning, aber auch unterschiedliche Technologien wie beispielsweise Hadoop, Apache Hive oder Apache Spark werden genannt. Oder aber das Thema wird vor dem Hintergrund von Herausforderungen wie Datenschutz und Datensicherheit diskutiert. Dabei können diese und weitere Aspekte unter dem Begriff Data Governance zusammengefasst werden.

Insbesondere wenn es um die Verwaltung und Zugriffsteuerung von extrem großen Datenmengen geht, sorgt Data Governance für funktionierende Rahmenbedingungen und sorgt für die Einhaltung von Standards:

  • Qualitätsstandards
  • Sicherheitsstandards
  • Datenerfassungsstandards
  • Prozessstandards

Data Governance stellt nicht zuletzt auch die Lösung für eine Herausforderung dar, die uns in der Praxis immer wieder begegnet. Zwar sind in vielen Unternehmen viele Daten vorhanden. Nicht alle verfügbaren Daten dürfen jedoch in Data-Science-Projekten verarbeitet werden. Zudem fehlt es oft an deskriptiven Metadaten, die es ermöglichen, relevante Daten für die Analyse zu identifizieren.

1. Was ist Data Governance?

Weder Theorie noch Praxis liefern derzeit eine eindeutige Definition von Data Governance. Die allgemeinste Formel, auf die Data Governance reduziert werden kann, lautet: Die Vorgabe einzuhaltender Regeln im Umgang mit einem definierten Datenspektrum. Manchmal wird in diesem Zusammenhang auch von Data Management gesprochen, ohne dass es inhaltlich große Abweichungen gibt. Die Aufgaben von Data Governance oder von Data Management sind kurz gesagt die Planung, Kontrolle und Bereitstellung von Daten. Data Governance bezieht sich in seiner ursprünglichen Form auf die Verteilung von Zugriffsrechten und verwandten Aufgaben in Bezug auf Datenmanagement in Unternehmen.

Darüber hinaus wird im Rahmen der Data Governance sichergestellt, dass alle rechtlichen Vorgaben, wie beispielsweise der Datenschutz, eingehalten werden. Eine weitere wichtige Aufgabe ist es, die Werkzeuge bereitzustellen, die nötig sind, damit ein sicherer Zugriff auf die Daten im Unternehmen jederzeit möglich ist. Damit erfüllt Data Governance mehrere Zwecke:

  • Den Zugriff auf Daten sicherstellen
  • Risiken erkennen und vermeiden
  • Unternehmerische Potenziale erkennen und nutzen
  • Kosten bei der Datenspeicherung und Verwaltung senken

Die Erstellung eines Datenkatalogs, bei dem ebenfalls diese Zuständigkeiten geregelt werden, ist einer unserer Standardprozesse.

2. Vier Entscheidungs- und Kompetenzbereiche von Data Governance

Es gibt demnach vier Kernbereiche, die unter den Begriff Data Governance fallen:

  • Data Quality
  • Data Maintenance
  • Data Privacy
  • Data Compliance

In jedem dieser vier Bereiche geht es stets um die Zuweisung von Rollen (Data Roles), die Sicherstellung der Einhaltung von Standards und die Definition von Prozessen.

  1. Data Quality: Hier geht es um die Sicherstellung, dass Daten vollständig erfasst werden, dass Daten aktuell sind, für die Weiterverarbeitung geeignet sind und entsprechend vorbereitet werden sowie der Zugang gewährleistet und geregelt ist.
  2. Data Maintenance: Hat die Datenanreicherung, Korrektur von Daten und Pflege von Stammdaten zum Ziel.
  3. Data Privacy: Sicherstellung, dass alle relevanten Standards unter Sicherheitsaspekten und Vertraulichkeit dem Kunden gegenüber eingehalten werden.
  4. Data Compliance: Einhaltung von gesetzlichen Standards, ethischen und moralischen Richtlinien sowie firmeneigener Standards und Richtlinien.

3. Data Governance als notwendige Ergänzung zum Data Lake

Unternehmen, die Daten in einem Data Lake speichern, benötigen eine gut aufgestellte Strategie für das Verwalten der großen Mengen von Daten, die dort gespeichert sind. Ohne die notwendigen Standards bei der Datenerfassung, Datenspeicherung und Datenverarbeitung laufen Unternehmen mit Data Lake Gefahr, mit einem „Data Swamp“ (bzw. „Datensumpf“) zu enden.

Relevante Daten zu finden und zu verarbeiten ist dann nur noch schwer möglich und das ganze System wird ineffizient. Aber auch über den Anwendungsfall Data Lake hinaus gilt: Wenn Daten immer mehr als ein wichtiger Teil der Wertschöpfungskette erkannt werden, so lassen sich diese nur dann sinnvoll und ökonomisch rentabel verarbeiten, wenn wichtige Standards definiert und eingehalten werden. Insbesondere die Einhaltung der rechtlichen Rahmenbedingungen ist entscheidend, wenn neue Märkte erschlossen werden sollen.

4. Die Vorteile von Data Governance

  • Bessere Verständigung durch gemeinsames Vokabular
  • Zeitersparnis durch deskriptive Metadaten
  • Standardisierung von Zugrifssprozessen
  • Mehr Vertrauen in die Digitale Transformation

Data Governance bringt mehrere Vorteile mit sich, die weit über die bloße Erfüllung von regulativen Anforderungen hinausgehen. Erstens wird durch ein gemeinsames Vokabular von Geschäftsbegriffen den Analysten ermöglicht, ohne unnötige Umwege die relevanten Daten für ihre Use Cases zu finden. Zweitens sparen deskriptive Metadaten den Mitarbeitern wertvolle Zeit beim Verständnis von Datenquellen. Drittens werden Zugriffsprozesse standardisiert und Datenschutzvorschriften durch automatische Anonymisierung, klare Regelungen und Umsetzung von Zugriffsrechten eingehalten. Und zuletzt gewinnen viertens die Mitarbeiter und Kunden mehr Vertrauen in den Prozess der digitalen Transformation, weil es klare Richtlinien zur Beurteilung und Einhaltung von Standards und Regelungen bei der Datenverarbeitung gibt.

5. Data Governance: Integraler Bestandteil von Datenstrategien

Data Governance ist ein integraler Bestandteil von erfolgreichen Data-Science-Strategien. Sie sorgt dafür, dass durch das Einhalten von Standards messbar die Datenqualität steigt. Damit stellt sie zugleich sicher, dass Prozesse bei der Datenverarbeitung optimiert werden. Sie ist keine reine IT-Aufgabe, sondern befindet sich an der Schnittstelle mehrerer Bereiche.

Zudem ist es keine einzelne Aufgabe oder kein singuläres Projekt, das einmalig durchgeführt werden muss. Data Governance ist vielmehr ein permanenter Prozess – viele Unternehmen setzen darum auf einen Data Governance Officer oder – je nach Unternehmensgröße – institutionalisieren die Aufgabe als Abteilung. Das oberste Ziel von Data Governance ist die Erhaltung und Anreicherung von firmeninternem Wissen und die Wahrung von Standards bei dessen strategischen Einsatz.

6. Use Cases der Alexander Thamm GmbH

Data Governance Modell in der Rückversicherung

Ein internationaler Kunde aus der Rückversicherung der Alexander Thamm GmbH hatte zum Ziel, aus seinen vorhandenen Daten eine Strategie zur Digitalisierung im Unternehmen einführen. Die Herausforderung war es mit alten und neue Datenquellen, sowie interne und externe Daten klare Strukturen und Prozesse für eine konzernweite Data Governance zu erstellen. Durch eine saubere Definition der Verantwortlichkeiten und der Zusammenarbeit mit allen Abteilungen, konnten die notwendigen Prozesse für die Datenarchitektur, Datenqualität und Datenpflege erfolgreich implementiert werden. Mehr dazu finden Sie in unserem Use Case zu Data Governance in der Rückversicherung.

DG Modell für einen Automobilhersteller

Ein Automobilkonzern wollte die Transformation zu einer datengetriebenen Organisation vorantreiben. ​Herausforderung war, dass Data Science Use Cases nicht umgesetzt werden konnten, aufgrund von fehlenden Prozessen und Verantwortlichkeiten​. Fehlende Datenzugriffsprozesse, schlechte Datenqualität und unterschiedliche Namensgebungskonventionen waren dabei ebenfalls zentrale Hürden. Unsere Experten konzipierten und implementieren transparente Workflows zur Regelung von Datenzugriff, Problemmanagement und weiteren essenziellen Prozessen​.

Zudem wurden klare Rollen und Verantwortlichkeiten definiert, ​
die passenden Benutzern zugewiesen werden können​. Die Aufbereitung von geeigneten Datenmodellen für die Metadatenbanken Business-Glossary, Data-Dictionary, ​Data-Projects-Glossary war ebenfalls Teil des Lösungsansatzes.

Die Alexander Thamm GmbH entwickelte somit einen standardisierten Zugriffsprozess durch automatische Anonymisierung neuregistrierter Datenobjekte​. Ein gemeinsames Vokabular von Geschäftsbegriffen ermöglicht es den Analysten nun, ohne Umwege die relevanten Daten für ihre Use-Cases zu finden​.

7. 7 Schritte zur Implementierung

  • Erarbeitung einer klaren Datenstruktur auf Basis einer erprobten Vorlage zur Identifizierung der Datenqualität und Nutzungsszenarien des Datenkatalogs.
  • Erarbeitung von wichtigen Einsichten und den tatsächlichen Nutzen des Datenkatalogs.
  • Ableitung von erforderlichen Prozesse und erkennbaren Nutzenargumentationen in einem gemeinsamen Workshop. Hier diskutiert man auch die Erfahrungen der ersten Schritte.
  • Ein weiterer Workshop vermittelt Kenntnisse zu den Anforderungen an eine Data-Governance-Strategie und nimmt erste Lösungsansätze für Ihr Unternehmen in den Blick.
  • Mit den Erfahrungen bei der Erstellung des Datenkatalogs und den Workshop-Ergebnissen ist die Grundlage für eine Datenstrategie gegeben und eine Roadmap kann erstellt werden.
  • Start eines Pilotprojektes
  • Bewertung der Ergebnisse des Pilotprojektes und ableiten einer ersten Abschätzung des Umfangs und des Aufwandes für die Data Governance und die damit verbundenen Veränderungen im Unternehmen.

Unsere Angebote und Dienstleistungen im Bereich Data Governance

Data Governance ist ein umfängliches und zum Teil sehr komplexes Thema. Spätestens seit der Neufassung der EU-DSGVO vermitteln wir verstärkt dieses Thema, um die Sensibilität für Datenschutz und Datensicherheit im Management dafür weiterzubefördern. Wir begleiten Unternehmen bei der Auswahl passender Tools wie Informatica, Collibra oder Azure, um die benötigten Strukturen und Abläufe zu implementieren. Da Data Governance ein wichtiger Aspekt der digitalen Transformation ist, verstehen wir uns zudem als Enabler für eine unternehmensumspannende Erarbeitung passender Prozesse und Rollen. Dies kann sowohl im Rahmen eines Workshops geschehen oder bei einer Begleitung über einen längeren Zeitraum. Die genaue Dauer der Begleitung ist jeweils abhängig von Größe und Struktur der jeweiligen Organisation.

Sind Sie bereit für die Einführung einer Data Governance? Dann sprechen Sie mit uns. Wir helfen Ihnen dabei!

 

Autor:innen

Michaela Tiedemann

Michaela Tiedemann ist seit den jungen Startup Tagen der Alexander Thamm GmbH mit im Team. Sie hat die Entwicklung vom schnelllebigen, spontanen Startup hin zum erfolgreichen Unternehmen aktiv mitgestaltet. Mit der Gründung einer eigenen Familie begann für Michaela Tiedemann dann parallel dazu ein ganz neues Kapitel. Den Job an den Nagel zu hängen, kam für die frisch gebackene Mutter aber nicht in Frage. Stattdessen entwickelte sie eine Strategie, wie sie ihre Stelle als Chief Marketing Officer mit ihrer Rolle als Mutter in Einklang bringen kann.

0 Kommentare

Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert