Wie Unternehmen von dezentraler Datenverwaltung profitieren

Data Mesh beschreibt die Art und Weise, wie Unternehmen ihre Daten verwalten und nutzen. Als fortschrittliches Konzept der Datenarchitektur zielt ein Data Mesh darauf ab, die Herausforderungen zentralisierter Datenstrukturen zu überwinden und eine dezentrale, agile Datenlandschaft zu schaffen. Es ermöglicht die Verbindung von Dateneigentümern, Datenproduzenten und Datenkonsumenten, um den Informationsaustausch zu verbessern und datengesteuerte Prozesse effizienter zu gestalten. Dabei betrachtet ein Data Mesh Daten als wertvolle Produkte, die von den jeweiligen Domänenexperten selbstständig verwaltet und anderen Teams zur Verfügung gestellt werden. Doch wie genau funktioniert dieses Konzept, welche Prinzipien liegen ihm zugrunde und welche Vor- und Nachteile sind mit einer Umsetzung verbunden? Dieser Artikel wird ein umfassender Einblick in die Welt des Data Mesh geben und beleuchten, wie Unternehmen von dieser wegweisenden Datenarchitektur profitieren können.
Data Mesh beschreibt ein Konzept für die Datenarchitektur in Unternehmen, welches darauf abzielt, die Datenverwaltung zu dezentralisieren und datengesteuerte Prozesse zu verbessern.
Ziel ist es, den Dateneigentümer, den Datenproduzenten und den Datenkonsumenten miteinander zu verbinden. Dabei sollte das Data Mesh Konzept gemäß ihrer Begründerin Zhamak Dehghani vor allem an jenen Herausforderungen ansetzen, bei welchen zentralisierte und monolithische Datenstrukturen an ihre Grenzen stoßen. Dies trifft vor allem auf die Organisation und die Zugänglichkeit der Daten zu.
Beim Data Mesh Ansatz werden Daten als Produkte angesehen und die Verbraucher dieser Daten sollten als Kunden behandelt werden. Das Prinzip der Daten als Produkte anzusehen, zielt darauf ab, die Probleme der Datenqualität und der veralteten Datensilos, auch als „Dark Data“ bezeichnet, anzugehen. Dark Data sind die Informationen, die Organisationen im Rahmen ihrer regulären Geschäftsaktivitäten sammeln, verarbeiten und speichern, jedoch im Allgemeinen nicht für andere Zwecke nutzen.
Data Mesh und Data Fabric beschreiben zwei Ansätze für eine Datenarchitektur, welche jedoch verschiedene Schwerpunkte haben.
Während sich Data Mesh auf die dezentrale Datenverwaltung und die Autonomie der datenbesitzenden Teams konzentriert und es darauf abzielt, Daten als Produkte zu betrachten und die Selbstbedienungsfähigkeit fördert, ist eine Data Fabric hingegen ein integrierter Datenansatz, der die verschiedenen Datenspeicher, Datenquellen und Datenverarbeitungstechnologien eines Unternehmens nahtlos miteinander verbindet. Es betont die Einheitlichkeit und Konsistenz der Datenzugriffe und -transformationen und strebt eine zentrale Datenkontrolle an, um eine einheitliche Sicht auf die Daten zu gewähren.
In Bezug auf Datensicherheit liegt beim Data Mesh die Verantwortung bei den einzelnen Teams, während eine Data Fabric eine zentralisierte Datensicherheit ermöglicht. Data Mesh betont die Eigenverantwortung der Teams in Bezug auf Data Governance, während die Data Fabric eine zentralisierte Data Governance umfassen kann. Data Mesh ist für komplexe und skalierende Datenlandschaften geeignet, während eine Data Fabric die durchgängige Verbindung und Verarbeitung großer Datenmengen über unterschiedliche Systeme hinweg erleichtern soll.
Trotz der unterschiedlichen Schwerpunkte von Data Mesh und Data Fabric können die beiden Ansätze kombiniert werden, um eine durchgängige Datenstrategie zu entwickeln und Nutzen aus beiden Ansätze zu generieren. Eine Möglichkeit besteht darin, eine Data Fabric als grundlegende Dateninfrastruktur zu implementieren, auf der das Data-Mesh-Konzept basiert. Dadurch erhält man eine einheitliche Sicht auf die Daten, ermöglicht Datenintegration über verschiedene Systeme hinweg und unterstützt die Skalierbarkeit der Dateninfrastruktur. So haben die Teams im Data Mesh eine solide Grundlage, um auf qualitativ hochwertige und integrierte Daten zuzugreifen und brauchen sich nicht um die technischen Aspekte der Datenintegration zu sorgen.
Ein alternativer Ansatz ist es, Teile des Data Mesh in die Data Fabric Strategie zu implementieren. Konkret bedeutet dies, dass die Verantwortung für die Daten nicht lediglich auf zentrale Einheiten, sondern auch auf die einzelnen Teams in der Data Fabric verteilt wird. Dabei wird jedes Team dabei zu einem sogenannten „Data Product Owner“ für die Daten, welche es verwaltet. Dieser Ansatz bestärkt die dezentrale Verantwortung und Zusammenarbeit, wie es gemäß dem Data Mesh Konzepts bestimmt ist. Zeitgleich wird durch die Data Fabric die Infrastruktur sichergestellt, sodass die Datenintegration, Datenqualität und Data Governance über alle Teams hinweg konsistent und effizient sind.
Ähnlich wie eine Data Fabric beschreibt auch ein Data Lake einen Ansatz einer Datenarchitektur, welche sich zu einer Data Fabric oder einem Data Mesh unterscheidet, jedoch auch einige Gemeinsamkeiten aufweist. Ein Data Lake ist ein zentraler Speicher, der eine große Menge unstrukturierter und strukturierter Daten aus verschiedenen Quellen aufnimmt. Es bietet eine kostengünstige Möglichkeit, Daten zu speichern, bevor sie analysiert oder in andere Systeme geladen werden. In einem Data Lake können Daten leicht zusammengeführt und analysiert werden, was ihn zu einem wertvollen Werkzeug für Big-Data-Analysen macht.
Im Gegensatz dazu ist ein Data Mesh dezentralisiert, da es die Verantwortung für die Daten auf die datenbesitzenden Teams in den Domänen verteilt. Jedes Team ist für die Verwaltung seiner eigenen Daten verantwortlich und stellt sie anderen Teams über standardisierte Schnittstellen zur Verfügung. Dadurch wird eine engere Integration zwischen den Geschäftsbereichen und den Daten selbst erreicht, was die Agilität und Flexibilität erhöht.
Obwohl ein Data Mesh und ein Data Lake (sowie auch eine Data Fabric) verschiedene Herangehensweisen darstellen, können sie in manchen Situationen miteinander verbunden werden. Zum Beispiel könnte ein Data Lake als Grundlage dienen, auf der die Prinzipien von Data Mesh oder Data Fabric angewendet werden, um eine dezentrale Datenverantwortung oder eine einheitliche Dateninfrastruktur zu ermöglichen. Alternativ könnte ein Data Lake als zentrale Datenquelle fungieren, welche für verschiedene Domänen dienlich ist. Auch innerhalb eines Data Mesh können einzelne Teams und Domänen ihre eigenen Data Lakes generieren, um so ihre Daten zu organisieren.
Das Data Mesh Konzept basiert auf den folgenden 4 Prinzipien:
Als modernes Architekturkonzept dezentralisiert das Data Mesh die Datenverwaltung in Unternehmen und stellt Daten dort bereit, wo sie entstehen.Dadurch sollen Silos aufgebrochen, die Datenqualität verbessert und datengesteuerte Prozesse beschleunigt werden. Wie jedes Konzept bringt jedoch auch das Data Mesh sowohl Vorteile als auch Herausforderungen mit sich, welche wir im Folgenden genauer beleuchten.
In großen Unternehmen benötigen Abteilungen wie Marketing, Finanzen oder Operations oft eigene, kontextspezifische Datenanalysen. Mit Data Mesh verwalten die jeweiligen Teams ihre Datenprodukte selbst und stellen sie in hoher Qualität bereit. Dadurch entfällt die Abhängigkeit von einer zentralen Datenabteilung und Entscheidungen werden schneller getroffen.
Data Mesh betrachtet Daten als Produkte, die klar definiert, dokumentiert und für andere Teams wiederverwendbar sind. Ein E-Commerce-Unternehmen kann beispielsweise ein standardisiertes Bestell-Datenprodukt entwickeln, das neben Transaktionsdetails auch Informationen zu Lieferstatus, Retouren und Zahlungsarten enthält. Dieses Datenprodukt kann dann von der Logistik genutzt werden, um Lieferketten zu optimieren, und vom Kundensupport, um Anfragen schneller und präziser zu bearbeiten. So entsteht aus einem einmal gepflegten Datenprodukt ein Mehrwert für mehrere Unternehmensbereiche.
Teams können auf qualitätsgesicherte Datenprodukte anderer Domänen zugreifen, ohne lange Wartezeiten durch zentrale IT-Prozesse. Dies ermöglicht schnelle A/B-Tests, Pilotprojekte oder Marktexperimente. Unternehmen steigern dadurch ihre Agilität und bringen neue Ideen rascher zur Marktreife.
In diesem Fall entwickelt nicht nur ein zentrales Data-Science-Team KI-Modelle. Auch Fachbereiche wie HR, Marketing oder Risikomanagement können eigene Machine-Learning-Anwendungen direkt auf ihren Domänendaten trainieren. Die Nähe zu den Daten erhöht die Präzision und fachliche Relevanz der Modelle, während gemeinsame Standards gleichzeitig sicherstellen, dass Governance- und Sicherheitsanforderungen eingehalten werden.
Die Einführung eines Data Mesh erfordert eine sorgfältige Planung und eine schrittweise Umsetzung. Nachfolgend wird der Standardablauf des Implementierungsprozesses eines Data Mesh in einem Unternehmen beschrieben:
Es bestehen verschiedene Lösungen und Tools, welche Unternehmen dabei unterstützen, ein Data Mesh erfolgreich einzusetzen:
Mit einem Data Mesh greift man auf ein Konzept zur dezentralen Datenarchitektur zurück, welches darauf abzielt, die Datenverwaltung zu verbessern. Es verbindet Dateneigentümer, -produzenten und -konsumenten, indem es Daten als Produkte betrachtet und die Selbstbedienungsfähigkeit fördert. Aufgrund der Vorteile eines Data Mesh wie beispielsweise der guten Skalierbarkeit, der Demokratisierung von Daten, der Reduzierung technischer Schulden oder der Interoperabilität kann diese dezentrale Datenarchitektur Unternehmen einen großen Nutzen bringen. In Kombinationen mit ähnlichen Ansätzen wie einer Data Fabric oder einem Data Lake können Unternehmen ihre Datenverwaltung verbessern, die Zusammenarbeit zwischen den Teams fördern und von den Vorteilen einer dezentralen Datenarchitektur profitieren.
Diesen Beitrag teilen: