Data Scientist: Mehr als nur „Irgendwas mit Daten“

Der Beruf des Data Scientist wird in unsere Gesellschaft immer wichtiger.

Big Data, Digitalisierung, Industrie 4.0 – schon lange bewegen diese und andere Buzzwords die IT-und Geschäftswelt zugleich. Ein Berufsbild, das damit in enger Verbindung steht und etwa vom Harvard Business Review als „Sexiest Job of the 21st Century“ bezeichnet wurde, ist der Data Scientist.

  • Warum mangelt es trotzdem an ihnen?
  • Was verbirgt sich überhaupt dahinter?
  • Und was muss ein Data Scientist können?

Der Frage nach dem Mangel sollte die Frage vorausgehen, wie der Begriff Data Scientist interpretiert wird. Es lässt sich grob zwischen zwei Berufsbildern unterscheiden.

  • Zum einen der „Enterprise Data Scientist“, der in einem Unternehmen arbeitet und gewissermaßen einen Mix aus Betriebswirtschaftler, IT-Spezialist, Statistiker und Kommunikationsexperte darstellt.
  • Zum anderen der „Academic Data Scientist“, der eher der reinen Algorithmen-Entwicklung zuzuordnen ist, mit „idealen“ Daten arbeitet und weniger praxis- als methodisch orientiert ist.

Im Enterprise-Umfeld kommt es eher selten vor, dass ein gänzlich neuer Algorithmus entwickelt wird. Vielmehr werden bestehende Konzepte an die konkrete Problemstellung angepasst oder erweitert, da eine vollständige Neuentwicklung von Modellierungsverfahren häufig zu lange dauert.

Technisches Know-how und kommunikative Stärke

Was muss ein Data Scientist nun können? Die Grundlage bilden gute Kenntnisse der Informatik, Betriebswirtschaftslehre, Mathematik und Statistik. Ein Data Scientist muss betriebswirtschaftliche Vorgänge verstehen können, um Ergebnisse von Analysen zu interpretieren und die datengenerierenden Prozesse nachzuvollziehen. Aber auch das tiefgreifende Verständnis von Datenstrukturen, -banken und -modellen sind zwingende Kompetenzen. Hinzu kommen die programmiertechnischen Fähigkeiten, um mit diesen Daten auch arbeiten bzw. interagieren zu können. Dies umfasst u.a. die Verknüpfung verschiedener Datenquellen, die Erstellung komplexer Abfragen und die Beherrschung sehr großer Datenmengen.

Statistische und analytische Fähigkeiten kommen dann ins Spiel, wenn aus historischen Daten Vorhersagen über zukünftige Ereignisse abgeleitet werden sollen. Auch die Fähigkeit, Prozesse zu verstehen und zu analysieren bzw. Daten und Analyse-Ergebnisse visuell aufzubereiten, ist sehr wichtig.

Abgerundet wird das Profil durch eine hohe Problemlösungskompetenz und gute Kommunikationsfähigkeiten. Diese sind erforderlich, da komplexe Sachverhalte und Modelle so kommuniziert werden müssen, dass Management, Anwender und Kunde der Lösung vertrauen, und damit Kundenperspektive und Vision auf dem Weg durch den Datendschungel nicht verloren gehen. Denn es geht darum, die Geschichte zu erzählen, die in diesen Daten steckt, und das für jede Zielgruppe passend und relevant verpackt.

Den perfekten Data Scientist gibt es nicht

Natürlich bringen sich Fachkräfte in Projekten entsprechend ihrer jeweiligen Stärken und Vorzüge unterschiedlich ein und Data Scientists entwickeln bei ihrer Arbeit auch eigene Schwerpunkte. Grundsätzlich werden jedoch von allen Bewerbern im Data Science-Bereich alle diese unterschiedlichen Fähigkeiten gefordert und gefördert.

Den perfekten Data Scientist haben wir übrigens noch nicht gesehen und wenn man die Summe aller Fähigkeiten nimmt und diese ins Verhältnis zur rasanten technologischen Entwicklung stellt, wird es den perfekten Data Scientist wahrscheinlich auch nie geben. Vielmehr geht es darum, dass ein Data Scientist die Klammer bildet, um datengetriebene Fragestellungen von Anfang bis Ende lösen zu können und Experten wie Statistiker oder Data Engineers zielbringend einzusetzen.

Wenn beispielsweise der Kollege aus dem Fachbereich mit der „Performance“ seiner Arbeit unzufrieden ist, dann muss der Data Scientist in der Lage sein, folgende Sichtweisen zu verstehen:

  1. Business-Sichtweise: Sind z.B. meine Projektziele gefährdet?
  2. Daten-Sichtweise: Laufen meine Datenbankabfragen zu langsam?
  3. Analytics-Sichtweise: Ist die Prognosegüte / Modellperformanz zu schlecht oder ist die Visualisierung in der Anzeige der Daten zu langsam?

Ohne den Data Scientist würden die Experten hier stundenlang darüber brüten, was denn der Kollege wohl gemeint haben könnte.

Probleme lösen wie ein Detektiv

Der „Enterprise Data Scientist“ lässt sich erneut untergliedern in „interne“ Data Scientists, die bei Unternehmen angestellt sind, und „externe“ Data Scientists, die beratend tätig sind. Die Externen werden vor dem Hintergrund von Digitalisierung und Industrie 4.0 beispielsweise häufig von Strategiegremien konsultiert. Als Dienstleister arbeiten sie zudem mit den unterschiedlichen Fachabteilungen in einem Unternehmen zusammen, erstellen Root-Cause-Analysen zu bestimmten Fragestellungen oder fungieren als „Sparringspartner“ für interne Data Scientists. In dieser Funktion haben sie einen unvoreingenommenen Blick auf Sachverhalte, können frische Ideen einbringen und Fachabteilungen Alternativen aufzeigen, an die diese vielleicht vorher noch nicht gedacht haben. Sie bieten Unternehmen zudem aktiv Hilfe an, erheben Fragestellungen bzw. machen Fachbereiche erst auf mögliche Lösungen aufmerksam.

Schlussendlich übersetzen Data Scientists Anforderungen in abstrakte datenbasierte Fragestellungen und entwickeln daraufhin Lösungen, die konkrete Geschäftsfragestellungen beantworten. Das Vorgehen basiert auf Hypothesen, die verworfen oder bestätigt werden. Diese hypothesengetriebene, experimentelle Arbeitsweise ähnelt sehr dem wissenschaftlichen Arbeiten und so erklärt sich auch der Begriff des Data Scientist. Es ist auch der Mut gefragt, Problemstellungen zu hinterfragen: Was soll überhaupt erreicht werden und warum? Auf der Suche nach der Lösung für sehr kniffelige Probleme agiert der Data Scientist somit fast wie eine Art Spitzendetektiv.

Führt man sich dieses umfassende und sehr anspruchsvolle Anforderungsprofil vor Augen, wird schnell klar, warum ein Mangel an Data Scientists herrscht. Die Kombination aus sehr gut ausgeprägten kommunikativen Fähigkeiten und großem technischen Know-how stellt eine große Hürde dar.

Gartner wie auch McKinsey gehen davon aus, dass die Nachfrage nach Data Scientists 2017 bereits 60% größer sein wird als das bestehende Angebot. IDC beziffert die Anzahl an benötigten Data Scientists bis 2018 auf etwas mehr als eine Millionen und sieht parallel dazu das Fünffache an Bedarf an Mitarbeitern, die gute Skills im Bereich Datenmanagement und Dateninterpretation aufweisen können.

Mittlerweile entstehen daher an vielen Orten in Deutschland, der Schweiz und Österreich (Aufbau-) Studiengänge und Weiterbildungsmöglichkeiten für Data Scientist. Der Erfolg dieser Maßnahmen muss sich aber noch in der Realität beweisen. Oft klafft hier noch eine Lücke zwischen Theorie und Praxis. Weltweit bieten wenige Firmen daher auch Traineeprogramme für Data Science an, so z.B. die Alexander Thamm GmbH in München.

Ein Beruf mit Zukunft

Die Voraussetzungen für einen Data Scientist sind ausgezeichnet: sehr gute Verdienstmöglichkeiten, ein vielfältiger, facettenreicher Aufgabenbereich und vor allem großes Zukunftspotenzial. Obwohl es in Unternehmen noch einige Widerstände zu überwinden gilt – Stichwort „Silodenken“ – und es oft eine Frage der Unternehmenskultur ist, ob sich Digitalisierungsansätze durchsetzen, der „Megatrend“ Digitalisierung ist schon lange kein Trend mehr, sondern eine sich exponentiell beschleunigende Entwicklung, die nicht mehr aufzuhalten ist.

Intelligente Maschinen z.B. werden mehr und mehr Tätigkeiten von Menschen übernehmen, auch im kognitiven Bereich, etwa bei der Mustererkennung und Ideengenerierung. Hier geht es nicht darum, Menschen zu ersetzen, sondern jeweilige Fähigkeiten und Prozesse sinnvoll zu ergänzen. Gerade deshalb wird der Bedarf an Data Scientists weiter steigen. Mit deren Expertise wird es zukünftig möglich sein, mit intelligenten Maschinen zusammen und nicht gegen sie zu arbeiten. Denn sie schaffen es, die betriebswirtschaftlich oder technisch orientierte Fragestellung in eine datengetriebene Fragestellung zu übersetzen – und das ist ohne fundierte Bewertung und Erarbeitung von Erkenntnissen nicht möglich.

In absehbarer Zeit wird kaum ein Unternehmen mehr auf die Dienste von Data Scientists verzichten können, denn Big Data und Datenanalysen werden nicht mehr nur „nice to have“ sondern entscheidend für den Geschäftserfolg und die Konkurrenzfähigkeit sein. Deshalb muss weiter intensiv in die Ausbildung von Fachkräften investiert werden.

Der Beitrag ist zuerst auf IT-Zoom erschienen und kann hier gelesen werden!

 

Melden Sie sich hier für unseren kostenlosen Newsletter an.

Newsletter
 

Tags

top