Big Data –  Grundlagen, Methoden & Erfolgsfaktoren

Big Data – Grundlagen, Methoden & Erfolgsfaktoren

Big Data ist längst aus dem berühmten Hype-Cycle von Gartner verschwunden und gehört vielleicht auch nicht mehr zu den beliebtesten Buzzwords. Dennoch ist Big Data nach wie vor eines der wichtigsten Themen in Data-Science-Projekten. Umso wichtiger ist es, immer wieder nach aktuellen Technologien, den Chancen sowie den Erfolgs- und Risikofaktoren zu fragen. Laut Bitkom priorisieren deutsche Unternehmen das Thema Big Data inzwischen mehrheitlich und stufen Big Data neben Robotics und dem Internet of Things als wichtig für ihre Wettbewerbsfähigkeit ein.

(more…)
Der Beruf „Data Scientist“: Berufsbild, Data Scientist Ausbildung, Studium und Training on the Job

Der Beruf „Data Scientist“: Berufsbild, Data Scientist Ausbildung, Studium und Training on the Job

Data Scientist Ausbildung – Mit dem massiv steigenden Datenaufkommen in Unternehmen und Organisationen sowie dem damit verbundenen Bedarf an Datenanalysen steigt der Bedarf an Fachleuten. Ein Berufsbild, das damit in enger Verbindung steht und etwa vom Harvard Business Review als „Sexiest Job of the 21st Century“ bezeichnet wurde, ist der Data Scientist. In diesem Zuge stellt sich auch die Frage nach der Data Scientist Ausbildung, Möglichkeiten des Trainings on the Job und passenden Studiengängen.

Bedarf und Mangel von Data Scientists

Warum mangelt es am Markt an Data Scientists? Der Frage nach dem Mangel sollte die Frage vorausgehen, wie der Begriff Data Scientist interpretiert wird. Es lässt sich grob zwischen zwei Berufsbildern unterscheiden:

  • Enterprise Data Scientist: Stellt gewissermaßen einen Mix aus Betriebswirtschaftler, IT-Spezialist, Statistiker und Kommunikationsexperte darstellt.
  • Academic Data Scientist: Entwickelt reine Algorithmen und arbeitet mit „idealen“ Daten und ist weniger praxis- als methodisch orientiert.

Im Enterprise-Umfeld kommt es eher selten vor, dass ein gänzlich neuer Algorithmus entwickelt wird. Vielmehr werden bestehende Konzepte an die konkrete Problemstellung angepasst oder erweitert, da eine vollständige Neuentwicklung von Modellierungsverfahren häufig zu lange dauert.

Eine Studie von McKinsey Global zeigt, dass der Bedarf allein in den USA im kommenden Jahr das Angebot bei Weitem übersteigen wird. Eine Schwierigkeit, die in den bloßen Zahlen nicht zum Ausdruck kommt: Es gibt nicht das eine Berufsbild des Data Scientists oder nur eine spezielle Data Scientist Ausbildung. Die Anforderungen in den jeweiligen Branchen sind höchst unterschiedlich. Daher stellt sich die konkrete Frage: Welche verschiedenen Möglichkeiten bieten sich in Deutschland für eine Data Scientist Ausbildung und wie sieht der Berufsalltag aus?

Data Science Definition

Data Science – also die Wissenschaft von den Daten – ist zunächst ein Bündel aus verschiedenen Disziplinen wie Informatik, Mathematik, Betriebswirtschaftslehre und Statistik. Der Ursprung des Faches ist nicht, wie man annehmen könnte, die Universität, sondern es entwickelte sich im Zuge der sich ändernden Bedürfnisse aus der Wirtschaft heraus. Daher begründet sich auch der hohe Praxisbezug des Berufsbildes sowie der Wissenschaft der Data Science und nicht zuletzt auch der Data Scientist Ausbildung.

Ganz allgemein gesagt geht es bei Data Science darum, Daten mit wissenschaftlichen Methoden zu untersuchen und im Kontext von Unternehmen und Organisationen einzusetzen. Das Anforderungsprofil an einen Data Scientist wächst entsprechend durch die Einbettung seiner Tätigkeit in Unternehmen.

Berufsbild des Data Scientist ist geprägt von der Praxis

Data Scientists sind nicht nur mit der Auswertung von Daten beschäftigt, sondern müssen betriebswirtschaftliche Zusammenhänge verstehen und die Ergebnisse kommunizieren können. Der Großteil des Tagesgeschäftes eines Data Scientist besteht jedoch darin, geeignete Datenquellen zu identifizieren und zusammenzustellen sowie die Analysen vorzubereiten und durchzuführen.

Ein Data Scientist trägt zum Teil große Verantwortung, da von den Ergebnissen der Datenanalysen viel abhängen kann. Darum ist es von enormer Wichtigkeit die zugrundeliegenden Daten immer wieder auf Plausibilität, Vollständigkeit, Korrektheit und Relevanz zu überprüfen.

Bildquelle: http://www.marketingdistillery.com

Probleme lösen wie ein Detektiv

Der „Enterprise Data Scientist“ lässt sich erneut untergliedern in interne Data Scientists, die bei Unternehmen angestellt sind, und externe Data Scientists, die beratend tätig sind. Die Externen werden vor dem Hintergrund von Digitalisierung und Industrie 4.0 beispielsweise häufig von Strategiegremien konsultiert.

Als Dienstleister arbeiten sie zudem mit den unterschiedlichen Fachabteilungen in einem Unternehmen zusammen, erstellen Root-Cause-Analysen zu bestimmten Fragestellungen oder fungieren als „Sparringspartner“ für interne Data Scientists. In dieser Funktion haben sie einen unvoreingenommenen Blick auf Sachverhalte, können frische Ideen einbringen und Fachabteilungen Alternativen aufzeigen, an die diese vielleicht vorher noch nicht gedacht haben. Sie bieten Unternehmen zudem aktiv Hilfe an, erheben Fragestellungen bzw. machen Fachbereiche erst auf mögliche Lösungen aufmerksam.

Schlussendlich übersetzen Data Scientists Anforderungen in abstrakte datenbasierte Fragestellungen und entwickeln daraufhin Lösungen, die konkrete Geschäftsfragestellungen beantworten. Das Vorgehen basiert auf Hypothesen, die verworfen oder bestätigt werden. Diese hypothesengetriebene, experimentelle Arbeitsweise ähnelt sehr dem wissenschaftlichen Arbeiten und so erklärt sich auch der Begriff des Data Scientist.

Es ist auch der Mut gefragt, Problemstellungen zu hinterfragen: Was soll überhaupt erreicht werden und warum? Auf der Suche nach der Lösung für sehr kniffelige Probleme agiert der Data Scientist somit fast wie eine Art Spitzendetektiv.

Führt man sich dieses umfassende und sehr anspruchsvolle Anforderungsprofil vor Augen, wird schnell klar, warum ein Mangel an Data Scientists herrscht. Die Kombination aus sehr gut ausgeprägten kommunikativen Fähigkeiten und großem technischen Know-how stellt eine große Hürde dar.

Good to Know:
Gartner wie auch McKinsey gehen davon aus, dass die Nachfrage nach Data Scientists 2017 bereits 60 % größer sein wird als das bestehende Angebot. IDC beziffert die Anzahl an benötigten Data Scientists bis 2018 auf etwas mehr als eine Million und sieht parallel dazu das Fünffache an Bedarf an Mitarbeitern, die gute Skills im Bereich Datenmanagement und Dateninterpretation aufweisen können.

Mittlerweile entstehen daher an vielen Orten in Deutschland, der Schweiz und Österreich (Aufbau-) Studiengänge und Weiterbildungsmöglichkeiten für Data Scientist. Der Erfolg dieser Maßnahmen muss sich aber noch in der Realität beweisen. Oft klafft hier noch eine Lücke zwischen Theorie und Praxis. Weltweit bieten wenige Firmen daher auch Traineeprogramme für Data Science und Trainee-Programme für Data Engineers an.

Technisches Know-how und kommunikative Stärke

Die Grundlage bilden gute Kenntnisse der Informatik, Betriebswirtschaftslehre, Mathematik und Statistik. Ein Data Scientist muss daher:

  • Betriebswirtschaftliche Vorgänge verstehen können
  • Ergebnisse von Analysen zu interpretieren
  • Datengenerierenden Prozesse nachzuvollziehen

Aber auch das tiefgreifende Verständnis von Datenstrukturen, -banken und -modellen sind zwingende Kompetenzen. Hinzu kommen die programmiertechnischen Fähigkeiten, um mit diesen Daten auch arbeiten bzw. interagieren zu können. Dies umfasst u.a. die Verknüpfung verschiedener Datenquellen, die Erstellung komplexer Abfragen und die Beherrschung sehr großer Datenmengen.

Statistische und analytische Fähigkeiten kommen dann ins Spiel, wenn aus historischen Daten Vorhersagen über zukünftige Ereignisse abgeleitet werden sollen. Auch die Fähigkeit, Prozesse zu verstehen und zu analysieren bzw. Daten und Analyse-Ergebnisse visuell aufzubereiten, ist sehr wichtig.

Abgerundet wird das Profil durch eine hohe Problemlösungskompetenz und gute Kommunikationsfähigkeiten. Diese sind erforderlich, da komplexe Sachverhalte und Modelle so kommuniziert werden müssen, dass Management, Anwender und Kunde der Lösung vertrauen, und damit Kundenperspektive und Vision auf dem Weg durch den Datendschungel nicht verloren gehen. Denn es geht darum, die Geschichte zu erzählen, die in diesen Daten steckt, und das für jede Zielgruppe passend und relevant verpackt.

Forschung und Studium: Data Science an deutschen Universitäten

Auch wenn Data Science sich aus der Wirtschaft heraus entwickelte, gehört die wissenschaftliche Beschäftigung mit dem Thema heute zum festen Bestandteil der Universitätslandschaft in Deutschland. Die unterschiedlichen Forschungsbereiche, in denen Data Science Anwendung findet, zeigen, wie universell einsatzfähig die Methoden der Datenwissenschaften sind. Angefangen von der Medizin über die Geisteswissenschaften bis hin zu Weltraumforschung finden sich zahlreiche Forschungsgebiete, in denen Datenanalysen neue Erkenntnisse bringen.

Gleichzeitig bieten die Universitäten und Fachhochschulen damit eine Möglichkeit der Data Scientist Ausbildung. Inzwischen bieten bereits über 20 Universitäten und Hochschulen in Deutschland und Österreich Data Science Studiengänge an. Dabei handelt es sich mehrheitlich um Masterstudiengänge.

Wer diesen Weg wählt, um Data Scientist zu werden, sollte bei seinem Studium darauf achten, sich Kenntnisse in den folgenden fünf Bereichen anzueignen:

  1. Analytics
  2. Data Management
  3. Informations-Design & Kommunikation
  4. Entrepreneurship
  5. IT

In unserem Artikel zu “Studium Künstliche Intelligenz und Data Science” findest du mehr Informationen zum Studienangebot für Bachelor und Master.

Das Interesse an Digitalberufen steigt stark an

In Deutschland ist der Beruf Data Scientist so beliebt wie kein anderer. Das ergab vor Kurzem auch eine Datenanalyse des Jobportals Glassdoor. Dabei wurden etwa eine halbe Million Suchanfragen ausgewertet. Neben dem Data Scientist, der auf Platz 1 aller Anfragen landete, sind insgesamt 5 neue, digitale Berufe unter den Top 10 gelandet. Unter anderem auch der Software Entwickler (Platz 4), der Data Analyst (Platz 8) und der UX Designer (Platz 9). Auch das Job-Portal Monster.de verzeichnete eine Verdoppelung der Suchanfragen nach dem Beruf Data Scientist in den vergangenen Monaten.

Laut einer aktuellen Studie der Jobplattform „Jobfit“ ist nicht nur eine starke Zunahme bei der Nachfrage nach Data Scientists zu verzeichnen. Die Analyse von mehr als 64.000 Stellenanzeigen hat ergeben, dass vor allem ein akademischer Hintergrund zum Standard der Ausschreibungen gehört und Soft Skills wie Kommunikationsstärke, Teamfähigkeit und Kreativität noch vor Kenntnissen wie SQL oder Machine Learning gefragt sind.

Diese Qualifikationen werden derzeit am meisten gefragt, wenn Unternehmen nach einem Data Scientist suchen. (Quelle: Jobfit)

Data Scientist Ausbildung, Weiterbildung und „Training on the Job“

Das Studium ist aber nicht der einzige Weg, um ein Data Scientist zu werden. Vielmehr bietet sich hier eine große Chance für Ingenieure, Wirtschaftswissenschaftler, Statistiker, Mathematiker oder verwandter Fachgebiete. Kommerzielle Anbieter wie die Fraunhofer Gesellschaft bietet Schulungen, Kurse und Weiterbildungen an, in denen gezielt einzelne Fähigkeiten erlernt werden können. Der Vorteil dieser alternativen Ausbildungswege für die Data Scientist Ausbildung ist, dass oft schon Praxiswissen aus bestimmten Bereichen vorhanden ist. Wer die entsprechenden Voraussetzungen mitbringt, kann sich auch im Rahmen eines Trainee-Programms Schlüsselqualifikationen aneignen.

Auch Schulungen für Einsteiger oder unsere Data Academy stellen eine gute Möglichkeit zur ersten Annäherung in Richtung einer Data Scientist Ausbildung dar. Darüber hinaus ist es uns von der Alexander Thamm GmbH ein Anliegen, unsere Kunden und die Mitarbeiter unserer Partnerunternehmen durch Trainings und Schulungen zu befähigen, den Mehrwert aus ihren Daten zu realisieren.

Data Scientist Ausbildung

Mit dem Beruf des Data Scientists verbinden sich viele Hoffnungen und Chancen. Die Berufsbezeichnungen und die Ausbildungswege sind in dem noch jungen Betätigungsfeld zum Teil noch uneinheitlich, spiegeln aber die große Vielfalt der Einsatzgebiete von Data Scientists wider. Vom Marketing bis hin zur Industrie 4.0 ist alles möglich.

Der hohe Spezialisierungsgrad macht es zudem schwierig, eine einheitliche Berufsausbildung oder ein einheitliches Studium als goldenen Weg zu etablieren beziehungsweise zu empfehlen. Denn gerade diese große Bandbreite und die hohe Praxisrelevanz macht den Beruf und die Data Scientist Ausbildung zu einer attraktiven Karriereoption. Facharbeiter und Spezialisten aus einem bestimmten Bereich können sich durch geeignete Maßnahmen weiterbilden und so einen zukunftsträchtigen und derzeit mit am meisten gefragten Jobs erhalten.

Den perfekten Data Scientist gibt es nicht

Natürlich bringen sich Fachkräfte in Projekten entsprechend ihrer jeweiligen Stärken und Vorzüge unterschiedlich ein und Data Scientists entwickeln bei ihrer Arbeit auch eigene Schwerpunkte. Grundsätzlich werden jedoch von allen Bewerbern im Data Science-Bereich alle diese unterschiedlichen Fähigkeiten gefordert und gefördert.

Den perfekten Data Scientist haben wir übrigens noch nicht gesehen und wenn man die Summe aller Fähigkeiten nimmt und diese ins Verhältnis zur rasanten technologischen Entwicklung stellt, wird es den perfekten Data Scientist wahrscheinlich auch nie geben. Vielmehr geht es darum, dass ein Data Scientist die Klammer bildet, um datengetriebene Fragestellungen von Anfang bis Ende lösen zu können und Experten wie Statistiker oder Data Engineers zielbringend einzusetzen.

Wenn beispielsweise der Kollege aus dem Fachbereich mit der „Performance“ seiner Arbeit unzufrieden ist, dann muss der Data Scientist in der Lage sein, folgende Sichtweisen zu verstehen:

  1. Business-Sichtweise: Sind z.B. meine Projektziele gefährdet?
  2. Daten-Sichtweise: Laufen meine Datenbankabfragen zu langsam?
  3. Analytics-Sichtweise: Ist die Prognosegüte / Modellperformanz zu schlecht oder ist die Datenvisualisierung in der Anzeige der Daten zu langsam?

Ohne den Data Scientist würden die Experten hier stundenlang darüber brüten, was denn der Kollege wohl gemeint haben könnte.

Fazit: Ein Beruf mit Zukunft

Die Voraussetzungen für einen Data Scientist sind ausgezeichnet: sehr gute Verdienstmöglichkeiten, ein vielfältiger, facettenreicher Aufgabenbereich und vor allem großes Zukunftspotenzial. Obwohl es in Unternehmen noch einige Widerstände zu überwinden gilt – Stichwort „Silodenken“ – und es oft eine Frage der Unternehmenskultur ist, ob sich Digitalisierungsansätze durchsetzen, der „Megatrend“ Digitalisierung ist schon lange kein Trend mehr, sondern eine sich exponentiell beschleunigende Entwicklung, die nicht mehr aufzuhalten ist.

Intelligente Maschinen z.B. werden mehr und mehr Tätigkeiten von Menschen übernehmen, auch im kognitiven Bereich, etwa bei der Mustererkennung und Ideengenerierung. Hier geht es nicht darum, Menschen zu ersetzen, sondern jeweilige Fähigkeiten und Prozesse sinnvoll zu ergänzen. Gerade deshalb wird der Bedarf an Data Scientists weiter steigen.

Mit deren Expertise wird es zukünftig möglich sein, mit intelligenten Maschinen zusammen und nicht gegen sie zu arbeiten. Denn sie schaffen es, die betriebswirtschaftlich oder technisch orientierte Fragestellung in eine datengetriebene Fragestellung zu übersetzen – und das ist ohne fundierte Bewertung und Erarbeitung von Erkenntnissen nicht möglich.

In absehbarer Zeit wird kaum ein Unternehmen mehr auf die Dienste von Data Scientists verzichten können, denn Big Data und Datenanalysen werden nicht mehr nur „nice to have“ sondern entscheidend für den Geschäftserfolg und die Konkurrenzfähigkeit sein. Deshalb muss weiter intensiv in die Ausbildung von Fachkräften investiert werden.