Data Engineering – Grundlagen, Aufgaben und Bedeutung

Data Engineering in Data-Science-Projekten

Data Engineering ist ein Teilbereich von Data-Science-Projekten, dessen wahre Relevanz erst in den letzten Jahren erkannt wurde. Besonders wenn es um das Produktivsetzen von Data Science Use Cases geht, spielt Data Engineering eine Schlüsselrolle. In diesem Grundlagen-Artikel finden Sie relevante Informationen zum Thema Data Engineering.

Weiterlesen

Vielfach unterschätzt, aber unschätzbar wertvoll: Der Data Engineer

Neben dem Data Scientist spielt der Data Engineer eine Schlüsselrolle bei der Datenauswertung.

Data Engineering ist ein Bereich, der immer noch von vielen Unternehmen unterschätzt wird, wenn es darum geht, ihre Daten in Mehrwert zu verwandeln. In diesem Blog-Artikel erfahren Sie, warum der Data Engineer eine Schlüsselposition in Data-Science-Teams einnimmt sowie alles Wesentliche über das Berufsbild und Ausbildungsmöglichkeiten.

Weiterlesen

4 Strategien, die zum Erfolg führen: Anforderungsmanagement in Data-Science-Projekten mit Schwerpunkt auf Visualisierung

Data-Science Anforderungen Visualisierungs-Projekt

Anforderungen in Data-Science-Projekten und deren genaue Analyse sind für das Gelingen von datengetriebenen Projekten von zentraler Bedeutung. Diese sollten vollständig und widerspruchsfrei sein. Der Umgang mit Anforderungen ist ein wesentlicher Erfolgsfaktor in Projekten. Dieser Text präsentiert Strategien, mit denen sich Anforderungen in Data-Science-Projekten mit Visualisierungsanteil optimal ermitteln lassen.

Weiterlesen

Verstärkendes Lernen im Einsatz – Voraussetzungen und Use Cases

Verstärkendes Lernen

Verstärkendes Lernen bzw. Reinforcement Learning ist eine der vielversprechendsten Machine Learning Methoden bzw. im Bereich KI. Nachdem wir uns im zweiten Teil der Artikel-Serie mit dem Stand der Forschung beschäftigt haben, erfahren Sie in diesem dritten und letzten Teil alles Wichtige über den praktischen Einsatz von Verstärkendem Lernen.

Weiterlesen

Transfer Learning am Beispiel von Bildanalysen

Tansfer Learning, Machine Learning

Transfer Learning ist eine von verschiedenen im Bereich Machine Learning angewandten Lernmethoden, um Algorithmen mit den Fähigkeiten auszustatten, die sie für eine bestimmte Aufgabe brauchen. Die bekanntesten und verbreitetsten Lernmethoden sind sicher Unsupervised Machine Learning und Supervised Machine Learning. Dieser Artikel gibt einen Überblick über die wichtigsten Aspekte des Transfer Learning.

Weiterlesen

Mercury-ML: Alexander Thamm startet eigene Python Open-Source-Bibliothek für leicht konfigurierbaren Machine Learning Workflow

Mercury-ML Logo

In der täglichen Zusammenarbeit mit unseren Kunden stehen wir häufig vor der Herausforderung, aus einer Vielzahl verschiedener Open-Source Bibliotheken unterschiedliche Funktionen zu einem maschinellen Lernen Workflow zusammenzuführen. Was als internes Projekt zur Verbesserung unserer eigenen Arbeit begonnen hat, möchten wir nun der Öffentlichkeit als Open-Source Bibliothek unter dem Namen Mercury-ML zur Verfügung stellen.

Weiterlesen

Vom Prototyp zum Data Product: Mit diesen 3 Best Practices gelingt die Produktivsetzung

Prototyp

Von der Idee – z.B. den Online-Verkauf von Produkten zu erhöhen – bis zum fertigen Data Product – z.B. der Implementierung eines operativen Produktempfehlungssystems  auf der Website – muss ein Data-Science-Projekt zahlreiche Schritte durchlaufen. Derzeit scheitern viele Datenprojekte während der Bereitstellungsphase (Deployment Phase). In diesem Stadium wird das Ergebnis der Prototypenphase in ein operatives Data Product überführt und in die jeweiligen Geschäftsprozesse integriert. Dies ist eine der wichtigsten Phasen des Data-Science-Lebenszyklus, da sich hier entscheidet, ob ein Projekt tatsächlich Mehrwert aus Daten generieren kann. Dabei kann ein Projekt in dieser kritischen Phase an mehreren Herausforderungen scheitern.

Weiterlesen

5 Gründe, warum Data-Science-Projekte kaum Mehrwert aus Daten generieren

Kind auf Leiter streckt Hand zum Himmel.

Daten durchdringen heute nahezu jeden Geschäftsprozess. In den vergangenen Jahren haben Unternehmen zunehmend Datenprodukte in Data-Science-Projekten pilotiert. Trotzdem gelingt es in vielen Fällen nicht, diese in den produktiven Einsatz zu bringen und somit Daten langfristig gewinnbringend einzusetzen. Worin genau besteht eigentlich die Schwierigkeit, wenn es darum geht, Mehrwert aus Daten zu generieren?

Weiterlesen

1 2 3 11
top