Es gibt eine Reihe von Fachgebieten, die sich ein gemeinsames Ziel teilen: Daten zu nutzen und diese in Erkenntnisse oder Mehrwert umzusetzen; zum Beispiel indem die Daten visualisiert oder analysiert werden. Diese Fachgebiete sind Business Intelligence (BI), Datenanalyse, Voraussagende/Fortgeschrittene Analyse, Data Mining, Data Science, Statistik und Machine Learning. Alle diese Gebiete sind verbunden und überschneiden sich in großen Teilen, es kann daher schwierig sein sie voneinander abzugrenzen. Unterschiedliche Personen definieren diese deshalb jeweils unterschiedlich. 

Data Science ist wohl das unschärfste Konzept von diesen und hat sich zu einer Art übergreifendem Konzept entwickelt, dass alle anderen Konzepte umfasst. Dies dürfte allerdings keine Überraschung sein, da sich das Konzept auf die Nutzung wissenschaftlicher Methoden und die Umsetzung von Daten in Wissen und Mehrwert bezieht.

Normalerweise werden Methoden der Datenwissenschaft in Unternehmen angewendet. Datenwissenschaft speist sich aus einer Reihe von Disziplinen, vor allem Statistik, Mathematik, Geschäftsanalyse, Computerwissenschaft und Machine Learning. Aufgrund der weiten Definition umfassen die Methoden der Data Science ein weites Feld.

Dazu gehören sowohl viele verschiedene Arten von Analysemethoden und Machine Learning, aber auch die Datenvisualisierung von strukturierten und unstrukturierten Daten. Innerhalb von Unternehmen umfasst die Anwendung der Data Science auch die Analyse von Geschäftsabläufen und Datenvorbereitung. Data Science hat sich seit 2012 sehr stark weiterentwickelt, als das Harvard Business Review Magazin Datenwissenschaftler als „den attraktivsten Job des 21. Jahrhunderts“ bezeichnet hat.

Manche sagen, dass sich die Datenwissenschaft aus BI oder Data Mining entwickelt hat, da es auf einer ähnlichen Idee beruht; tatsächlich wendet sie aber eine größere und weiter entwickelte Zahl von Methoden an, zum Beispiel Machine Learning. Andere, kritischere Stimmen behaupten, dass Data Science nur ein neuer Name für Statistik, BI oder Data Mining ist.