Eine Data Warehouse ist ein zentrales Datenaufbewahrungssystem, das dazu gedacht ist unternehmensweit alle Daten zu umfassen. Es ist eine themenorientierte, integrierte, zeitabhängige und nicht-flüchtige Sammlung von Daten. Es unterstützt den Entscheidungsfindungsprozess der Führungsebenen, indem es eine zusammenhängende Ansicht aller unternehmensweiten Daten bietet.

Es ist eine architektonische Blaupause, genauer ein logischen (nicht greifbares) Konzept. Die DWH Architektur wird normalerweise über mehrere, abhängige Datenbanksysteme integriert und realisiert. Das Ziel von DWH ist es, alle Daten eines Unternehmens in einem System zu bündeln. Allerdings ist es nicht unüblich für Unternehmen, je nach ihrer Größe, mehrere DWHs zu unterhalten. Die Charakteristika eines DWH sind: 

  • Integriert: Eine Data Warehouse Architektur integriert Daten aus mehreren Datenquellen, die sonst über eine Organisation (oder darüber hinaus) verteilt sind. 
  • Themenorientiert: Das Ziel ist es, seinen Nutzern eine Ansicht spezifischer Themenbereiche zu bieten, z.B. „Verkäufe“, und diese zu analyiseren. 
  • Zeitabhängig: DWHs speichern anfallende Daten permanent. Dementgegen stehen transaktionale Systeme, die jeweils nur die aktuellsten Aufzeichnungen speichern. 
  • Nicht-flüchtig: Das Ziel eines DWH ist es, Daten fortlaufend zu speichern, um ein Bild dessen zu bieten, was passiert ist, und nicht dieses Bild zu verändern. Daher verändern sich Daten, sobald sie im DWH gespeichert sind, üblicherweise nicht mehr. 

Für Jahrzehnte waren Data Warehouse Architekturen die architektonische Lösung der Wahl dafür, wie Daten in einem Unternehmen bewegt und gespeichert werden sollen.

Das Ziel eines DWH ist es die Datenbewegungen in einem Unternehmen, von ihrer Sammlung bis zu ihrer Nutzung, zu organisieren; um dies sicherzustellen ist es eine einheitliche, zentralisierte Lösung, die alle in einem Unternehmen vorhandenen Daten speichert.