Was ist ein Data Warehouse (DW)?
- Data Warehousing
- business warehouse, core data store
- 5. August 2021
- 3 Min Lesezeit

Paul Vatter
Definition eines Data Warehouse (DW)
Unter einem Data Warehouse ist eine unternehmensweite Datenbasis zu verstehen, welche Daten aus verschiedenen heterogenen Datenquellen integriert und zu Analyse- und Auswertungszwecken bereitstellt. Ein gut konzipiertes Data Warehouse liefert einen hohen Datendurchsatz, führt Abfragen schnell durch und bietet den Endnutzern die Möglichkeit, die Daten in kleinere Teile zu zerlegen, um sie aus verschiedenen Blickwinkeln betrachten zu können.
Mehr zum Aufbau und zur Frage, warum man ein Data Warehouse benötigt, gibt es in diesem Wiki-Artikel.
Was sind die vier wesentlichen Charakteristika eines Data Warehouse (DW)?
Themenoriertiert
Die Datenstruktur in einem DW dient zur Unterstützung von Managemententscheidungen und ist nicht auf die Unterstützung von operativen Geschäftsprozessen ausgerichtet. Die Daten werden nach bestimmten Objekten wie z. B. Kunde oder Produkt gespeichert. Entscheidungsträger analysieren die Daten dieser Objekte und treffen ihre Entscheidungen auf deren Basis.
Integriert
Die Daten werden aus verschiedenen heterogenen Datenquellen in einen gemeinsamen Datenbestand integriert. Für die Integration müssen die Daten in eine einheitliche Datenstruktur und ein gemeinsames Datenformat überführt werden.
Nicht flüchtig
In einem DW werden die gespeicherten Daten weder gelöscht noch modifiziert. Lediglich zur Beseitigung von Fehlern können die Daten in einem DW geändert werden. Im Laufe der Zeit entsteht so ein historischer Datenbestand, der sich aus den Daten der einzelnen operativen Anwendungssysteme zusammensetzt.
Zeitbezogen
Die Daten werden zu unterschiedlichen Zeitpunkten in ein DW geladen. Die neu geladenen Datensätze überschreiben nicht den alten Datenbestand, sondern ergänzen diesen lediglich. Dadurch entsteht jedes Mal eine Momentaufnahme des Unternehmensgeschehens. Dementsprechend lassen sich die Daten über unterschiedliche Zeiträume miteinander vergleichen und Trends identifizieren.
Was hat der Begriff Business Intelligence (BI) mit Data Warehousing zu tun?
Business Intelligence (BI) umfasst den Zugriff auf Informationen mithilfe von IT-Systemen. Die Analyse, Auswertung und Darstellung der geschäftsrelevanten Unternehmensdaten soll Erkenntnisse über den aktuellen Unternehmensstand liefern. Diese Erkenntnisse tragen massgeblich zur strategischen und operativen Entscheidungsunterstützung bei. Ziel ist es, dem Management hochqualitative Daten zur Verfügung zu stellen und bei seinen Entscheidungen bestmöglich zu unterstützen.
- Für die technische Umsetzung einer BI-Lösung ist ein DW notwendig, die das Fundament einer jeden BI-Lösung bildet.
Was ist ein Datenbankmanagementsystem?
- Ein Datenbankmanagementsystem – auch kurz Datenbanksystem genannt – ist für die Verwaltung grosser Informationsmengen konzipiert worden.
- Das primäre Ziel eines Datenbanksystems ist es, einen möglichst effizienten und bequemen Weg zum Speichern und Abrufen von Datenbankinformationen zu ermöglichen.
- Ein Datenbanksystem ist eine organisierte Sammlung von elektronisch strukturierten Informationen oder Daten, die in einem Computersystem gespeichert sind. Innerhalb einer Datenbank können die Daten einfach verwaltet, verändert, aktualisiert und abgerufen werden.
- Die Kernaufgabe einer Datenbank liegt in der effizienten, dauerhaften und fehlerfreien Speicherung grosser Datenmengen sowie der bedarfsgerechten Bereitstellung der benötigten Informationen.
Warum ist der Begriff „Cloud Computing“ wichtig beim Thema Data Warehouse (DW)?
- Der Name Cloud Computing ist eine Metapher für das Internet. Das Internet wird typischerweise in Netzwerkdiagrammen als Wolke dargestellt.
- Das Wolkensymbol steht für unbekannte Netzinfrastrukturen, die das Netzwerk zum Funktionieren bringen.
- Eine der wohl aktuell anerkanntesten Definitionen des Cloud Computing ist die der National Institute of Standards and Technology (NIST), die auch in Fachkreisen oft herangezogen wird. Das NIST definiert Cloud Computing als ein Modell, welches den allgegenwärtigen, bequemen und bedarfsgerechten Netzwerkzugriff auf einen gemeinsam genutzten Pool konfigurierbarer Rechenressourcen (z. B. Netzwerk, Server, Anwendungen, Dienste und Speicher) ermöglicht.
- Diese Rechenressourcen können mit minimalem Verwaltungsaufwand oder Interaktion mit dem Dienstanbieter schnell bereitgestellt und freigegeben werden.
Das Cloud-Modell setzt sich aus drei Dienstmodellen zusammen:
- Infrastructure-as-a-Service
- Platform as a Service und
- Software-as-a-Service).
Das sind die vier Bereitstellungsmodellen von Cloud Computing:
- Private,
- Public,
- Hybrid und
- Community Cloud.
- Im Gegensatz zum Cloud Computing werden Data Warehouse Lösungen auch on-premise zur Verfügung gestellt.
- „On-Premises“ bedeutet im Deutschen so viel wie „in den eigenen Räumlichkeiten“ oder „vor Ort“.
- Die Beschreibung von on-premise bezieht sich auf die Nutzung eigener Server und einer eigenen IT-Umgebung.
- Während der Zugriff in der Cloud über das Internet erfolgt, werden on-premise Lösungen lokal auf dem eigenen Rechner betrieben.
Mehr wissen?
Sie möchten tiefer in dieses Thema einsteigen? Dann freuen wir uns, Ihnen alle Elemente des Data Warehousings persönlich zu präsentieren – sehr gerne auch kombiniert mit Details zu weiteren Funktionen der SAP Data Warehouse Cloud. Nehmen Sie einfach Kontakt mit uns auf!

Published by:

Paul Vatter
Leiter Datenwerkstatt

Paul Vatter
Wie hat Ihnen der Artikel gefallen?
Wie hilfreich war dieser Beitrag?
Klicken Sie auf einen Stern, um zu bewerten!
Durchschnittliche Bewertung 0 / 5.
Anzahl Bewertungen: 0
Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!