fbpx
Home Data Warehousing Was ist ein Data Warehouse (DW)?

Was ist ein Data Warehouse (DW)?

Unter einem Data Warehouse ist eine unternehmensweite Datenbasis zu verstehen, welche Daten aus verschiedenen heterogenen Datenquellen integriert und zu Analyse- und Auswertungszwecken bereitstellt. Ein gut konzipiertes Data Warehouse liefert einen hohen Datendurchsatz, führt Abfragen schnell durch und bietet den Endnutzern die Möglichkeit, die Daten in kleinere Teile zu zerlegen, um sie aus verschiedenen Blickwinkeln betrachten zu können. 

Mehr zum Aufbau und zur Frage, warum man ein Data Warehouse benötigt, gibt es in diesem Wiki-Artikel.

 

Was sind die vier wesentlichen Charakteristika eines Data Warehouse (DW)?

 Die Datenstruktur in einem DW dient zur Unterstützung von Managemententscheidungen und ist nicht auf die Unterstützung von operativen Geschäftsprozessen ausgerichtet. Die Daten werden nach bestimmten Objekten wie z. B. Kunde oder Produkt gespeichert. Entscheidungsträger analysieren die Daten dieser Objekte und treffen ihre Entscheidungen auf deren Basis. 

Die Daten werden aus verschiedenen heterogenen Datenquellen in einen gemeinsamen Datenbestand integriert. Für die Integration müssen die Daten in eine einheitliche Datenstruktur und ein gemeinsames Datenformat überführt werden. 

In einem DW werden die gespeicherten Daten weder gelöscht noch modifiziert. Lediglich zur Beseitigung von Fehlern können die Daten in einem DW geändert werden. Im Laufe der Zeit entsteht so ein historischer Datenbestand, der sich aus den Daten der einzelnen operativen Anwendungssysteme zusammensetzt.

Die Daten werden zu unterschiedlichen Zeitpunkten in ein DW geladen. Die neu geladenen Datensätze überschreiben nicht den alten Datenbestand, sondern ergänzen diesen lediglich. Dadurch entsteht jedes Mal eine Momentaufnahme des Unternehmensgeschehens. Dementsprechend lassen sich die Daten über unterschiedliche Zeiträume miteinander vergleichen und Trends identifizieren. 

Was hat der Begriff Business Intelligence (BI) mit Data Warehousing zu tun?

Business Intelligence (BI) umfasst den Zugriff auf Informationen mithilfe von IT-Systemen. Die Analyse, Auswertung und Darstellung der geschäftsrelevanten Unternehmensdaten soll Erkenntnisse über den aktuellen Unternehmensstand liefern. Diese Erkenntnisse tragen massgeblich zur strategischen und operativen Entscheidungsunterstützung bei. Ziel ist es, dem Management hochqualitative Daten zur Verfügung zu stellen und bei seinen Entscheidungen bestmöglich zu unterstützen.

Was ist ein Datenbankmanagementsystem?

  • Ein Datenbankmanagementsystem – auch kurz Datenbanksystem genannt – ist für die Verwaltung grosser Informationsmengen konzipiert worden.
  • Das primäre Ziel eines Datenbanksystems ist es, einen möglichst effizienten und bequemen Weg zum Speichern und Abrufen von Datenbankinformationen zu ermöglichen.
  • Ein Datenbanksystem ist eine organisierte Sammlung von elektronisch strukturierten Informationen oder Daten, die in einem Computersystem gespeichert sind. Innerhalb einer Datenbank können die Daten einfach verwaltet, verändert, aktualisiert und abgerufen werden. 
  • Die Kernaufgabe einer Datenbank liegt in der effizienten, dauerhaften und fehlerfreien Speicherung grosser Datenmengen sowie der bedarfsgerechten Bereitstellung der benötigten Informationen. 

Warum ist der Begriff „Cloud Computing“ wichtig beim Thema Data Warehouse (DW)?

  • Der Name Cloud Computing ist eine Metapher für das Internet. Das Internet wird typischerweise in Netzwerkdiagrammen als Wolke dargestellt.
  • Das Wolkensymbol steht für unbekannte Netzinfrastrukturen, die das Netzwerk zum Funktionieren bringen.
  • Eine der wohl aktuell anerkanntesten Definitionen des Cloud Computing ist die der National Institute of Standards and Technology (NIST), die auch in Fachkreisen oft herangezogen wird. Das NIST definiert Cloud Computing als ein Modell, welches den allgegenwärtigen, bequemen und bedarfsgerechten Netzwerkzugriff auf einen gemeinsam genutzten Pool konfigurierbarer Rechenressourcen (z. B. Netzwerk, Server, Anwendungen, Dienste und Speicher) ermöglicht.
  • Diese Rechenressourcen können mit minimalem Verwaltungsaufwand oder Interaktion mit dem Dienstanbieter schnell bereitgestellt und freigegeben werden. 

Das Cloud-Modell setzt sich aus drei Dienstmodellen zusammen:

  1. Infrastructure-as-a-Service
  2. Platform as a Service und
  3. Software-as-a-Service).

Das sind die vier Bereitstellungsmodellen von Cloud Computing:

  1. Private,
  2. Public,
  3. Hybrid und
  4. Community Cloud.
  • Im Gegensatz zum Cloud Computing werden Data Warehouse Lösungen auch on-premise zur Verfügung gestellt. 
  • „On-Premises“ bedeutet im Deutschen so viel wie „in den eigenen Räumlichkeiten“ oder „vor Ort“
  • Die Beschreibung von on-premise bezieht sich auf die Nutzung eigener Server und einer eigenen IT-Umgebung.
  • Während der Zugriff in der Cloud über das Internet erfolgt, werden on-premise Lösungen lokal auf dem eigenen Rechner betrieben. 

Mehr wissen?

Sie möchten tiefer in dieses Thema einsteigen? Dann freuen wir uns, Ihnen alle Elemente des Data Warehousings persönlich zu präsentieren – sehr gerne auch kombiniert mit Details zu weiteren Funktionen der SAP Data Warehouse Cloud. Nehmen Sie einfach Kontakt mit uns auf!

Ihre Ansprechpartnerin für Data Warehousing
Nadine Matt_2
Nadine Matt
Customer Engagement & Communication Executive

Published by:

Paul Vatter

Leiter Datenwerkstatt

autor:IN

Wie hat Ihnen der Artikel gefallen?

Wie hilfreich war dieser Beitrag?

Klicken Sie auf einen Stern, um zu bewerten!

Durchschnittliche Bewertung 0 / 5.
Anzahl Bewertungen: 0

Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!

INFORMATIONEN

Weitere Informationen

SAP Analysis for Microsoft Office vs. SAP Analytics Cloud Excel Add-In: Funktionen und Unterschiede

Dieser Artikel vergleicht die Features und Einsatzmöglichkeiten von SAP Analysis for Microsoft Office (AfO) und dem SAP Analytics Cloud (SAC)…

Wiki Big Query SAP Warehousing

Google BigQuery vs. SAP Warehousing

In diesem Wiki-Artikel werden zwei führende Lösungen für die Datenverwaltung und -analyse in der modernen datengetriebenen Welt vorgestellt: Google BigQuery und SAP BW. Beide Systeme bieten leistungsstarke Funktionen, unterscheiden sich jedoch in ihren Ansätzen und Einsatzbereichen.

Wiki SAC GCP Excelimport

SAC & GCP Excel-Import

Der Artikel beschreibt die SAC & GCP Lösung, mit der Excel Plandaten einfach und komfortabel in SAP Analytics Cloud (SAC) Modelle importiert werden können. Mit Hilfe von Excel-Templates und einer benutzerfreundlichen Web-Applikation werden die Daten lokal aufbereitet und über die SAC Data Import API automatisiert in das SAC-Modell übertragen.

Titelbild Wiki Was ist Artificial Intelligence (AI) (1)

Was ist Artificial Intelligence (AI)?

Artificial Intelligence steht für Künstliche Intelligenz (KI). Und da es keine allgemein anerkannte philosophische Definition von Intelligenz gibt, lassen sich auch unterschiedliche Auffassungen darüber finden, was Künstliche Intelligenz ist…

Titelbild Wiki Was ist Machine Learning (ML)

Was ist Machine Learning (ML)?

Machine Learning ist die Antwort auf eine der Fragestellungen an eine schwache Künstliche Intelligenz. Es handelt sich um ein fundamentales Konzept, um Algorithmen zu studieren, die sich selbst automatisch aufgrund von Erfahrungen (unter Verwendung von Daten) verbessern…

Wiki How to R - Beginners Guide (1)

How to R – Beginner Guide Zeitreihenanalyse

Wir beschränken uns in diesem kleinen Tutorial darauf, die wesentlichen Schritte in der Zeitreihenanalyse kurz in der Programmiersprache R zu skizzieren…

EU Taxonomie Wiki

EU Taxonomie – Implentierung in einem SAP-Analytics-System

Von der KPI Definition bis zum Reporting: Bewerten Sie Ihre Unternehmens-Aktivitäten Umsatz, CapEx und OpEx gemäss den EU Taxonomie Kriterien. Wir begleiten Sie Schritt für-Schritt bei der erfolgreichen Umsetzung der EU Taxonomie Richtlinien…

GDPR Cookie Consent with Real Cookie Banner