Home Data Warehousing Google BigQuery: Die wichtigsten Basics

Google BigQuery: Die wichtigsten Basics

Mit BigQuery verkauft Google ein Warehousing Tool, das etablierte Systeme ersetzen können soll. Welche konkreten Vorteile Google BigQuery bietet, wie die Datenverarbeitung damit funktioniert und wie die Kombination mit SAP-Produkten funktionieren kann, erläutert der folgende Wissensartikel.

Inhaltsverzeichnis

1. Eine Einführung in Google BigQuery

Sie ziehen in Erwägung, Ihr Data Warehouse zu Google BigQuery zu migrieren? Im Folgenden werden die wichtigsten Fragen, die im Zuge der Entscheidungsfindung aufkommen, beantwortet.

1.1 Was genau ist Google BigQuery?

BigQuery ist ein von Google verwaltetes cloudbasiertes Data Warehouse, mit dem Terabytes an Daten in Sekundenschnelle abgefragt werden können. BigQuery kann verwendet werden, um SQL-Analysen zu optimieren, Datensets aus mehreren Quellen zusammenzuführen und schnell und einfach große Datensätze zu analysieren.

1.2 Wie funktioniert Google BigQuery?

BigQuery funktioniert durch das Streamen von Eingabedaten in temporäre Tabellen im Arbeitsspeicher. Die Tabellen werden dann mit der SQL-Sprache abgefragt, und die Ergebnisse anschließend an den Benutzer zurückgesendet. Dieser Prozess ermöglicht sehr schnelle Datenverarbeitungsgeschwindigkeiten.

1.3 Wie viel kostet BigQuery?

Das Preismodell für BigQuery basiert auf nutzungsbasierter Bezahlung. Diese setzt sich zum einen aus zu speicherndem Datenvolumen (Speicherpreise), zum anderen aus Abfragevolumen (Analysepreise) zusammen. Für Kunden ist das erste 1 TB an verarbeiteten Daten pro Monat sowie die ersten 10 GB Speicher kostenlos. Danach betragen die Kosten ca. 0,02 CHF pro gespeichertem GB sowie ca. 5 CHF pro analysiertem 1 TB. Darüber hinaus besteht die Möglichkeit über Pauschalpreise, d.h. fest reservierte Slots (=virtuelle CPUs) zu erwerben. Dies bietet z.B. Unternehmen mit hohem Datenvolumen eine erhöhte Preissicherheit und lässt sich mit den On-Demand-Preismodellen kombinieren.

1.4 Welchen SQL-Dialect verwendet BigQuery?

Den sogenannten Google Standard Dialect, allerdings wird auch Legacy SQL (primär zwecks rückwärtskompatibilität) unterstützt.

1.5 Wo werden die Daten in BigQuery gespeichert?

BigQuery ist in zahlreichen Regionen verfügbar (siehe hier) – unter anderem in Zürich (europe-west6). Folglich bleiben sämtliche Daten in der Schweiz.

2. Welche wesentlichen Vorteile bringt BigQuery mit sich?

Google BigQuery bietet im Vergleich zu herkömmlichen Lösungen einige Vorteile, unter anderem in den Bereichen Geschwindigkeit, Skalierbarkeit und Integration in ML & BI.

Geschwindigkeit

Big Data bringt große Herausforderungen mit sich – insbesondere, wenn es darum geht, diese Daten zu analysieren und diese zu transformieren. Herkömmliche Lösungen erfordern zeitaufwändige ETL-Prozesse (= Extrahieren, Transformieren, Laden), um die Daten vor der Analyse zu verschieben und vorzubereiten. Mit Google BigQuery ist keine Vorverarbeitung erforderlich. Der Vorteil besteht also darin, dass jeder Datensatz in Sekundenschnelle abgefragt werden kann. Die Transformation selbst findet direkt in BigQuery statt. In Folge dessen werden BI (Business Intelligence)-Zyklen blitzschnell, sodass Erkenntnisse in kürzerer Zeit gewonnen werden können.

Skalierbarkeit

Mit dem Wachstum eines Unternehmens wächst auch der Bedarf an leistungsfähigeren Analysetools, die in der Lage sind, immer größere Datenmengen zu verarbeiten. BigQuery ist ein vollständig von Google verwalteter Data Warehouse-Dienst. Das bedeutet, dass sich Unternehmer keine Gedanken über die Bereitstellung von Ressourcen oder die Verwaltung der Infrastruktur machen müssen. Die Architektur von BigQuery sieht hierbei eine klare Trennung zwischen der Speicherung und Computing (d.h. Berechnungen/Transformationen) vor. Dies ermöglicht eine separate (automatische) Skalierung von sowohl Speicher als auch Computing je nach Use Case. Da BigQuery parallele Prozessierung unterstützt, kann kurzfristig nahezu unendlich skaliert werden.

Integration in ML & BI

Als ein zentraler Baustein der Dateninfrastruktur der Google Cloud ist BigQuery bestens in die GCP-Systemlandschaft eingebunden. So können z.B. über BigQuery ML Machine Learning Modelle direkt in BigQuery aufgesetzt werden und durch weitere Google Services wie Vertex AI weiterverarbeitet werden.

3. Kombination von Google Cloud BigQuery und SAP-Lösungen

Die SAP Analytics Cloud ist ein Cloud-basiertes Business-Intelligence-Tool, mittels welchem interaktive Berichte und Dashboards aus spezifischen Daten erstellt werden können. Es lässt sich sowohl mit SAP- als auch mit Nicht-SAP-Systemen integrieren und erleichtert so den Einblick in wichtige Geschäftsabläufe. So lässt sich z.B. Google BigQuery einfach in einer SAC-Reporting Landschaft integrieren, oder es können Reports und Dashboards auf Basis der BigQuery Daten in der SAC erstellt werden.

4. Fazit

Google BigQuery besticht vor allem durch die schnelle Verarbeitung und Aufbereitung von grossen Datenmengen. Mühsame und zeitaufwändige ETL-Prozesse gehören damit der Vergangenheit an. Durch die dynamische Struktur ist das Tool flexibel skalierbar, so wie auch die Kosten dynamisch abgerechnet werden können. Besonders im Zusammenhang mit anderen Produkten der Google Cloud Platform (GCP) kann die Nutzung von Google BigQuery einen entscheidenden Vorteil bieten.

Mehr wissen?

Sie haben noch offene Fragen oder Interesse daran, Google Analytics zu in Ihrem Unternehmen einzuführen? Dann freuen wir uns auf den persönlichen Austausch. Nehmen Sie einfach Kontakt mit uns auf!

 

Ihre SAP Analytics Ansprechpartnerin
Nadine Matt_2
Nadine Matt
Inhouse Sales Analytics

Published by:

Christian Blessing

Senior Analytics Consultant

autor:IN

Wie hat Ihnen der Artikel gefallen?

Wie hilfreich war dieser Beitrag?

Klicken Sie auf einen Stern, um zu bewerten!

Durchschnittliche Bewertung 5 / 5.
Anzahl Bewertungen: 9

Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!

ANALYTICS LÖSUNGEN

Erfahren Sie mehr über unsere Analytics Lösungen

INFORMATIONEN

Weitere Informationen

Die Bedeutung der Datenqualität für Analytics

In der Welt der Analytics ist Datenqualität der Schlüssel zum Erkennen relevanter Muster und zum Treffen fundierter Entscheidungen. Nur durch…

Wiki Predictive Controlling

Predictive Controlling: Die automatisierte rollierende Hochrechnung der Erfolgsrechnung im Konzern

Predictive Controlling ermöglicht Vorhersagen durch Datenanalyse und fortschrittliche Modelle. Unternehmen treffen fundierte Entscheidungen, reagieren frühzeitig auf Veränderungen und stärken ihre…

Titelbild Wiki Artikel SAP Data Intelligence

SAP Data Intelligence – Mit Datenintelligenz mehr aus Ihren Daten holen.

Wie können die Daten(-ströme) aus verschiedenen Standorten effizient und intelligent genutzt werden?SAP Data Intelligence erleichtert es Unternehmen, ihre Daten zu…

Wiki ESG Reporting

ESG Reportings: Bedeutung, Relevanz und SAP Lösungen

ESG ist mittlerweile mehr als ein Trend – Unternehmen zeigen damit, welchen Stellenwert das Thema Nachhaltigkeit in ihrer Organisation einnimmt…

Titelbild On-Premise vs. Off-Premise Software Was ist der Unterschied

On-Premise vs. Off-Premise Software: Was ist der Unterschied?

Was ist on- und was ist off-premise Software und was ist der Unterschied? Diese Thematik behandelt der folgende Wissensartikel. Zudem…

Wiki: Eugen im Interview zur BW Bridge

Über eine Brücke musst Du gehen: Funktionen und Überblick der SAP BW Bridge

Die BW Bridge wird von der SAP als Möglichkeit präsentiert, ein System aus einer klassischen on-premise Umgebung in die SAP…

Wiki - The Big 5 - Sustainability Reporting

Die „Big Five“ des Sustainability Reportings

Wer gibt Standards im Bereich der Nachhaltigkeitsberichterstattung vor? Der folgende Wissensartikel befasst sich mit dieser Frage. Es werden fünf verschiedene…

GDPR Cookie Consent with Real Cookie Banner