Home Data Warehousing Google BigQuery: Die wichtigsten Basics

Google BigQuery: Die wichtigsten Basics

Mit BigQuery verkauft Google ein Warehousing Tool, das etablierte Systeme ersetzen können soll. Welche konkreten Vorteile Google BigQuery bietet, wie die Datenverarbeitung damit funktioniert und wie die Kombination mit SAP-Produkten funktionieren kann, erläutert der folgende Wissensartikel.

Inhaltsverzeichnis

Eine Einführung in Google BigQuery

Sie ziehen in Erwägung, Ihr Data Warehouse zu Google BigQuery zu migrieren? Im Folgenden werden die wichtigsten Fragen, die im Zuge der Entscheidungsfindung aufkommen, beantwortet.

Was genau ist Google BigQuery?

BigQuery ist ein von Google verwaltetes cloudbasiertes Data Warehouse, mit dem Terabytes an Daten in Sekundenschnelle abgefragt werden können. BigQuery kann verwendet werden, um SQL-Analysen zu optimieren, Datensets aus mehreren Quellen zusammenzuführen und schnell und einfach große Datensätze zu analysieren.

Wie funktioniert Google BigQuery?

BigQuery funktioniert durch das Streamen von Eingabedaten in temporäre Tabellen im Arbeitsspeicher. Die Tabellen werden dann mit der SQL-Sprache abgefragt, und die Ergebnisse anschließend an den Benutzer zurückgesendet. Dieser Prozess ermöglicht sehr schnelle Datenverarbeitungsgeschwindigkeiten.

Wie viel kostet BigQuery?

Das Preismodell für BigQuery basiert auf nutzungsbasierter Bezahlung. Diese setzt sich zum einen aus zu speicherndem Datenvolumen (Speicherpreise), zum anderen aus Abfragevolumen (Analysepreise) zusammen. Für Kunden ist das erste 1 TB an verarbeiteten Daten pro Monat sowie die ersten 10 GB Speicher kostenlos. Danach betragen die Kosten ca. 0,02 CHF pro gespeichertem GB sowie ca. 5 CHF pro analysiertem 1 TB. Darüber hinaus besteht die Möglichkeit über Pauschalpreise, d.h. fest reservierte Slots (=virtuelle CPUs) zu erwerben. Dies bietet z.B. Unternehmen mit hohem Datenvolumen eine erhöhte Preissicherheit und lässt sich mit den On-Demand-Preismodellen kombinieren.

Welchen SQL-Dialect verwendet BigQuery?

Den sogenannten Google Standard Dialect, allerdings wird auch Legacy SQL (primär zwecks rückwärtskompatibilität) unterstützt.

Wo werden die Daten in BigQuery gespeichert?

BigQuery ist in zahlreichen Regionen verfügbar (siehe hier) – unter anderem in Zürich (europe-west6). Folglich bleiben sämtliche Daten in der Schweiz.

Welche wesentlichen Vorteile bringt BigQuery mit sich?

Google BigQuery bietet im Vergleich zu herkömmlichen Lösungen einige Vorteile, unter anderem in den Bereichen Geschwindigkeit, Skalierbarkeit und Integration in ML & BI.

Geschwindigkeit

Big Data bringt große Herausforderungen mit sich – insbesondere, wenn es darum geht, diese Daten zu analysieren und diese zu transformieren. Herkömmliche Lösungen erfordern zeitaufwändige ETL-Prozesse (= Extrahieren, Transformieren, Laden), um die Daten vor der Analyse zu verschieben und vorzubereiten. Mit Google BigQuery ist keine Vorverarbeitung erforderlich. Der Vorteil besteht also darin, dass jeder Datensatz in Sekundenschnelle abgefragt werden kann. Die Transformation selbst findet direkt in BigQuery statt. In Folge dessen werden BI (Business Intelligence)-Zyklen blitzschnell, sodass Erkenntnisse in kürzerer Zeit gewonnen werden können.

Skalierbarkeit

Mit dem Wachstum eines Unternehmens wächst auch der Bedarf an leistungsfähigeren Analysetools, die in der Lage sind, immer größere Datenmengen zu verarbeiten. BigQuery ist ein vollständig von Google verwalteter Data Warehouse-Dienst. Das bedeutet, dass sich Unternehmer keine Gedanken über die Bereitstellung von Ressourcen oder die Verwaltung der Infrastruktur machen müssen. Die Architektur von BigQuery sieht hierbei eine klare Trennung zwischen der Speicherung und Computing (d.h. Berechnungen/Transformationen) vor. Dies ermöglicht eine separate (automatische) Skalierung von sowohl Speicher als auch Computing je nach Use Case. Da BigQuery parallele Prozessierung unterstützt, kann kurzfristig nahezu unendlich skaliert werden.

Integration in ML & BI

Als ein zentraler Baustein der Dateninfrastruktur der Google Cloud ist BigQuery bestens in die GCP-Systemlandschaft eingebunden. So können z.B. über BigQuery ML Machine Learning Modelle direkt in BigQuery aufgesetzt werden und durch weitere Google Services wie Vertex AI weiterverarbeitet werden.

Kombination von Google Cloud BigQuery und SAP-Lösungen

Die SAP Analytics Cloud ist ein Cloud-basiertes Business-Intelligence-Tool, mittels welchem interaktive Berichte und Dashboards aus spezifischen Daten erstellt werden können. Es lässt sich sowohl mit SAP- als auch mit Nicht-SAP-Systemen integrieren und erleichtert so den Einblick in wichtige Geschäftsabläufe. So lässt sich z.B. Google BigQuery einfach in einer SAC-Reporting Landschaft integrieren, oder es können Reports und Dashboards auf Basis der BigQuery Daten in der SAC erstellt werden.

Fazit

Google BigQuery besticht vor allem durch die schnelle Verarbeitung und Aufbereitung von grossen Datenmengen. Mühsame und zeitaufwändige ETL-Prozesse gehören damit der Vergangenheit an. Durch die dynamische Struktur ist das Tool flexibel skalierbar, so wie auch die Kosten dynamisch abgerechnet werden können. Besonders im Zusammenhang mit anderen Produkten der Google Cloud Platform (GCP) kann die Nutzung von Google BigQuery einen entscheidenden Vorteil bieten.

Mehr wissen?

Sie haben noch offene Fragen oder Interesse daran, Google Analytics zu in Ihrem Unternehmen einzuführen? Dann freuen wir uns auf den persönlichen Austausch. Nehmen Sie einfach Kontakt mit uns auf!

 

Ihre Analytics Ansprechpartnerin
Nadine Matt_2
Nadine Matt
Customer Engagement & Communication Executive

Published by:

Christian Blessing

Senior Analytics Consultant

autor:IN

Wie hat Ihnen der Artikel gefallen?

Wie hilfreich war dieser Beitrag?

Klicken Sie auf einen Stern, um zu bewerten!

Durchschnittliche Bewertung 4.9 / 5.
Anzahl Bewertungen: 10

Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!

INFORMATIONEN

Weitere Informationen

Wiki How to R - Beginners Guide (1)

How to R – Beginner Guide Zeitreihenanalyse

Wir beschränken uns in diesem kleinen Tutorial darauf, die wesentlichen Schritte in der Zeitreihenanalyse kurz in der Programmiersprache R zu skizzieren…

EU Taxonomie Wiki

EU Taxonomie – Implentierung in einem SAP-Analytics-System

Von der KPI Definition bis zum Reporting: Bewerten Sie Ihre Unternehmens-Aktivitäten Umsatz, CapEx und OpEx gemäss den EU Taxonomie Kriterien. Wir begleiten Sie Schritt für-Schritt bei der erfolgreichen Umsetzung der EU Taxonomie Richtlinien…

Wiki SCT

Sustainability Control Tower (SCT)

In einer Zeit, in der nachhaltiges Wirtschaften unabdingbar ist, steht die Überwachung und Erfassung der eigenen Nachhaltigkeitsleistung durch präzise Daten immer mehr im Mittelpunkt. Eine umfassende Nachhaltigkeitslösung, die ein ganzheitliches Reporting ermöglicht, ist der SAP Sustainability Control Tower…

Wiki Was ist R

Was ist R?

R ist eine für statistische Anwendungen entwickelte Programmiersprache, die vor allem im Bereich Data Science einen hohen Verbreitungsgrad geniesst…

Wiki 5 Sustainability KPIs

Die 5 wichtigsten Sustainability KPIs

Wozu benötigt man Kennzahlen im Nachhaltigkeitsbereich? Was sind die 5 wichtigsten Sustainability KPIs? Und warum sind Sustainability KPIs wichtig für Ihr Unternehmen? Diese Fragen werden im nachfolgenden Artikel beantwortet…

Wiki Datasphere vs BW4HANA

Vergleich: SAP Datasphere vs. SAP BW/4HANA

Die SAP bietet mit Lösungen wie SAP BW/4HANA und SAP Datasphere unterschiedliche Data-Warehousing-Optionen an. Während BW/4HANA auf strukturierte Unternehmensdaten und Analytik spezialisiert ist, konzentriert sich die Datasphere auf umfassende Datenintegration über Plattformen hinweg…

Wiki Managed Cloud Services

Managed Cloud Services

Managed Cloud Services ermöglichen es Unternehmen, die Vorteile der Cloud-Technologie zu nutzen, ohne sich mit der Komplexität der Cloud-Verwaltung auseinandersetzen zu müssen…

GDPR Cookie Consent with Real Cookie Banner