Accueil Entreposage de données Google BigQuery : Les bases essentielles

Google BigQuery, le moteur de recherche : Les bases essentielles

Wiki Introduction à Google BigQuery

Avec BigQuery, Google vend un outil d'entreposage qui doit pouvoir remplacer les systèmes établis. L'article suivant explique quels sont les avantages concrets de Google BigQuery, comment le traitement des données fonctionne avec lui et comment la combinaison avec des produits SAP peut fonctionner.

Table des matières

Une introduction à Google BigQuery

Vous envisagez de migrer votre entrepôt de données vers Google BigQuery ? Vous trouverez ci-dessous les réponses aux principales questions qui se posent lors de la prise de décision.

Qu'est-ce que Google BigQuery exactement ?

BigQuery est un entrepôt de données basé sur le cloud, géré par Google, qui permet d'interroger des téraoctets de données en quelques secondes. BigQuery peut être utilisé pour optimiser les analyses SQL, fusionner des ensembles de données provenant de plusieurs sources et analyser rapidement et facilement de grands ensembles de données.

Comment fonctionne Google BigQuery ?

BigQuery fonctionne en diffusant des données d'entrée dans des tables temporaires en mémoire. Ces tables sont ensuite interrogées à l'aide du langage SQL et les résultats sont ensuite renvoyés à l'utilisateur. Ce processus permet des vitesses de traitement des données très rapides.

Combien coûte BigQuery ?

Le modèle de prix de BigQuery est basé sur un paiement à l'utilisation. Celui-ci se compose d'une part du volume de données à stocker (prix du stockage) et d'autre part du volume de requêtes (prix de l'analyse). Pour les clients, le premier 1 TB de données traitées par mois ainsi que les premiers 10 Go de mémoire sont gratuits. Ensuite, les coûts s'élèvent à environ 0,02 CHF par Go stocké et à environ 5 CHF par 1 TB analysé. Il est en outre possible d'acheter des slots (= unités centrales virtuelles) réservés de manière fixe via des prix forfaitaires. Cela offre par exemple aux entreprises ayant un volume de données important une plus grande sécurité des prix et peut être combiné avec les modèles de prix à la demande.

Quel est le dialecte SQL utilisé par BigQuery ?

Le Google Standard Dialect, mais le Legacy SQL est également pris en charge (principalement à des fins de rétrocompatibilité).

Où les données sont-elles stockées dans BigQuery ?

BigQuery est disponible dans de nombreuses régions(voir ici) - entre autres à Zurich (europe-west6). Par conséquent, toutes les données restent en Suisse.

Quels sont les principaux avantages de BigQuery ?

Google BigQuery offre plusieurs avantages par rapport aux solutions traditionnelles, notamment en termes de vitesse, d'évolutivité et d'intégration dans ML & BI.

Vitesse

Le Big Data pose de grands défis, notamment lorsqu'il s'agit d'analyser ces données et de les transformer. Les solutions traditionnelles nécessitent des processus ETL (= extraire, transformer, charger) qui prennent beaucoup de temps pour déplacer et préparer les données avant l'analyse. Avec Google BigQuery, aucun traitement préalable n'est nécessaire. L'avantage réside donc dans le fait que chaque jeu de données peut être interrogé en quelques secondes. La transformation elle-même a lieu directement dans BigQuery. Par conséquent, les cycles de BI (Business Intelligence) deviennent plus rapides, ce qui permet d'obtenir des informations en moins de temps.

Évolutivité

La croissance d'une entreprise s'accompagne d'un besoin croissant d'outils d'analyse plus puissants, capables de traiter des volumes de données toujours plus importants. BigQuery est un service d'entrepôt de données entièrement géré par Google. Cela signifie que les entrepreneurs n'ont pas à se soucier de la mise à disposition de ressources ou de la gestion de l'infrastructure. L'architecture de BigQuery prévoit une séparation claire entre le stockage et le calcul (c'est-à-dire les calculs/transformations). Cela permet une mise à l'échelle (automatique) séparée du stockage et du calcul en fonction du cas d'utilisation. Comme BigQuery prend en charge le traitement parallèle, il est possible de procéder à une mise à l'échelle quasiment infinie à court terme.

Intégration dans ML & BI

En tant qu'élément central de l'infrastructure de données de Google Cloud, BigQuery est parfaitement intégré dans l'environnement système de GCP. Ainsi, des modèles de Machine Learning peuvent par exemple être mis en place directement dans BigQuery via BigQuery ML et être traités par d'autres services Google comme Vertex AI.

Combinaison de Google Cloud BigQuery et de solutions SAP

SAP Analytics Cloud est un outil de Business Intelligence basé sur le cloud qui permet de créer des rapports et des tableaux de bord interactifs à partir de données spécifiques. Il s'intègre aussi bien avec des systèmes SAP qu'avec des systèmes non-SAP et facilite ainsi l'aperçu des processus commerciaux importants. Par exemple, Google BigQuery peut être facilement intégré dans un paysage de reporting SAC, ou des rapports et des tableaux de bord peuvent être créés sur la base des données BigQuery dans le SAC.

Conclusion

Google BigQuery séduit avant tout par la rapidité du traitement et de la préparation de grandes quantités de données. Les processus ETL fastidieux et chronophages appartiennent ainsi au passé. Grâce à sa structure dynamique, l'outil est modulable de manière flexible, de même que les coûts peuvent être facturés de manière dynamique. L'utilisation de Google BigQuery peut offrir un avantage décisif, en particulier en relation avec d'autres produits de la Google Cloud Platform (GCP).

En savoir plus ?

Vous avez encore des questions ou vous êtes intéressé par l'introduction de Google Analytics dans votre entreprise ? Dans ce cas, nous nous réjouissons d'un échange personnel. N'hésitez pas à prendre contact avec nous !

 

Votre contact Analytics
Christiane Kalfass-sPeers Mood Print-150
Spécialiste en recrutement et marketing

Publié par :

Christian Blessing

Consultant senior en analyse

autor:IN

Cet article vous a-t-il plu ?

Cet article vous a-t-il été utile ?

Cliquez sur une étoile pour évaluer !

Note moyenne 4.9 / 5.
Nombre d'évaluations : 10

Aucun vote pour l'instant ! Soyez la première personne à noter ce post !

INFORMATIONS

Plus d'informations

Visual Databricks et BDC Wiki

Databricks + BDC = ❤

Dans le monde des affaires actuel, axé sur les données, la capacité d'analyser et d'utiliser efficacement de grandes quantités de données est...
wiki_Au revoir les malentendus L'art d'une communication de projet réussie

Adieu les malentendus : l'art d'une communication de projet réussie

Une communication efficace est essentielle à la réussite d'un projet. Vous ...
Wiki sur le sujet. Analytique embarquée

SAP Analytique embarquée

SAP Embedded Analytics est en quelque sorte un reporting opérationnel performant en...
Photo de couverture WIKI SAC vs. Power Bi

SAP Analytics Cloud (SAC) vs. Power BI - Le reporting du futur

Les possibilités de reporting qui incluent la Business Intelligence sont nombreuses. Nous...
Le lien entre le SAC et le DSP

Seamless Planning combine SAC et DSP

L'intégration transparente de SAP Analytics Cloud (SAC) et de SAP Datasphere (DSP) optimise, accélère et simplifie vos processus de planification. Ainsi...
Wiki gestion de projet

3 étapes pour une gestion réussie des parties prenantes

La gestion des parties prenantes est un facteur de réussite essentiel pour tout projet. Elle...
Contenu professionnel dans SAP Datasphere - Wiki Visual

Contenu métier dans SAP Datasphere - Les meilleures pratiques pour progresser rapidement

SAP Datasphere propose, comme SAP BW ou SAP Analytics Cloud, un contenu commercial prédéfini. Celui-ci se compose de modèles de données...