Google BigQuery, le moteur de recherche : Les bases essentielles
- Entreposage de données, Google Analytics
- Data Warehousing, google, Google BigQuery, sap
- 3 min de lecture
Christian Blessing
Avec BigQuery, Google vend un outil d'entreposage qui doit pouvoir remplacer les systèmes établis. L'article suivant explique quels sont les avantages concrets de Google BigQuery, comment le traitement des données fonctionne avec lui et comment la combinaison avec des produits SAP peut fonctionner.
Une introduction à Google BigQuery
Vous envisagez de migrer votre entrepôt de données vers Google BigQuery ? Vous trouverez ci-dessous les réponses aux principales questions qui se posent lors de la prise de décision.
Qu'est-ce que Google BigQuery exactement ?
BigQuery est un entrepôt de données basé sur le cloud, géré par Google, qui permet d'interroger des téraoctets de données en quelques secondes. BigQuery peut être utilisé pour optimiser les analyses SQL, fusionner des ensembles de données provenant de plusieurs sources et analyser rapidement et facilement de grands ensembles de données.
Comment fonctionne Google BigQuery ?
BigQuery fonctionne en diffusant des données d'entrée dans des tables temporaires en mémoire. Ces tables sont ensuite interrogées à l'aide du langage SQL et les résultats sont ensuite renvoyés à l'utilisateur. Ce processus permet des vitesses de traitement des données très rapides.
Combien coûte BigQuery ?
Le modèle de prix de BigQuery est basé sur un paiement à l'utilisation. Celui-ci se compose d'une part du volume de données à stocker (prix du stockage) et d'autre part du volume de requêtes (prix de l'analyse). Pour les clients, le premier 1 TB de données traitées par mois ainsi que les premiers 10 Go de mémoire sont gratuits. Ensuite, les coûts s'élèvent à environ 0,02 CHF par Go stocké et à environ 5 CHF par 1 TB analysé. Il est en outre possible d'acheter des slots (= unités centrales virtuelles) réservés de manière fixe via des prix forfaitaires. Cela offre par exemple aux entreprises ayant un volume de données important une plus grande sécurité des prix et peut être combiné avec les modèles de prix à la demande.
Quel est le dialecte SQL utilisé par BigQuery ?
Le Google Standard Dialect, mais le Legacy SQL est également pris en charge (principalement à des fins de rétrocompatibilité).
Où les données sont-elles stockées dans BigQuery ?
BigQuery est disponible dans de nombreuses régions(voir ici) - entre autres à Zurich (europe-west6). Par conséquent, toutes les données restent en Suisse.
Quels sont les principaux avantages de BigQuery ?
Google BigQuery offre plusieurs avantages par rapport aux solutions traditionnelles, notamment en termes de vitesse, d'évolutivité et d'intégration dans ML & BI.
Vitesse
Le Big Data pose de grands défis, notamment lorsqu'il s'agit d'analyser ces données et de les transformer. Les solutions traditionnelles nécessitent des processus ETL (= extraire, transformer, charger) qui prennent beaucoup de temps pour déplacer et préparer les données avant l'analyse. Avec Google BigQuery, aucun traitement préalable n'est nécessaire. L'avantage réside donc dans le fait que chaque jeu de données peut être interrogé en quelques secondes. La transformation elle-même a lieu directement dans BigQuery. Par conséquent, les cycles de BI (Business Intelligence) deviennent plus rapides, ce qui permet d'obtenir des informations en moins de temps.
Évolutivité
La croissance d'une entreprise s'accompagne d'un besoin croissant d'outils d'analyse plus puissants, capables de traiter des volumes de données toujours plus importants. BigQuery est un service d'entrepôt de données entièrement géré par Google. Cela signifie que les entrepreneurs n'ont pas à se soucier de la mise à disposition de ressources ou de la gestion de l'infrastructure. L'architecture de BigQuery prévoit une séparation claire entre le stockage et le calcul (c'est-à-dire les calculs/transformations). Cela permet une mise à l'échelle (automatique) séparée du stockage et du calcul en fonction du cas d'utilisation. Comme BigQuery prend en charge le traitement parallèle, il est possible de procéder à une mise à l'échelle quasiment infinie à court terme.
Intégration dans ML & BI
En tant qu'élément central de l'infrastructure de données de Google Cloud, BigQuery est parfaitement intégré dans l'environnement système de GCP. Ainsi, des modèles de Machine Learning peuvent par exemple être mis en place directement dans BigQuery via BigQuery ML et être traités par d'autres services Google comme Vertex AI.
Combinaison de Google Cloud BigQuery et de solutions SAP
SAP Analytics Cloud est un outil de Business Intelligence basé sur le cloud qui permet de créer des rapports et des tableaux de bord interactifs à partir de données spécifiques. Il s'intègre aussi bien avec des systèmes SAP qu'avec des systèmes non-SAP et facilite ainsi l'aperçu des processus commerciaux importants. Par exemple, Google BigQuery peut être facilement intégré dans un paysage de reporting SAC, ou des rapports et des tableaux de bord peuvent être créés sur la base des données BigQuery dans le SAC.
Conclusion
Google BigQuery séduit avant tout par la rapidité du traitement et de la préparation de grandes quantités de données. Les processus ETL fastidieux et chronophages appartiennent ainsi au passé. Grâce à sa structure dynamique, l'outil est modulable de manière flexible, de même que les coûts peuvent être facturés de manière dynamique. L'utilisation de Google BigQuery peut offrir un avantage décisif, en particulier en relation avec d'autres produits de la Google Cloud Platform (GCP).
Vous avez encore des questions ou vous êtes intéressé par l'introduction de Google Analytics dans votre entreprise ? Dans ce cas, nous nous réjouissons d'un échange personnel. N'hésitez pas à prendre contact avec nous !
Publié par :
Christian Blessing
Consultant senior en analyse
Christian Blessing
Cet article vous a-t-il plu ?
Cet article vous a-t-il été utile ?
Cliquez sur une étoile pour évaluer !
Note moyenne 4.9 / 5.
Nombre d'évaluations : 10
Aucun vote pour l'instant ! Soyez la première personne à noter ce post !