Home Databricks BDC Connect: Der direkte Draht zu Databricks, Snowflake und Co.

BDC Connect: Der direkte Draht zu Databricks, Snowflake und Co.

Die Integration von SAP-Daten in moderne Cloud-Plattformen wie Databricks oder Snowflake gleicht oft einem Hürdenlauf: Komplexe ETL-Prozesse, kostspielige Datenkopien und der Verlust wertvoller Geschäftslogik sind die Regel. Doch damit ist jetzt Schluss. SAP läutet mit BDC Connect eine neue Ära ein, in der der direkte Live-Zugriff auf Daten ohne Replikation zum Standard wird. Hier wird beschrieben, wie dieser Paradigmenwechsel funktioniert und Ihre Datenstrategie revolutioniert.

Inhaltsverzeichnis 

1. Problemstellung: Die Sackgasse der Legacy-Architekturen

Historisch gewachsene Integrationsansätze leiden unter massiven Effizienzverlusten. Traditionelle ETL-Prozesse führen dazu, dass Daten physisch kopiert werden müssen, was nicht nur Speicherplatz beansprucht, sondern auch die Integrität der Informationen gefährdet.

Ein Kernproblem ist der «semantische Kollaps»: Wenn SAP-Tabellen isoliert extrahiert werden, gehen wertvolle Metainformationen wie Hierarchien, Währungsumrechnungslogiken und Geschäftsregeln verloren. Diese müssen in den Zielplattformen mühsam rekonstruiert werden, was oft zu Inkonsistenzen führt. Zudem führt die zeitversetzte Replikation dazu, dass Entscheidungen auf veralteten Datenständen getroffen werden.

Herausforderung

Legacy (ETL und Replikation)

Modern (BDC Connect und Zero-Copy)

Aufwand

Hoher Ressourcenverbrauch für Pipeline-Bau

Fokus auf Datenprodukte und Analysen

Daten

Zeitversetzte Kopien und Latenz

Live-Zugriff auf die Quellsysteme

Semantik

Verlust von Hierarchien und Logik

Erhalt des Business-Kontexts (ORD und CSN)

Kosten

Hohe Speicher- und Transferkosten

Minimierte TCO durch Zero-Copy-Ansatz

Governance

Fragmentierte Katalog-Silos

Zentrale Kontrolle und Universal Governance

2. Strategische Konnektivität: Partner und Roadmap

SAP BDC Connect ist als offene Architektur konzipiert, die verschiedene Ökosysteme miteinander verbindet. Dies ermöglicht es Unternehmen, ihre bevorzugte Analyseplattform zu nutzen, während die Datenhoheit bei SAP verbleibt. Die Plattformen werden entweder als OEM-Lösungen (tief integriert) oder als Solution Extensions (SOLEX) angebunden.

Partnerplattform

Status (April 2026)

Strategischer Fokus

Databricks

General Availability (GA)

Advanced AI und Pro-Code ML Umgebungen

Snowflake

GA H1 2026 (SOLEX)

Enterprise Data Warehousing und Skalierbarkeit

Google BigQuery

GA H1 2026

Cloud-native Analytics und Google Ökosystem

Microsoft Fabric

GA H2 2026

Nahtlose Azure OneLake Harmonisierung

3. Technischer Deep Dive: Das Zero-Copy Delta Sharing Protokoll

Das Herzstück von BDC Connect ist das Delta-Sharing-Protokoll. Es handelt sich um den ersten offenen Standard für sicheres Data Sharing, der eine hohe Interoperabilität über verschiedene Cloud-Plattformen hinweg gewährleistet. Im Gegensatz zu klassischen Schnittstellen arbeitet dieses Protokoll direkt auf der Speicherebene des Cloud-Objektspeichers.

Der Prozess beginnt mit einem Metadaten-Handshake, bei dem Schema- und Partitionsinformationen ausgetauscht werden. Anstatt die Daten physisch zu bewegen, generiert der BDC Connect Server kurzzeitig gültige, kryptografisch gesicherte Links (Pre-signed URLs) direkt zum zugrunde liegenden Speicher. Die Compute-Engine des Zielsystems nutzt diese URLs, um die Datenpakete parallel und mit maximaler Bandbreite zu lesen. Dadurch entfällt die Notwendigkeit eines zwischengeschalteten Integrations-Servers, was die Skalierbarkeit nahezu unbegrenzt erhöht.

Ergänzt wird dies durch die Standards ORD (Open Resource Discovery) und CSN (Core Schema Notation). Diese sorgen dafür, dass die Zielplattform nicht nur Rohdaten empfängt, sondern auch deren Bedeutung versteht. Felder werden automatisch typisiert, Beziehungen erkannt und Geschäftsbeschreibungen übernommen.

4. Nutzungsrichtlinien: Rechte und Einschränkungen

Um die Compliance und die Performance der Architektur zu gewährleisten, hat SAP klare Richtlinien für die Verwendung von BDC Connect definiert. Diese regeln den Umgang mit den bereitgestellten Datenprodukten in Drittsystemen.

Richtlinie

Status

Beschreibung

Consume

Erlaubt

Abfrage, Analyse und Visualisierung der Datenprodukte im Zielsystem.

Materialize

Eingeschränkt

Nur temporäres Caching zur Performance-Optimierung gestattet.

Distribute

Untersagt

Keine Weitergabe der SAP-Daten an Systeme außerhalb des BDC-Verbunds.

Es ist wichtig zu beachten, dass transformierte oder angereicherte Daten (Enrichment) als neue, eigenständige Objekte gelten. Sobald die ursprüngliche SAP-Information durch Verknüpfung mit Fremddaten oder durch AI-gestützte Verarbeitung verändert wurde, unterliegt sie nicht mehr den Materialisierungsbeschränkungen und kann dauerhaft im Zielsystem persistent gespeichert werden.

5. Identitätsmanagement und Universal Governance

Ein zentrales Anliegen für CIOs und CSOs ist die durchgängige Sicherheit. BDC Connect löst das Problem fragmentierter Sicherheitskonzepte durch eine durchgängige Identitätskette. Hierbei arbeiten verschiedene Verzeichnisdienste und Authentifizierungsprotokolle Hand in Hand.

Microsoft Entra ID dient als primäre Quelle für alle Benutzeridentitäten. Über das Identity Provisioning System (IPS) werden diese Informationen automatisiert in den SAP Cloud Identity Service (IAS) synchronisiert. Der entscheidende Vorteil dieser Architektur liegt in der Integration mit Katalogen wie dem Unity Catalog oder Snowflake Horizon. Da diese Systeme dieselben Identitäten verwenden, können granulare Zugriffsrechte auf Zeilen- und Spaltenebene definiert werden, die konsistent über die gesamte hybride Landschaft hinweg wirken.

Komponente

Aufgabe im Sicherheitskonzept

Microsoft Entra ID

Zentrale Quelle der Wahrheit für alle Identitäten

SAP IPS

Automatisierte Synchronisation der Identitätsdaten

SAP IAS

Authentifizierung für alle SAP-Cloud-Dienste

Unity Catalog / Horizon

Durchsetzung granulärer Zugriffsrechte auf Datenbankebene

6. Kostenmodell und Wirtschaftlichkeit

Die Preisgestaltung für SAP Business Data Cloud Connect ist modular aufgebaut und basiert auf einem Drei-Säulen-Modell:

  1. Capacity Units für die Basislizenzierung,
  2. Infrastructure Fees für den technischen Betrieb und
  3. Premium-Fees für spezialisierte Partner-Workloads. 

Um die Wirtschaftlichkeit eines Projekts bewerten zu können, ist es entscheidend zu verstehen, welches System welche Gebühren zu welchem Zeitpunkt auslöst.

6.1. Kommerzieller Vergleich der Partnermodelle

Je nachdem, wie ein Drittsystem angebunden ist (als Kernkomponente, Solution Extension oder externer Konnektor), ergeben sich unterschiedliche Kostenstrukturen. Die folgende Tabelle gibt Aufschluss darüber, ob Infrastructure Fees oder Premium Fees anfallen.

Datenprodukt-Konsument

Infrastructure Fees

Premium Fees

Beschreibung des Modells

SAP Datasphere in BDC Core

Nein

Nein

Vollständig in der BDC-Kernlizenz enthalten.

SAP Databricks in BDC Core

Nein

Nein

OEM-Variante, keine zusätzlichen Konnektorgebühren.

SAP Snowflake (SOLEX)

Ja

Nein

Solution Extension; Abrechnung über SAP, Infrastrukturkosten fallen an.

Databricks (Standard/Connect)

Ja

Nein

Bestehende Kundeninstanz via BDC Connect.

Google BigQuery

Ja

Nein

Cloud-native Anbindung via BDC Connect.

Snowflake (Standard/Connect)

Ja

Ja

Bestehende Kundeninstanz; unterliegt dem Premium-Uplift.

Microsoft Fabric

Ja

Ja

Nahtlose Anbindung; unterliegt dem Premium-Uplift.

6.2. Detaillierte Gebührenstruktur

Infrastructure Fees werden für den technischen Betrieb des Datenaustauschs erhoben. Sie unterteilen sich in Kosten für den Datentransfer und Kosten für die Prozessierung der Anfragen.

  • Inter-Region Data Transfer: Diese Gebühr wird nur fällig, wenn Daten aus der SAP BDC über Hyperscaler-Grenzen (z. B. Azure nach AWS) oder Regionsgrenzen (z. B. EU-West nach US-East) hinweg geteilt werden. Der Datentransfer innerhalb derselben Region auf demselben Hyperscaler bleibt in der Regel kostenfrei.
  • Processing Requests: Hierbei handelt es sich um API-Aufrufe. Jede Anfrage des Zielsystems an den BDC Connect Server zur Bereitstellung von Daten wird gezählt.

Gebührenkategorie

Kapazitätsservice

Einheit

Wert in BDC CU

Infrastruktur

Inter-Region Data Transfer

1 GB

0.185

Infrastruktur

Processing Requests

2.500 API-Aufrufe

0.055

6.3. Premium Fees und Compute-Uplift

Die Premium Fee wird für ausgewählte Partner (aktuell Snowflake und Microsoft Fabric) erhoben. Sie stellt einen Aufschlag dar, der auf dem Wert des Rechenaufwands basiert, den die SAP-Daten im Zielsystem verursachen.

Der Prozess für die Berechnung der Premium Fee bei Snowflake sieht beispielsweise wie folgt aus: Snowflake überwacht die Nutzung der SAP-Datenprodukte und identifiziert die Rechenlast (Workload), die direkt mit diesen Daten verknüpft ist. Periodisch meldet Snowflake den Nettopreis, den der Kunde für diese spezifischen Workloads gezahlt hat, an SAP. SAP nutzt diese Information als Basis und berechnet einen Uplift in BDC Capacity Units, der vom Kundenkontingent abgezogen wird. Es ist zu erwarten, dass dieser effektive Uplift – je nach Rabattstufe der BDC – bei über 40 Prozent der Rechenkosten auf der Partnerseite liegt.

7. Fallstudie: Realisierung eines Cashflow-Forecasts

Der Nutzen dieser Architektur zeigt sich deutlich am Beispiel einer Liquiditätsvorhersage.

Dieses Szenario verdeutlicht den Prozess von der Rohdatenbereitstellung bis zum analytischen Mehrwert:

  1. Datenbereitstellung: S/4HANA stellt relevante Finanzdaten als semantisch reiches Datenprodukt zur Verfügung.
  2. Zero-Copy Zugriff: Via BDC Connect erhält die Databricks-Umgebung sofortigen Live-Zugriff auf diese Daten ohne jegliche Replikation.
  3. Advanced Analytics: Ein Data Scientist trainiert ein ML-Modell in Databricks, welches die SAP-Daten mit externen Marktdaten anreichert.
  4. Feedback-Loop: Die Prognoseergebnisse werden als angereichertes Datenprodukt zurück an die Business Data Cloud übermittelt.
  5. Entscheidungsgrundlage: Das Management konsumiert die finalen Insights nahtlos in der SAP Analytics Cloud (SAC) auf Basis einer Echtzeit-Datenquelle.

8. Fazit und Ausblick

SAP BDC Connect bietet die optimale Balance zwischen Flexibilität, Kontrolle und Kosteneffizienz. Es ermöglicht Unternehmen, ihre Investitionen in SAP-Software mit den Möglichkeiten moderner Cloud-Innovationen zu verbinden. Während spezialisierte OEM-Lösungen wie SAP Databricks die höchste Integrationstiefe bieten, gewährleistet BDC Connect die Einbindung in eine universelle Unternehmensstrategie. Der zukünftige Fokus liegt auf der Unterstützung weiterer Datenformate wie Apache Iceberg, um die Offenheit der Plattform weiter zu stärken.

Haben Sie Fragen zu den Kosten, Partnern oder der Implementierung? Keine Datenlandschaft ist wie die andere. Lassen Sie uns gemeinsam herausfinden, wie SAP BDC Connect den entscheidenden Wettbewerbsvorteil für Ihr Unternehmen freisetzen kann. Wir freuen uns auf den Austausch.

Published by:

Dr. Andreas Wagner

Customer Success Executive

autor:IN

Wie hat Ihnen der Artikel gefallen?

Wie hilfreich war dieser Beitrag?

Klicken Sie auf einen Stern, um zu bewerten!

Durchschnittliche Bewertung 5 / 5.
Anzahl Bewertungen: 1

Bislang keine Stimmen! Seien Sie die erste Person, die diesen Beitrag bewertet!

INFORMATIONEN

Weitere Informationen

Sapphire Opinion Piece Header with Michael May

Sapphire 2026: Von Reporting und Planning zu Directing

Die Sapphire Announcements 2026 habenordentlich Wellen geschlagen, aber was bedeutet es wirklich für Unternehmen? Während die meisten Kommentatoren über...

Die Raumstation: Medallion-Architektur als Herzstück der Lakehouse-Mission

Wie funktioniert das in der Datasharing mit SAP und Databricks? Die strategische Partnerschaft zwischen SAP und Databricks ermöglicht eine...

Mission Control: Die Architektur des Databricks Unity Catalog im modernen Enterprise-Datennetzwerk

Wie funktioniert das in der Datasharing mit SAP und Databricks? Die strategische Partnerschaft zwischen SAP und Databricks ermöglicht eine...
_Snowflake AI Data Cloud

Snowflake AI Data Cloud

Mit SAP Business Data Cloud (BDC) hat die SAP ihre neue strategische Plattform für Data & AI inzwischen erfolgreich...

Was ist SAP S/4HANA?

SAP S/4HANA ist mehr als ein technisches Upgrade – es ist eine grundlegende Systemtransformation. In diesem Artikel erfahren Sie,...

AI meets BI: Modernes Reporting im Databricks Lakehouse

In der traditionellen IT-Welt existieren oft zwei getrennte Universen: Die Business Intelligence (BI), die sich mit der Analyse historischer...
Symbolbild für Datenformate in Databricks. Ein Icon stellt den schichtweisen Aufbau von Parquet-Dateien mit einer darüberliegenden Delta-Lake-Schicht dar.

Der richtige Treibstoff: Die Evolution der Tabellenformate im Lakehouse

Die Auswahl des richtigen Datenformats ist ein kritischer, aber oft unterschätzter Faktor für die Performance und Effizienz in Databricks....