Datasphere si propone come la data platform meglio integrata con il mondo SAP, puntando però anche sull'apertura verso i partner tecnologici
Quando si dice che le aziende dovrebbero essere guidate dai dati si va sul sicuro, ma si lascia sullo sfondo una questione che non è affatto banale: per essere "data driven" bisogna avere a disposizione i dati che servono, quando servono (cioè, ormai, costantemente). E questo per un'azienda mediamente complessa significa dover mettere insieme sorgenti dati eterogenee che spesso non sono state pensate per comunicare fra loro. E per farlo con la velocità e la ricchezza di funzioni che oggi si cercano. Ecco perché "essere data driven" può significare dover ripensare e modernizzare tutta una infrastruttura di data management.
SAP sa bene che il data management è diventato una questione chiave per qualsiasi Trasformazione Digitale che si rispetti, motivo per cui ha deciso di giocare più pesantemente in questo campo presentando SAP Datasphere. Che nominalmente è la nuova versione di SAP Data Warehouse Cloud (la transizione dalla vecchia alla nuova piattaforma è automatica, da oggi) ma che in realtà è una nuova piattaforma di data fabric che traspone su un livello diverso le logiche precedenti di gestione di dati e metadati. Perché oggi la questione non è solo gestire i dati ma anche integrarli, catalogarli, estrarne significati, federarli e virtualizzarli.
Il vantaggio principale di SAP Datasphere, per un utente SAP, è che la nuova piattaforma è strettamente integrata con il resto del mondo SAP. Si basa sulla stessa Business Technology Platform e innanzitutto ha accesso diretto ai dati operativi che i sistemi SAP già gestiscono, con i relativi metadati. Questo tra l'altro significa che la piattaforma "eredita" nativamente, senza doverle ricreare da zero, le relazioni, le associazioni e le componenti semantiche dei dati SAP. Il tutto in automatico e con alcuni moduli specifici (Datasphere Analytic Model e Datasphere Catalog) per la definizione di modelli semantici e le attività di scoperta e classificazione delle informazioni.
Inoltre, pur essendo pensata per implementazioni in cloud "puro" o ibrido, Datasphere può dialogare con le istanze on-premise di piattaforme SAP come SAP Business Warehouse, ereditandone automaticamente modelli e connettori. Il che dovrebbe facilitare - e velocizzare, magari - la transizione al cloud da parte delle aziende che usano ancora SAP NetWeaver BW o SAP BW/4HANA. Non è certo questo l'obiettivo principale della nuova piattaforma, ma per SAP - come per molte altre grandi software house - portare rapidamente al SaaS più clienti possibile sta facendo sempre più la differenza.
SAP Datasphere si propone anche come piattaforma in grado di concentrare - non fisicamente - tutti i dati, operativi e non, di cui l'azienda utente può avere bisogno. In primis questa capacità riguarda le piattaforme business di SAP stessa, ovviamente. Con il vantaggio che i dati non devono essere tutti concentrati in data warehouse o repository centralizzati, ma possono essere replicati, federati e virtualizzati.
La software house tedesca ha anche facilitato l'accesso a sorgenti di dati predefinite attraverso il Datasphere Marketplace, in sintesi un "mercato" di oltre tremila - al momento - dataset certificati e affidabili che possono essere "digeriti" da Datasphere con pochi clic del mouse.
L'approccio della data fabric - o meglio della business data fabric, per come la definisce SAP - sarebbe poco efficace se Datasphere non potesse interfacciarsi con altre piattaforme di data management o con altri moduli che complementano la gestione delle informazioni. Per questo SAP ha definito partnership tecnologiche mirate con alcune software house oggi "trendy" del mercato open data management: Collibra per la data governance, Confluent per il data streaming, Databricks per la sua piattaforma Data Lakehouse, DataRobot per il machine learning.
Una volta portati a bordo tutti i dati di interesse, un aspetto chiave diventa la data governance, in particolare organizzare al meglio i dati e distribuirli correttamente tra i vari "consumatori" interni. Per questo esiste Datasphere Spaces, una funzione che permette di definire veri e propri "spazi di lavoro" con viste limitate e controllate sui dati globali. L'obiettivo è garantire che ogni parte dell'azienda abbia visibilità solo dei dati che effettivamente deve consultare ed elaborare. Parallelamente, la parte IT dell'azienda può verificare costantemente chi usa quali dati e facendo quale consumo delle risorse IT allocabili.