Cloudera spinge l’hybrid data platform, ideale per l’AI

Fabio Pascali, Regional Vice President Italy, Greece & Cyprus di Cloudera, inquadra lo scenario in cui opera il vendor, con una focalizzazione sull’affermarsi dell’AI, nello specifico quella generativa,  e spiega il nuovo posizionamento aziendale in questo scenario, la proposizione d’offerta, la centralità dei partner. Aspettando Evolve24

Autore: Barbara Torresani

In attesa della tappa milanese di Evolve24, l'evento mondiale di Cloudera, in programma il prossimo 23 ottobre a Milano, Fabio Pascali, Regional Vice President Italy, Greece & Cyprus, si confronta con la stampa italiana, nella nuova sede aziendale milanese al centro dell’innovazione italiana in Piazza Gae Aulenti, soffermandosi sui temi nelle corde dell’azienda. A partire da come il vendor sta sostenendo l’adozione dell’Intelligenza Artificiale per spingersi fino alle ultime novità d’offerta e di strategia.

Si parte dall’AI: un tema molto dibattuto, su cui Cloudera sa di poter giocare un ruolo strategico, essendo posizionata al centro di qualunque operazione di AI, e, a maggior ragione, dell’AI generativa, proprio perché riconosce nei dati al centro dell’AI la base da cui tutto parte: ”Cloudera è al centro della trasformazione in atto: è lì che si posiziona, proponendo al mercato una piattaforma in grado di fornire tutti i dati necessari al motore di AI generativa al fine di fornire risultati coerenti, sicuri, scalabili, quanto più privi di allucinazioni e cost effective”, afferma il manager.

A supporto di ciò, Pascali cita le evidenze di una recente indagine globale Cloudera-Foundry sullo stato delle moderne architetture di dati e su come l’ascesa dell’AI stia impattando sulle strategie dei dati.

La ricerca “Data Architecture and Strategy in the AI Era, condotta a su oltre 600 tra data leader e decision maker IT lo scorso al ivello mondiale , rileva che il 90% dei leader IT ritiene che l’unificazione del ciclo di vita dei dati su un’unica piattaforma sia fondamentale per gli analytics e l’AI. Con la diffusione dell’AI generativa è sempre più evidente l’importanza di avere dati affidabili, dal momento che gli insight generati dall’AI sono tanto potenti quanto i dati che la alimentano. Emerge inoltre che tre responsabili IT su cinque hanno dichiarato di essere nelle fasi iniziali dell’adozione dell’AI, mentre solo l’8% non ha ancora pianificato progetti di questo tipo. Tuttavia, gli intervistati hanno ammesso di aver incontrato molti ostacoli nel percorso di implementazione dell’AI dovuti a diversi fattori, primo fra tutti la qualità e la disponibilità dei dati (36%), le sfide legate a scalabilità e implementazione (36%), l’integrazione con i sistemi esistenti (35%), la gestione del cambiamento (34%) e la trasparenza dei modelli (34%). Ciò dimostra che, sebbene molte organizzazioni stiano investendo nell’AI, esistono diversi problemi che è necessario affrontare a monte.“Come azienda in grado di gestire l’intero ciclo di vita dei dati, elementi costitutivi di ogni progetto di AI, Cloudera sa bene quanto sia importante gestirli al meglio, per favorire insight personalizzati, evitare allucinazioni, e garantire addestramento continuo dei LLM e aderenza alle normative in evoluzione”, rimarca. Nel dettaglio, sottolinea Pascali, gli intervistati identificano tre punti fondamentali.
In primis, la necessità di avere una ‘modern data architecture’: un’unica piattaforma di dati che funzioni senza soluzione di continuità su infrastrutture cloud pubbliche e on-premise, con vantaggi quali la semplificazione dei processi di dati/analisi (40%), seguita dalla flessibilità nella gestione di tutti i tipi di dati (38%). ”Un'architettura moderna di dati porta inevitabilmente con sé il delicato tema della gestione di qualunque tipo di dato. In questa direzione Cloudera ha sposato il modello della Open Data Lakehouse che consente alle imprese di trarre valore dai loro investimenti in cloud sbloccando valore dai dati sia da cloud pubblico che privato, al fine di alimentare soluzioni di AI affidabili e complete”. Cloudera opta per questo modello, in particolar modo Iceberg, come formato tabellare alla base del processo, fornendo ai clienti una gestione di dati non più solo legata al dato non strutturato, ma anche al dato strutturato. I clienti che hanno a disposizione effettivamente un'architettura moderna di dati possono mettere questa architettura moderna a disposizione degli algoritmi di AI generativa.

In secondo luogo, gli intervistati sollevano la necessità di avere una gestione integrata dei dati: “Oltre a metterli a disposizione, occorre gestirli in maniera opportuna”, commenta Pascali, con tecnologie di gestione cloud flessibili e scalabili che forniscano gli strumenti per trasformare le informazioni in approfondimenti”. Per quanto riguarda i fattori che ostacolano la gestione dei dati end-to-end necessaria per lo sviluppo di modelli di AI, il 62% degli intervistati ha dichiarato che si tratta del volume e della complessità dei dati, il 56% della sicurezza dei dati e il 52% della governance e della conformità,

Si arriva quindi al terzo punto: la necessità di avere un'architettura flessibile e sicura. In una prospettiva a lungo termine, un approccio ibrido alla gestione dei dati che includa sia infrastrutture on-premise che cloud pubblico è la strategia preferita - il 93% degli intervistati concorda sul fatto che le funzionalità multicloud/ibride per i dati e gli analytics sono fondamentali per consentire a un’organizzazione di adattarsi al cambiamento. “Flessibile, commenta Pascali, in quanto i dati possono essere ovunque: on-premise, in cloud, ibridi. Se si è in grado di disporre dei propri dati e gestirli in qualunque situazione, l’algoritmo di AI generativa può sfruttare questa complessità, mentre mettendoli in un'unica location, quelli posizionati altrove non sono accessibili ai modelli”. Piattaforma che deve altresì essere sicura: “L’attenzione alla sicurezza del dato e alla privacy è molto alta. Alcuni dati possono essere esportati senza nessun problema, altri richiedono di essere utilizzati con attenzione. Avere una piattaforma dati sicura e un approccio alle AI quanto più all'interno del profilo aziendale, consente di non esporre l’azienda a rischi”.

La risposta Cloudera

La risposta Cloudera a questi tre priorità passa da una piattaforma integrata del dato in grado di gestirne l'intero ciclo di vita in modo integrato e flessibile in qualunque modello e hyperscaler; una piattaforma altresì sicura, con funzionalità di sicurezza embedded all'interno, così come embedded risultano il modello di AI generativa e gli algoritmi proposti: “Portiamo gli LLM, come quelli di Hugging Face, all'interno della piattaforma. Quindi i dati, ovunque essi siano, la nostra è una posizione agonistica in questo senso, non escono dal profilo di sicurezza dell'azienda. Ovunque si muovano, l'investimento che gli utenti fanno nella data platform viene mantenuto. E questo vale appunto anche con l’AI generativa”, chiarisce.

Verta per la gestione operativa dei modelli di AI e la partnership con Nvidia

Funzionale al disegno aziendale verso l’AI enterprise, è la recente acquisizione di Verta da parte di Cloudera, per la gestione operativa dei modelli di AI.

Verta, come chiarisce Pascali, è all’avanguardia nella gestione, nel servizio e nella governance dei modelli per l’AI predittiva e generativa, in quanto affronta uno dei maggiori ostacoli all’implementazione dell’AI, consentendo alle aziende di costruire, rendere operativi, monitorare, proteggere e scalare efficacemente modelli in tutta l’azienda: “I clienti possono disporre di modelli più evoluti, con complessità e numerosità fortemente aumentate: la gestione di tutte queste versioni e di tutti questi modelli diventa fattore critico da governare. Fondamentale quindi aiutare i clienti a creare, sviluppare, e gestire il modello nel suo intero ciclo di vita, così come anche nella fase di dismissione. Da qui, l’acquisizione di Verta, che va a colmare uno spazio che Cloudera indirizzava già nella componente di machine learning, e ora lo fa anche in quella AI. Si tratta della prima di numerose mosse strategiche da intraprendere per estendere la nostra posizione nei dati e nell’enterprise AI affidabile”.

Da leggersi in questa direzione anche il rafforzamento della partnership con Nvidia, come chiarisce Pascali: “Anche in questo caso, Cloudera vantava già una partnership con il vendor per la parte di GPU per accelerare determinati carichi in ambito di machine learning. Ora la collaborazione si è estesa per la parte di micro-servizi per accelerare lo sviluppo e l'operatività di algoritmi di GenAI. Un tema importante che ci consente di crescere e di scalare in determinate aree sempre più strategiche”.

In concreto, Cloudera utilizzerà NVIDIA AI Enterprise, con i microservizi NVIDIA NIM, per liberare il potenziale di 25 exabyte di dati aziendali protetti in Cloudera Data Platform. Il servizio Cloudera Powered by NVIDIA integrerà i microservizi NVIDIA NIM di livello enterprise, parte della piattaforma software NVIDIA AI Enterprise, in Cloudera Machine Learning, un servizio di Cloudera Data Platform per i workflow AI/ML, per offrire workflow AI generativi end-to-end veloci, sicuri e semplificati in produzione.Eppur si muove

Dal suo osservatorio privilegiato, Pascali rileva in Italia un’attenzione elevata verso l’AI generativa. Moltissimi POC e alcuni investimenti concreti di alcune realtà che operano con Cloudera in maniera significativa nell'ambito della trusted AI, ovvero adottando un approccio totalmente sicuro ai dati in riferimento alla GenAI. L’interesse quindi sembra essere diffuso e orizzontale in molti ambiti, con un’attenzione particolare in quelli fortemente ‘regolati’, come il settore pubblico, dove il tema della ‘governance’ del dato è molto sentito, e nel settore finance e nell’energy, in cui la sicurezza del dato è baricentrica: “E’ un approccio che sta riscuotendo successo e noi lo stiamo adottando. Non puntiamo infatti a prendere il 100% del mercato, ma ci focalizziamo sul tema dell’AI sicura, trusted, enterprise, dove sappiamo di poter offrire un valore aggiunto rispetto alle altre soluzioni”, sostiene.

E’ innegabile che, al momento siano le grandi realtà a essere maggiormente coinvolte e adottino approcci avanzati di GenAI, soprattutto per la loro capacità di execution: “Un approccio flessibile alle data architecture come quello proposto da Cloudera abbracciando anche il mondo cloud, di fatto, sta però consentendo di abbassare l’entry point point di architetture complesse, aprendo via via la strada a un allargamento della platea, coinvolgendo e interessando aziende anche di taglio inferiore".

Per la riuscita e il successo di questi progetti Pascali sottolinea quanto sia fondamentale lo sviluppo di una dinamica di ecosistema: “Oggi Cloudera è una realtà che vuole collaborare con le terze parti. E’un’azienda che negli anni si è trasformata passando dall’essere una realtà legata il mondo dei Big Data al mondo molto più esteso relativo alla ‘Data Platform’, che abbraccia qualunque tipo di dato, in tutta la sua complessità, dalla sorgente fino alla gestione in real time e alla creazione di lake house, intersecando il tema del cloud, sempre più strategico”.

L’Italia brilla nel panorama europeo

Una trasformazione aziendale molto ben recepita nel Belpaese, a detta del manager. Tanto che la filiale italiana brilla nel panorama europeo: è stata infatti premiata dalla Corporate come miglior country a livello EMEA e per la trasformazione cloud: “Siamo un’eccellenza all’interno di Cloudera e in tutto ciò l'ecosistema dei partner ha giocato un ruolo fondamentale, rappresentando di fatto la cerniera tra noi e l'esigenza di business e tecnologica vera e propria dei clienti. Cloudera infatti offre la piattaforma tecnologica, non dispone di verticalità embedded, mentre i system integrator abilitano use case basati sulla nostra piattaforma. Use case differenti come, ‘per esempio, la gestione del cliente a 360°”, enfatizza.

In un mondo, quale quello dell'architettura dati e dell'AI generativa costellato da differenti tecnologie il system integrator rappresenta quindi il profilo corretto per integrare tutti questi strumenti e portare a meta il risultato: ”Cloudera mette a disposizione i mattoncini lego sui quali poi viene costruita l'opera finale”. afferma.

I nuovi assistenti AI per ottenere insight sui dati

Un’azienda, Cloudera, essa stessa utilizzatrice di AI generativa che poi mette a disposizione dei clienti. Ed ecco un accenno alle più recenti novità in direzione AI, a partire dagli assistenti AI per SQL, BI e ML, con l’obiettivo di accelerare lo sviluppo di applicazioni basate su dati, analytics e AI e ottenere insight a maggior valore: “Con i nuovi assistenti AI, le imprese possono mettere in produzione dati, analisi e applicazioni AI affidabili più velocemente, ampliando al contempo numero e tipologia di dipendenti che possono accedere a questi strumenti”, commenta Pascali.

Nello specifico, SQL AI Assistant risolve le sfide associate alla scrittura di query SQL complesse e consente agli utenti dell’organizzazione di acquisire competenze avanzate su SQL. Gli utenti dovranno semplicemente descrivere ciò di cui hanno bisogno in linguaggio naturale e l’assistente SQL AI troverà i dati pertinenti utilizzando tecniche avanzate come prompt engineering e retrieval augmented generation (RAG). L’AI Chatbot all’interno di Cloudera Data Visualization è progettato per dialogare direttamente con i dati aziendali al fine di fornire approfondimenti contestualizzati sul business che vanno al di là di ciò che i cruscotti di BI possono tipicamente visualizzare, con il chatbot che risiede direttamente nella dashboard e nei report creati con Cloudera Data Visualization e sfrutta il contesto dei dati disponibili dietro la dashboard per fornire alle aziende insight più profondi e fruibili. Da parte sua Cloudera Copilot per Cloudera Machine Learning è alimentato da LLM pre-addestrati progettati per superare le sfide tipicamente legate all’implementazione di modelli AI e ML in produzione, dalla gestione dei dati alla codifica. L’integrazione con oltre 130 modelli e dataset di Hugging Face, consente a Cloudera Copilot di supportrea il processo di sviluppo end-to-end delle applicazioni AI e accelerare le attività dei data scientist, lo sviluppo dei modelli e la messa a punto, permettendo alle aziende di stimolare lo sviluppo dell’apprendimento automatico e iniziare a vederne il valore in modo più rapido

Occorre fare la differenza

In definitiva, Cloudera sta cercando di occupare uno spazio ben definito nel mercato, cavalcando il concetto di Hybrid Data Platform, distinguendosi nel panorama facendo leva su alcuni elementi caratteristici, come ben spiega Pascali: “Cloudera punta a portare valore ai clienti, offrendo una piattaforma end to end integrata (che non richiede tassa di integrazione di nuovi strumenti nel tempo), che permette agli utenti di utilizzare in maniera efficace i dati in qualunque contesto, senza alcun lock-in infrastrutturale, garantendo lo stesso livello di sicurezza ovunque questi si trovino. Il tutto sposando appieno il tema dell’open source, un elemento di fortissima accelerazione: gli algoritmi di LLM che Cloudera importa sono già pre-addestrati e messi a disposizione all'interno di moduli machine learning con un'accelerazione molto rapida affinché gli utenti possano avere a disposizione strumenti già pronti, in continua evoluzione. Gestione unificata, qualità e disponibilità del dato, in un contesto sicuro sono quindi gli elementi su cui Cloudera pensa di poter fare la differenza”.

Appuntamento a Milano il prossimo 23 ottobre

Tutti argomenti al centro di Evolve24, levento flagship del vendor a livello mondiale, che farà tappa il prossimo 23 ottobre a Milano, una delle 7 tappe previste, a testimonianza della centralità della country per il vendor. Un evento internazionale con una declinazione a livello italiano, che vedrà la partecipazione del top management dell’azienda nonché molti C-level di aziende clienti, e partner di caratura internazionale, tra cui AWS, IBM e Red Hat, solo per citarne alcuni, e altri a livello locale.

Un appuntamento non di pura tecnologia, anzi, ma divulgativo e di business, per continuare a creare cultura sul mondo dei dati.


Visualizza la versione completa sul sito

Informativa
Questo sito o gli strumenti terzi da questo utilizzati si avvalgono di cookie necessari al funzionamento ed utili alle finalità illustrate nella cookie policy. Se vuoi saperne di più o negare il consenso a tutti o ad alcuni cookie, consulta la cookie policy. Chiudendo questo banner, acconsenti all’uso dei cookie.