Una riflessione di Chris Royles di Cloudera sul ruolo centrale dei dati nell’intelligenza artificiale generativa
Il 2024 sta confermando l'ondata di profondo cambiamento che sta interessando il panorama dei dati. Sulla scia delle tendenze dei mesi precedenti, abbiamo assistito a ulteriori progressi negli algoritmi di intelligenza artificiale (AI), nei modelli linguistici di grandi dimensioni (LLM), nelle capacità di analisi dei dati e nel cloud computing.
Questi sviluppi non solo hanno rivoluzionato il modo in cui le organizzazioni utilizzano i dati, ma hanno anche iniziato a ridefinire il modo in cui esse operano e si organizzano. Ora, nel contesto della continua innovazione dell'AI, il panorama dei dati è destinato a evolvere ulteriormente: stiamo entrando in un'era in cui i dati non sono più solo uno strumento o un asset da avere, ma una forza trainante per il business.
Questi gli sviluppi che prevediamo cambieranno le strategie dei dati per i prossimi mesi.
Chris Royles di Cloudera
Il mercato dell'AI tenderà a consolidarsi, come avvenuto in passato per il mercato del cloud, nel quale gli innovatori più piccoli sono stati assorbiti o superati dai concorrenti più grandi. Le realtà più avanzate, supportate da capitali importanti, stanno assumendo posizioni sempre più dominanti, mettendo in ombra i nuovi arrivati. Grazie a ingenti investimenti - come i 13 miliardi di dollari di Microsoft destinati a OpenAI - queste entità possono replicare rapidamente le idee innovative sviluppate dalle startup più piccole semplicemente aggiungendo nuove API. Perché? Perché hanno team più numerosi, budget più elevati e finanziatori di alto profilo.
Anche nell'Unione Europea le autorità di regolamentazione stanno svolgendo un ruolo importante. Il mercato è plasmato da regolamentazioni più stringenti volte a limitare gli impatti a più alto rischio dell’AI che tuttavia possono ostacolare il ritmo dell'innovazione e limitare lo sviluppo di alcune soluzioni di AI.
Se questo consolidamento influenza il panorama dell'AI, è importante notare che anche il modo in cui l'AI viene impiegata subirà una trasformazione.
Il passaggio dell'AI dai laboratori di ricerca alla produzione su scala è una delle poche certezze di quest’anno. Questa transizione darà vita a nuovi casi d'uso in tutti i settori. Nel settore delle scienze biologiche, ad esempio, l'AI sta già rivoluzionando la ricerca e la scoperta di farmaci, raddoppiando di fatto il numero di nuovi farmaci disponibili per la sperimentazione. Ma questo è solo l'inizio: il vero potere dell'AI si realizzerà pienamente quando verrà utilizzata in modo più diffuso nella produzione in vari settori. Le organizzazioni dovrebbero iniziare a prepararsi a questo cambiamento chiedendo a sistemi come GenAI di elencare i casi d'uso specifici del settore che possono aiutare la loro attività, assicurandosi di essere pronti a capitalizzare il pieno potenziale dell'AI.
Lo sviluppo dell'AI in produzione non avviene in modo isolato, ed è strettamente legato all'evoluzione della gestione dei dati.
Già nel 2023 ha iniziato a prendere forma il concetto di data lakehouse, ma il suo vero valore si concretizzerà nei prossimi mesi. I lakehouse consentiranno agli elementi dello stack tecnologico di un'organizzazione di distribuire efficacemente i dati tra i servizi, cosa che fino ad oggi ha rappresentato una sfida. Questa evoluzione è fondamentale per consentire applicazioni concrete e reali, come le istantanee dei dati in tempo reale per la conformità finanziaria. Man mano che le organizzazioni iniziano a esercitare un maggiore controllo sui propri dati, il valore dei data lakehouse diventerà sempre più evidente. Questo non solo semplificherà la gestione dei dati, ma migliorerà anche l'efficacia dell'intelligenza artificiale fornendole dati più strutturati e accessibili.
I progressi nella gestione dei dati non si fermano qui. Il modo in cui le organizzazioni considerano e gestiscono i dati subirà un ulteriore cambiamento fondamentale: il passaggio dalla concezione del dato come risorsa a quella di dato come prodotto.
Questo cambiamento è fondamentale per la prossima fase di maturità dei dati e sarà accompagnato dall'emergere di nuovi ruoli, come quello di "data product owner", che enfatizzeranno questa etica del prodotto. Si tratta di un cambio di approccio fondamentale per ottenere una comprensione più approfondita dei dati, per estrarne informazioni utili e per costruire un corpus di dati affidabili che sia manutenibile e trasportabile. Questo cambiamento strategico abilita poi una collaborazione tra i team di tutta l’organizzazione, riunendo funzioni e unità aziendali eterogenee. Trattando i dati come un prodotto, le organizzazioni possono anche dare vita a una nuova ondata di AI affidabile, che cioè si basasu dati affidabili e ricchi di insight.
L'evoluzione dell'intelligenza artificiale e della gestione dei dati è già un tema centrale del mercato. Per le organizzazioni, adattarsi a queste tendenze non è solo vantaggioso, ma essenziale per rimanere competitive. Nel corso di quest’anno assisteremo a numerosi progressi tecnologici e a un cambio di paradigma nel modo in cui i dati vengono integrati nelle strategie aziendali. La costante è che il futuro che ci si prospetta è sempre più intrinsecamente guidato dai dati e abilitato dall'intelligenza artificiale.
Chris Royles è Emea Field CTO di Cloudera
(Alcune immagini generate con AI tramite l'app Microsoft Copilot)