DeepSeek: le dieci cose da sapere

DeepSeek è davvero il ChatGPT cinese che mette in crisi le aziende USA dell'AI? Probabilmente no, ma il suo sviluppo avrà un peso importante.

Autore: Redazione ImpresaCity

Lo scalpore suscitato dalla cinese DeepSeek-AI sembra mettere in dubbio alcuni capisaldi presunti del mercato AI. Ma è davvero così? E come siamo arrivati a questo punto? Ecco la sintesi della vicenda, e dei suoi possibili sviluppi, in dieci punti chiave.

1. Cosa è DeepSeek?

DeepSeek è il nome generico di una famiglia di modelli di AI Generativa che la startup cinese DeepSeek-AI ha sviluppato nel corso, grosso modo, dell'ultimo anno e mezzo. La società è stata infatti fondata a metà 2023 dall'imprenditore cinese Liang Wenfeng ed è sostanzialmente il "braccio AI" del suo hedge fund battezzato High-Flyer. Per ottimizzare le performance del fondo, Liang Wenfeng e i suoi altri co-fondatori hanno sviluppato, negli Anni Dieci, modelli di machine learning per il trading. Da questo iniziale lavoro, a quanto pare, prendono le mosse gli sviluppi in campo GenAI che hanno portato a DeepSeek.

2. Quali sono le principali tecnologie DeepSeek?

DeepSeek-AI ha fatto notizia lanciando un chatbot molto simile, nel concetto di base e nel funzionamento, a ChatGPT. Si basa su un modello di "ragionamento simulato" battezzato DeepSeek-R1 e considerato analogo a OpenAI-o1, una delle offerte di punta della software house americana. DeepSeek-R1, spiega DeepSeek-AI, "raggiunge performance comparabili a OpenAI-o1 per task matematici, di programmazione e di ragionamento".

La società cinese ha anche presentato un LLM di "simulated reasoning" meno performante (DeepSeek-R1-Zero) e sei LLM "distillati" che derivano dal lavoro fatto per R1 ma si basano su altri LLM open source come Llama3 e Qwen. È stato rilasciato anche un LLM battezzato DeepSeek-V3, che usa un approccio definito Mixture-of-Experts (MoE) per ridurre il peso elaborativo. DeepSeek-AI è attiva anche nel segmento degli LLM "multimodali", ossia che possono tanto generare testo quanto creare immagini e completare task con elaborazione visuale. I suoi modelli più recenti - Janus Pro 1B e 7B - sono, secondo la software house cinese, per molti versi al livello di Stable Diffusion e OpenAI DALL-E, i modelli "grafici" che vanno oggi per la maggiore.

3. Perché l'annuncio ha fatto tanto scalpore?

Principalmente per tre motivi. Il più importante è legato alle risorse che DeepSeek-AI afferma di aver usato per "addestrare" i modelli DeepSeek: molte, molte meno di quelle che affermano di usare i nomi chiave dell'AI americana, in primis OpenAI. Se quanto spiega la software house cinese è vero, ad esempio, l'addestramento di DeepSeek-V3 è costato solo 5,6 milioni di dollari: 2,8 milioni di ore/GPU (in questo caso poco "pregiati" acceleratori Nvidia H800) per un costo di 2 dollari l'ora. Quando si parla di addestramento di modelli per le software house americane, le configurazioni hardware utilizzate rimandano a costi che sono 20-30 volte superiori. Se DeepSeek-AI ha ragione, questi costi non sono davvero giustificati.

Ci sono poi altri due punti chiave nella vicenda. Primo: DeepSeek-AI sta sviluppando i suoi LLM più rapidamente di quanto non stia facendo OpenAI, che è il punto di riferimento del mercato. Secondo: l'azienda cinese non ha paura di rilasciare i suoi modelli con una licenza open source, cosa che aziende come OpenAI (e molte altre) non considerano nemmeno lontanamente per non rischiare di mettere in crisi il proprio business potenziale. Questo non vuol dire che DeepSeek sia completamente open source, come approfondiamo più avanti.

4. DeepSeek è davvero potente come ChatGPT?

Al momento ci sono solo le dichiarazioni di DeepSeek-AI ad affermarlo, e i suoi benchmark. Ai quali però si può far dire di tutto, perché i benchmark sono valutazioni sempre un po' dubbie. D'altro canto, essendo alcuni modelli DeepSeek "aperti", o quantomeno scaricabili, chiunque abbia le competenze giuste può implementarli e verificare direttamente. È quindi presumibile che la software house cinese non si sia sbilanciata in affermazioni troppo lontane dalla realtà.

Anche sul calcolo dei costi di addestramento andranno fatte le opportune verifiche, ma lo scarto con i prezzi "americani" è talmente elevato che resterebbe in ogni caso un segnale molto significativo. Ed è un dato di fatto da considerare anche che le aziende cinesi dell'AI operano con hardware Nvidia "azzoppato" per via dell'embargo USA sulle tecnologie di punta per l'AI.

5. Cosa ha di diverso l'approccio di DeepSeek?

Ben consapevoli di lavorare con hardware e acceleratori "limitati", i ricercatori cinesi hanno messo in atto una serie di ottimizzazioni e "scorciatoie" per estrarre il massimo da quello che avevano a disposizione. I metodi che hanno sviluppato, secondo i vari paper di DeepSeek-AI, hanno portato come effetto collaterale al contenimento dei costi che ha fatto tanto scalpore. L'impressione è che, invece, le software house americane abbiano replicato il modello-hyperscaler: mettere in campo sempre più risorse di computing, sempre più potenti, per risolvere qualsiasi problema a forza bruta.

C'è poi la questione dell'open source: DeepSeek-AI ha basato parte del suo lavoro su altro codice e altri modelli più o meno "open" (ad esempio Llama) e ha potuto quindi costruire su quanto avevano fatto già altri. Se avesse adottato un modello completamente proprietario, avrebbe dovuto fare tutto da zero, con tempi e costi completamente diversi.

6. Cos'è l'AI open source?

La maggior parte dei LLM di riferimento sono "chiusi" nel senso che chi li ha sviluppati non ha reso pubblici il loro codice, i "pesi" (i parametri delle reti neurali che si possono modificare per ottimizzare il comportamento di un dato modello dopo il suo addestramento iniziale), i dati dell’addestramento di base. I modelli chiusi sono quindi proprietari: si possono usare solo per come sono messi a disposizione o implementati da chi li ha sviluppati in prima battuta. Come è già accaduto per il software in generale, esiste invece un modello “open” anche nello sviluppo degli algoritmi di AI: chi li crea li cede in open source, rendendone pubblici e liberamente disponibili tutti i dettagli e componenti. In modo che altri possano studiarli, adattarli alle proprie esigenze, creare soluzioni specifiche.

Attenzione, però: non esiste una definizione ufficiale e nemmeno condivisa di cosa effettivamente sia una "open AI". E il parallelo tra open source e "open AI" vale fino ad un certo punto, perché si tratta di due "oggetti tecnologici" molto diversi fra loro. Un modello di AI davvero "open" dovrebbe idealmente essere trasparente (dare accesso al suo codice, ai dati di training, ai pesi, a una documentazione esaustiva), riutilizzabile (che è una questione di licensing, sempre per codice, dati e pesi), estendibile (che spesso significa prendere un modello e poterlo personalizzare per le proprie esigenze). Molti modelli che si descrivono come "open" - tra cui anche DeepSeek - non soddisfano tutti questi requisiti. Per ora, pragmaticamente, possiamo considerare "open" i modelli ottimizzabili e riutilizzabili. Sperando in qualcosa di meglio per il futuro.

7. Perché l'impatto negativo sui titoli AI USA?

Perché l'annuncio ha messo in dubbio quello che le aziende USA dell'AI hanno affermato fino a quel momento, ossia principalmente che hanno una leadership tecnologica indiscussa nei confronti del resto del mondo e che sviluppare l'AI richiede ingenti risorse hardware ed economiche. Il che giustifica(va) le decine e centinaia di miliardi di dollari richiesti, tanto allo Stato quanto agli investitori, per finanziare nuove infrastrutture e nuovi progetti.

Ma se bastano poche decine di milioni e qualche mese per fare quello che le aziende USA hanno fatto in più di due anni spendendo miliardi - in più senza per ora guadagnarci, Nvidia a parte - allora lo scenario che si presenta agli investitori di quelle stesse imprese è molto meno roseo delle loro promesse. E aggiungiamoci anche che il mercato vero - ossia gli utenti, non gli speculatori - della GenAI non è poi così convinto.

8. Ma la Cina non era indietro in campo AI?

Più no che sì. Lato competenze e ricerca, sicuramente no. Inoltre Pechino ha sempre creduto molto alle potenzialità dell'AI e quindi alla necessità di rivestire un ruolo importante nel suo mercato potenziale. Il Governo ha di conseguenza delineato e messo in atto diversi piani di sviluppo mirati, che indubbiamente hanno portato i loro frutti. Il punto debole della Cina è nella ridotta possibilità di accedere alle tecnologie hardware di frontiera, che le sono precluse per questioni di embarghi e geopolitica.

Qualsiasi embargo tecnologico ha peraltro una "capacità frenante" limitata. Lo si è visto in campo supercomputing, dove la Cina ci ha messo poco per colmare il gap e arrivare in cima alle classifiche di performance per i suoi sistemi HPC con tutta (o quasi) tecnologia "autarchica". L'impressione oggi è che in campo AI il ritardo della Cina rispetto agli USA sia molto minore del previsto, per molti versi marginale. Questo è dimostrato non solo dal lavoro di DeppSeek-AI, ma anche da quello di aziende cinesi più note e grandi come Alibaba (con i suoi LLM Qwen).

9. DeepSeek può cambiare davvero il mercato AI?

Direttamente, è molto difficile. In una fase come quella che stiamo vivendo, in cui la geopolitica e l'IT vanno a braccetto sempre più spesso, è improbabile che DeepSeek-AI venga percepita come un concorrente diretto delle varie OpenAI, xAI, Microsoft e compagnia. A livello globale ci possono essere sviluppi interessanti, ma in prospettiva: la Cina di certo - come è già successo in un po' tutti i campi dell'IT - spingerà le sue tecnologie di AI nei mercati (Asia, Africa, Sud America) che la Silicon Valley di solito trascura.

Diverso è il discorso sull'approccio di DeepSeek-AI, che può essere replicato perché la società lo ha ampiamente illustrato nella sua documentazione e perché l'architettura dei suoi LLM è disponibile (parzialmente) su GitHub. Per molti, quello che la software house cinese ha realizzato è la dimostrazione della bontà dell'approccio "open" per l'AI. E questo potrebbe sì avere impatti sul mercato, migliorando la percezione delle altre aziende di tutto il mondo che stanno sviluppando AI (più o meno) open source.

10. Cosa faranno i grandi nomi USA dell'AI?

Ad essere pragmatici, non c'è bisogno che facciano granché. Hanno le risorse per continuare a portare avanti i loro sviluppi come prima e lo scenario generale del mercato AI di per sé non è cambiato. Chi credeva nella GenAI continua a farlo, anche più di prima, chi è perplesso sul suo valore concreto continua ad esserlo. E il fatto che l'AI nel suo complesso - non la GenAI - sia fondamentale non è mai stato messo in discussione. Sembra insomma eccessivo parlare di "momento Sputnik" - per citare Marc Andreessen, del venture capital a16z - per il comparto AI americano. La GenAI è un mercato nascente - per certi versi nemmeno esiste - ed è naturale che prima o poi arrivi qualche azienda che adotta approcci innovativi e mette in discussione quelli delle grandi aziende "incumbent". È successo centinaia volte nell'IT e succederà ancora.

Semmai ci sono da calmare i maggiori dubbi degli investitori sui ritorni dei loro investimenti, ma queste sono questioni finanziarie e di "sentiment" del mercato che sono pilotabili fino a un certo punto. C'è peraltro da ricordare che la sensazione che il mercato GenAI fosse largamente sopravvalutato - l'ennesima "bolla", insomma - c'era già prima. Gli sviluppi di DeepSeek hanno rafforzato questa idea ma non cambiano molto la situazione di chi ha già una solida posizione nello scenario AI: ci sono troppi soldi in gioco. Più a margine, se si diffondesse un nuovo marcato scetticismo sui presunti costi degli sviluppi AI potrebbe magari essere più difficile per le aziende minori, e le startup, trovare fondi. Ma anche questo, come molto altro, è da vedere nel tempo.


Visualizza la versione completa sul sito

Informativa
Questo sito o gli strumenti terzi da questo utilizzati si avvalgono di cookie necessari al funzionamento ed utili alle finalità illustrate nella cookie policy. Se vuoi saperne di più o negare il consenso a tutti o ad alcuni cookie, consulta la cookie policy. Chiudendo questo banner, acconsenti all’uso dei cookie.