Intel, a tutta Enterprise AI con Gaudi 3 e una piattaforma aperta

All’evento Vision 2024 in Arizona, Intel punta forte sulla propria visione di enterprise AI con un nuovo acceleratore AI e con collaborazioni aperte a tutto tondo, per sviluppare sistemi di GenAI aperti e multi-vendor

Autore: e. b.

Poco più di tre mesi fa, a metà dicembre, durante l’evento “AI Everywhere” di New York, il CEO di Intel Pat Gelsinger aveva detto che Gaudi 3 sarebbe arrivato presto, mostrando per la prima volta un wafer dell'acceleratore AI di nuova generazione per il deep learning e modelli di AI generativa su grande scala.

Puntualmente, all’evento Intel Vision 2024, che a inizio aprile ha riunito clienti e partner a Phoenix in Arizona, è stato presentato l’acceleratore Gaudi 3 che porta prestazioni, standard aperti e possibilità di scelta all’intelligenza artificiale generativa, annunciando nel contempo anche una suite di nuovi sistemi aperti e scalabili, prodotti di nuova generazione e collaborazioni strategiche per accelerare l’adozione della tecnologia.

“L’innovazione avanza a un ritmo senza precedenti e ogni azienda sta rapidamente adottando intelligenza artificiale: Intel la sta portando in ogni parte dell’azienda, dal PC al data center fino all’edge. Le nostre ultime piattaforme Gaudi, Xeon e Core Ultra offrono un insieme coerente di soluzioni flessibili su misura per soddisfare le mutevoli esigenze dei nostri clienti e partner e sfruttare le immense opportunità che si presentano per il futuro”, ha commentato Pat Gelsinger.


Il CEO di Intel Pat Gelsinger durante il suo keynote all'evento di Phoenix

Nel dettaglio, l’acceleratore AI Intel Gaudi 3 alimenterà i sistemi AI con un potenziale di decine di migliaia di acceleratori collegati tramite Ethernet. Intel Gaudi 3 promette una potenza di calcolo AI quattro volte superiore per BF16 e un’ampiezza di banda della memoria superiore di una volta e mezza rispetto al suo predecessore. L’acceleratore rappresenterà un passo avanti significativo nella formazione e nell’inferenza dell’AI per le aziende globali che desiderano implementare la GenAI su larga scala.

Rispetto a Nvidia H100, fa notare Intel, si prevede che Gaudi 3 fornisca un time-to-train mediamente più veloce del 50% sui modelli Llama2 con parametri 7B e 13B e sul modello con parametri GPT-3 175B. Inoltre, si prevede che il throughput di inferenza dell'acceleratore Intel Gaudi 3 supererà l’H100 del 50% in termini di prestazioni medie e del 40% termini di efficienza energetica media dell'inferenza tra i parametri Llama 7B e 70B e i modelli di parametri Falcon 180B.

Intel Gaudi 3, disponibile nel corso di questo trimestre per gli OEM, tra cui Dell Technologies, HPE e Lenovo, fornisce un software aperto community based e reti Ethernet standard. Inoltre, consente alle aziende di scalare in modo flessibile da un singolo nodo a cluster, super-cluster e mega-cluster con migliaia di nodi, sostenendo inferenza, messa a punto e formazione su larga scala.


Una piattaforma aperta di Enterprise AI

In collaborazione con società quali Hugging Face, Red Hat, SAP, SAS e VMware, Intel ha anche annunciato l'intenzione di creare una piattaforma aperta per l’Enterprise AI. L’iniziativa mira a sviluppare sistemi GenAI aperti e multi-vendor che offrano facilità di implementazione, e le migliori prestazioni e valore, abilitati dalla generazione retrieval-augmented (RAG). Questa consente di abilitare le grandi fonti di dati proprietarie delle aziende che funzionano su soluzioni standard e sicure basate su Intel Xeon con funzionalità LLM aperte, accelerando l’utilizzo della GenAI nelle imprese.

Come passo iniziale, Intel rilascerà implementazioni di riferimento per le pipeline GenAI su soluzioni sicure basate su Intel Xeon e Gaudi, pubblicherà un quadro concettuale tecnico e continuerà ad aggiungere capacità infrastrutturale in Intel Tiber Developer Cloud per lo sviluppo dell'ecosistema e la convalida di RAG e pipeline future. Intel incoraggia un'ulteriore partecipazione dell'ecosistema per unire le forze in questo sforzo aperto per facilitare l'adozione da parte delle imprese, estendere la copertura delle soluzioni e accelerare i risultati di business.


Una roadmap con clienti e partner

Intel ha anche delineato la propria strategia per sistemi di intelligenza artificiale aperti e scalabili, inclusi hardware, software, framework e strumenti. L’approccio di Intel consente a un ecosistema ampio e aperto di attori del settore AI di offrire soluzioni che soddisfano le esigenze GenAI specifiche dell’azienda. Questo include produttori di apparecchiature, fornitori di database, integratori di sistemi, fornitori di software e servizi e altro ancora. Consente inoltre alle aziende di utilizzare i partner e le soluzioni dell'ecosistema che già conoscono e di cui si fidano.

Intel ha condiviso una completa roadmap con i clienti e i partner di tutti i settori, come IBM, Bosch, NielseIQ e Infosys, con l’obiettivo di implementare le soluzioni di accelerazione Intel Gaudi per innovative applicazioni di intelligenza artificiale generativa.

Intel ha inoltre annunciato collaborazioni con Google Cloud, Thales e Cohesity per sfruttare le capacità informatiche riservate di Intel nelle proprie istanze cloud. Questo include Intel Trust Domain Extensions (TDX), Intel Software Guard Extensions (SGX) e il servizio di attestazione di Intel. I clienti possono eseguire i propri modelli e algoritmi di intelligenza artificiale in un ambiente di esecuzione affidabile (TEE) e sfruttare i servizi fiduciari di Intel per verificarne l’affidabilità.


Visualizza la versione completa sul sito

Informativa
Questo sito o gli strumenti terzi da questo utilizzati si avvalgono di cookie necessari al funzionamento ed utili alle finalità illustrate nella cookie policy. Se vuoi saperne di più o negare il consenso a tutti o ad alcuni cookie, consulta la cookie policy. Chiudendo questo banner, acconsenti all’uso dei cookie.