▾ G11 Media: | ChannelCity | ImpresaCity | SecurityOpenLab | Italian Channel Awards | Italian Project Awards | Italian Security Awards | ...

Red Hat, nuove funzionalità in chiave AI per Enterprise Linux AI

La versione 1.3 aggiunge il modello Granite 3.0 8b, semplifica la preparazione dei dati di addestramento per l’AI ed espande il supporto per i più recenti hardware di elaborazione accelerata

Tecnologie

Da Red Hat arriva la versione più recente di Red Hat Enterprise Linux AI, RHEL AI 1.3, la piattaforma di modelli di base per lo sviluppo, il test e l’esecuzione di modelli di intelligenza artificiale generativa in ambito aziendale. Già disponibile, RHEL AI 1.3 supporta le ultime evoluzioni nella famiglia di modelli linguistici di grandi dimensioni (LLM) Granite e integra miglioramenti open source per la preparazione dei dati, mantenendo al contempo un’ampia scelta per le implementazioni hybrid cloud, inclusa l’architettura di elaborazione accelerata sottostante.

RHEL AI costituisce un pilastro fondamentale della visione di Red Hat sull’AI e unisce la famiglia di modelli open source Granite con gli strumenti di allineamento dei modelli InstructLab, basati su metodologia LAB (Large-scale Alignment) per i chatBot. Questi componenti sono offerti come un’immagine Red Hat Enterprise Linux ottimizzata e avviabile per implementazioni su singoli server in qualsiasi punto dell’hybrid cloud.

RHEL AI 1.3 estende l’impegno di Red Hat verso gli LLM Granite con il supporto per Granite 3.0 8b per i casi d’uso in lingua inglese. Granite 3.0 8b è un modello convergente, che supporta la generazione di codice e la chiamata di funzioni sia in inglese che in numerose altre lingue. I casi d’uso in lingue diverse dall’inglese, così come il codice e le funzioni, sono disponibili come anteprima per gli sviluppatori all’interno di RHEL AI 1.3, con l’obiettivo di supportare queste funzionalità anche in altre lingue nelle future versioni di RHEL AI.


Recentemente reso open source da IBM Research, Docling è un progetto upstream che aiuta ad analizzare i formati di documenti comuni e a convertirli in formati come Markdown e JSON, preparando questi contenuti per le applicazioni e l’addestramento dell’AI generativa. RHEL AI 1.3 ora integra questa innovazione come funzionalità supportata, consentendo agli utenti di convertire i PDF in Markdown per una più semplice ingestione dei dati per la regolazione del modello con InstructLab.

Grazie a Docling, RHEL AI 1.3 ora include anche un chunking context-aware, che tiene conto della struttura e degli elementi semantici dei documenti utilizzati per l’addestramento dell’AI generativa. Ciò aiuta rendere le applicazioni di AI generativa più coerenti e a sviluppare risposte più appropriate per il contesto e le attività, senza necessità di ulteriori aggiustamenti. Le future versioni di RHEL AI continueranno a supportare e perfezionare i componenti di Docling, inclusi altri formati di documenti e l’integrazione per le pipeline RAG (Retrieval-Augmented Generation), allineandoli alle conoscenze di InstructLab.

La libertà di scelta è una componente fondamentale dell’hybrid cloud e deve essere offerta per le applicazioni di AI generativa a partire dalle architetture di chip sottostanti, proprio per assicurare che la Gen AI possa mantenere la sua peculiarità di carico di lavoro distintivo per gli ambienti ibridi. RHEL AI supporta già i principali acceleratori di Nvidia e AMD e la versione 1.3 ora include Intel Gaudi 3 come anteprima tecnologica.


Oltre all’architettura dei chip, RHEL AI è supportato dai principali cloud provider, tra cui AWS, Google Cloud e Microsoft Azure come offerta “bring your own subscription” (BYOS). La piattaforma sarà presto disponibile anche come soluzione ottimizzata e convalidata su Azure Marketplace e AWS Marketplace. RHEL AI è disponibile come piattaforma di modelli di base preferita sulle offerte hardware accelerate dei partner Red Hat, inclusi i server Dell PowerEdge R760xa e i server Lenovo ThinkSystem SR675 V3.

Infine, per rispondere all’esigenza di scalabilità dei servizi degli LLM, Red Hat OpenShift AI ora supporta il servizio parallelizzato su più nodi con runtime vLLM, fornendo la capacità di gestire più richieste in tempo reale. Red Hat OpenShift AI consente inoltre agli utenti di modificare dinamicamente i parametri di un LLM durante il servizio, come lo sharding del modello su più GPU o la quantizzazione del modello a un footprint più piccolo. Questi miglioramenti mirano ad accelerare i tempi di risposta per gli utenti, aumentando la soddisfazione dei clienti e riducendo il churn.

Riteniamo che i modelli più piccoli e ottimizzati siano una necessità per poter sfruttare il potere trasformativo dell’AI generativa, e che questi modelli debbano essere implementati ovunque nell’hybrid cloud. I miglioramenti apportati a RHEL AI si basano su questa convinzione, semplificando la preparazione dei dati aziendali per l’addestramento di modelli privati con Docling e incorporando gli ultimi progressi nella famiglia Granite di LLM open source”, commenta Joe Fernandes, vice president e general manager, Artificial Intelligence Business Unit di Red Hat.

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con le notizie di ImpresaCity.it iscriviti alla nostra Newsletter gratuita.
Abbonati alla rivista ImpresaCity Magazine e ricevi la tua copia.

Notizie correlate

Speciali Tutti gli speciali

Reportage

L'observability a supporto dell'innovazione digitale

Reportage

Red Hat Summit Connect 2024

Reportage

WPC 2024

Speciale

Speciale Data Center

Speciale

Speciale Hybrid Working

Calendario Tutto

Gen 23
Nutanix Cloud Day Roadshow - Bari

Magazine Tutti i numeri

ImpresaCity Magazine


Leggi il Magazine

Iscriviti alla nostra newsletter

Soluzioni B2B per il Mercato delle Imprese e per la Pubblica Amministrazione

Iscriviti alla newsletter