Hortonworks, l'open source per il big data

Hortonworks, l'open source per il big data

Il framework di data management basato su file system distribuito attualizza la propria roadmap evolutiva coerentemente con i nuovi paradigmi dell’IoT e di contesti applicativi smart x

di: Redazione del 14/04/2017 09:44

Big Data & Analytics
 
img-20170405-085430--fileminimizer-.jpg
Dataworks Summit 2017 - Hortonworks - l’open source company targata Hadoop, framework di data management basato su file system distribuito e orientato all’analisi big data - attualizza la propria roadmap evolutiva coerentemente con i nuovi paradigmi dell’IoT e di contesti applicativi smart x. L’obiettivo è rendere disponibile una schema che consenta di conciliare esigenze di elaborazione centralizzata e nello stessso tempo distribuita, on the edge, secondo quanto implicitamente ascrivibile al fog computing. Questa nuovo fronte tecnologico - al di là della capacità di sfruttare al meglio, in termini di efficienza, la disponibilità dei dati - introduce nuove istanze di capacità interpretativa dei dati che oggi trovano un naturale alleato nell’intelligenza artificiale e nel machine learning. Tutti elementi, questi ultimi, che vengono oggi metabolizzati da Hortonworks in due dimensioni applicative che coinvolgono da una parte i dati a riposo e dall’altra i dati in movimento con un focus primario sul real time analytics.

img-20170404-140707--fileminimizer-.jpgRoadmap tecnologica
Il Dataworks Summit di Monaco di Baviera - svoltosi nel corso della prima settimana di aprile - è stata la vetrina in cui si sono messe a fuoco le iniziative intraprese nell’alveo di questo contesto evolutivo. Raj Verma (nella foto), Shau Connoly e Scott Gnau - rispettivamente Chief Operating Officer, Chief Strategy Officer e Chief Technology Officer - si sono spesi per rendere intellegibili il percorso definito e la roadmap tecnologica, il cui obiettivo di fondo rimane sempre e comunque legato al modello originario ovvero fornire un’architettura di data management flessibile e al passo con i tempi. D’altra parte, lo sappiamo, la complessità e i volumi dei dati disponibili sono sempre più elevati e le architetture tradizionali non sono adatte a gestire una realtà diversificata e in espansione come quella con cui le organizzazioni si stanno confrontando. Occorre perciò essere in grado di mettere a punto uno storage teoricamente infinitamente scalabile per implementare un data lake ovvero un data store operazionale – in e off the cloud - in grado di ospitare volumi di dati eterogenei strutturati e non strutturati per rispondere a esigenze di elaborazione dati diversificata (batch, interattiva e e in real time) in contesti ambientali di volta in volta differenti. Se inizialmente Hadoop è stato adottato come tecnologia in grado di modernizzare le architetture software, ottimizzando l’utilizzo dei dati e riducendo i costi associati alla gestione in ambiente proprietario, oggi il driver diventa il business, poiché individua in una struttura dati di questo tipo il potenziale per l’approntamento di nuovi servizi e applicazioni in ambito big data e Iot.

Work in progress
Quotata al Nasdaq dal 2014, nell’ultimo anno fiscale Hortonworks ha raggiunto un fatturato di 184,5 milioni di dollari, volume d’affari del 56% superiore a quello conseguito nel 2015. L’attuale capitalizzazione di mercato è oggi pari a 685 milioni di dollari. L’azione ha superato i dieci dollari recuperando la perdita subita nei primi nove mesi del 2016. Da novembre a oggi la performance è stata strepitosa (+50%) e ha consentito al titolo di riprendere quota riportandosi ai livelli dell’agosto scorso. Certo è un percorso tutto in salita. Ricordiamo che Hortonworks al suo ingresso al Nasdaq era infatti prezzata 25 dollari ad azione. Il management della società rivendica di essere la sola e vera Hadoop open source company in quanto Cloudera, astro nascente ora proiettata anch’essa ad essere quotata in borsa, ha nel tempo associato al framework originario di Apache tecnologia di derivazione proprietaria. Cloudera posiziona la propria offerta caratterizzandosi come piattaforma di data management, machine learning e advanced analytics con un’enfasi sulla nuova frontiera cognitiva e di intelligenza artificiale, considerata il prossimo vero capo di battaglia del futuribile data management Per Forrester Research il mondo Hadoop, e le due aziende che si contendono il mercato di riferimento, è al centro di un nuova evoluzione e chi meglio riuscirà a declinare il framework di data management coerentemente con la nuova frontiera tecnologica e, insieme, di business, sarà destinato a prevalere.

img-20170404-132540--fileminimizer-.jpgCompetizione open Relativamente alle performance finanziarie il Coo Raj Verma sostiene che l’andamento di Hortonworks sia in parte anche conseguenza di una ancora mancata e non piena comprensione del modello di business che sottende l’open source. “Certo Red Hat ce l’ha fatta, ma si deve osservare che Red Hat rappresenta il ritorno dell’investimento di una vita, quello di Linux. Tutte le aziende che si affacciano a Wall Street e sono espressione di un nuovo business hanno un andamento discontinuo nella prima fase, ma poi nel tempo riescono ad arrivare a una fase di stabilizzazione e crescita. Dobbiamo riuscire a provare che questo modello di business è monetizzabile. I risultati dell’ultimo periodo testimoniano della capacità di indirizzare problemi reali ed esigenze sempre più diffuse tra le organizzazioni. Il nostro cashflow è positivo. Continuiamo ad avere gli investimenti necessari per supportare la nostra strategia di crescita e il mercato sembra accordarci quella fiducia che in passato è venuta a mancare”. Non temo il confronto con Cloudera, continua Verma. “Se mi si chiede se l’intelligenza artificiale sarà il nuovo faro guida dei nuovi sviluppi non posso che rispondere affermativamente. Ma occorre essere pragmatici. L’assetto della nostra offerta e gli investimenti previsti sono coerenti con le problematiche con cui si confrontano le aziende. Si spiega solo in questo modo la crescita del 56% che abbiamo conseguito nell’ultimo anno”. Verma sottolinea, inoltre, che il successo di un progetto Hadoop sta nel creare le condizioni per poter scale ed estendere nel tempo il progetto. Think big, start small, dice Verma. “Intraprendere iniziative big data significa iniziare un lungo viaggio e non è certo un qualcosa cui possono interessati coloro che vogliono ottenere gratificazioni immediate. L’approccio deve essere step by step e avere un ampio respiro”.


Real time analytics Every business is a data business, è il mantra di Hortonworks, e Hadoop è il framework di riferimento per cogliere le opportunità di mercato. Ecco, quindi, che accanto alla Hortonworks Data Platform (Hdp), core technology per eccellenza in ambito big data, è stata resa disponibile Hortonworks DataFlow (Hdf), piattaforma basata sul progetto Apache NiFi per gestire la complessità di analisi dati in real-time e le sfide dell’acquisizione e del trasporto di dati da una moltitudine di sorgenti grandi e piccole, veloci e lente, sempre connesse. Hdf può essere così pensato come hub di un ecosistema digitale che fornisce funzioni di data acquisition, event processing, trasporto e delivery attraverso data flow generati da dati in movimento e a riposo per effettuare real-time analysis.

“Nell’ambito del data management stiamo assistendo a un cambiamento paradigmatico”, afferma Il Cto Scott Gnau. “Per trent’anni il tutto era circoscritto a una gestione e analisi dati confinata all’interno del perimetro aziendale. Con l’IoT ciò non è più possibile. In questa nuova dimensione di mondo connesso è importante che i dati risiedano lì dove è conveniente che siano, on the edge. Push the anlalytic es to the data e non il contrario. Il cambiamento interessa dati in movimento e a riposo. L’analytics associato all’autonomus car deve poter dare risposte nel più breve tempo possibile sfruttando anche la conoscenza del data center ma per agire localmente. Ecco, quindi, le connected data platform e un portafoglio di soluzioni satellite e complementari. Comunicazione bidirezionale, peer-to-peer, dati in streaming. Tutto questo è parte dei problemi e iniziative con cui ci confrontiamo in questo momento. Tutte le funzioni che concorrono alla definizione di questi processi sono oggetto di investimento e orientate a definire una migliore analytics.”. Stay tuned.
Tag notizia:

Cosa ne pensi di questa notizia?

Attualità

...continua

Opinioni e Commenti

...continua
 
 
 

Vota