Nei processi Big Data si evidenziano due tecnologie: i database relazionali ottimizzati per compiti analitici (spesso chiamati analityc RDBMS o ADBMS) che prevedono l’utilizzo di tecnologia a calcolo parallelo (MPP) e sistemi non relazionali (talvolta definiti come
NoSQL systems) per elaborazione di dati multi-strutturati.
Nel corso degli ultimi anni lo sviluppo di prodotti ADBSM da parte di piccole aziende innovative ha fatto sì che i vendor tradizionali si impegnassero nel migliorare la capacità di elaborazione analitica. Ciò ha portato a miglioramenti e nuove funzionalità nei prodotti RDMS esistenti così come a una politica di acquisizioni. Emc, per esempio, ha acquisito
Greenplum, Hp Vertica, Ibm Netezza, Microsoft Datallegro, Teradata Aster Data. Tutte le soluzioni che questi vendor sono andati a implementare negli anni stanno oggi conoscendo un periodo di rapida trasformazione e una progressiva integrazione e metabolizzazione delle feature open source Hadoop.
A questo proposito è utile osservare che per i sistemi analitici creati sino a questo momento si stanno cercando di definire ambienti che possano permettere la migliore ottimizzazione delle capacità di calcolo e analisi strutturando processi e workload distribuiti cercando di fare leva sui punti di forza di ciascuna tecnologia, ADBMS-NoSQL.
Ecco, per esempio (vedi video), come Netezza intende incorporare e sfruttare il meglio dei due mondi all’interno della sua appliance. Potremmo definire la prossima generazione di database come quella dei DB convergenti. Gli annunci che si sono susseguiti alla fine dell’anno e quanto avvenuto nel primo trimestre 2013 testimoniano della vivacità che contraddistingue queste tecnologie,
vedi recenti aggiornamenti. Non è esclusa, ovviamente Oracle che prevede possibilità di creare una finestra di comunicazione con il mondo open source attraverso
connettori Hadoop, così come la messa a punto di
una soluzione nativa NoSQL.
Come affermato da Scott Yara, co-fondatore di Greenplum, “We’re all ina Hadoop period”. La società, ora parte della galassia EMC, ha annunciato di avere integrato una soluzione Hadoop completamente reingegnerizzata,
Pivotal HD, nel proprio database analitico. “Qualsiasi vendor di database che non sposa a una logica di piattaforma Hadooop compie oggi un grave errore”.
Questa prospettiva coinvolge anche il fronte delle tecnologie di base, all'interno del quale si osservano iniziative di un certo spessore, considerato che è vitale riuscire a disporre di hardware più veloce e performante. Un esempio per tutti
Intel che sta lavorando su una propria distribuzione Hadoop.