Analytics is manufacturing: l'espressione è strana ma sintetizza la
concezione moderna dell'analisi dei dati, secondo cui generare informazioni a partire dai dati grezzi è un
processo “produttivo” costante e indispensabile per molte parti - in prospettiva tutte - di una impresa moderna.
Analytics is manufacturing è anche uno dei principi del
DataOps Manifesto, le “
tavole della legge” di un modo di concepire l'analisi dei dati che si sta diffondendo nelle grandi imprese, promettendo di rendere l'analisi dei dati più funzionale alle loro esigenze.
È evidente dalla denominazione stessa che il modello DataOps si ispira a DevOps. In fondo l’obiettivo è il medesimo: trasformare una attività isolata e "da esperti" in un
processo ciclico, misurabile e focalizzato sui risultati tangibili per l'impresa. Non più quindi un processo "waterfall" il cui output è valido per chi lo produce ma che va poi ulteriormente raffinato per aiutare davvero i processi aziendali. Insomma, come il codice non deve essere buono per chi lo sviluppa ma per chi lo deve usare, anche le analisi dei dati
non devono essere solo "ben fatte" ma anche utili a chi le riceve.
In tutto questo, DataOps è
molto più d'impatto di DevOps. Gli analytics evoluti – quindi tutto il campo del machine learning, della data science e dei modelli predittivi – sono un tema nuovo per molte imprese, per cui semplificarli e renderli sistematici dà decisamente
una grossa mano. In confronto, lo sviluppo software è una attività quasi storica.
Per DataOps conta solo ciò che è utile
DataOps parte in un certo senso dalla fine: la
quantificazione del risultato. Le tecniche e le procedure di analytics valide - e quindi da mantenere - sono cioè quelle che producono un vantaggio misurabile per l'impresa. In particolare sono utili le soluzioni e le tecniche che
generano "insight" precisi, in maniera regolare e riproducibile, partendo da dati accurati. Le altre possono, e anzi dovrebbero, essere abbandonate senza forti opposizioni interne o concettuali. E questo processo di selezione continua nel tempo, perché DataOps spinge la ricerca costante del migliore
livello di analisi possibile.
Come per DevOps, anche per DataOps uno degli snodi chiave da affrontare è
legare davvero la parte "ops" a quella che la precede, in questo caso l'analisi dei dati. L'idea di fondo è che questa non è una attività isolata portata avanti da tecnici isolati ma deve esserci una interazione costante con chi poi ne usa i risultati.
I sostenitori del modello DataOps non vogliono certo banalizzare l'analisi evoluta dei dati. Sanno che è una disciplina con figure specifiche e preparate, come i
data scientist, ma vedono il loro contributo calato in un
approccio di squadra e interdisciplinare. L'obiettivo è fare in modo che i processi di analytics siano sempre allineati agli obiettivi di business e in sincronia con altri processi complementari in azienda. Per questo serve che i "tecnici" abbiano un feedback continuo da parte di chi sul loro lavoro basa la propria attività.
DataOps: una questione organizzativa
Uno dei principi teorizzati nel DataOps Manifesto è "reduce heroism": non ci sono esperti
in torri d'avorio o fuoriclasse indispensabili, solo un costante lavoro di squadra verso un obiettivo comune. Il team ideale per DataOps
quindi è cross-funzionale e combina i data scientist con le operations, il product management, la pianificazione dell'architettura IT, l'ingegneria del software e via dicendo, a seconda delle necessità che uno specifico progetto impone.
Team così interdisciplinari
comportano spesso un certo attrito, ed è qui uno dei principali freni per la diffusione di DataOps. Figure professionali diverse vedono uno stesso problema in maniera differente e ne giudicano critici aspetti diversi. Serve avere sempre la capacità di
raggiungere un compromesso positivo: condividere la propria visione con quella degli altri per capire le esigenze di tutti e arrivare a una soluzione che soddisfi le più importanti.
In questo senso aiuta - o dovrebbe aiutare - la mancanza di gerarchie e di catene di comando estese e rigide. DataOps spinge infatti un
modello organizzativo "piatto" e flessibile, in cui i team si formano in funzione dei problemi da affrontare e si auto-organizzano senza una gerarchia articolata.