Alle tre del mattino il responsabile del provider che ospita i vostri server avvisa pubblicamente, via Twitter, che i suoi clienti
farebbero meglio ad attivare il loro piano di disaster recovery. Perché un incendio sta mettendo fuori uso parte delle strutture di uno dei principali data center del provider stesso. Non è un buon modo di iniziare la giornata, ma è quello che gli utenti di
OVHcloud, uno dei principali cloud e data center provider europei, hanno dovuto affrontare nella nottata tra martedì e mercoledì scorso.
Una nottata con conseguenze facilmente immaginabili, e subito palesi a chiunque passasse per i social network. La
trasparenza del CEO e fondatore di OVHcloud,
Octave Klaba, nel raccontare le difficoltà del provider via Twitter
apre la strada alle reazioni dirette dei clienti, sempre via Twitter. Così abbiamo tutti visto come il blocco dei data center di Strasburgo si sia tradotto nel conseguente
blocco dei siti web e dei servizi online di molti utenti OVHcloud, anche italiani. Un blocco totale o parziale a seconda dei casi, ma comunque un disagio più o meno critico.
La cronaca della vicenda è semplice, anche perché Klaba ne ha delineato praticamente in diretta i punti principali. Più articolato è mettere in fila
quello che l'incidente di Strasburgo lascia come "morale" su cui riflettere. Per OVHcloud, per i suoi clienti, per il mondo data center in generale. Ma prima serve fare un passo indietro e ricapitolare quanto è accaduto.
L'incidente di Strasburgo
OVHcloud conta una trentina di datacenter distribuiti in tutto il mondo. A Strasburgo c'è una delle strutture storiche del provider, che ospita diversi data center distinti. Per motivi ancora tutti da chiarire,
poco dopo la mezzanotte di martedì è scoppiato un incendio in uno di questi data center, quello siglato SBG2. L'incendio ha distrutto completamente SBG2 e danneggiato il data center SBG1, mettendone fuori uso un terzo (4 data room su 12). I restanti data center principali SBG3 e SBG4 non sono stati danneggiati, ma sono comunque stati "spenti"
come misura precauzionale. Di fatto, tutto il sito di Strasburgo è stato isolato.
Gli impatti del blocco vanno ben oltre quello che si intuisce leggendo i commenti su Twitter. OVHcloud ha nel tempo sviluppato
un parco clienti importante in Francia e nelle nazioni francofone, comprese le ex colonie come l'Algeria o la Costa D'Avorio. Non sorprende quindi che dopo l'incidente si parli di
qualcosa come 3,6 milioni di siti web finiti offline. Secondo Netcraft, quasi il 20% degli indirizzi IP gestiti da OVH
è scomparso da Internet al momento del blocco. In Francia - ma non solo lì, anche ad esempio in Polonia e Gran Bretagna - il problema ha toccato
siti e servizi governativi. Tra cui, fortunatamente solo per qualche ora, anche il servizio francese per la pianificazione delle vaccinazioni anti-Covid.
Come per tutti i cloud provider, d'altronde, anche per OVHcloud la "dipartita" di un data center mette fuori gioco un numero elevatissimo di risorse IT. Octave Klaba ha indicato che OVHcloud ha in piano di sostituire circa
10 mila server nel giro di tre-quattro settimane, attingendo allo stock di server che è disponibile nei siti di Roubaix e Gravelines. Operazione facilitata dal fatto che OVHcloud
produce direttamente buona parte dei server che utilizza. Se tutto va come il provider auspica, nel corso della prossima settimana dovrebbero essere riattivati SBG1, SBG4 e SBG3. Ma ovviamente la questione va oltre il ritorno all'operatività in sé.
La reazione dei clienti
OVHcloud serve varie categorie di aziende clienti, cosa che spiega le differenti reazioni che si sono potute leggere sui social network. A nessuno piace dover mettere in atto in piena notte un piano di disaster recovery, ma
è proprio per casi come questo che un piano del genere viene sviluppato. L'impressione è che parecchi utenti di OVHcloud
non abbiano affatto considerato una eventualità come quella dello scorso 10 marzo. I tweet di risposta a Octave Klaba possono non essere un campione del tutto significativo, ma il polso della situazione lo hanno dato. E non in senso positivo. Anche se hanno solo confermato quello che gli esperti di settore dicono da tempo.
La reazione di una buona fetta del "campione social" (per così dire) è stata una brusca presa di contatto con la realtà: passare al cloud
non significa delegare completamente al provider l'operatività dei sistemi e la continuità generale del business. OVHcloud ha le sue responsabilità nella parte infrastrutturale, che è "caduta" in maniera imprevedibile e incontrollabile per il singolo cliente. Ma quando Klaba indicava ai clienti di avviare i piani di disaster recovery non faceva della facile ironia. E nemmeno cercava di sviare l'attenzione dall'efficacia o meno dei suoi stessi piani di business continuity.
Diceva una cosa teoricamente ovvia: è persa (o potrebbe perdersi a breve) l'istanza principale dei vostri dati e dei vostri servizi, attivate quella secondaria.
Alcuni utenti hanno descritto di aver rapidamente attivato
una vera e propria replica del sito principale e dei suoi servizi che era stata definita in un altro sito di OVHcloud. Un servizio che la stessa piattaforma del cloud provider francese - come di quasi tutti gli altri - prevede, in una logica di
disaster recovery multi-sito che è sostanzialmente la base del DR. Altri hanno effettuato più semplicemente un ripristino dei dati, salvati via backup. Altri hanno scoperto che il backup su cui contavano
non era aggiornato o non era stato completato. Altri ancora non avevano una rete di sicurezza a cui affidarsi.
Il problema è noto: moltissime azienda fanno fatica a vedere la sicurezza come
qualcosa che deve essere intrinseco ai processi. Siamo spesso lontani da una gestione del rischio che consideri non "se" qualcosa di negativo impatterà sui sistemi, ma solo quando e in che misura. E gli stessi che invocano sanzioni contro OVHcloud,
GDPR alla mano, potrebbero trovarsi nei panni del provider, perché hanno la loro parte di responsabilità. È appunto il nodo della
responsabilità ormai quasi sempre condivisa sulla cyber security, un concetto evidentemente ancora poco chiaro.
I segnali al mercato
Octave Klaba ha definito quello dell'incendio "il peggior giorno degli ultimi 22 anni" e c'è certamente da credergli. Non è semplicissimo districarsi nelle clausole contrattuali dei provider, ma al di là dei possibili danni economici diretti
il danno di immagine è indubbio. Un danno vissuto anche a livello nazionale: più di un magazine francese ha descritto l'incidente come
un colpo importante all'immagine di French Tech. Proprio ora che il cloud europeo cerca in vario modo di
rafforzarsi nei confronti dello strapotere statunitense. Ma anche del crescente ruolo tecnologico del cloud cinese.
Le indagini di OVHcloud e delle autorità locali spiegheranno cosa è successo. E magari indicheranno che cosa si poteva fare e non è stato fatto, in quanto a misure preventive. Oppure no. La causa plausibile al momento, avvalorata secondo Klaba dalle riprese delle termocamere interne dei data center, è
l'esplosione di uno o due UPS. Di cui uno, racconta il fondatore di OVHcloud, riparato giusto il giorno prima dell'incidente. Resta comunque la constatazione che per i cloud/hosting provider non basta pensare alla semplice Legge di Murphy: è ovvio che se qualcosa potrà andar male, lo farà.
Il punto chiave è che lo farà nel peggior modo possibile. Ed è a questo "peggior modo" che bisogna pensare sin dalle prime fasi di concezione ed ideazione di un data center.
È implicito che tutti i provider sappiano questo e si muovano di conseguenza. Come è implicita la loro buona volontà nell'offrire garanzie tecniche adeguate ai loro clienti. I principali provider possono certo recuperare da un incidente come quello di Strasburgo, ma fra loro
cambiano i tempi in cui riescono a farlo ed i disservizi che nel frattempo devono subire i loro utenti. Per questo è davvero importante che tutti i data center provider, grandi e soprattutto meno grandi, sfruttino in positivo la negativa esperienza di OVHcloud.
Dal punto di vista del mercato, il rischio è che eventi come quello di Strasburgo allarghino, nella
percezione degli utenti, il divario -
che già esiste - tra grandi, meno grandi e piccoli provider. La percezione cioè che solo i grandi hyperscaler possano essere allo stesso tempo performanti e affidabili. Ma una eccessiva
concentrazione del mercato non farebbe bene a nessuno.
E le aziende utenti? Oggi l'idea di essere offline solo per qualche ora spaventa qualsiasi impresa. Giustamente, perché la digitalizzazione fa bene ma comporta la
dipendenza dalla piena operatività dei servizi digitali, propri e dei propri fornitori. Qui la presa di coscienza necessaria è che la continuità del business dipende anche da quanto sappiamo
proteggerci da soli: il provider arriva fino ad un certo punto. L'ultimo pezzo di strada va fatto investendo direttamente in componenti e servizi per la protezione dei processi e dei dati.