banner

Blog

Dec 10, 2023

Come spiegare mesh di dati, tessuti e cloud

Di Isaac Sacolick

Redattore collaboratore, InfoWorld |

Il tuo CEO sa cos'è un database e probabilmente pensa che un data warehouse sia un grande archivio di dati utilizzato per reporting e analisi. Sanno poco sugli archivi dati NoSQL, sul motivo per cui hanno bisogno di un cluster Spark o su come vengono utilizzati i data Lake per acquisire dati strutturati e non strutturati.

Gli amministratori delegati e i leader aziendali si concentrano sul valore aziendale dei dati, dell’analisi e del machine learning e si preoccupano meno delle tecnologie sottostanti.

Ma qui sta il paradosso, perché vogliono capire il valore dell’investimento di tempo e denaro nelle nuove tecnologie. Prova a spiegare le più recenti tecnologie di gestione dei dati, tra cui data mesh, data fabric e cloud di dati distribuiti, e osserva come gira la testa il tuo CEO.

Non si tratta solo degli amministratori delegati. La tecnologia dei dati è esplosa sin dagli albori del web, quando il dibattito principale era se costruire il proprio data warehouse su Oracle, Microsoft o open source. Molti leader non IT oggi si accontentano di credere che i dati siano "nel cloud" e che l'integrazione, la qualità e le prestazioni dei dati siano "problemi IT".

Chiunque lavori con i dati dovrebbe essere pronto a spiegare le tecnologie e le pratiche più critiche in un linguaggio accessibile. Nel mio libro, Digital Trailblazer, condivido una storia su come spiegare cosa sia un cookie del browser ai membri del consiglio di amministrazione della nostra startup quando il web era nuovo. Non sai mai quando ti verrà consegnato il microfono per rispondere a una domanda tecnica. Rispondere con technobabble può facilmente scoraggiare o rallentare gli investimenti chiave.

Gordon Allott, presidente e CEO di K3, suggerisce di iniziare con una risposta semplice: “Data Lake, data warehouse, mesh e fabric si riferiscono tutti semplicemente alla strategia complessiva dei dati aziendali”.

Mantenere le risposte semplici è importante, ma spesso non è sufficiente. Quando un dirigente mi chiede informazioni su un termine tecnico, voglio rispondere alla domanda in un modo che incoraggi la curiosità e le domande di follow-up.

Cominciamo spiegando cos'è una mesh di dati. Steven Lin, product marketing manager di Semarchy, ha condiviso questa risposta concisa: "Un data mesh è un approccio decentralizzato alla gestione dei dati, in cui più team all'interno di un'azienda sono responsabili dei propri dati, promuovendo la collaborazione e la flessibilità", ha affermato.

Non ci sono parole complesse in questa definizione e introduce i problemi che le mesh di dati mirano a risolvere, il tipo di soluzione e il motivo per cui è importante.

Aspettatevi però che vi vengano richiesti dettagli più tecnici, soprattutto se il dirigente ha una conoscenza preliminare di altre tecnologie di gestione dei dati. Ad esempio, "I data warehouse e i data lake non avrebbero dovuto risolvere il problema della gestione dei dati?"

Questa domanda può essere una trappola se si risponde considerando le differenze tecniche tra data warehouse, laghi e mesh. Concentra invece la tua risposta sull’obiettivo aziendale.

Satish Jayanthi, cofondatore e CTO di Coalesce, offre questo suggerimento: “La qualità dei dati spesso influisce sull'accuratezza dell'analisi aziendale e del processo decisionale. Implementando i paradigmi del data mesh, la qualità e l’accuratezza dei dati possono essere migliorate, con conseguente maggiore fiducia tra le aziende nell’utilizzo dei dati in modo più ampio per un processo decisionale informato”.

Mi piace questa risposta e spero che il dirigente voglia approfondire il modo in cui i paradigmi di data mesh aiutano a migliorare la qualità dei dati. Jayanthi risponde: “Uno dei principi fondamentali, la proprietà del dominio, garantisce che il team che produce i dati sia responsabile della qualità e dell'accuratezza. Questo principio dei dati come prodotto garantisce che i dati condivisi con altri gruppi siano accurati, riutilizzabili, autodocumentati e soddisfino standard elevati”.

Se non hai esperienza con le mesh di dati e desideri approfondire i dettagli tecnici, suggerisco di rivedere l'articolo fondamentale di Zhamak Dehghani sul passaggio da un data Lake monolitico a una mesh di dati distribuita.

CONDIVIDERE