La gestione dei dati è un aspetto imprescindibile per la vita aziendale. Dietro questo concetto ci sono vari aspetti da conoscere e sfide da affrontare, comprese buone pratiche per il suo impiego
Se i dati sono il “nuovo petrolio” il data management rappresenta l’infrastruttura adatta a gestirlo. Già questo dovrebbe fare comprendere la sua enorme importanza. Sì, perché se i dati sono sempre più considerati un autentico tesoro, tanto prezioso in quanto permettono alle aziende di prendere decisioni più informate, migliorare le campagne di marketing, ottimizzare le attività e ridurre i costi, consentendo di aumentare i ricavi e i profitti, la mancanza di un’adeguata gestione dei dati può vanificare tutto. La sua assenza pone enti e aziende a ritrovarsi con silos di dati incompatibili, set incoerenti e problemi di data quality che limitano la capacità di eseguire applicazioni di business intelligence se non, peggio, portare a risultati errati.
Le aziende possono faticare a ricavare un valore reale dai loro dati e molti di essi rimangono inattivi. Secondo Forrester, fino al 73% dei dati di un’azienda rimane inutilizzato per l’analisi. È qui che il data management svolge un ruolo fondamentale. Con una strategia appropriata, le aziende possono migliorare la qualità dei dati e l’accesso in tutta l’organizzazione.
Quindi, la loro gestione mirata ed efficace è il vero “new oil”. Un’indagine del 2021 sulle aziende Fortune 1000 rivelava che il 48,5% degli intervistati li utilizza come base per l’innovazione. Inoltre, le aziende incentrate sui dati ottimizzano i processi e i piani di crescita utilizzando dati più affidabili. Ciò rende il data management una pratica essenziale per qualsiasi azienda che desideri ottenere un vantaggio competitivo rispetto alle offerte dei concorrenti, per esempio.
Cos’è il data management
Il data management rappresenta tutto l’insieme di soluzioni e sistemi in grado di rendere possibile la gestione dei dati. Se vogliamo cercare una definizione possiamo ritrovarla in quella della Data Management Association, associazione non profit indipendente di riferimento: “è lo sviluppo e l’esecuzione di architetture, politiche, pratiche e procedure che gestiscono in modo appropriato le esigenze dell’intero ciclo di vita dei dati di un’azienda”.
Questo insieme di pratiche, tecniche architettoniche e strumenti permettono di ottenere un accesso coerente ai dati e alla loro distribuzione, “attraverso lo spettro delle aree tematiche e dei tipi di struttura dei dati nell’azienda, per soddisfare i requisiti di consumo dei dati di tutte le applicazioni e i processi aziendali”, aggiunge Gartner.
Tutto questo processo che permette di acquisire, archiviare, organizzare e manutenere i dati creati e raccolti dall’organizzazione aziendale, se efficace, rappresenta un elemento cruciale per l’implementazione dei sistemi IT. Essi eseguono le applicazioni aziendali e forniscono informazioni analitiche che aiutano a guidare il processo decisionale operativo e la pianificazione strategica da parte di dirigenti aziendali, manager e altri utenti finali.
Il processo di data management comprende una combinazione di funzioni diverse che, collettivamente, mirano ad assicurare che i dati nei sistemi aziendali siano accurati, disponibili e accessibili.
La gestione garantisce l’affidabilità e l’accessibilità dei dati all’interno dell’organizzazione per l’intero ciclo di vita, consentendo al contempo l’archiviazione sicura, controllata e protetta di un asset specifico.
Perché la gestione dei dati è importante
Data management è il primo passo fondamentale per svolgere un’analisi efficace dei dati su scala, fornendo così la possibilità di effettuare importanti approfondimenti in grado di migliorare i profitti aziendali. Con una gestione efficace, le persone all’interno di un’organizzazione possono trovare e accedere a dati affidabili alle loro richieste.
Inoltre, può aumentare la visibilità delle risorse di dati dell’organizzazione, rendendo più facile per le persone trovare rapidamente e con sicurezza i dati giusti per le loro analisi. La visibilità dei dati consente all’azienda di essere più organizzata e produttiva, permettendo ai dipendenti di trovare i dati di cui hanno bisogno per svolgere al meglio il proprio lavoro.
Un altro vantaggio offerto dal data management è l’affidabilità, in quanto aiuta a ridurre al minimo i potenziali errori, stabilendo processi e politiche di utilizzo e creando fiducia nei dati utilizzati per prendere decisioni in tutta l’organizzazione. Con dati affidabili e aggiornati, le aziende possono rispondere in modo più efficiente ai cambiamenti del mercato e alle esigenze dei clienti.
Tra i vantaggi ottenibili, va segnalata anche la scalabilità. La gestione dei dati consente, infatti, alle organizzazioni di scalarli efficacemente con processi ripetibili per mantenerli aggiornati. Quando i processi sono facili da ripetere, l’organizzazione può evitare i costi inutili della duplicazione, come la ripetizione delle stesse ricerche da parte dei dipendenti o di costose interrogazioni.
Infine, ma non certo meno importante vantaggio, data management protegge l’organizzazione e i suoi dipendenti da perdite, furti e violazioni di dati con strumenti di autenticazione e crittografia. Una adeguata sicurezza dei dati garantisce il backup delle informazioni aziendali vitali e il loro recupero in caso di indisponibilità della fonte primaria.
Piattaforme e sistemi utilizzati nel data management
Data management rappresenta un insieme composto da varie parti che svolgono un’azione sinergica per ottenere un determinato risultato. Possiamo individuarne diverse. La data governance stabilisce standard e politiche comuni per la protezione dei dati, in linea con le normative governative. La data architecture descrive la struttura delle risorse di dati di un’organizzazione e il modo in cui essi si spostano da un punto all’altro del sistema. Inoltre, la data integration comporta la combinazione di dati provenienti da più fonti e la loro presentazione in una visione unificata. C’è poi la data stewardship, la prassi di supervisione che garantisce la qualità e l’idoneità delle risorse per gli utenti aziendali. Data quality misura l’idoneità di un asset di dati allo scopo per cui è stato concepito, grazie a fattori quali la coerenza, l’accuratezza e la tempestività, mentre data lineage fornisce visibilità sul modo in cui i dati fluiscono attraverso un’organizzazione, comprese le origini, le trasformazioni e i punti di destinazione.
Aggiungiamoci anche la bonifica dei dati, o data remediation, che rappresenta l’organizzazione, la pulizia, lo spostamento, l’eliminazione e l’archiviazione dei dati per garantire la loro qualità e la correzione di eventuali errori. Se poi vogliamo ci sono anche: la scansione dei dati sensibili (sensitive data scan), che permette la loro identificazione, ubicazione e sicurezza; e la data security, ovvero la pratica di proteggere i dati da forze e violazioni dannose, indesiderate e corruttive.
In termini di sistemi, gli elementi determinanti per archiviare e utilizzare i dati sono i database. Anche in questo caso ce ne sono diversi: i più diffuso è il database relazionale, che utilizza spesso il linguaggio di programmazione SQL. Esistono poi, e si sono affermati negli anni, i database NoSQL e in questo senso se ne possono individuare almeno quattro: i database documentali, che memorizzano gli elementi di dati in strutture simili a documenti, i key-value database che associano chiavi uniche e valori associati, i wide-column store con tabelle con un gran numero di colonne e i graph database che collegano elementi di dati correlati in un formato a grafo.
I database NoSQL sono spesso utilizzati nelle implementazioni di big data grazie alla loro capacità di memorizzare e gestire diversi tipi di dati. A questo proposito si parla di big data management i cui sistemi sono sempre più spesso implementati nel cloud.
Aggiungiamo, tra i vari sistemi, anche data warehouse e data lake: si tratta di due archivi alternativi per la gestione dei dati analitici. Nel caso del data warehouse, si tratta di un sistema di gestione progettato per consentire e supportare le attività di business intelligence; quando si parla di data lake si intendono dei “depositi” per grandi volumi di dati.
Della gestione fa parte anche la data integration: la tecnica più diffusa è l’estrazione, la trasformazione e il caricamento (Extract, transform and load ETL), che estrae i dati dai sistemi di origine, li converte in un formato coerente e quindi li carica, debitamente integrati, in un data warehouse o in un altro sistema di destinazione.
Nel processo di data management fanno parte integrante le piattaforme di data management (DMP). Sono considerate tali le piattaforme software impiegate per la raccolta e la gestione dei dati e permettono alle aziende di identificare segmenti di pubblico utilizzabili per indirizzare utenti e contesti specifici nelle campagne pubblicitarie online. Le DMP possono utilizzare big data e algoritmi di intelligenza artificiale per elaborare e analizzare grandi insiemi di dati sugli utenti provenienti da varie fonti. Alcuni vantaggi dell’utilizzo delle DMP includono l’organizzazione dei dati, una maggiore conoscenza del pubblico e dei mercati e un’efficace pianificazione del budget pubblicitario. Le Data Management Platform devono anche affrontare problemi di privacy a causa dell’integrazione di software di terze parti con dati privati.
Più in generale, col termine piattaforma dati ci si riferisce a qualsiasi piattaforma software utilizzata per la raccolta e la gestione dei dati. Si tratta di una soluzione integrata capace di combinare le funzionalità di un data lake o di un data warehouse per scopi di business intelligence.
Alcune best practice
Come abbiamo potuto leggere finora, si comprende come la data management comprende soluzioni, sistemi e tecniche diverse. Non c’è un’unica ricetta ideale per le esigenze di ogni ente o azienda. Tuttavia, esistono diversi punti strategici che si applicano nella maggior parte dei casi, delle vere e proprie best practice che possono essere così identificate.
Una prima buona regola valida per tutti è quella di stabilire gli obiettivi. Prima di elaborare una strategia di gestione mirata, il proprietario dei dati deve definire gli obiettivi che intende raggiungere. Gli obiettivi focalizzano gli sforzi individuali e definiscono i risultati desiderati e misurabili. Inoltre, stabiliscono le aspettative per i team e i reparti di un’azienda in merito a ciò che l’organizzazione sta cercando di raggiungere nel suo complesso.
Ogni azienda, a questo proposito deve saper determinare quali dati sono rilevanti; valutare quale strumento di gestione sia più adatto per la propria natura; definire obiettivi prioritari.
Una seconda best practice riguarda la capacità di costruire un sistema scalabile, in grado cioè di essere ampliato man mano che le esigenze aumentano. A ciò si aggiunge anche un’altra priorità:
saper focalizzare la visualizzazione dei dati. Non tutti all’interno di un’azienda che trae vantaggio dai dati si sentono a proprio agio nell’analizzarli. Illustrare le informazioni pertinenti in un formato visivo come un grafico aumenta l’accessibilità dei dati per il dipendente medio e incoraggia l’ulteriore utilizzo degli strumenti di dati.
Le sfide del data management
La gestione dei dati è fondamentale, ma le sfide per riuscire a contare su un sistema efficace non mancano. Secondo alcune stime, entro il 2025 le persone e le aziende di tutto il mondo produrranno ogni giorno 463 exabyte di dati, rispetto ai tre exabyte di dieci anni fa. Forrester ha rilevato che l’82% dei responsabili di data management intervistati trova difficile controllare e prevedere i costi dei dati, rendendo fondamentali gli strumenti di gestione dell’ecosistema.
Secondo il rapporto Global Data Management 2021 di Experian, le organizzazioni ritengono che il 32% dei loro dati sia impreciso e il 55% dei leader aziendali ha difficoltà a fidarsi dei propri asset di dati. Ciò rafforza l’importanza di un approccio ponderato alla gestione dei dati. Senza dati affidabili, i dirigenti possono perdere rapidamente fiducia nelle analisi dei dati eseguite nell’organizzazione. I dipendenti possono dedicare fino al 50% del loro tempo a cercarli e a correggere gli errori da soli, spesso senza avvisare il reparto originario che ospita il set di dati difettosi.
Una recente indagine di Capital One basata su un campione di dirigenti aziendali ha messo in luce come il 76% del campione ha dichiarato di trovare difficile la comprensione dei propri dati, l’82% dei responsabili di data management ritiene che il controllo e la previsione dei costi dei dati siano impegnativi. Altra criticità riguarda la capacità di provvedere a questa funzione cruciale da parte del personal: i responsabili delle decisioni non dispongono di personale sufficiente, di competenze interne o di collaborazione tra team e strumenti per raggiungere i loro obiettivi.
Un altro problema riguarda la mancanza di catalogazione dei dati e la loro governance: nel primo caso quasi l’80% degli intervistati l’ha segnalata tra le principali sfide; nel secondo caso, l’82% ha citato politiche di governance dei dati confuse.
Le sfide non finiscono qui. Se un’organizzazione non dispone di un’architettura dei dati ben progettata, può ritrovarsi con sistemi isolati, difficili da integrare e gestire in modo coordinato. Anche in ambienti meglio pianificati, consentire ai data scientist e agli altri analisti di trovare e accedere ai dati rilevanti può essere un problema, soprattutto quando i dati sono sparsi in vari database e sistemi di big data.
Il passaggio al cloud può facilitare alcuni aspetti del lavoro di gestione dei dati, ma crea anche nuove sfide. Per esempio, la migrazione ai database e alle piattaforme di big data nel cloud può essere complicata per le organizzazioni che devono spostare i dati e i carichi di lavoro di elaborazione dai sistemi on-premise esistenti.
Molti team di data management sono ora tra i dipendenti responsabili della protezione dei dati aziendali e della limitazione delle potenziali responsabilità legali per le violazioni o l’uso improprio. I responsabili della gestione dei dati devono contribuire a garantire la conformità alle normative governative e di settore in materia di sicurezza, privacy e utilizzo.
Queste sfide di gestione dei dati sono comuni e non sono affatto le uniche. Man mano che le organizzazioni ne generano di più, adottano nuovi strumenti e tecnologie per la raccolta e l’analisi e trovano nuovi modi per applicarli, emergono inevitabilmente nuove sfide e complicazioni etiche e di privacy. Le organizzazioni devono sperimentare modi per costruire programmi di gestione dei dati a prova di errore. McKinsey ha posto alcuni principi relativi ai dati che possono fornire un utile punto di partenza:
- Stabilire regole specifiche dell’azienda per l’utilizzo dei dati.
- Comunicare i valori dei dati, sia all’interno che all’esterno dell’organizzazione.
- Costruire un team eterogeneo incentrato su di essi.
- Considerare l’impatto degli algoritmi e dell’uso complessivo dei dati.
- Pensare in modo globale.
- Incorporare i principi dei dati nelle operazioni aziendali.