Lavorando per sapere come i dati entrano nell’organizzazione, dove esistono o si trasformano mentre viaggiano attraverso diversi processi e sistemi, i leader dei dati hanno coniato il termine data lineage per visualizzare il patrimonio dei dati da una prospettiva di dipendenza (ordine). Il lineage documenta le origini dei dati, il loro movimento, i loro usi e qualsiasi cambiamento durante il loro viaggio.
Il lineage dei dati permette alle organizzazioni di tracciare i dati mentre si muovono attraverso ogni destinazione, tracciando le alterazioni e gli errori dei dati fino alla loro origine. Quando i dati cambiano, cambiano anche il loro significato, il loro scopo e il loro punteggio di qualità, con conseguenti imprecisioni nei dati. Il lineage dei dati permette agli utenti di individuare la causa dei problemi dei dati e di risolverli. Fornisce anche una traccia di controllo delle informazioni.
Comprendere i diversi tipi di lineage dei dati
Quando si cerca di spiegare il lineage, persone diverse offriranno definizioni diverse perché il loro punto di vista dipende dal loro ruolo di utenti e dalla domanda a cui stanno cercando di rispondere.
Esempio di domande a cui il lineage può aiutare a rispondere:
- Quali sono le politiche applicate nell’esecuzione di questo processo aziendale?
- Quali regole di qualità sono state applicate prima che questo rapporto fosse inviato a un cliente?
- Chi sono le persone che sono nella catena di responsabilità per assicurare che il set di dati sia corretto?
- Devo firmare questo rapporto di audit?
Possiamo classificare queste viste in due gruppi. Il primo è il lineage dei dati tecnici, che sorveglia gli elementi cruciali per la conformità, le operazioni, le procedure, le trasformazioni e le combinazioni di dati. L’altro è il lineage dei dati aziendali, che fornisce una visione del lineage tecnico a livello di applicazione o di business, che permette agli utenti aziendali di capire il ruolo dei dati nei processi aziendali.
Gli utenti dei dati tecnici risiedono tipicamente nel dipartimento IT. Con il lineage dei dati tecnici, le risorse IT possono identificare dove si trovano i dati sensibili, come cambiano, chi ha accesso, come vengono condivisi e i loro livelli di qualità. Queste informazioni permettono agli utenti tecnici di rispondere alle domande sui dati per quanto riguarda la loro sensibilità e la loro qualità, per garantire la conformità e l’accuratezza.
Il lineage dei dati aziendali fornisce informazioni su come i dati si adattano al business e sui vari risultati aziendali in caso di trasformazione delle informazioni. Il lineage dei dati dal punto di vista del business permette agli utenti di rispondere alle domande sui dati in relazione al business, fornendo trasparenza nel canale di analisi dei dati per produrre una business intelligence accurata e affidabile. Il lineage dei dati aziendali guarda oltre le connessioni tra i metadati, guarda alle regole, alla frequenza, alla criticità, al contesto d’uso e determina la proprietà e documenta la conoscenza.
Ancora, tracciare il lineage dei dati dalla creazione all’uso significa che le organizzazioni hanno bisogno di un quadro integrato del catalogo dei dati che incorpori i giusti strumenti di lineage dei dati.
Sfruttare gli strumenti di lineage dei dati per costruire un catalogo dati intelligente
Seguire il lineage sia aziendale che tecnico attraverso un quadro di governance dei dati aiuta le organizzazioni a sviluppare definizioni standard dei dati e documentare le informazioni. Inoltre, le aziende possono includere punteggi di qualità e business lineage per costruire la fiducia nei dati e collegare le definizioni dei dati ai casi aziendali.
Per rendere un catalogo dati dettagliato una realtà, le organizzazioni devono adottare una piattaforma di data intelligence con capacità di data lineage integrate e automatizzate. Incorporando funzioni automatizzate di data lineage, le aziende profilano automaticamente i dati ed estraggono i metadati non appena entrano in azienda. Tuttavia, catturare il lineage non è sufficiente, è anche fondamentale essere in grado di visualizzarlo e navigarlo. La visualizzazione ideale del lineage presenterebbe agli utenti un “browser di lineage” che permette loro di visualizzare il lineage nella prospettiva che è più significativa per la domanda a cui stanno cercando di rispondere. Come risultato, gli utenti aziendali scoprono rapidamente i modelli e collegano le informazioni a diversi processi e risultati aziendali. Questo fornisce un contesto aziendale dettagliato e la conoscenza di tutte le risorse di dati aziendali.
Le capacità di qualità dei dati all’interno della piattaforma misurano anche l’impatto degli sforzi di qualità dei dati rispetto alle aspettative aziendali. Comprendendo gli effetti che la qualità dei dati ha su diversi ambienti di business, gli utenti guadagnano fiducia nei loro dati.
Con un ampio catalogo di dati business-ready che incorpora la qualità dei dati e strumenti automatici di lineage dei dati, le aziende riducono il rischio di incomprensione dei dati tra gli utenti. Invece, si assicurano che gli utenti aziendali abbiano dati aziendali di alta qualità su richiesta per generare maggiori profitti.
Stai cercando informazioni sugli strumenti di lineage dei dati automatizzati? Scarica l’articolo qui sopra o qui sotto per saperne di più.
Per ulteriori informazioni sul data lineage di base, leggi questa definizione da WhatIs.com di TechTarget: https://whatis.techtarget.com/definition/data-lineage.