Potíže s poznáním toho, jak data vstupují do organizace, kde existují nebo se transformují při průchodu různými procesy a systémy, vedoucích pracovníci v oblasti dat vymysleli termín datová linie pro vizualizaci dědictví dat z hlediska závislosti (pořadí). Lineage dokumentuje původ dat, jejich pohyb, použití a případné změny během jejich cesty.
Data lineage umožňuje organizacím sledovat data při jejich pohybu jednotlivými cíli a sledovat změny a chyby dat zpět k jejich zdroji. Když se data mění, mění se i jejich význam, účel a hodnocení kvality dat, což vede k nepřesnostem v datech. Lineage dat umožňuje uživatelům dat určit příčinu problémů s daty a napravit je. Poskytuje také informační auditní stopu.
Pochopení různých typů lineace dat
Při pokusu o vysvětlení lineace budou různí lidé nabízet různé definice, protože jejich pohled závisí na jejich roli uživatele a otázce, na kterou se snaží odpovědět.
Příkladové otázky, na které může lineace pomoci odpovědět:
- Jaké zásady byly použity při provádění tohoto podnikového procesu?
- Jaká pravidla kvality byla uplatněna před odesláním této zprávy klientovi?
- Kdo jsou lidé, kteří jsou v řetězci odpovědnosti za zajištění správnosti souboru dat?
- Měl bych tuto zprávu o auditu podepsat?
Tyto pohledy můžeme rozdělit do dvou skupin. Prvním pohledem je technická datová linie, která dohlíží na prvky, které jsou rozhodující pro shodu, operace, postupy, transformace a kombinace dat. Druhou skupinou je linie obchodních dat, ta poskytuje pohled na technickou linii na aplikační nebo obchodní vrstvě, což umožňuje obchodním uživatelům pochopit roli dat v obchodních procesech.
Uživatelé technických dat obvykle sídlí v oddělení IT. Díky technické linii dat mohou IT zdroje určit, kde se citlivá data nacházejí, jak se mění, kdo k nim má přístup, jak jsou sdílena a jaká je jejich úroveň kvality. Tyto informace umožňují technickým uživatelům odpovědět na otázky týkající se citlivosti dat a jejich kvality, a zajistit tak soulad s předpisy a přesnost.
Linie obchodních dat poskytuje přehled o tom, jak data zapadají do podnikání a jaké jsou různé obchodní výsledky, pokud se informace transformují. Linie dat z obchodního hlediska umožňuje uživatelům odpovědět na otázky týkající se dat, jak se vztahují k podnikání, a poskytuje transparentnost do kanálu pro analýzu dat, aby bylo možné vytvářet přesné a spolehlivé obchodní informace. Linie obchodních dat se zabývá nejen souvislostmi mezi metadaty, ale také pravidly, četností, kritičností, kontextem použití, určuje vlastnictví a dokumentuje znalosti.
Stále platí, že sledování linie dat od jejich vytvoření až po použití znamená, že organizace potřebují integrovaný rámec datového katalogu, který zahrnuje správné nástroje pro sledování linie dat.
Využití nástrojů pro sledování linie dat k vytvoření inteligentního datového katalogu
Sledování obchodní i technické linie prostřednictvím rámce správy dat pomáhá organizacím vytvořit standardní definice dat a dokumentovat informace. Kromě toho mohou společnosti zahrnout hodnocení kvality a obchodní linii, aby vybudovaly důvěryhodnost dat a propojily definice dat s obchodními případy.
Aby se podrobný datový katalog stal skutečností, musí organizace přijmout platformu pro inteligenci dat s integrovanými a automatizovanými možnostmi datové linie. Začleněním funkcí automatizované datové linie společnosti automaticky profilují data a získávají metadata, jakmile vstoupí do podniku. Zachycení datové linie však nestačí, rozhodující je také možnost jejího zobrazení a procházení. Ideální zobrazení lineage by uživatelům představilo „prohlížeč lineage“, který by jim umožnil zobrazit lineage z perspektivy, která je pro otázku, na niž se snaží odpovědět, nejvýznamnější. Výsledkem je, že podnikoví uživatelé rychle odhalí vzory a propojí informace s různými podnikovými procesy a výsledky. To poskytuje detailní obchodní kontext a znalosti kolem všech podnikových datových aktiv.
Funkce kvality dat v rámci platformy také měří dopad úsilí o kvalitu dat na obchodní očekávání. Díky pochopení dopadů, které má kvalita dat na různá podniková prostředí, získávají podnikoví uživatelé důvěru ve svá data.
Díky rozsáhlému katalogu dat připravených pro podnikání, který zahrnuje nástroje pro kvalitu dat a automatizovanou datovou linii, snižují podniky riziko nedorozumění mezi podnikovými uživateli. Místo toho zajistí, že podnikoví uživatelé budou mít na vyžádání k dispozici vysoce kvalitní obchodní data, která jim umožní generovat vyšší zisky.
Hledáte informace o automatizovaných nástrojích pro lineaci dat? Stáhněte si článek výše nebo níže a dozvíte se více.
Pro další informace o základech data lineage si přečtěte tuto definici z webu WhatIs.com společnosti TechTarget: https://whatis.techtarget.com/definition/data-lineage.