Då dataansvariga kämpar med att veta hur data kommer in i organisationen, var den finns eller omvandlas när den går genom olika processer och system, myntade de begreppet data Lineage för att visualisera datans arv från ett beroendeperspektiv (ordning). Linjering dokumenterar datas ursprung, rörelse, användning och eventuella förändringar under resans gång.
Data lineage gör det möjligt för organisationer att spåra data när de rör sig genom varje destination, och spåra dataförändringar och fel tillbaka till sin källa. När data ändras, ändras även dess innebörd, syfte och poäng för datakvalitet, vilket resulterar i felaktigheter i data. Data lineage ger dataanvändare möjlighet att hitta orsaken till dataproblem och åtgärda dem. Det ger också en informationsspårning.
Förstå olika typer av datalinjering
När man försöker förklara datalinjering kommer olika personer att erbjuda olika definitioner eftersom deras åsikter beror på deras roll som användare och den fråga de försöker besvara.
Exempel på frågor som datalinjering kan hjälpa till att besvara:
- Vilka policyer tillämpades vid utförandet av den här affärsprocessen?
- Vilka kvalitetsregler tillämpades innan den här rapporten skickades till en kund?
- Vem är de personer som ingår i ansvarskedjan för att se till att datamängden är korrekt?
- Bör jag underteckna den här granskningsrapporten?
Vi kan dela in dessa synpunkter i två grupper. Den första synen är teknisk datalinje, som övervakar element som är avgörande för överensstämmelse, verksamhet, förfaranden, omvandlingar och datakombinationer. Den andra är affärsdataledning, den ger en bild av den tekniska ledningen på ett applikations- eller affärslager, vilket gör det möjligt för affärsanvändare att förstå datas roll i affärsprocesser.
Tekniska dataanvändare finns vanligtvis på IT-avdelningen. Med teknisk dataledning kan IT-resurser identifiera var känsliga data finns, hur de ändras, vem som har tillgång till dem, hur de delas och vilka kvalitetsnivåer de har. Denna information gör det möjligt för tekniska användare att besvara frågor om hur känsliga data är och vilken kvalitet de har, för att säkerställa efterlevnad och noggrannhet.
Företagsdatalag ger insikt i hur data passar in i verksamheten och vilka olika affärsresultat som kan uppnås om information omvandlas. Datalinjering ur ett affärsperspektiv gör det möjligt för användare att besvara frågor om data som är relaterade till verksamheten, vilket ger insyn i dataanalyskanalen för att producera korrekt och tillförlitlig affärsinformation. Affärsdatalinjering ser bortom kopplingarna mellan metadata, den tittar på regler, frekvens, kriticitet, användningskontext och bestämmer ägarskap och dokumenterar kunskap.
Syfte att spåra datalinjering från skapande till användning innebär ändå att organisationer behöver ett integrerat ramverk för datakataloger som innehåller de rätta verktygen för datalinjering.
Leveraging Data Lineage Tools to Build an Intelligent Data Catalog
Följande både affärsmässiga och tekniska linjenät genom ett ramverk för dataförvaltning hjälper organisationer att utveckla standardiserade datadebitioner och dokumentera informationen. Dessutom kan företag inkludera kvalitetspoäng och affärslinje för att bygga upp datatillit och koppla datadefinitioner till affärsfall.
För att göra en detaljerad datakatalog till verklighet måste organisationer anta en dataintelligensplattform med integrerade och automatiserade funktioner för datalinjering. Genom att införliva funktioner för automatiserad datalinjering kan företag automatiskt profilera data och extrahera metadata så snart de kommer in i verksamheten. Det räcker dock inte med att fånga upp data lineage, utan det är också viktigt att kunna visa och bläddra i den. Den idealiska linjebildningen skulle ge användarna en ”linjebläsare” som gör det möjligt för dem att se linjebildningen ur det perspektiv som är mest meningsfullt för den fråga som de försöker besvara. Detta gör att affärsanvändare snabbt kan upptäcka mönster och koppla information till olika affärsprocesser och resultat. Detta ger ett detaljerat affärskontext och kunskap kring alla företagets datatillgångar.
Datakvalitetsfunktioner inom plattformen mäter också vilken inverkan datakvalitetsinsatser har mot affärsförväntningar. Genom att förstå vilka effekter datakvalitet har på olika affärsmiljöer får affärsanvändare förtroende för sina data.
Med en omfattande affärsklar datakatalog som innehåller verktyg för datakvalitet och automatiserad datalinjering minskar företag risken för datamissförstånd bland affärsanvändare. Istället ser de till att affärsanvändarna har högkvalitativa affärsdata på begäran för att generera ökade vinster.
Söker du information om verktyg för automatiserad datalinjering? Ladda ner artikeln ovan eller nedan för att lära dig mer.
För ytterligare information om grunderna för data lineage, läs den här definitionen från TechTargets WhatIs.com: https://whatis.techtarget.com/definition/data-lineage.