Data Lineage Tools’ rolle i erhvervslivet

Da dataledere kæmpede med at vide, hvordan data kommer ind i organisationen, hvor de findes eller omdannes, når de rejser gennem forskellige processer og systemer, opfandt de udtrykket data lineage for at visualisere dataenes arv ud fra et afhængighedsperspektiv (rækkefølge). Lineage dokumenterer datas oprindelse, bevægelser, anvendelser og eventuelle ændringer undervejs.

Data lineage gør det muligt for organisationer at spore data, mens de bevæger sig gennem hver destination, og spore ændringer og fejl i data tilbage til deres kilde. Når data ændres, ændres også deres betydning, formål og datakvalitetsscore, hvilket resulterer i unøjagtigheder i data. Datalinje giver dataudbydere mulighed for at finde årsagen til dataproblemer og rette dem. Det giver også et informationsrevisionsspor.

Forståelse af forskellige typer datalinje

Når man forsøger at forklare datalinje, vil forskellige personer give forskellige definitioner, fordi deres synspunkter afhænger af deres rolle som bruger og det spørgsmål, de forsøger at besvare.

Eksempler på spørgsmål, som datalinje kan hjælpe med at besvare:

  • Hvad er de politikker, der blev anvendt i forbindelse med udførelsen af denne forretningsproces?
  • Hvilke kvalitetsregler blev håndhævet, før denne rapport blev sendt til en kunde?
  • Hvem er de personer, der er med i ansvarskæden for at sikre, at datasættet er korrekt?
  • Bør jeg underskrive denne revisionsrapport?

Vi kan inddele disse synspunkter i to grupper. Det første synspunkt er den tekniske datalinje, som overvåger de elementer, der er afgørende for overholdelse, operationer, procedurer, transformationer og datakombinationer. Den anden er forretningsdata lineage, den giver et overblik over teknisk lineage på et applikations- eller forretningslag, som gør det muligt for forretningsbrugere at forstå datas rolle i forretningsprocesser.

Tekniske databehandlere opholder sig typisk i it-afdelingen. Med teknisk datalinje kan it-ressourcerne identificere, hvor følsomme data er placeret, hvordan de ændres, hvem der har adgang, hvordan de deles og deres kvalitetsniveauer. Disse oplysninger gør det muligt for tekniske brugere at besvare spørgsmål om, hvor følsomme dataene er, og om deres kvalitet, for at sikre overholdelse og nøjagtighed.

Forretningsdata lineage giver indsigt i, hvordan data passer ind i forretningen og de forskellige forretningsresultater, hvis oplysninger omdannes. Data lineage fra et forretningsperspektiv giver brugerne mulighed for at besvare spørgsmål om dataene, som de relaterer sig til forretningen, hvilket giver gennemsigtighed i dataanalysekanalen for at producere nøjagtig, pålidelig business intelligence. Forretningsdata lineage ser ud over forbindelserne mellem metadata, den ser på regler, hyppighed, kritikalitet, brugskontekst og bestemmer ejerskab og dokumenterer viden.

Selvfølgelig betyder sporing af data lineage fra oprettelse til brug, at organisationer har brug for en integreret datakatalogramme, der inkorporerer de rigtige data lineage-værktøjer.

Leveraging Data Lineage Tools to Build an Intelligent Data Catalog

Følge både forretnings- og teknisk lineage gennem en data governance-ramme hjælper organisationer med at udvikle standarddatadefinitioner og dokumentere informationerne. Desuden kan virksomheder inkludere kvalitetsscorer og forretningslinje for at opbygge tillid til data og forbinde datadefinitioner med forretningscases.

For at gøre et detaljeret datakatalog til en realitet skal organisationer indføre en dataintelligensplatform med integrerede og automatiserede datalinjefunktioner. Ved at indarbejde automatiserede datalinjefunktioner kan virksomheder automatisk profilere data og udtrække metadata, så snart de kommer ind i virksomheden. Det er imidlertid ikke nok at indfange lineage, det er også afgørende at kunne se og gennemse den. Den ideelle lineagevisning ville præsentere brugerne med en “lineage-browser”, der giver dem mulighed for at se lineagen i det perspektiv, der er mest meningsfuldt for det spørgsmål, de forsøger at besvare. Som et resultat heraf kan forretningsbrugere hurtigt afdække mønstre og forbinde oplysninger med forskellige forretningsprocesser og resultater. Dette giver detaljeret forretningskontekst og viden omkring alle virksomhedens dataaktiver.

Datakvalitetsfunktioner i platformen måler også den effekt, som datakvalitetsindsatsen har i forhold til forretningens forventninger. Ved at forstå, hvilke virkninger datakvalitet har på forskellige forretningsmiljøer, får forretningsbrugere tillid til deres data.

Med et omfattende forretningsklart datakatalog, der indeholder datakvalitets- og automatiserede datalinjeværktøjer, reducerer virksomheder risikoen for misforståelser af data blandt forretningsbrugere. I stedet sikrer de, at forretningsbrugere har forretningsdata af høj kvalitet på efterspørgsel, så de kan generere øget profit.

Søger du efter oplysninger om automatiserede datalinjeværktøjer? Download artiklen ovenfor eller nedenfor for at få mere at vide.

Læs denne definition fra TechTargets WhatIs.com for yderligere oplysninger om grundbegrebet data lineage: https://whatis.techtarget.com/definition/data-lineage.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.