La difficulté de savoir comment les données entrent dans l’organisation, où elles existent ou se transforment lorsqu’elles passent par différents processus et systèmes, les leaders des données ont inventé le terme lignage des données pour visualiser l’héritage des données d’un point de vue de dépendance (ordre). Le lignage documente les origines des données, leur mouvement, leurs utilisations et tout changement au cours de leur voyage.
Le lignage des données permet aux organisations de suivre les données à mesure qu’elles passent par chaque destination, en retraçant les altérations et les erreurs de données jusqu’à leur source. Lorsque les données changent, il en va de même pour leur signification, leur objectif et le score de qualité des données, ce qui entraîne des inexactitudes dans les données. Le lignage des données permet aux utilisateurs de données d’identifier la cause des problèmes de données et de les résoudre. Il fournit également une piste d’audit de l’information.
Comprendre les différents types de lignage de données
Lorsqu’on essaie d’expliquer le lignage, différentes personnes proposeront différentes définitions parce que leurs points de vue dépendent de leur rôle en tant qu’utilisateur et de la question à laquelle ils essaient de répondre.
Exemples de questions auxquelles le lignage peut aider à répondre :
- Quelles sont les politiques qui ont été appliquées dans l’exécution de ce processus métier ?
- Quelles règles de qualité ont été appliquées avant que ce rapport ne soit envoyé à un client ?
- Quelles sont les personnes qui se trouvent dans la chaîne de responsabilité pour garantir que l’ensemble des données est correct ?
- Dois-je signer ce rapport d’audit ?
Nous pouvons classer ces points de vue en deux groupes. Le premier point de vue est le lignage des données techniques, qui supervise les éléments qui sont cruciaux pour la conformité, les opérations, les procédures, les transformations et les combinaisons de données. L’autre est le lignage des données métier, il fournit une vue du lignage technique au niveau d’une application ou d’une couche métier, ce qui permet aux utilisateurs métier de comprendre le rôle des données dans les processus métier.
Les utilisateurs de données techniques résident généralement dans le département informatique. Avec le lignage des données techniques, les ressources informatiques peuvent identifier où se trouvent les données sensibles, comment elles changent, qui y a accès, comment elles sont partagées et leurs niveaux de qualité. Ces informations donnent aux utilisateurs techniques les moyens de répondre aux questions sur les données concernant leur degré de sensibilité et leur qualité, afin de garantir la conformité et l’exactitude.
Le lignage des données d’entreprise permet de comprendre comment les données s’intègrent à l’entreprise et les différents résultats commerciaux si les informations se transforment. Le lignage des données du point de vue de l’entreprise permet aux utilisateurs de répondre à des questions sur les données dans la mesure où elles sont liées à l’entreprise, offrant une transparence dans le canal d’analyse des données pour produire une intelligence d’entreprise précise et fiable. Le lignage des données d’entreprise va au-delà des connexions entre les métadonnées, il examine les règles, la fréquence, la criticité, le contexte d’utilisation, et détermine la propriété et documente les connaissances.
Pour autant, retracer le lignage des données de la création à l’utilisation signifie que les organisations ont besoin d’un cadre de catalogue de données intégré qui incorpore les bons outils de lignage de données.
L’exploitation des outils de lignage de données pour construire un catalogue de données intelligent
Suivre le lignage d’entreprise et technique à travers un cadre de gouvernance des données aide les organisations à développer des définitions de données standard et à documenter les informations. En outre, les entreprises peuvent inclure des scores de qualité et un lignage métier pour instaurer la confiance dans les données et relier les définitions de données aux cas d’affaires.
Pour faire d’un catalogue de données détaillé une réalité, les organisations doivent adopter une plateforme de data intelligence dotée de fonctionnalités de lignage de données intégrées et automatisées. En intégrant des fonctionnalités de lignage de données automatisées, les entreprises profilent automatiquement les données et extraient les métadonnées dès qu’elles entrent dans l’entreprise. Cependant, il ne suffit pas de capturer le lignage, il est également essentiel de pouvoir le visualiser et le parcourir. L’affichage idéal de l’historique présenterait aux utilisateurs un « navigateur d’historique » qui leur permettrait de visualiser l’historique sous la perspective la plus significative pour la question à laquelle ils essaient de répondre. En conséquence, les utilisateurs professionnels découvrent rapidement des modèles et relient les informations à différents processus et résultats commerciaux. Cela fournit un contexte métier détaillé et des connaissances autour de tous les actifs de données de l’entreprise.
Les capacités de qualité des données au sein de la plate-forme mesurent également l’impact des efforts de qualité des données par rapport aux attentes de l’entreprise. En comprenant les effets de la qualité des données sur différents environnements métier, les utilisateurs métier gagnent en confiance dans leurs données.
Avec un vaste catalogue de données prêtes à l’emploi qui intègre des outils de qualité des données et de lignage automatisé des données, les entreprises réduisent le risque de mauvaise compréhension des données par les utilisateurs métier. Au lieu de cela, elles s’assurent que les utilisateurs professionnels disposent de données commerciales de haute qualité à la demande pour générer des bénéfices accrus.
Vous cherchez des informations sur les outils de lignage automatisé des données ? Téléchargez l’article ci-dessus ou ci-dessous pour en savoir plus.
Pour plus d’informations sur les bases du lignage de données, lisez cette définition du site WhatIs.com de TechTarget : https://whatis.techtarget.com/definition/data-lineage.