Al tratar de saber cómo entran los datos en la organización, dónde existen o se transforman a medida que viajan a través de diferentes procesos y sistemas, los líderes de datos acuñaron el término linaje de datos para visualizar la herencia de los datos desde una perspectiva de dependencia (orden). El linaje documenta los orígenes de los datos, su movimiento, sus usos y cualquier cambio durante su viaje.
El linaje de los datos permite a las organizaciones rastrear los datos a medida que pasan por cada destino, rastreando las alteraciones y los errores de los datos hasta su origen. Cuando los datos cambian, también lo hacen su significado, propósito y puntuación de calidad de los datos, lo que da lugar a inexactitudes en los datos. El linaje de los datos permite a los usuarios identificar la causa de los problemas de los datos y solucionarlos. También proporciona una pista de auditoría de la información.
Comprensión de los diferentes tipos de linaje de datos
Cuando se trata de explicar el linaje, diferentes personas ofrecerán diferentes definiciones porque sus puntos de vista dependen de su papel como usuario y la pregunta que están tratando de responder.
Preguntas de ejemplo que el linaje puede ayudar a responder:
- ¿Cuáles son las políticas que se aplicaron en la ejecución de este proceso de negocio?
- ¿Qué normas de calidad se aplicaron antes de enviar este informe a un cliente?
- ¿Quiénes son las personas que están en la cadena de responsabilidad para asegurar que el conjunto de datos es correcto?
- ¿Debo firmar este informe de auditoría?
Podemos clasificar esos puntos de vista en dos grupos. La primera vista es el linaje de datos técnicos, que supervisa los elementos que son cruciales para el cumplimiento, las operaciones, los procedimientos, las transformaciones y las combinaciones de datos. El otro es el linaje de datos de negocio, que proporciona una visión del linaje técnico en una aplicación o capa de negocio, que permite a los usuarios de negocio entender el papel de los datos en los procesos de negocio.
Los usuarios de datos técnicos suelen residir en el departamento de TI. Con el linaje de datos técnicos, los recursos de TI pueden identificar dónde se encuentran los datos sensibles, cómo cambian, quién tiene acceso, cómo se comparten y sus niveles de calidad. Esta información permite a los usuarios técnicos responder a las preguntas sobre los datos en cuanto a su sensibilidad y calidad, para garantizar el cumplimiento y la exactitud.
El linaje de datos de negocio proporciona una visión de cómo los datos se ajustan al negocio y a los distintos resultados empresariales si la información se transforma. El linaje de datos desde una perspectiva empresarial permite a los usuarios responder a preguntas sobre los datos en relación con el negocio, proporcionando transparencia en el canal de análisis de datos para producir una inteligencia empresarial precisa y fiable. El linaje de datos del negocio mira más allá de las conexiones entre los metadatos, mira las reglas, la frecuencia, la criticidad, el contexto de uso, y determina la propiedad y documenta el conocimiento.
Aún así, rastrear el linaje de los datos desde su creación hasta su uso significa que las organizaciones necesitan un marco de catálogo de datos integrado que incorpore las herramientas de linaje de datos adecuadas.
Aprovechar las herramientas de linaje de datos para construir un catálogo de datos inteligente
Seguir el linaje tanto empresarial como técnico a través de un marco de gobierno de datos ayuda a las organizaciones a desarrollar definiciones de datos estándar y a documentar la información. Además, las empresas pueden incluir puntuaciones de calidad y linaje empresarial para crear confianza en los datos y conectar las definiciones de datos con los casos empresariales.
Para hacer realidad un catálogo de datos detallado, las organizaciones deben adoptar una plataforma de inteligencia de datos con capacidades de linaje de datos integradas y automatizadas. Al incorporar funciones automatizadas de linaje de datos, las empresas perfilan automáticamente los datos y extraen los metadatos en cuanto entran en la empresa. Sin embargo, no basta con capturar el linaje, sino que también es fundamental poder visualizarlo y navegar por él. La vista de linaje ideal presentaría a los usuarios un «navegador de linaje» que les permitiera ver el linaje en la perspectiva que sea más significativa para la pregunta que están tratando de responder. Como resultado, los usuarios empresariales descubren rápidamente patrones y conectan la información con diferentes procesos y resultados empresariales. Esto proporciona un contexto de negocio detallado y conocimiento alrededor de todos los activos de datos de la empresa.
Las capacidades de calidad de datos dentro de la plataforma también miden el impacto que tienen los esfuerzos de calidad de datos frente a las expectativas del negocio. Al comprender los efectos que tiene la calidad de los datos en los diferentes entornos empresariales, los usuarios de la empresa ganan confianza en sus datos.
Con un amplio catálogo de datos preparados para el negocio que incorpora herramientas de calidad de datos y de linaje de datos automatizado, las empresas reducen el riesgo de malentendidos entre los usuarios de la empresa. En su lugar, se aseguran de que los usuarios de la empresa tengan datos empresariales de alta calidad bajo demanda para generar mayores beneficios.
¿Busca información sobre las herramientas automatizadas de linaje de datos? Descargue el artículo anterior o el siguiente para obtener más información.
Para obtener información adicional sobre los fundamentos del linaje de datos, lea esta definición de WhatIs.com de TechTarget: https://whatis.techtarget.com/definition/data-lineage.