Data Governance, la nueva filosofía que revolucionará la gestión de datos


¿Cómo se deben gestionar los datos de una compañía para sacarles el máximo provecho? ¿Qué características debemos tener en cuenta para no desperdiciar los grandes volúmenes de datos? Los datos son cada vez más valiosos para las compañías, por eso su gestión es un aspecto de gran interés. En este escenario entra en juego Data Governance (DG), la gestión de la disponibilidad, usabilidad, integridad y seguridad de los datos utilizados en una compañía. Un programa sólido de DG debe tener un órgano de gobierno o consejo, un conjunto definido de procedimientos y un plan para ejecutar esos procedimientos.

¿Por qué Data Governance?

Las compañías se benefician de Data Governance porque garantiza que los datos sean coherentes y fiables. Esto es fundamental a medida que más organizaciones confían en los datos para tomar decisiones comerciales, optimizar operaciones, crear nuevos productos y servicios y mejorar la rentabilidad.

Pilares de Data Governance

Custodia de datos

La custodia de datos (Data stewardship en inglés) hace referencia a la supervisión sobre políticas de seguridad y uso del dato. Los equipos de custodia de datos generalmente se forman para orientar las implementaciones de Data Governance. Estos equipos pueden incluir personas de TI y comerciales familiarizadas con aspectos específicos de los datos dentro de la organización. Los expertos en la custodia de datos trabajan con personas involucradas en el ciclo de vida de los datos para ayudar a garantizar que el uso de los mismos se ajuste a las políticas de Data Governance de una empresa.

Calidad de datos

La precisión, la integridad y la coherencia entre las fuentes de datos son las características principales de las iniciativas de Data Governance exitosas. La limpieza de datos es un elemento común en la calidad de datos, ya que identifica, correlaciona y elimina casos duplicados. La limpieza de datos explica las diversas formas en que, por ejemplo, se puede describir el mismo cliente o producto.

Gestión de datos maestros

Aunque Data Governance afecta a casi todos los aspectos de la gestión de datos, un área estrechamente asociada con los procesos de DG es la gestión de datos maestros. Esta es una disciplina que establece una referencia superior para garantizar el uso consistente de datos en grandes organizaciones. Los repositorios de metadatos, que contienen información sobre datos, a menudo se usan para establecer referencias de grupos cruzados en programas MDM.

Casos de uso

A medida que los volúmenes de datos se expanden y surgen nuevas tecnologías, Data Governance tendrá una aplicación más amplia. Muchas infracciones de datos de alto perfil han convertido la seguridad en una parte crucial de Data Governance.

Los cambios en relación a la privacidad de datos también han llevado a la inclusión de auditorías de protección de los mismos y su privacidad como parte de los programas de Data Governance. La directiva de la Unión Europea (UE) relativa al Reglamento General de Protección de Datos (GDPR) es un ejemplo de un caso de uso para la Data Governance.

Cómo elegir una herramienta

Debido a la aparición de esta nueva necesidad, tenemos que conocer en profundidad nuestro caso de uso para elegir correctamente las tecnologías adecuadas. Hay algunos aspectos a considerar, teniendo en cuenta los pilares mencionados, que todas las herramientas deberían incluir.

Inserción y traducción de metadatos

Los metadatos deben ser insertados usando técnicas adecuadas para fuentes variadas de datos. La mayoría de las herramientas de Data Governance resuelven esto a través de una herramienta ETL específica que inserta metadatos, aunque existen otras que integran todo en una sola plataforma.

Este proceso también se conoce como “catalogación” en el ecosistema DG. Poder crear un catálogo inteligente a partir de datos y fuentes de metadatos, entornos de análisis y entornos de ejecución. Este catálogo puede incluir categorías como la inserción, la integración, la calidad, la limpieza y el perfilado.

Repositorios de metadatos / Catálogo de datos

Se usa para documentar y administrar metadatos, y para realizar análisis utilizándolos. Las organizaciones también pueden usar repositorios para publicar información sobre activos reutilizables, lo que permite a los usuarios navegar entre metadatos durante actividades del ciclo de vida tales como el diseño, las pruebas y la administración de despliegues (la gestión de código de un entorno a otro).

Business Glossary / Diccionario de datos

Un repositorio utilizado para comunicar y gestionar los términos comerciales de la empresa junto con las definiciones asociadas y las relaciones entre esos términos. El diccionario de datos puede ser el resultado de aplicar la calidad de los datos, la limpieza de datos y el perfil de los datos al depósito de metadatos, y sus elementos deben estar relacionados con algún término empresarial en el glosario.

Linaje de datos

Especifica los orígenes de los datos y dónde se mueven con el tiempo. También describe qué ocurre con estos a medida que pasan por diversos procesos. Muestra las relaciones entre los repositorios de metadatos, el diccionario de datos y el glosario de negocio.

El linaje de datos puede ayudar a analizar cómo se usa la información y a rastrear aspectos clave de esta que sirven para un propósito particular. Debe incluir soporte para taxonomías, modelos de relación de entidades (ER), ontología y lenguaje de modelado.

Cambio de Análisis de Impacto / Aprobación

 Transmite detalles específicos sobre las dependencias de la información o el impacto de un cambio dentro de una fuente de datos. Está más relacionado con la custodia de datos.

Cubre todos los aspectos en cuanto a:

  • Control de cambios en las fuentes o términos
  • Flujos de trabajo de seguridad y aprobación relacionados con la propiedad
  • Custodia de datos y trabajo colaborativo.

Los datos se han convertido en un elemento de valor incalculable para las compañías. Saber gestionarlos es una tarea que requiere un gran esfuerzo y en muchas ocasiones no es sencillo escoger un camino a seguir para llevarlo a cabo con éxito. Data Governance es una filosofía que pone por encima de todo, la calidad de los datos y su correcta gestión. Se trata de algo a lo que deben aspirar las compañías en todos los sectores, pero especialmente en el financiero, donde los datos han demostrado ser vitales para el futuro del negocio.