¿Qué es Data Catalog?

data-catalog-diagram

En la actualidad las organizaciones enfrentan muchos desafíos cuando trabajan con sus datos, uno de los más habituales es ¿donde los encuentro?, acá es donde aparece el concepto de Data Catalog que en la práctica es un inventario organizado de los datos que posee una compañía.

Una de las características principales de un Data Catalog es la incorporación de metadatos para facilitar la administración y la gobernanza de los mismos.

Problemas que se deben resolver

A medida que una compañía comienza a utilizar con mayor frecuencia sus datos, requiere un mayor grado de gobernanza, incluyendo desafíos cómo definir correctamente los responsables, los reglamentos de seguridad y el almacenaje para agilizar la utilización.

No obstante, la gran mayoría de organizaciones no posee un programa de gobierno de datos robusto, generando problemas en la gobernanza de los mismo, llegando incluso a generar alguno(s) de los siguientes problemas:

  • Pérdida de tiempo y esfuerzo en buscar datos y cómo acceder a ellos
  • Data lakes que se convierten en Data swamps
  • Ausencia de un vocabulario comercial común
  • Dificultad de evaluar la procedencia, calidad y fiabilidad
  • Incapacidad de capturar conocimientos
  • Dificultad de reutilizar los activos de datos

¿Qué debe tener un Data Catalog?

Búsqueda y detección

Opciones flexibles de búsqueda y filtrado de datos para que sean identificados rápidamente, un plus es la incorporación de etiquetas técnico / comerciales para permitir clasificarlos y/o agruparlos.

Recopilación de metadatos de varias fuentes

Recopilación de metadatos técnicos de los sistemas que almacenan sus datos para identificar rápidamente de donde provienen.

Conservación de metadatos

Permitir a los expertos de los dominios de negocio agregar etiquetas, asociaciones, anotaciones, clasificaciones y otros para aportar conocimiento a los usuarios de los datos.

Inteligencia de datos y automatización

Aplicación de tecnologías de Inteligencia Artificial o Machine Learning para la gestión  y administración de un catálogo de datos eficiente y reducir la operación del mismo.

Capacidades de nivel empresarial

Capacidades de integración con terceros a través de API REST para ingestar metadatos o complementar la solución.

¿Quieres mejorar tu operación?

Si te gusto este blog y quieres implementarlo en tu compañía no dudes en revisar nuestros servicios.

¡QUIERO SABER MÁS!