Ir al contenido
Ver todas las entradas

Descubrimiento de datos: ¿Un medio para un fin o un fin para un medio?

Cuando se trata de gestión y gobernanza de datos, “descubrimiento de datos” Históricamente ha sido un término vago. ¿Se refiere simplemente a la capacidad de conectar y crear un inventario de los activos de datos de una empresa, o implica algo más?

Como analista en Gartner durante 14 años, atendí cientos de llamadas sobre descubrimiento de datos. Cuando un cliente me preguntaba sobre el descubrimiento de datos, inevitablemente preguntaba: "¿Para qué?". ¿Por qué le interesaba a la empresa hacerlo en primer lugar? Algunos indicaban que querían crear un inventario para ver qué activos de datos tenían, y esto siempre era un indicio clave de que el proyecto no llegaría muy lejos. ¿Por qué?

Inventario de datos vs. Catálogo de datos

Comencemos con lo que sucederá con los resultados del descubrimiento: ¿adónde irán? A menudo me preguntaban sobre la diferencia entre... inventario de datos y un catálogo de datos, lo que me llevó a crear una analogía de mis días de universidad, cuando Internet estaba a unos años de su fase embrionaria.

En aquel entonces, la "investigación" consistía en ir a la biblioteca y buscar información en libros impresos y material de referencia. Un inventario de datos sería similar a una lista simple y completa de todos los libros de la biblioteca. Y eso es mejor que nada, pero cuando se trata de cientos de miles o millones de libros, este enfoque es poco práctico y de poco valor.

Las bibliotecas utilizan el sistema decimal Dewey, que es una forma de clasificar y correlación Los libros se segmentan lógicamente, de modo que todos los libros sobre, por ejemplo, finanzas, se ubiquen en una sola área y se puedan encontrar fácilmente consultando un catálogo de fichas disponible. Esta idea es básicamente la misma que la del catálogo de datos actual, pero este último en formato electrónico.

El descubrimiento comienza con la necesidad empresarial

Un inventario de datos en sí mismo tiene poca utilidad, salvo para mostrar una lista dispar de activos. Las organizaciones necesitan saber más sobre sus activos de datos que simplemente lo que poseen para que estos sean valiosos. Esta iniciativa no comienza con la consulta de los datos, sino en el extremo opuesto de la organización: en las iniciativas empresariales. ¿Para qué descubrir e inventariar datos si el esfuerzo no está vinculado a los objetivos empresariales ni, una vez aplicado, contribuye a alcanzarlos?

Como analista del sector, cuando me preguntaban sobre el inventario de datos, inmediatamente preguntaba a qué KPI empresarial estaba vinculada la iniciativa. Recibía diversas respuestas, pero rara vez una de ellas era un objetivo tangible o un KPI que respondiera, por ejemplo, a una de las siguientes preguntas:

  • ¿Cómo ayudaron específicamente los datos de inventario a que las ventas alcanzaran las cifras trimestrales o al marketing a cumplir los objetivos de la campaña?
  • ¿Cómo ayudó el inventario a cumplir con los requisitos de privacidad? ¿Solicitudes DSAR?
  • ¿Cómo el inventario protegió mejor a la organización?

Una vez que comenzamos a comprender por qué estamos haciendo el descubrimiento y qué se requiere del negocio, entonces podemos comenzar a hacer preguntas importantes sobre los datos en sí, como:

  • ¿Cómo se relacionan los datos entre sí?
  • ¿Cómo se utilizan los datos?
  • ¿Donde se originó?

Un conjunto profundo de capacidades más allá del inventario

Para entender las respuestas a estas preguntas, necesitamos:

  • pasar de simplemente hacer un inventario como parte del descubrimiento y comenzar a profundizar en el metadatos —incluidos metadatos inferidos e implícitos
  • entender etiquetas y rótulos de datosCómo se clasifican los datos y cómo deben clasificarse con etiquetas adicionales
  • correlacionar datos para que podamos ver todos los elementos de datos que están vinculados a una entidad, como un solo individuo, de modo que podamos comercializar eficazmente con esa persona o proteger de manera integral su privacidad.
  • datos del clúster Para encontrar, por ejemplo, todos los documentos hipotecarios en archivos compartidos o números de cuentas de clientes en varias bases de datos en toda la organización.
  • cubrir todos los datos de la empresa — el promedio 20% que es estructurado y el 80% que es no estructurado
  • construir un catálogo de datos moderno como parte de la gestión activa de datos, como parte del proceso general.

Entonces descubrimiento de datos Es más que simplemente inventariar los datos y esperar que la organización les encuentre un uso. El descubrimiento de datos comienza en el otro extremo de la organización —en el negocio, en los KPI de marketing y ventas, y en las iniciativas de privacidad y seguridad— como algo que puede vincularse a los KPI, objetivos o iniciativas establecidos.

Una vez que sabemos qué datos queremos descubrir, podemos ir más allá de simplemente encontrarlos y convertirlos en valor real que pueda medirse.

Contenido