Los catálogos de datos son un componente fundamental de cualquier estrategia de gestión de datos (y metadatos). A medida que crece la complejidad de los ecosistemas de datos y el volumen de datos que circulan por ellos, el enfoque tradicional de los catálogos de datos debe evolucionar.
Repensar la catalogación de datos requiere un contexto más profundo, amplitud de la cobertura de las fuentes de datosy automatización orquestada para mapear y catalogar datos confidenciales y personales con un profundo conocimiento de los datos, incorporando metadatos activos, atributos directos e inferidos y clasificadores.
La inteligencia de datos es un factor impulsor y catalizador para la inversión en catálogos de datos hoy en día: las organizaciones necesitan poder contextualizar datos personales, sensibles y situacionales para obtener valor de la gestión de metadatos. No se trata solo de dónde y cómo se encuentran los datos, sino de cómo se relacionan los elementos de datos con los términos de negocio y cómo se puede utilizar la base de un catálogo de datos para refinar aspectos clave de la comprensión de los datos, como su calidad y linaje.
Sin la capacidad de incorporar información y perspectivas adicionales a los datos, muchas empresas corren riesgos innecesarios: la capacidad de automatizar la inteligencia de datos permite a las organizaciones utilizar sus datos al máximo.
Al gestionar los riesgos de privacidad y seguridad y, al mismo tiempo, proporcionar una visión más amplia de los datos mediante el descubrimiento y la clasificación automatizados, las organizaciones pueden hacer un mejor uso de sus datos, reducir el riesgo y aprovechar más contexto y mayor precisión para análisis avanzados.
Inventario de activos de datos distribuidos y aislados
Dos de los desafíos operativos más urgentes de los catálogos de datos tradicionales son su cobertura limitada de las fuentes de datos empresariales y el grado de trabajo manual. curación Es necesario etiquetar elementos de datos en el catálogo de datos con descripciones.
Es necesario implementar catálogos de datos eficaces con capacidad de escalar, cubrir todas las fuentes de datos donde se almacenan datos sensibles y personales, rellenar automáticamente con los datos correctos (y propagar etiquetas de términos comerciales) e ir más allá de los metadatos exclusivamente técnicos para proporcionar el contexto necesario para una gobernanza de datos respetuosa con la privacidad. Es fundamental poder encontrar e inventariar todos los datos de una organización, independientemente del tipo de datos, dónde se almacenen o si se sabe o no qué son.
Para gestionar el riesgo al impulsar estrategias de gestión y análisis de datos, aproveche un catálogo mejorado con aprendizaje automático (ML) con metadatos activos y una amplia cobertura de datos. Incorporar la clasificación mediante aprendizaje automático ayuda a las organizaciones a identificar sistemáticamente las relaciones entre los elementos de datos, automatizar el proceso de asociación de metadatos con elementos de datos para actividades como la protección de la privacidad y la evaluación de la calidad de los datos, y establecer relaciones entre datos que, de otro modo, podrían pasarse por alto. De esta forma, las organizaciones pueden obtener fácilmente una visión unificada de los activos distribuidos y aislados, e inventariar y encontrar con mayor facilidad los datos relevantes en todo el ecosistema de datos.
BigID combina un catálogo aumentado con ML con clasificación, correlacióny análisis de conglomerados para brindar un conocimiento más profundo del contexto de los datos, lo que permite a las organizaciones aprovechar más sus datos y al mismo tiempo garantizar que se apliquen las políticas de cumplimiento de la privacidad y el uso ético de los datos.
Catálogo en contexto
Al representar, describir y organizar más tipos de datos de más fuentes en un catálogo de datosLas organizaciones pueden obtener una visión consolidada que integra la privacidad, la seguridad y el conocimiento del negocio, todo en un único panel. Un inventario de datos unificado y respetuoso con la privacidad combina atributos, metadatos y contexto en torno a los datos personales y sensibles de una organización, lo que proporciona una comprensión y un análisis más profundos de los datos.
BigID descubre y clasifica más tipos de datos en distintas fuentes, desde lagos de datos hasta sistemas de archivos y bases de datos relacionales, dondequiera que se encuentren (entornos locales, híbridos y en la nube), creando un inventario unificado que permite a los administradores de datos tomar decisiones inteligentes en todo el ecosistema de una organización. Al aprovechar un enfoque de descubrimiento en profundidadBigID puede descubrir relaciones entre conjuntos de datos conectados y dispares e incorporar esa información al catálogo de datos.
¿Qué son los metadatos activos?
Un enfoque de última generación para los catálogos de datos considera no solo los metadatos técnicos, sino también los metadatos empresariales y operativos para obtener un contexto adicional y una visión basada en datos. Al asociar continuamente más tipos de datos, las organizaciones pueden tomar decisiones más informadas e inteligentes sobre sus datos.
Los metadatos activos se centran en conectar en lugar de recopilar: aprovechan los metadatos (pasivos) que las organizaciones han recopilado durante todo este tiempo solo a intervalos periódicos, pero ahora añaden contexto. Los metadatos activos conectan todos esos puntos de metadatos independientes que podrían haberse quedado obsoletos con un enfoque exclusivamente pasivo, a la vez que aprovechan el aprendizaje automático para añadir contenido y contexto, relacionar conjuntos de datos y ayudar a encontrar los datos adecuados necesarios para el análisis, la gobernanza y la gestión autónoma de datos.
Intercambio de metadatos, interoperabilidad y arquitecturas abiertas
Para lograr una visibilidad completa de los datos y los silos, es importante poder integrarse con otras tecnologías de catálogo, gestión de datos y gobernanza: las organizaciones deben poder intercambiar datos, etiquetas y metadatos con otros catálogos, aplicar términos comerciales, consumir jerarquías de datos, agregar resultados e incorporar contexto de datos.
Para generar más valor y utilidad en todo el ecosistema de datos, BigID creó un intercambio bidireccional de metadatos que permite a las organizaciones importar glosarios empresariales, mapear términos comerciales y consolidar su infraestructura de gobernanza para una gestión y aplicación de políticas más automatizadas. Al aprovechar un intercambio de metadatos bidireccional y extensible, las organizaciones pueden beneficiarse de los elementos fundamentales del descubrimiento y la clasificación de datos, a la vez que se integran con las soluciones tradicionales de gestión de metadatos y las enriquecen, desde catálogos hasta flujos de trabajo de gobernanza.
El enfoque BigID para los catálogos de datos
Un catálogo de datos basado en aprendizaje automático (ML) es el primer paso en la gestión de metadatos para descubrir, identificar, clasificar y gestionar datos. BigID aprovecha un catálogo de datos basado en ML para automatizar el descubrimiento y optimizar los flujos de trabajo manuales, logrando mayor precisión, inteligencia de datos y una rentabilidad más rápida.
- Catálogo en contextot: Vea atributos, metadatos y contexto alrededor de sus datos (PI, PII, datos confidenciales, relaciones de datos) para tomar decisiones inteligentes
- Visión holísticaNo solo recopilamos datos, sino que conectamos los puntos que los rodean. Nuestro catálogo tiene en cuenta el contexto y el contenido, y aporta valor al asociar diferentes tipos de datos para obtener una visión global.
- Visibilidad entre silos:Obtenga una vista consolidada de los datos de su organización, incorporando datos personales, confidenciales y metadatos (incluso resultados agregados de otros catálogos y entradas)
Vea el enfoque BigID para los catálogos de datos en acción con un demostración en vivo – o descargue el informe técnico Catálogo de datos 2.0: repensando los catálogos de datos.