Ir al contenido
Ver todas las entradas

Estructurante, no estructurado Descubrimiento y mapeo de datos

Muchos hemos oído que los datos son el nuevo petróleo, porque impulsan el comercio digital moderno. Pero la analogía no se limita a la idea de que los datos impulsan la economía de la información. Al igual que el petróleo, los datos también son fluidos: pueden filtrarse y fluir hacia casi cualquier depósito o almacén. Se pueden extraer (recopilar o generar), distribuir (transferir), refinar (editar y bifurcar), vender y eliminar (utilizar). De hecho, seguimiento de datos a lo largo de su ciclo de vida Desde su creación hasta su disposición, no ha seguido el ritmo de las innovaciones en su producción, intercambio y almacenamiento. Sin embargo, a medida que las empresas recurren a los datos para impulsar su interacción con los clientes, empoderar a sus empleados y optimizar su rendimiento empresarial, conocer y comprender sus datos ha adquirido una nueva dimensión y prioridad.

Datos en todas partes

 

Si los clientes son el alma de los negocios digitales modernos, conocer sus datos adquiere una urgencia comercial crucial. Durante años, las empresas intentaron comprender a sus clientes, primero mediante la tecnología MDM y, posteriormente, mediante el análisis avanzado de Big Data. Sin embargo, a medida que las empresas amplían el número de puntos de contacto digitales, desde la web de escritorio hasta dispositivos móviles, wearables, asistentes de IA e IoT, los métodos tradicionales para unificar el conocimiento de los datos mediante la centralización se vuelven insostenibles. Hoy en día, los datos se filtran fácilmente a través de almacenes de datos estructurados, semiestructurados y no estructurados; abarcan el centro de datos y... nubeSe extiende por el Big Data, los lagos de datos y un sinfín de aplicaciones, tanto internas como externas. Los datos de los clientes están en todas partes, codificados de diversas maneras y en todo tipo de lenguajes.

Lo que se necesita ahora es que las empresas obtengan una visión centralizada de un cliente sin centralizar sus datos. Esto requiere la capacidad de buscar en todos los almacenes de datos, independientemente de su ubicación o idioma, y al mismo tiempo conciliar qué datos pertenecen a qué usuario o entidad. Esto exige nuevas ideas para la búsqueda y correlación de datos por persona o sujeto de datos, algo que no es posible con la tecnología de clasificación de datos de la era Motorola StarTAC presente en los productos DLP y DAM actuales.

Centralizar la vista de datos sin centralizar los datos

BigID aprovecha los últimos enfoques en búsqueda a escala de internet y resolución de entidades basada en aprendizaje automático (ML) para brindar a las organizaciones una forma de localizar e inventariar rápidamente sus datos centrados en la identidad sin moverlos ni copiarlos. Los algoritmos de BigID organizan, catalogan y mapean automáticamente los datos en toda la empresa a escala de petabytes, independientemente de dónde se almacenen o cómo estén codificados. Proporciona un índice virtual de todos los datos que conserva una empresa, mapeados por sujeto de datos, tipo de dato, almacén de datos o residencia, para que los profesionales de seguridad, cumplimiento o gobernanza puedan navegar y analizar con precisión sus activos de datos principales. Por lo tanto, permite obtener una vista centralizada de los datos de los clientes en almacenes de datos estructurados, pero quizás aún más importante, también en todas las ubicaciones no estructuradas donde las empresas almacenan datos, como recursos compartidos de archivos, clústeres de Hadoop, lagos de datos, repositorios de registros, etc.

Mejor cumplimiento de los datos mediante una mejor contabilidad de datos

La importancia de poder descubrir y mapear datos personales en almacenes de datos no estructurados no solo es necesaria para una alternativa más escalable y descentralizada a la tradicional MDM. También es clave si las empresas aspiran a cumplir con las nuevas normativas de protección de datos, como el RGPD.

El RGPD, en esencia, exige que las organizaciones rindan cuentas de los datos que conservan sobre sus clientes y empleados. Les exige que inventarien no solo dónde almacenan los datos personales, sino también dónde los almacenan. cada Datos personales. Los enfoques tradicionales de descubrimiento de datos, basados en encuestas o clasificación, tienen dificultades para localizar datos personales no identificables como PII y no pueden discernir qué datos pertenecen a qué persona. Además, su eficacia de búsqueda en el creciente universo de almacenes de datos no estructurados es limitada, ya que, en la mayoría de los casos, las tecnologías de descubrimiento son anteriores al desarrollo de los nuevos repositorios modernos de datos no estructurados.

 

RGPD y el imperativo cambiante de la protección de datos 

BigID no solo puede identificar un conjunto más amplio de información personal/información confidencial según su grado de "personalidad", sino que también puede hacerlo con cualquier tipo de datos e independientemente del idioma. Esto, obviamente, proporciona un potente complemento, o incluso una alternativa, a la gestión de datos maestros (MDM). Además, ayuda a las organizaciones a cumplir con algunos de los requisitos más esenciales del RGPD sobre titulares de datos y mantenimiento de registros, al poder encontrar y rastrear datos desde su creación, pasando por su procesamiento y su eliminación.

Si bien los datos pueden ser el nuevo "petróleo" en términos de su valor para una empresa moderna, a diferencia del petróleo, los datos no son fungibles. Cada dato es distinto en su tipo, procedencia y asociaciones. Sin embargo, nuevas tecnologías como BigID pueden brindar a las organizaciones una forma moderna de descubrir y mapear sus datos con precisión, a escala y en una gama ilimitada de almacenes de datos. Conocer y comprender a sus clientes a través de sus datos nunca ha sido tan esencial ni tan factible.