Para administrar y proteger sus datos, necesita saber no solo dónde están, sino también de quién son y qué Lo es. Los enfoques tradicionales de clasificación se centran en el etiquetado manual o en la comparación de patrones, que requiere muchos recursos (lo cual no siempre es fiable). Dada la velocidad y la diversidad del crecimiento de los datos, ya sean datos almacenados en un repositorio de big data o datos que se mueven entre el almacenamiento en la nube y los lagos de datos, estos enfoques tradicionales no son escalables ni sostenibles, y no proporcionan el contexto necesario para abordar los desafíos de privacidad y seguridad del entorno actual.
Por eso BigID aborda la clasificación de manera diferente: no basándose en lo que funcionó en el pasado ni identificando lo que cubre una legislación específica, sino con un enfoque centrado en la privacidad diseñado desde cero.
Eso significa mirar los datos – todos los datos, donde sea que viva, y encontrar formas de clasificar, etiquetar y conectar puntos de datos dispares en relaciones, identidades y perfiles significativos.
BigID adopta un enfoque de descubrimiento profundo que abarca todos los aspectos: encuentra datos dondequiera que estén y los superpone según el contexto y la correlación para su clasificación. Este enfoque se basa en métodos de clasificación más tradicionales (y los amplía) y amplía la cobertura a diversos tipos de información confidencial, desde datos personales identificable información a perfil información a información sensible más amplia.
¿Cómo lo hace BigID? Tenemos varias maneras, todas diseñadas específicamente para el entorno de datos actual (y su volumen y variedad).
Expresiones regulares y coincidencia de patrones
El método de clasificación de datos más tradicional; esta técnica combina expresiones y patrones conocidos con la información que se encuentra dentro de los datos.
Los números de tarjetas de crédito MasterCard, por ejemplo, son un número de dieciséis dígitos que comienza con 5262. Por lo tanto, es totalmente plausible que cualquier cadena entera de dieciséis dígitos que comience con 5262 pueda etiquetarse como un número de tarjeta de crédito MasterCard.
De manera similar, los identificadores basados en patrones, como códigos postales, números IBAN, números de Seguro Social y más, pueden caer en esta categoría: si ya conoce la estructura de la información que está tratando de hacer coincidir, podrá identificar patrones similares dentro de un conjunto de datos.
La comparación de patrones tradicional a menudo está determinada por la regulación: si algo como PCI-DSS determina que las organizaciones deben poder identificar números de tarjetas de crédito, los patrones de números de tarjetas de crédito se pueden analizar rápidamente y agregar a un conjunto de diccionarios.
La clasificación por coincidencia de patrones no está de ninguna manera obsoleta, pero es importante abordar más que los requisitos mínimos.
Hemos agregado identificadores de seguridad, por ejemplo, para que las organizaciones puedan identificar puntos de datos centrados en la seguridad, como claves API, credenciales, tokens e incluso contraseñas comunes.
Entonces, para algunos tipos de datos, la coincidencia de patrones es la solución.
Clasificación contextual
Un conjunto de datos mucho más complejo de clasificar es aquel que no sigue necesariamente un patrón determinado o consistente: es difícil identificar nombres descriptivos, y mucho menos verlos en el contexto de una identidad específica. El contexto también es crucial para distinguir entre dos valores de datos con formatos similares, pero que representan dos tipos de información diferentes (por ejemplo, un número de la Seguridad Social y un número de cuenta).
¿Pueden sus herramientas de clasificación tradicionales correlacionar un número de Seguro Social específico con un nombre, color de ojos, geolocalización e información educativa, todo relacionado con una sola persona o identidad?
No. Pero BigID sí puede.
BigID aprovecha Aprendizaje automático (ML) y reconocimiento de entidades nombradas (NER) no sólo identificar automáticamente información confidencial como registros de votación, actividad en redes sociales o altura basándose en inferencias u otras técnicas, sino también vincular esa instancia específica de información confidencial con una identidad o perfil individual.
La legislación sobre protección y privacidad de datos está ampliando la definición de información personal (y, posteriormente, lo que tipo La información que necesita ser protegida), y lo mismo debería suceder con sus soluciones de clasificación y descubrimiento.
Clasificadores de archivos por tipo
A medida que el volumen de datos continúa creciendo, es importante proteger el tipo correcto de información con las políticas adecuadas: los documentos legales deben seguir una política, los financieros otra, y así sucesivamente.
Por eso hemos añadido la clasificación de archivos por tipo a nuestro arsenal: BigID cuenta con modelos de aprendizaje automático que clasifican automáticamente los documentos según el contenido y la estructura de un archivo, sin limitarse a ningún clasificador de datos específico. Estos modelos pueden reconocer tipos de archivos sensibles: desde estados financieros hasta tarjetas de embarque y resúmenes de alta. documentación de fusiones y adquisiciones y más.
Para que las organizaciones puedan garantizar que cuentan con la protección de datos adecuada, primero deben poder identificarla de forma fácil y precisa.
Clasificación basada en políticas
Entre todos los tipos de clasificación y descubrimiento de datos, el principal impulsor de esto son las regulaciones de privacidad y protección de datos. GDPR a la CCPA a NYDFS Desde HIPAA hasta SOX hasta GLBA (y la lista continúa), las organizaciones necesitan poder identificar ciertos tipos de datos que caen bajo regulaciones específicas y promulgar políticas para administrar y proteger esos datos.
BigID cuenta con bibliotecas de políticas integradas para clasificar, gestionar y proteger tipos específicos de datos según la política: desde números de identificación y contraseñas sujetos a la CCPA, esquemas de identidad nacional para el RGPD, hasta información de tarjetas de crédito sujeta a la normativa PCI. Clasificar y gestionar datos según la política permite a las organizaciones crear flujos de trabajo para ese tipo específico de datos, gestionar el acceso, supervisar el uso y proteger datos sensibles que podrían estar siendo atacados.
Clasificación en cualquier lugar
El crecimiento, el valor y el significado de los datos evolucionan rápidamente, y las políticas y regulaciones vigentes están comenzando a adaptarse. A medida que evoluciona el mundo de los datos, también lo hace el valor de los datos personales, los datos sensibles y las propias políticas que buscan protegerlos. Por eso, BigID está replanteando la clasificación: revolucionando la clasificación de datos y... descubrimiento con un enfoque extensible y centrado en datos.
Las normativas de privacidad y protección de datos, como la Ley SHIELD de Nueva York, no solo amplían la definición de "información personal", sino que añaden capas a la clasificación tradicional en sus recomendaciones: las organizaciones deben poder correlacionar datos, como el nombre de usuario y el correo electrónico, junto con una contraseña o pregunta de seguridad, para aplicar las protecciones de seguridad recomendadas. La Ley SHIELD, precursora de la próxima ola de leyes de notificación de filtraciones de datos, amplía el tipo de datos cubiertos y la definición de lo que constituye una filtración de datos.
El éxito de la protección de datos y la automatización de la privacidad depende de la capacidad de descubrir, clasificar, correlacionar y catalogar con precisión toda la información sensible, independientemente de su ubicación. La coincidencia de patrones por sí sola ya no es suficiente: las organizaciones necesitan correlacionar datos con una identidad, establecer relaciones entre instancias individuales de datos sensibles, identificar automáticamente información sensible o personal, tanto directa como inferida, y establecer procesos y políticas para proteger y gestionar dichos datos.
El descubrimiento, la clasificación y la correlación de BigID se extienden a datos no estructurados, estructurados y semiestructurados a escala de petabytes, y se aplican a todo, desde Cassandra hasta Amazon S3 A CIFS a Gmail a Base de sofá De Box a Hadoop y en todas partes en el medio: le brindamos un inventario unificado de sus datos confidenciales, todo en un solo lugar.
Al adoptar un enfoque innovador y basado en datos para la clasificación, BigID clasifica de forma inteligente (y automática) datos y archivos confidenciales de cualquier tipo, dondequiera que se almacenen, en toda su organización. ¿Quiere verlo en acción? Obtenga una demostración para ver cómo BigID realiza la clasificación de manera diferente.