Más que 2,5 trillones de bytes de datos Se crean datos a diario, y la mayoría nunca se elimina. Fluyen desde múltiples unidades de negocio hacia numerosos sistemas en forma de datos estructurados y no estructurados, y hacia las aplicaciones empresariales. Las organizaciones están construyendo lagos y almacenes de datos para fines de inteligencia empresarial y análisis, que contienen cientos de miles de tablas y elementos de datos con miles de columnas. Algunos son generados automáticamente y otros se derivan de otros datos base.
Se trata de una gran cantidad de datos, y las empresas tienen dificultades para mantenerse al día. La mayoría de las grandes empresas desconocen todos los datos que recopilan en su organización ni dónde se almacenan. Los datos están pasando de ser un activo a un pasivo.
Eso tendrá que cambiar, ya que lo que está en juego nunca ha sido tan importante. Nuevas regulaciones de privacidad en la UE, California Y en todo el mundo se exige que las organizaciones conozcan todos los datos que almacenan y dónde se encuentran. Por ejemplo, las empresas necesitan poder encontrar todos los datos de los ciudadanos europeos para cumplir con... GDPRNecesitan poder encontrar información sobre menores y poder encontrar y eliminar la información de cualquier persona si así lo solicitan. ¿Cómo se puede lograr esto cuando se manejan petabytes de datos? Si se produce una filtración, ¿cómo se puede saber de quién fueron los datos robados? ¿Cómo se puede respetar la privacidad de los clientes si no se lleva un registro adecuado de todos los datos que se almacenan?
Las herramientas tradicionales de descubrimiento de datos no ayudan mucho cuando se trata de Encontrar información personal/información personal identificable que residen en Big Data. Necesitan transmitir los datos para escanearlos, lo cual no es práctico dada la gran cantidad de datos que las organizaciones tienen actualmente. Solo pueden encontrar información identificable, como el número de la Seguridad Social o el número de teléfono, pero no información personal contextual como la fecha de nacimiento. No pueden ayudar con los derechos de los interesados; solo indican el tipo de datos (clasificación), pero no pueden indicar de quién son para informar a las personas o eliminar sus datos. Además, tienen un soporte limitado para... diferentes fuentes de datosCuando es necesario eliminar datos de un titular de datos, debe eliminarse en todas partes, ya sea en Hadoop, Snowflake, AWS EMR, SAP HANA, Cassandra o MongoDB Atlas, entre otros repositorios. Con el uso de análisis de IA y múltiples canales de entrada, los datos reaparecen, lo que implica la necesidad de validar continuamente la eliminación.
La solución BigID: nativa de Big Data y centrada en entidades

BigID aborda esas brechas con la oferta más completa, permitiendo a las organizaciones encontrar y administrar todos sus datos, independientemente de dónde estén almacenados, de qué tipo sean y en qué formato estén.
La cobertura más completa – El descubrimiento y la clasificación de datos impulsados por el aprendizaje automático cubren un enorme conjunto de repositorios de big data: Hadoop, Hive, HBase, Copo de nieveAWS Redshift, AWS EMR, AWS DynamoDB, Cassandra, CouchBase, MongoDB, SAP HANA, ElasticSearch y Redis. Además de Big Data, BigID admite archivos no estructurados en recursos compartidos de Windows, Exchange, GDrive, Box, AWS S3, Azure Storage, NetApp y EMC, entre otros. Además, es compatible con todas las principales aplicaciones empresariales. Mientras las aplicaciones empresariales aportan datos a los repositorios de Big Data y los consumen desde ellos, BigID puede analizar esos sistemas para proporcionar una cobertura integral de los datos. BigID se integra con Collibra, ASG, SAP y SFDC de Salesforce. Microsoft, Iónico, Inmuta, ServiceNow, NetSuite, Jornada laboral, Zendesk, Jira, ServiceNow, SurveyMonkey y otros.
Nativo de Big Data – BigID ofrece flexibilidad y se adapta a diferentes entornos. Se ejecuta de forma nativa en entornos de big data como MapReduce o como funciones definidas por el usuario en almacenes de datos, aprovechando su capacidad de procesamiento paralelo para ejecutar análisis a gran escala sin necesidad de extraer los datos del almacén. Su arquitectura nativa en la nube permite la implementación de BigID en cualquier entorno de Kubernetes con escalado lateral automatizado que admite implementaciones híbridas, tanto locales como en la nube. El muestreo inteligente aumentado con IA proporciona resultados precisos auditando petabytes de datos, utilizando IA para reducir falsos positivos y falsos negativos, y proporcionando indicadores de calidad de datos que ayudan a gestionar la calidad de los datos a escala.
Correlación centrada en la entidad – La correlación de identidad basada en aprendizaje automático (ML) permite encontrar todos los datos de una persona específica en todas las fuentes con una precisión extremadamente alta y medible. Esto permite la operacionalización y automatización de las solicitudes de los interesados. Las funciones de cumplimiento validan y envían alertas continuamente cuando reaparecen los datos de una persona que solicitó su eliminación, y los propietarios de los datos reciben notificaciones sobre nuevos conjuntos de datos cuando se descubren. BigID exige el consentimiento y valida que las personas cuyos datos se encontraron en el almacén de datos hayan dado efectivamente su consentimiento.
Además, si ocurre una vulneración, BigID puede informarle qué datos se vieron afectados.
Descubrimiento de PI aumentado por IA – Las organizaciones pueden encontrar rápida y fácilmente los datos exactos que buscan. El muestreo inteligente aumentado con IA proporciona resultados precisos al auditar petabytes de datos. El descubrimiento impulsado por aprendizaje automático permite descubrir cualquier dato relacionado con un individuo, no solo los datos sensibles. Esto permite encontrar todas las transacciones, rutas, fecha de nacimiento, género, religión, etc. de un usuario.
Dado el entorno regulatorio actual, las organizaciones no pueden permitirse el lujo de ignorar ninguno de sus datos. Necesitan comprender exactamente qué datos poseen y, para ello, deben aplicar un enfoque integral. Con BigID, pueden cumplir con las regulaciones, proteger sus datos y ser mejores administradores de la privacidad.