Ir al contenido
Ver todas las entradas

Clasificación más inteligente para atributos de datos, metadatos y archivos

BigID utiliza múltiples métodos para buscar y categorizar datos. Esto incluye la clasificación tradicional basada en patrones para localizar datos de un formato o tipo específico. La tecnología de clasificación tradicional, como la presente en herramientas de seguridad de DLP o de gobernanza del acceso a datos, se basa principalmente en expresiones regulares para encontrar coincidencias exactas en cadenas de datos, como las de una tarjeta de crédito o un documento nacional de identidad. BigID moderniza estos enfoques con una nueva validación inteligente, a la vez que los integra con nuevos enfoques de aprendizaje automático e inteligencia artificial para aumentar la precisión y ampliar su alcance a metadatos y documentos.

BigID ofrece a las empresas una biblioteca expandible de clasificaciones predefinidas con reglas inteligentes y comprobaciones de validación para eliminar falsos positivos. BigID combina este método de clasificación con patrones difusos mediante aprendizaje automático (ML) para separar con precisión nombres y atributos de entidades de datos estructurados similares. Además, los clasificadores de entidades inteligentes de BigID pueden operar no solo con archivos no estructurados y bases de datos estructuradas, sino también con prácticamente cualquier sistema al que BigID pueda conectarse. Esto incluye NoSQL, Big Data, SaaS, IaaS, mainframe, pipelines y flujos de datos, entre otros.

Pero BigID no se detiene ahí: dado que las organizaciones de gobernanza de datos adoptan cada vez más herramientas de gestión de metadatos para gestionar el ciclo de vida de su información, BigID también ha incorporado su clasificación inteligente por primera vez a la gestión de metadatos. BigID no solo ayuda a las organizaciones a reclasificar metadatos mal categorizados, sino que también simplifica el tedioso y propenso a errores proceso de mapear sus datos físicos con sus definiciones lógicas de datos. Con BigID, los registros existentes se pueden mapear más fácilmente con sus atributos de datos reales. Además, cuando no existen definiciones lógicas de datos ni registros, BigID puede ayudar a recomendar definiciones a partir de los metadatos y atributos de datos clasificados.

Sin embargo, los atributos, las entidades y los metadatos de los datos no son el único formato que las organizaciones desean clasificar al categorizar su información. En los últimos años, las empresas se han enfrentado a un auge en la creación y el almacenamiento de documentos y formularios no estructurados. En muchas empresas, estos documentos o archivos representan numerosos petabytes de información almacenada en sistemas NAS heredados como NetApp o EMC, o en almacenes de archivos modernos como Box, O365, GDrive, S3, Salesforce, Sharepoint y más. Por lo tanto, BigID ha introducido la clasificación de archivos basada en aprendizaje profundo para ayudar a las organizaciones a categorizar y etiquetar su gran cantidad de datos no estructurados. BigID proporciona numerosas clasificaciones de documentos preentrenadas listas para usar, pero también ofrece a las organizaciones la opción de entrenar la IA de documentos de BigID con sus propios datos.