Pular para o conteúdo
Ver todas as postagens

Classificação mais inteligente para atributos de dados, metadados e arquivos

O BigID utiliza diversos métodos para encontrar e categorizar dados. Isso inclui a classificação tradicional baseada em padrões para localizar dados de um formato ou tipo específico. A tecnologia de classificação tradicional, como encontrada em ferramentas legadas de DLP ou de segurança de governança de acesso a dados, baseia-se em Expressões Regulares principalmente para encontrar correspondências exatas em sequências de dados, como um cartão de crédito ou documento de identidade nacional. O BigID moderniza essas abordagens com a nova validação inteligente, combinando-as com abordagens mais recentes de ML e IA para aumentar a precisão e ampliar seu escopo para metadados e documentos.

O BigID oferece às empresas uma biblioteca expansível de classificações predefinidas com regras inteligentes e verificações de validação para remover falsos positivos. O BigID combina esse método de classificação com padrões mais difusos usando ML para separar com precisão nomes e atributos de entidades de dados estruturados semelhantes. Além disso, os classificadores de entidades inteligentes do BigID podem operar não apenas em arquivos não estruturados e bancos de dados estruturados, mas também em qualquer coisa à qual o BigID possa se conectar, ou seja, quase tudo. Isso inclui noSQL, Big Data, SaaS, IaaS, mainframe, pipelines e fluxos de dados e muito mais.

Mas o BigID não para por aí: considerando que as organizações de governança de dados estão adotando cada vez mais ferramentas de gerenciamento de metadados para governar o ciclo de vida das informações, o BigID também trouxe sua classificação inteligente pela primeira vez para o gerenciamento de metadados. O BigID não só pode ajudar as organizações a reclassificar metadados categorizados incorretamente, como também simplificar o processo tedioso e propenso a erros de mapeamento de seus dados físicos para suas definições lógicas de dados. Usando o BigID, os registros existentes podem ser mapeados com mais facilidade para seus atributos de dados reais. Além disso, onde não há definições lógicas de dados ou registro, o BigID pode ajudar a recomendar definições a partir dos metadados e atributos de dados classificados.

No entanto, atributos de dados, entidades e metadados não são o único formato de dados que as organizações desejam classificar ao categorizar suas informações. Nos últimos anos, as empresas enfrentaram uma explosão na criação e armazenamento de documentos não estruturados e formulários. Em muitas empresas, esses documentos ou arquivos representam muitos petabytes de informações armazenadas em sistemas NAS legados, como NetApp ou EMC, ou em armazenamentos de arquivos modernos como Box, O365, GDrive, S3, Salesforce, Sharepoint e outros. O BigID, portanto, introduziu a classificação de arquivos baseada em aprendizado profundo para ajudar as organizações a categorizar e rotular sua vasta quantidade de dados não estruturados. O BigID fornece muitas classificações de documentos pré-treinadas prontas para uso, mas também oferece às organizações a opção de treinar a IA de documentos do BigID com seus próprios dados.