Pular para o conteúdo

Classificação mais inteligente para atributos de dados, metadados e arquivos

O BigID utiliza múltiplos métodos para encontrar e categorizar dados. Isso inclui a classificação tradicional baseada em padrões para localizar dados de um formato ou tipo específico. A tecnologia de classificação tradicional, encontrada em ferramentas legadas de DLP (Prevenção contra Perda de Dados) ou de governança de acesso a dados, depende principalmente de expressões regulares para encontrar correspondências exatas em sequências de dados, como números de cartão de crédito ou documentos de identidade. O BigID moderniza essas abordagens com uma nova validação inteligente, combinando-as também com novas abordagens de aprendizado de máquina (ML) e inteligência artificial (IA) para aumentar a precisão e ampliar seu escopo para metadados e documentos.

O BigID oferece às empresas uma biblioteca expansível de classificações predefinidas com regras inteligentes e verificações de validação para eliminar falsos positivos. O BigID combina esse método de classificação com padrões mais flexíveis usando aprendizado de máquina para separar com precisão nomes e atributos de entidades de dados estruturados semelhantes. Além disso, os classificadores de entidades inteligentes do BigID podem operar não apenas em arquivos não estruturados e bancos de dados estruturados, mas também em praticamente tudo a que o BigID possa se conectar. Isso inclui NoSQL, Big Data, SaaS, IaaS, mainframe, pipelines e fluxos de dados e muito mais.

Mas o BigID não para por aí: como as organizações de governança de dados estão adotando cada vez mais ferramentas de gerenciamento de metadados para governar o ciclo de vida da informação, o BigID também trouxe sua classificação inteligente, pela primeira vez, para o gerenciamento de metadados. O BigID não só ajuda as organizações a reclassificar metadados categorizados incorretamente, como também simplifica o processo tedioso e propenso a erros de mapear seus dados físicos para suas definições lógicas de dados. Com o BigID, os registros existentes podem ser mapeados com mais facilidade para seus atributos de dados reais. Além disso, onde não existem definições lógicas de dados ou registro, o BigID pode ajudar a recomendar definições a partir dos metadados e atributos de dados classificados.

No entanto, atributos de dados, entidades e metadados não são os únicos formatos de dados que as organizações desejam classificar ao categorizar suas informações. Nos últimos anos, as empresas têm enfrentado uma explosão na criação e no armazenamento de documentos e formulários não estruturados. Em muitas empresas, esses documentos ou arquivos representam muitos petabytes de informações armazenadas em sistemas NAS legados, como NetApp ou EMC, ou em sistemas de armazenamento de arquivos modernos, como Box, O365, Google Drive, S3, Salesforce, SharePoint e outros. A BigID, portanto, introduziu a classificação de arquivos baseada em aprendizado profundo para ajudar as organizações a categorizar e rotular sua vasta quantidade de dados não estruturados. A BigID oferece diversas classificações de documentos pré-treinadas, mas também dá às organizações a opção de treinar a IA de documentos da BigID com seus próprios dados.