Para gerenciar e proteger seus dados, você precisa saber não apenas onde eles estão, mas também a quem pertencem, e o que Sim, é verdade. As abordagens tradicionais de classificação focam-se na marcação manual ou na correspondência de padrões, que consome muitos recursos (e nem sempre é confiável). Dada a velocidade e a diversidade do crescimento dos dados – sejam eles dados em um repositório de big data ou dados que se movem entre armazenamento em nuvem e data lakes – essas abordagens tradicionais não são escaláveis nem sustentáveis e não fornecem o contexto necessário para lidar com os desafios de privacidade e segurança do ambiente atual.
É por isso que a BigID aborda a classificação de forma diferente: não com base no que funcionou no passado, nem identificando o que está coberto por legislação específica, mas com uma abordagem centrada na privacidade, concebida desde o início.
Isso significa analisar os dados – todos os dados, onde quer que esteja – e encontrar maneiras de classificar, etiquetar e conectar pontos de dados díspares em relacionamentos, identidades e perfis significativos.
A BigID adota uma abordagem de descoberta aprofundada que vai além do básico: encontrando dados onde quer que estejam e adicionando contexto e correlação para a classificação. Essa abordagem se baseia em (e amplia) métodos de classificação mais tradicionais e expande a cobertura para vários tipos de informações sensíveis – desde dados pessoais identificável informações para perfil informações para informações sensíveis mais amplas.
Então, como a BigID faz isso? Temos algumas maneiras – todas desenvolvidas especificamente para o ambiente de dados atual (e para o volume e a variedade).
Expressões regulares e reconhecimento de padrões
O método de classificação de dados mais tradicional, essa técnica relaciona expressões e padrões conhecidos com informações presentes nos seus dados.
Os números de cartão de crédito MasterCard, por exemplo, são números de dezesseis dígitos que começam com 5262. Portanto, é perfeitamente plausível que qualquer sequência de dezesseis dígitos que comece com 5262 possa ser considerada um número de cartão de crédito MasterCard.
Da mesma forma, identificadores baseados em padrões, como códigos postais, números IBAN, números de Segurança Social e outros, podem se enquadrar nessa categoria: se você já conhece a estrutura da informação que está tentando encontrar correspondência, poderá identificar padrões semelhantes em um conjunto de dados.
A correspondência de padrões tradicional é frequentemente definida por regulamentação: se algo como o PCI-DSS determinar que as organizações precisam ser capazes de identificar números de cartão de crédito, os padrões para esses números podem ser analisados rapidamente e adicionados a um conjunto de dicionários.
A classificação por reconhecimento de padrões não está de forma alguma obsoleta – mas é importante abordar mais do que os requisitos mínimos.
Adicionamos identificadores de segurança, por exemplo, para que as organizações possam identificar pontos de dados focados em segurança, como chaves de API, credenciais, tokens e até mesmo senhas comuns.
Assim, para alguns tipos de dados, a correspondência de padrões resolve o problema.
Classificação contextual
Um conjunto de dados muito mais complexo de classificar é aquele que não segue necessariamente um padrão dado ou consistente: é difícil identificar "nomes amigáveis" – muito menos vê-los no contexto de uma identidade específica. O contexto também é crucial para distinguir entre dois valores de dados que têm formatos semelhantes, mas são dois tipos diferentes de informação (um número de Segurança Social e um número de conta, por exemplo).
Será que as suas ferramentas de classificação tradicionais conseguem correlacionar um número de Segurança Social específico com um nome, cor dos olhos, geolocalização e informações sobre educação – tudo relacionado com uma única pessoa ou identidade?
Não. Mas o BigID consegue.
O BigID aproveita Aprendizado de Máquina (ML) e Reconhecimento de Entidades Nomeadas (NER) Não apenas para identificar automaticamente informações sensíveis, como registros de votação, atividades em redes sociais ou altura, com base em inferência ou outras técnicas, mas também para vincular essa instância específica de informação sensível a uma identidade ou perfil individual.
A legislação sobre privacidade e proteção de dados está expandindo a definição de informação pessoal (e, consequentemente, o que ela abrange). tipo Todas as informações precisam ser protegidas, e o mesmo deve valer para suas soluções de classificação e descoberta.
Classificadores de arquivos por tipo
Com o crescimento contínuo do volume de dados, é fundamental proteger o tipo certo de informação com as políticas adequadas: documentos jurídicos devem seguir uma política, documentos financeiros outra, e assim por diante.
Por isso, adicionamos a classificação de arquivos por tipo ao nosso arsenal: o BigID possui modelos de aprendizado de máquina que classificam documentos automaticamente com base no conteúdo e na estrutura do arquivo, sem se limitar a nenhum classificador de dados específico. Esses modelos podem reconhecer tipos de arquivos sensíveis: de demonstrativos financeiros a cartões de embarque e resumos de alta hospitalar. documentação de fusões e aquisições e mais.
Para garantir que as organizações tenham a proteção de dados adequada, elas precisam primeiro ser capazes de identificá-la de forma fácil e precisa.
Classificação baseada em políticas
Dentre todos os tipos de classificação e descoberta de dados, o principal fator impulsionador é a privacidade de dados e as regulamentações de proteção. RGPD para CCPA para NYDFS Da HIPAA à SOX, da GLBA e muitas outras (e a lista continua), as organizações precisam ser capazes de identificar certos tipos de dados que se enquadram em regulamentações específicas e implementar políticas para gerenciar e proteger esses dados.
O BigID possui bibliotecas de políticas integradas para ajudar a classificar, gerenciar e proteger tipos específicos de dados por política: isso abrange desde números de identificação e senhas que se enquadram na CCPA, esquemas de identidade nacionais para o GDPR, até informações de cartão de crédito que se enquadram no PCI. Classificar e gerenciar dados por política permite que as organizações criem fluxos de trabalho para esse tipo específico de dado, gerenciem o acesso, monitorem o uso e protejam dados confidenciais que possam estar sob ataque.
Classificação em qualquer lugar
O crescimento, o valor e o significado dos dados estão evoluindo rapidamente – e as políticas e regulamentações vigentes estão começando a acompanhar essa evolução. À medida que o mundo dos dados evolui, também evolui o valor dos dados pessoais, dos dados sensíveis e das próprias políticas que visam protegê-los. É por isso que a BigID está repensando a classificação: revolucionando a classificação de dados e descoberta Com uma abordagem extensível e centrada em dados.
Regulamentações de privacidade e proteção de dados, como a Lei SHIELD de Nova York, não apenas ampliam a definição de "informações pessoais", mas também adicionam camadas à classificação tradicional em suas recomendações: as organizações precisam ser capazes de correlacionar dados — como nome de usuário e e-mail em combinação com uma senha ou pergunta de segurança — para aplicar as proteções de segurança recomendadas. A Lei SHIELD, como um prenúncio da próxima onda de leis de notificação de violação de dados, expande tanto o tipo de dados abrangidos quanto a definição do que constitui uma violação de dados.
A automação bem-sucedida da proteção de dados e da privacidade depende da capacidade de descobrir, classificar, correlacionar e catalogar com precisão todas as informações sensíveis, independentemente de onde estejam localizadas. A simples correspondência de padrões já não é suficiente: as organizações precisam ser capazes de correlacionar dados a uma identidade, estabelecer relações entre instâncias individuais de dados sensíveis, identificar automaticamente informações sensíveis ou pessoais, tanto diretas quanto inferidas, e estabelecer processos e políticas para proteger e gerenciar esses dados.
A descoberta, classificação e correlação do BigID abrangem dados não estruturados, estruturados e semiestruturados em escala de petabytes e se aplicam a tudo, desde Cassandra até... Amazon S3 Para CIFS para Gmail para Base de sofá para Box para Hadoop e em todos os lugares intermediários: fornecendo um inventário unificado de seus dados confidenciais – tudo em um só lugar.
Ao adotar uma abordagem inovadora e orientada por dados para classificação, o BigID classifica de forma inteligente (e automática) dados e arquivos confidenciais de qualquer tipo, onde quer que estejam armazenados – em toda a sua organização. Quer ver como funciona? Obtenha uma demonstração Para ver como o BigID realiza a classificação de forma diferente.