Pular para o conteúdo

Desvendando os segredos do seu Data Lake com Descoberta centrada na privacidade

Mais do que 2,5 quintilhões de bytes de dados São criados dados todos os dias, e a maior parte deles nunca é excluída. Esses dados fluem de diversas unidades de negócios para inúmeros sistemas, na forma de dados estruturados e não estruturados, e para aplicações empresariais. As organizações estão construindo data lakes e data warehouses para fins de inteligência de negócios e análise, que contêm centenas de milhares de tabelas e elementos de dados com milhares de colunas. Alguns são gerados por máquinas e outros são derivados de outras bases de dados.

É um volume enorme de dados, e as empresas estão com dificuldades para acompanhar. A maioria das grandes empresas não tem conhecimento de todos os dados que coleta em toda a organização, nem de onde eles estão armazenados. Os dados estão se transformando de um ativo em um passivo.

Isso terá que mudar, pois os riscos nunca foram tão altos. Novas regulamentações de privacidade na UE, Califórnia e em todo o mundo exigem que as organizações saibam todos os dados que armazenam e onde eles estão localizados. Por exemplo, as empresas precisam ser capazes de encontrar todos os dados pertencentes a cidadãos europeus para cumprir com RGPDÉ preciso que consigam encontrar informações sobre menores e que possam localizar e excluir informações de qualquer indivíduo, caso solicitado. Como isso é possível quando se tem petabytes de dados armazenados? Em caso de violação de segurança, como saber de quem foram os dados roubados? Como respeitar adequadamente a privacidade dos clientes se não houver um controle preciso de todos os dados armazenados?

As ferramentas tradicionais de descoberta de dados não ajudam muito quando se trata de Encontrando PI/PII residem no Big Data. Precisam transmitir os dados para analisá-los, o que não é prático, considerando a enorme quantidade de dados que as organizações possuem atualmente. Só conseguem encontrar informações identificáveis, como número do Seguro Social ou número de telefone, mas não informações pessoais contextuais, como data de nascimento. Não podem ajudar com os direitos do titular dos dados; apenas informam o tipo de dados presentes (classificação), mas não podem dizer a quem pertencem os dados para fins de comunicação com os indivíduos ou para que excluam seus dados. E o suporte que oferecem é limitado para diferentes fontes de dadosQuando um titular de dados precisa ser excluído, ele deve ser excluído em todos os lugares, seja no Hadoop, Snowflake, AWS EMR, SAP HANA, Cassandra ou MongoDB Atlas, entre outros repositórios. Com o uso de análises de IA e múltiplos canais de entrada, os dados ressurgem, o que significa que você precisa validar continuamente a exclusão.

A solução BigID – Nativa de Big Data e centrada em entidades.

A BigID preenche essas lacunas com a oferta mais abrangente, permitindo que as organizações encontrem e gerenciem todos os seus dados, independentemente de onde estejam armazenados, do tipo e do formato em que se encontrem.

A cobertura mais completa – A descoberta e classificação de dados orientada por aprendizado de máquina abrange um enorme conjunto de repositórios de big data: Hadoop, Hive, HBase, Floco de neveO BigID suporta AWS Redshift, AWS EMR, AWS DynamoDB, Cassandra, CouchBase, MongoDB, SAP HANA, ElasticSearch e Redis. Além de Big Data, o BigID suporta arquivos não estruturados em compartilhamentos do Windows, Exchange, Google Drive, Box, AWS S3, Azure Storage, NetApp e EMC, entre outros. E todos os principais aplicativos de negócios são suportados. Enquanto os aplicativos de negócios contribuem com dados para repositórios de Big Data e consomem dados deles, o BigID pode analisar esses sistemas para fornecer uma visão holística dos dados. O BigID possui integrações com Collibra, ASG, SAP, Salesforce (SFDC), Microsoft, Iônico, ImunidadeServiceNow, NetSuite, Dia de trabalhoZendesk, Jira, ServiceNow, SurveyMonkey e outros.

Big Data Nativo –  O BigID oferece flexibilidade, sendo capaz de operar em diferentes ambientes. Ele funciona nativamente em ambientes de big data como MapReduce, ou como funções definidas pelo usuário em data warehouses, aproveitando seus recursos de processamento paralelo para executar varreduras em larga escala sem precisar transmitir os dados para fora do data warehouse. A arquitetura nativa da nuvem permite a implantação do BigID em qualquer ambiente Kubernetes com escalonamento lateral automatizado, que suporta implantações híbridas tanto on-premise quanto na nuvem. A amostragem inteligente aumentada por IA fornece resultados precisos, auditando petabytes de dados e utilizando IA para reduzir falsos positivos e falsos negativos, além de fornecer indicadores de qualidade de dados que ajudam a gerenciar a qualidade dos dados em escala.

Correlação centrada na entidade – A correlação de identidade baseada em aprendizado de máquina oferece a capacidade de encontrar todos os dados de um indivíduo específico em todas as fontes de dados com altíssima precisão e mensurável. Isso permite a operacionalização e a automação das solicitações dos titulares dos dados. Os recursos de conformidade validam continuamente e enviam alertas quando os dados de um indivíduo que solicitou sua exclusão reaparecem, e os proprietários dos dados são notificados sobre novos conjuntos de dados assim que são descobertos. O BigID garante o consentimento e valida se os indivíduos cujos dados foram encontrados no data warehouse realmente deram seu consentimento.

Além disso, em caso de violação de dados, a BigID pode informar quais dados foram afetados.

Descoberta de PI aprimorada por IA – As organizações podem encontrar de forma rápida e fácil os dados exatos que procuram. A amostragem inteligente, aprimorada por IA, fornece resultados precisos ao auditar petabytes de dados. A descoberta orientada por aprendizado de máquina permite encontrar quaisquer dados correlacionados a um indivíduo, e não apenas dados sensíveis isolados. Isso possibilita encontrar todas as transações de um usuário, rotas percorridas, data de nascimento, sexo, religião, etc.

Diante do atual cenário regulatório, as organizações não podem se dar ao luxo de ignorar nenhum de seus dados. Elas precisam entender exatamente quais dados possuem e, para isso, precisam adotar uma abordagem abrangente e integrada. Com o BigID, elas conseguem cumprir as regulamentações, proteger seus dados e se tornarem melhores administradoras de privacidade.