Pular para o conteúdo
Ver todas as postagens

Desvendando os segredos do seu Data Lake com Descoberta centrada na privacidade

Mais do que 2,5 quintilhões de bytes de dados Dados são criados todos os dias e a maioria deles nunca é excluída. Eles fluem de várias unidades de negócios para vários sistemas na forma de dados estruturados e não estruturados, e para aplicativos de negócios. As organizações estão construindo data lakes e data warehouses para fins de inteligência de negócios e análise, contendo centenas de milhares de tabelas e elementos de dados com milhares de colunas. Alguns são gerados por máquina e outros são derivados de outros dados básicos.

São muitos dados, e as empresas estão tendo dificuldades para acompanhar. A maioria das grandes empresas não sabe exatamente todos os dados que coleta em sua organização ou onde eles estão armazenados. Os dados estão se transformando de um ativo em um passivo.

Isso terá que mudar, pois os riscos nunca foram tão altos. Novas regulamentações de privacidade na UE, Califórnia e em todo o mundo exigem que as organizações saibam todos os dados que estão armazenando e onde eles estão localizados. Por exemplo, as empresas precisam ser capazes de encontrar todos os dados pertencentes a cidadãos europeus para cumprir GDPR. Eles precisam ser capazes de encontrar informações sobre menores e de localizar e excluir informações de qualquer indivíduo, se solicitado. Como isso pode ser feito quando se tem petabytes de dados? Em caso de violação de dados, como saber de quem são os dados roubados? Como respeitar adequadamente a privacidade dos seus clientes se não se tem uma contabilidade adequada de todos os dados armazenados?

As ferramentas tradicionais de descoberta de dados não ajudam muito quando se trata de encontrando PI/PII residindo em BigData. Eles precisam transmitir os dados para digitalizá-los, o que não é prático, dada a grande quantidade de dados que as organizações têm atualmente. Eles só conseguem encontrar informações identificáveis, como número do Seguro Social ou número de telefone, mas não informações pessoais contextuais, como data de nascimento. Eles não podem ajudar com os direitos dos titulares dos dados; eles apenas informam que tipo de dados estão lá (classificação), mas não podem dizer de quem são os dados para fins de relatórios aos indivíduos ou para excluir seus dados. E eles têm suporte limitado para diferentes fontes de dadosQuando um titular de dados precisa ser excluído, ele deve ser excluído em todos os lugares, seja no Hadoop, Snowflake, AWS EMR, SAP HANA, Cassandra ou MongoDB Atlas, entre outros repositórios. Com o uso de análises de IA e múltiplos canais de entrada, os dados ressurgem, o que significa que você precisa validar continuamente a exclusão.

A solução BigID – Nativa de Big Data e Centrada em Entidades

O BigID preenche essas lacunas com a oferta mais abrangente, permitindo que as organizações encontrem e gerenciem todos os seus dados, independentemente de onde estejam armazenados, de que tipo sejam e em que formato estejam.

A cobertura mais abrangente – A descoberta e classificação de dados orientadas por aprendizado de máquina abrangem um grande conjunto de repositórios de big data: Hadoop, Hive, HBase, Floco de neve, AWS Redshift, AWS EMR, AWS DynamoDB, Cassandra, CouchBase, MongoDB, SAP HANA, ElasticSearch e Redis. Além de big data, o BigID oferece suporte a arquivos não estruturados em compartilhamentos do Windows, Exchange, Gdrive, Box, AWS S3, Azure Storage, NetApp e EMC, entre outros. E todos os principais aplicativos de negócios são suportados. Enquanto os aplicativos de negócios contribuem com dados e os consomem de repositórios de big data, o BigID pode escanear esses sistemas para fornecer uma cobertura holística dos dados. O BigID possui integrações com Collibra, ASG, SAP, SFDC da Salesforce, Microsoft, Iônico, Imuta, ServiceNow, NetSuite, Dia de trabalho, Zendesk, Jira, ServiceNow, SurveyMonkey e outros.

Nativo de Big Data –  O BigID oferece flexibilidade, capaz de operar em diferentes ambientes. Ele roda nativamente em ambientes de big data como o MapReduce, ou como funções definidas pelo usuário em data warehouses, aproveitando seus recursos de processamento paralelo para executar varreduras em larga escala sem a necessidade de transmitir os dados para fora do data warehouse. A arquitetura nativa em nuvem permite a implantação do BigID em qualquer ambiente Kubernetes com escalonamento lateral automatizado que suporta implantações híbridas tanto no local quanto na nuvem. A amostragem inteligente aumentada por IA fornece resultados precisos, auditando os petabytes de dados, utilizando IA para reduzir falsos positivos e falsos negativos, e fornecendo indicadores de qualidade de dados que ajudam a gerenciar a qualidade dos dados em escala.

Correlação Centrada na Entidade – A correlação de identidade orientada por ML oferece a capacidade de encontrar todos os dados de um indivíduo específico em todas as fontes de dados com precisão extremamente alta e mensurável. Isso permite a operacionalização e a automação de solicitações de titulares de dados. Os recursos de conformidade validam e enviam alertas continuamente quando os dados de um indivíduo que solicitou a exclusão reaparecem, e os proprietários dos dados são notificados sobre novos conjuntos de dados quando descobertos. O BigID aplica o consentimento e valida se os indivíduos cujos dados foram encontrados no data warehouse realmente deram seu consentimento.

Além disso, se houver uma violação, o BigID pode informar quais dados foram afetados.

Descoberta de PI aumentada por IA – As organizações podem encontrar de forma rápida e fácil os dados exatos que procuram. A amostragem inteligente, complementada por IA, fornece resultados precisos por meio da auditoria dos petabytes de dados. A descoberta orientada por ML permite a descoberta de quaisquer dados correlacionados a um indivíduo, não apenas os dados sensíveis em si. Isso permite encontrar todas as transações de um usuário, rotas, data de nascimento, gênero, religião, etc.

Dado o ambiente regulatório atual, as organizações não podem se dar ao luxo de ignorar nenhum de seus dados. Elas precisam entender exatamente quais dados possuem e, para isso, precisam usar uma abordagem abrangente e integrada. Com o BigID, elas conseguem cumprir as regulamentações, proteger seus dados e ser melhores guardiões da privacidade.

 

Conteúdo