Pular para o conteúdo

Estruturação, Não Estruturado Descoberta e mapeamento de dados

Muitos de nós já ouvimos dizer que os dados são o novo petróleo, porque impulsionam o comércio digital moderno. Mas a analogia não se limita à ideia de que os dados alimentam a economia da informação. Assim como o petróleo, os dados também são fluidos: podem infiltrar-se e fluir para quase qualquer reservatório ou armazenamento. Podem ser facilmente "extraídos" (coletados ou gerados), "transportados" (distribuídos ou transferidos), "refinados" (editados e divididos), "vendidos" e "descartados" (apagados). Na verdade, rastreamento de dados ao longo de todo o seu ciclo de vida A jornada de criação e descarte de dados não acompanhou as inovações em sua produção, compartilhamento e armazenamento. No entanto, à medida que as empresas passam a depender de dados para impulsionar o engajamento com os clientes, capacitar seus funcionários e otimizar o desempenho dos negócios, conhecer e compreender seus dados assume uma nova dimensão e prioridade.

Dados em todos os lugares

 

Se os clientes são a força vital dos negócios digitais modernos, então conhecer os dados dos clientes assume uma urgência comercial de "vida ou morte". Durante anos, as empresas tentaram obter uma visão de seus clientes — primeiro por meio da tecnologia MDM e, posteriormente, por meio de análises avançadas de Big Data. Mas, à medida que as empresas expandem o número de pontos de contato digitais, da web para dispositivos móveis, wearables, assistentes virtuais com inteligência artificial e IoT, os métodos de ontem para unificar o conhecimento de dados por meio da centralização dos dados tornam-se menos viáveis. Hoje, os dados "vazam" facilmente entre armazenamentos de dados estruturados, semiestruturados e não estruturados; eles abrangem o data center e a nuvem. nuvemEla se espalha por Big Data, data lakes e inúmeras aplicações – tanto internas quanto externas. Os dados dos clientes estão por toda parte, codificados de diversas maneiras e em todos os tipos de linguagem.

O que se precisa agora é de uma forma para as empresas obterem uma visão centralizada do cliente sem centralizar seus dados. Isso exige a capacidade de pesquisar em todos os repositórios de dados, independentemente de sua localização ou idioma, conciliando ao mesmo tempo quais dados pertencem a qual usuário ou entidade. Isso requer uma nova abordagem para encontrar e correlacionar dados por pessoa ou titular dos dados, algo que não é possível com a tecnologia de classificação de dados da era Motorola StarTAC encontrada nos produtos DLP e DAM atuais.

Centralizando a visualização dos dados sem centralizar os dados.

A BigID aproveita as mais recentes abordagens em buscas em escala de internet e resolução de entidades baseada em aprendizado de máquina para fornecer às organizações uma maneira de localizar e inventariar rapidamente seus dados centrados em identidade, sem precisar movê-los ou copiá-los. Os algoritmos da BigID organizam, catalogam e mapeiam automaticamente os dados em toda a empresa em escala de petabytes, independentemente de onde os dados estejam armazenados ou como estejam codificados. Ela fornece um índice virtual de todos os dados que uma empresa mantém, mapeados por titular dos dados, tipo de dados, repositório de dados ou local de residência, para que os profissionais de segurança, conformidade ou governança possam navegar e analisar com precisão seus principais ativos de dados. Dessa forma, é possível obter uma visão centralizada dos dados do cliente em repositórios de dados estruturados, mas, talvez ainda mais importante, também em todos os diversos locais não estruturados onde as empresas armazenam dados, como compartilhamentos de arquivos, clusters Hadoop, data lakes, repositórios de logs e muito mais.

Melhor conformidade de dados por meio de uma melhor contabilidade de dados

A importância de poder descobrir e mapear dados pessoais em repositórios de dados não estruturados não é apenas uma necessidade para uma alternativa mais escalável e descentralizada ao MDM tradicional. É também fundamental para que as empresas estejam em conformidade com as novas regulamentações de proteção de dados, como o GDPR.

A GDPR, em sua essência, exige que as organizações prestem contas dos dados que armazenam sobre seus clientes e funcionários. Exige que elas inventariem não apenas onde armazenam dados pessoais, mas também onde os armazenam. cada Os dados pessoais. As abordagens tradicionais para a descoberta de dados — que se baseiam em pesquisas ou classificação — têm dificuldade em localizar dados pessoais que não sejam informações pessoais identificáveis (PII) e não conseguem discernir a qual pessoa pertencem cada dado. Além disso, sua eficácia é limitada na busca em todo o universo crescente de repositórios de dados não estruturados, uma vez que, na maioria dos casos, as tecnologias de descoberta são anteriores ao desenvolvimento de novos repositórios modernos de dados não estruturados.

 

RGPD e a mudança imperativa do requisito da proteção de dados 

O BigID não só consegue identificar um conjunto mais amplo de informações pessoais com base no seu grau de "personalidade", como também o faz em qualquer tipo de dado, independentemente do idioma. Isto, obviamente, representa um poderoso complemento, ou mesmo uma alternativa, ao MDM (Mobile Device Management). Além disso, ajuda as organizações a cumprir alguns dos requisitos mais essenciais do RGPD (Regulamento Geral sobre a Proteção de Dados) em matéria de titularidade de dados e manutenção de registos, permitindo encontrar e rastrear dados desde a sua criação, passando pelo processamento, até à sua eliminação.

Embora os dados possam ser o novo “petróleo” em termos de valor para uma empresa moderna, ao contrário do petróleo, eles não são fungíveis. Cada dado é distinto em seu tipo, origem e associações. No entanto, novas tecnologias como o BigID podem oferecer às organizações uma maneira moderna de descobrir e mapear seus dados com precisão, em escala e em uma gama ilimitada de repositórios de dados. Conhecer e entender seus clientes por meio de seus dados nunca foi tão essencial nem tão viável.