Pular para o conteúdo
Ver todas as postagens

Ver para crer: melhor conformidade de dados por meio de Visualização de dados mais inteligente

Os dados estão no cerne dos negócios digitais modernos. Eles definem como os usuários se envolvem e interagem com uma empresa. Compreender e analisar o conteúdo do cliente não é, obviamente, uma busca nova. Todo o campo do Big Data é uma resposta à necessidade de melhor compreender e antecipar o comportamento do cliente, entendendo as pegadas digitais que ele deixa para trás. No entanto, com a rápida proliferação de aplicativos e pontos de contato digitais, as empresas estão enfrentando uma dispersão de dados sem precedentes, dificultando a análise e, ao mesmo tempo, complicando a gestão de dados. privacidade e proteção de dados.

Uma imagem vale mais que mil palavras

É impossível conhecer completamente o seu cliente sem conhecer os dados dele, mas obter visibilidade de dados de Informações Pessoais (IP) difusos e constantemente disseminados pode, às vezes, parecer impossível. As abordagens tradicionais para construir visões 360° dos clientes exigiam a montagem de data warehouses complexos de gerenciar e, em última análise, incompletos. Cada novo data lake para informações do cliente era apenas uma cópia fraca dos dados que pretendia representar, fornecendo apenas uma imagem parcial e fazendo com que navegar pelo lago parecesse mais como caminhar por um pântano.

As ferramentas modernas de governança de dados visam preencher parcialmente essa lacuna, fornecendo às organizações uma imagem mais clara do que possuem, onde quer que estejam. No entanto, elas são limitadas por dependerem de pesquisas incompletas ou mesmo imprecisas para identificar e gerenciar a dispersão de dados. Embora a memória humana possa se traduzir perfeitamente em uma obra de arte, ela não é um insumo confiável para derivar ciência a partir de dados. Uma pintura jamais oferecerá o realismo objetivo de uma fotografia, e mesmo as palavras mais descritivas jamais poderão visualizar com precisão a realidade das informações pessoais do cliente que as organizações coletam e processam.

De lagos e pântanos de dados

O volume de dados que as empresas coletam sobre seus clientes hoje é grande e está aumentando. Dados de identidade possuem características únicas que tornam sua visualização possível sem a necessidade de mais um data lake, ou pântano de dados, dependendo da perspectiva. Quando os fundadores do Google tentaram simplificar a navegação em algo tão grande quanto a internet, seu padrão não foi criar um fac-símile mais pesquisável. Em vez disso, concentraram seus esforços na construção de um índice inteligente que mapeasse os relacionamentos dispersos entre os ponteiros de hiperlink que definem a World Wide Web de endereços da internet.

Quando o Facebook entrou em cena, percebeu que o segredo para enfrentar os desafios de desempenho, escala e contexto do mapeamento de bilhões de relações humanas interligadas era elevar o conceito de um grafo social que articulasse o conteúdo e o contexto de quem e o que interagia em sua plataforma. Certamente, armazenamentos, armazéns e data lakes ainda têm seu lugar na agregação e análise de dados, mas a essência da visualização das relações sociais era o grafo social, assim como o índice PageRank do Google havia sido para navegar pela aparente desordem da internet.

As lições aprendidas pelo Google e pelo Facebook levantam a questão de por que o mapeamento do ativo mais vital que uma organização gerencia, os dados de seus clientes, deveria ser diferente. Assim como a Web e o Gráfico Social, os dados pessoais em organizações e empresas são conectados por relacionamentos: os dados pertencem a um titular de dados específico, os dados são armazenados em um determinado país, os dados são acessados por um aplicativo comum, etc. As ferramentas tradicionais de descoberta de PI ignoram todas essas nuances, pois tentam encontrar apenas qualquer coisa que se pareça com um número de previdência social ou qualquer coisa que se pareça com um cartão de crédito. No entanto, o contexto do relacionamento é essencial para entender as PI, protegê-las e garantir a conformidade com a privacidade na era de regulamentações como o GDPR, que exigem conhecimento completo dos dados de uma pessoa.

Estar Consciente Estando Lá

Entender os dados dos clientes exige uma maneira eficaz de mapear visualmente sua distribuição, movimentação e conectividade. Estar presente significa "estar" ciente. Isso é vital para os esforços em torno da governança de dados. No entanto, isso realmente impacta quando se trata de proteção de dados e conformidade com a privacidade.

Esforços anteriores de proteção de dados não tiveram sucesso porque operaram sem contexto, frequentemente gerando erros inaceitáveis. Conhecer o risco dos dados exige um contexto que envolva mais informações do que apenas se um número tem 16 dígitos. Também exige a capacidade de desidentificar os dados de forma a preservar o valor analítico para a organização e, ao mesmo tempo, proteger a privacidade da pessoa a quem os dados pertencem.

Da mesma forma, as regulamentações de privacidade modernas, como o RGPD da UE, exigem um conjunto completo de proteções que são impossíveis de alcançar apenas com uma abordagem de data warehouse ou usando uma ferramenta baseada em expressões regulares da era PCI para descobrindo informações confidenciais. Exige contexto em torno de dados como residência, finalidade de uso, requisitos de retenção, consentimento, linhagem e, claro, afiliação a uma pessoa específica. Sem essa capacidade de compreender e visualizar o contexto e os relacionamentos, será impossível cumprir os requisitos de consentimento, retenção ou direito ao esquecimento.

À medida que as organizações tentam entender dados de identidade em centenas de petabytes, as abordagens tradicionais de descoberta e visualização entrarão em colapso. Soluções como o BigID visam repensar como o Big Identity Data é descoberto e visualizado sem adicionar novas complexidades de gerenciamento ou segurança de dados.

Conteúdo