Pular para o conteúdo
Ver todas as postagens

Descoberta de dados: Um meio para um fim ou um fim para um meio?

Quando se trata de gerenciamento de dados e governança de dados, “descoberta de dados” historicamente, é um termo vago. É simplesmente a capacidade de conectar e criar um inventário dos ativos de dados de uma empresa — ou há algo mais envolvido no processo?

Como analista da Gartner por 14 anos, atendi centenas de ligações sobre descoberta de dados. Quando um cliente perguntava sobre a descoberta de dados, eu inevitavelmente perguntava: "Para quê?". Por que a empresa estava interessada em fazer a descoberta? Alguns indicavam que queriam criar um inventário para ver quais ativos de dados possuíam — e isso sempre era um indicativo importante de que o projeto não iria muito longe. Por quê?

Inventário de dados vs. catálogo de dados

Vamos começar com o que acontecerá com os resultados da descoberta — para onde eles irão? Muitas vezes me perguntavam sobre a diferença entre um inventário de dados e um catálogo de dados, o que me levou a criar uma analogia dos meus tempos de faculdade, quando a internet estava a poucos anos de sua fase embrionária.

Na época, "pesquisa" consistia em ir à biblioteca e procurar informações em livros impressos e materiais de referência. Um inventário de dados seria semelhante a uma lista simples e completa de todos os livros da biblioteca. E isso é melhor do que nada, mas quando se trata de centenas de milhares a milhões de livros, essa abordagem é impraticável e de pouco valor.

As bibliotecas usam o Sistema Decimal de Dewey, que é uma maneira de classificar e correlacionar livros em uma segmentação lógica, de modo que todos os livros sobre, digamos, finanças, fiquem localizados em uma única área e possam ser facilmente "descobertos" e localizados consultando um catálogo de fichas disponível. Essa é basicamente a mesma ideia do catálogo de dados atual — este último em formato eletrônico.

A descoberta começa com a necessidade do negócio

Um inventário de dados, por si só, tem pouca utilidade, exceto para mostrar uma lista heterogênea de ativos. As organizações precisam saber mais sobre seus ativos de dados do que simplesmente o que possuem, para que esses ativos tenham algum valor. Essa iniciativa não começa com a consulta aos dados, mas sim no extremo oposto da organização — nas iniciativas de negócios. Por que descobrir e inventariar dados se o esforço não está vinculado aos objetivos de negócios e, uma vez aplicado, ajuda a alcançá-los?

Como analista do setor, quando questionado sobre o inventário de dados, eu imediatamente perguntava a qual KPI de negócios a iniciativa estava vinculada. Eu recebia uma variedade de respostas, mas muito raramente uma delas era uma meta ou KPI tangível que respondesse, por exemplo, a uma das seguintes perguntas:

  • Como os dados de inventário ajudaram especificamente as vendas a atingir os números trimestrais ou o marketing a atingir as metas da campanha?
  • Como o inventário ajudou a atender às necessidades de privacidade Solicitações de DSAR?
  • Como o inventário protegeu melhor a organização?

Quando começarmos a entender por que estamos fazendo a descoberta e o que é exigido do negócio, poderemos começar a fazer perguntas importantes sobre os dados em si, como:

  • Como os dados são inter-relacionados?
  • Como os dados são usados?
  • De onde surgiu?

Um conjunto profundo de recursos além do inventário

Para entender as respostas a essas perguntas, precisamos:

  • deixe de simplesmente fazer um inventário como parte da descoberta e comece a se aprofundar no assunto metadados — incluindo metadados inferidos e implícitos
  • entender rótulos e tags de dados, como os dados são classificados e como devem ser classificados com tags adicionais
  • correlacionar dados para que possamos ver todos os elementos de dados vinculados a uma entidade — como um único indivíduo — para que possamos comercializar efetivamente para essa pessoa ou proteger sua privacidade de forma holística
  • dados de cluster para encontrar, por exemplo, todos os documentos de hipoteca em compartilhamentos de arquivos ou números de contas de clientes em vários bancos de dados em toda a organização
  • abranger todos os dados empresariais — a média de 20% que é estruturado e o 80% que é não estruturado
  • construir um catálogo de dados moderno como parte do gerenciamento ativo de dados como parte do processo geral.

Então descoberta de dados é mais do que simplesmente inventariar os dados e esperar que a organização encontre um uso para eles. A descoberta de dados começa na outra ponta da organização — nos negócios, nos KPIs de marketing e vendas, nas iniciativas de privacidade e segurança — como algo que pode ser vinculado a KPIs, metas ou iniciativas estabelecidas.

Quando sabemos o que queremos descobrir nos dados, podemos ir além de apenas encontrá-los e transformá-los em valor real que pode ser medido.

Conteúdo