Pular para o conteúdo

Descoberta de dados: Um meio para um fim ou um fim para um meio?

Quando se trata de gestão e governança de dados, “descoberta de dados” Historicamente, tem sido um termo vago. Trata-se simplesmente da capacidade de conectar e criar um inventário dos ativos de dados de uma empresa — ou há mais coisas envolvidas no processo?

Como analista da Gartner por 14 anos, atendi centenas de ligações sobre descoberta de dados. Quando um cliente perguntava sobre fazer descoberta de dados, eu invariavelmente perguntava: "Para quê?". Por que a empresa estava interessada em fazer descoberta de dados, afinal? Alguns indicavam que queriam criar um inventário para ver quais ativos de dados possuíam — e isso sempre era um forte indício de que o projeto não iria muito longe. Por quê?

Inventário de dados vs. Catálogo de dados

Vamos começar com o que acontecerá com os resultados da descoberta — para onde eles irão? Eu costumava receber frequentemente a pergunta sobre a diferença entre um inventário de dados e um catálogo de dadosO que me levou a criar uma analogia com os meus tempos de faculdade, quando a internet ainda estava a poucos anos da sua fase embrionária.

Naquela época, "pesquisa" consistia em ir à biblioteca e procurar informações em livros e materiais de referência impressos. Um inventário de dados seria semelhante a uma lista simples e completa de todos os livros da biblioteca. E isso é melhor do que nada, mas quando se trata de centenas de milhares ou milhões de livros, essa abordagem é impraticável e de pouca utilidade.

As bibliotecas usam o Sistema Decimal de Dewey, que é uma forma de classificar e correlacionar Os livros são organizados em uma segmentação lógica, de forma que todos os livros sobre, digamos, finanças, fiquem localizados em uma área específica e possam ser facilmente "descobertos" e encontrados consultando um catálogo de fichas. Essa ideia é basicamente a mesma dos catálogos de dados atuais — só que em formato eletrônico.

A descoberta começa com a necessidade do negócio.

Um inventário de dados em si tem pouca utilidade, exceto para exibir uma lista dispersa de ativos. As organizações precisam saber mais sobre seus ativos de dados do que simplesmente o que possuem para que esses ativos tenham algum valor. Essa iniciativa não começa com a consulta dos dados, mas sim no extremo oposto da organização — nas iniciativas de negócios. Por que descobrir e inventariar dados se o esforço não estiver vinculado a objetivos de negócios e, uma vez aplicado, não ajudar a alcançá-los?

Como analista do setor, quando questionado sobre o inventário de dados, eu imediatamente perguntava a qual indicador-chave de desempenho (KPI) de negócios a iniciativa estava vinculada. Recebia diversas respostas, mas raramente uma delas era uma meta ou KPI tangível que respondesse, por exemplo, a uma das seguintes perguntas:

  • De que forma os dados de inventário ajudaram especificamente as vendas a atingir as metas trimestrais ou o marketing a alcançar os objetivos da campanha?
  • De que forma o inventário ajudou a atingir as metas? Privacidade DSAR pedidos?
  • De que forma o inventário protegeu melhor a organização?

Assim que começarmos a entender por que estamos realizando a descoberta e o que é exigido da empresa, poderemos começar a fazer perguntas importantes sobre os próprios dados, como:

  • Como os dados estão inter-relacionados?
  • Como os dados são utilizados?
  • Qual é a sua origem?

Um conjunto abrangente de capacidades que vai além do inventário.

Para entendermos as respostas a essas perguntas, precisamos:

  • Deixe de lado a simples realização de um inventário como parte da fase de descoberta e comece a investigar mais a fundo. metadados — incluindo metadados inferidos e implícitos
  • entender rótulos e etiquetas de dados, como os dados são classificados e como deveriam ser classificados com tags adicionais.
  • correlacionar dados para que possamos visualizar todos os elementos de dados vinculados a uma entidade — como um indivíduo — e assim, possamos direcionar nosso marketing a essa pessoa de forma eficaz ou proteger sua privacidade de maneira integral.
  • dados de cluster Para encontrar, por exemplo, todos os documentos de hipoteca em compartilhamentos de arquivos ou números de contas de clientes em vários bancos de dados em toda a organização.
  • abrange todos os dados da empresa — a média de 20% que é estruturado e o 80% que é não estruturado
  • construir um catálogo de dados moderno como parte da gestão ativa de dados, como parte do processo geral.

Então descoberta de dados A descoberta de dados vai além de simplesmente inventariar os dados e esperar que a organização encontre uma utilidade para eles. Ela começa na outra ponta da organização — nos negócios, nos KPIs de marketing e vendas, nas iniciativas de privacidade e segurança — como algo que pode ser vinculado a KPIs, metas ou iniciativas já estabelecidas.

Uma vez que sabemos para que queremos descobrir os dados, podemos ir além da simples busca e transformá-los em valor real que possa ser mensurado.

Conteúdo

Postagens relacionadas

Ver todas as postagens