O Modelo de Avaliação das Capacidades de Gestão de Dados (DCAM) — estabelecido pelo Conselho EDM em 2015 — é uma estrutura padrão do setor que cada vez mais empresas em Serviços Financeiros e outros países estão adotando.
Os profissionais de dados utilizam a estrutura DCAM para definir, priorizar, organizar, mensurar e monitorar o nível de maturidade de seus dados. governança de dados programas. O DCAM aborda as capacidades que as organizações precisam para:
- Desenvolver a estratégia de dados e o plano de negócios.
- Construir uma base de dados sustentável dentro de uma estrutura operacional.
- Medir a consistência e a utilização dos dados em toda a organização.
- Estabelecer colaboração e alinhamento entre as partes interessadas.
- Integrar o programa de gestão de dados aos principais aspectos das operações.
Como é feita a pontuação do DCAM?
O DCAM estabelece padrões e avalia as capacidades de gestão de dados para o desenvolvimento, implementação e manutenção de um programa eficaz. Para cada capacidade, um programa de gestão de dados pode receber uma das seis pontuações:
- não iniciado
- conceptual
- desenvolvimento
- definido
- alcançou
- aprimorado
Desafios do DCAM: Cruzando o Abismo das Capacidades
De acordo com o Relatório de Benchmarking Global de Gestão de Dados de 2020, que pesquisou empresas financeiras e não financeiras sobre suas pontuações DCAM, 53% de empresas do setor financeiro e 66% de empresas de outros setores estão "em andamento/planejando" ou "não iniciadas" na governança e manutenção de domínios, estruturas, modelos, definições e glossários de dados autorizados.
Embora muitas organizações possam iniciar, conceber e até mesmo começar a desenvolver suas capacidades implementando planos e identificando as partes interessadas certas para participar das discussões, definir o engajamento, os processos e as evidências que precisam ser estabelecidos e verificados é uma tarefa mais complexa.
A transição do nível “desenvolvimental” para o nível “definido” é conhecida como “abismo de capacidades” e apresenta desafios para as organizações, incluindo:
- monitoramento de novos modelos de negócios e dados, inventário de dadose conjuntos de dados
- Treinamento contínuo de pessoal e gestão da rotatividade de funcionários.
- Incorporar dados às práticas comerciais habituais
- manter um sólido apoio das partes interessadas e financiamento
Como a IA/ML reduz a lacuna nas capacidades de DCAM
Analisar as lacunas e elaborar um plano priorizado para saná-las é uma preocupação crítica e urgente para os profissionais de dados que implementam o DCAM.
Nos últimos anos, a adoção acelerada de inteligência artificial e aprendizado de máquina As novas capacidades permitiram sanar as lacunas de avaliação mais rapidamente, além de atender com mais eficiência aos requisitos de auditoria para órgãos reguladores e fins internos.
Organizações que utilizam técnicas de aprendizado de máquina em seus programas de gerenciamento de dados podem:
- Identificar padrões de dados críticos elementos de forma mais rápida e precisa, aproveitando tanto o aprendizado supervisionado quanto o não supervisionado.
- automaticamente digitalização Conjuntos de dados maiores e mais rápidos para escalar a governança
- aplicar etiquetas para identificação e categorização mais rápidas
Como se antecipar ao DCAM com o BigID
Aqui estão quatro capacidades críticas essenciais que as organizações podem implementar para melhorar sua pontuação em capacidades DCAM.
1. Encontrar e inventariar dados automaticamente
Para a arquitetura de negócios e de dados, os dados provenientes de repositórios físicos precisam ser localizados, documentados e inventariados. Dado o grande volume de data centers espalhados por escritórios globais, a dispersão de dados não é simples de documentar usando métodos tradicionais. descoberta e mapeamento.
A documentação manual e os métodos de levantamento são frequentemente usados para manter os repositórios físicos atualizados. Esse método é lento, consome muitos recursos e é difícil de manter de forma a refletir com precisão o cenário de dados em constante expansão.
Mesmo depois de uma organização catalogar seus dados físicos, os profissionais de dados ainda precisam entender o conteúdo subjacente presente em documentos e arquivos. Este é um problema crescente. dados não estruturados, que geralmente é excluído dos inventários que utilizam métodos manuais.
A BigID utiliza aprendizado de máquina avançado para automatizar inventariar todos os dados — estruturados e não estruturados — em toda a empresa. Isso permite que as organizações capturem os fundamentos metadados sobre a origem do elemento de dados, nome do campo e localização do campo — todos esses elementos são necessários para documentar a arquitetura física e de dados.
Um inventário automatizado, baseado em IA, fornece evidências que verificam... metadados com base no conteúdo dos dados subjacentes — e torna-o acessível às partes interessadas e aos usuários de negócios em um único local. catálogo.
2. Identificar e mapear dados semelhantes entre colunas
Organizações que avaliam suas capacidades de DCAM podem aproveitar a IA/ML para analisar grandes conjuntos de dados de diferentes fontes, identificar padrões e inferir conexões.
À medida que os dados são definidos por meio da identificação de domínios de dados lógicos, modelos e metadados, a correspondência de padrões em larga escala pode ajudar a identificar dados duplicados.
O BigID permite que as organizações encontrem automaticamente dados semelhantes, duplicados e redundantes com aprendizado de máquina avançado. Os insights derivados dessa análise automatizada capacitam as equipes de dados a encontrar e corrigir dados relevantes, identificar relações entre conjuntos de dados e fazer recomendações sobre dados que pertencem ao mesmo domínio lógico.
3. Descobrir e etiquetar elementos de dados críticos para ontologias
Para colmatar as lacunas de dados, as organizações precisam de identificar, definir, modelar e padronizar as entidades empresariais. Para sustentar estas atividades, as equipas de dados devem localizar e etiquetar todos os dados sensíveis ou críticos nas suas fontes de dados — e mapa Esses dados são organizados em taxonomias internas e padrões globais. Como essas informações geralmente residem em fontes estruturadas e não estruturadas, a automação é fundamental para classificar, rotular e documentar todos os dados em grande escala de forma eficaz.
O diferencial exclusivo do BigID é que ele oferece uma solução única. classificação de dados capacidades que vão desde a classificação difusa até o PNL (Processamento de Linguagem Natural) tecnologia baseada em grafos permitir que as organizações descobrir e classificar todos os tipos de dados sensíveis, críticos e comerciais — com menos falsos positivos, maior precisão e insights mais rápidos.
A próxima geração da BigID classificação Otimiza a varredura para focar nos dados e metadados — e encontrar, etiquetar e combinar dados. O resultado é maior privacidade, sensibilidade, requisitos de consentimento e monitoramento de políticas.
4. Detectar anomalias para a qualidade dos dados
Para atender aos requisitos de gerenciamento de qualidade de dados do DCAM, as organizações podem aproveitar a automação para identificar valores discrepantes em grandes conjuntos de dados. A avaliação inicial do perfil de qualidade dos dados prioriza o escopo dos dados com base na criticidade e na materialidade.
O BigID fornece resultados de análises estatísticas em um conjunto de dados — como completude (ou identificação de valores nulos), intervalo de valores de dados e desvio padrão de valores numéricos.
Para manter ainda mais o nível de maturidade da capacidade, o aprendizado de máquina identifica regras relevantes para verificar no conjunto de dados — incluindo a proposição de valores de tolerância ou limite aceitáveis e a exibição de análises de tendências. qualidade dos dadosAs equipes de dados podem demonstrar que atingiram um nível mais elevado de maturidade na gestão da qualidade de dados, utilizando o BigID para monitorar continuamente novos conjuntos de dados recebidos.
BigID para DCAM
Os programas tradicionais de gerenciamento de dados dependem de recursos manuais para inventariar, rotular, classificar e definir regras de qualidade de dados — o que levou a uma fadiga generalizada na espera de que esses programas gerem valor para os negócios.
Os profissionais de gestão de dados podem aproveitar a tecnologia automatizada de aprendizado de máquina da BigID para atender às necessidades medidas pelo DCAM, reduzir as lacunas de maturidade de dados e, em última análise:
- manter seus inventário de dados
- Identificar e classificar os dados que eles precisam gerenciar e monitorar
- mapa para domínios de dados
- Criar novas regras em torno da gestão da qualidade dos dados.
- Melhorar a postura dos dados para auditorias DCAM bem-sucedidas.
Saiba mais sobre como o BigID pode ajudar. Seu programa de gerenciamento de dados descobre, classifica e monitora com mais eficácia todos os dados da sua organização — estruturados e não estruturados — e alcança resultados mais rápidos e sustentáveis.