Le modèle d'évaluation des capacités de gestion des données (DCAM) — établi par le Conseil EDM en 2015 — est un cadre standard de l'industrie que de plus en plus d'entreprises Services financiers et au-delà adoptent.
Les professionnels des données utilisent le cadre DCAM pour définir, prioriser, organiser, mesurer et surveiller le niveau de maturité de leurs données. gouvernance des données programmes. DCAM répond aux besoins des organisations en matière de capacités pour :
- développer la stratégie de données et l'analyse de rentabilisation
- construire une base de données durable dans un cadre opérationnel
- mesurer la cohérence et l'utilisation des données dans toute l'organisation
- établir la collaboration et l'alignement des parties prenantes
- intégrer le programme de gestion des données dans les aspects fondamentaux des opérations
Comment le DCAM est-il noté ?
Le DCAM établit des normes et évalue les capacités de gestion des données pour le développement, la mise en œuvre et le maintien d'un programme efficace. Pour chaque capacité, un programme de gestion des données peut obtenir l'un des six scores suivants :
- non initié
- conceptuel
- du développement
- défini
- réalisé
- amélioré
Défis DCAM : franchir le fossé des capacités
Selon le Rapport de référence sur la gestion des données mondiales 2020, qui a interrogé des sociétés financières et non financières sur leurs scores DCAM, 53% de FinServ et 66% de non-FinServ sont soit « en cours/en planification » ou « non initiés » dans la gouvernance et la maintenance des domaines de données, structures, modèles, définitions et glossaires autorisés.
Bien que de nombreuses organisations puissent initier, conceptualiser et même commencer à développer leurs capacités en déployant des plans et en identifiant les bonnes parties prenantes pour participer aux discussions, il est plus difficile de définir l'engagement, les processus et les preuves qui doivent être établis et vérifiés.
Le passage du « développement » au « défini » est connu sous le nom de « gouffre des capacités » et présente des défis pour les organisations, notamment :
- suivi des nouveaux modèles d'affaires et de données, inventaire des donnéeset des ensembles de données
- former continuellement les personnes et gérer le turnover
- intégrer les données dans les pratiques habituelles
- maintenir un soutien et un financement solides des parties prenantes
Comment l'IA/ML comble le fossé des capacités DCAM
L’analyse des lacunes et l’élaboration d’un plan prioritaire pour les combler constituent une préoccupation essentielle et urgente pour les professionnels des données qui mettent en œuvre DCAM.
Ces dernières années, l’adoption accélérée de intelligence artificielle et apprentissage automatique Les capacités ont permis de combler plus rapidement les lacunes en matière d’évaluation, ainsi que de répondre plus efficacement aux exigences d’audit pour les organismes de réglementation et à des fins internes.
Les organisations qui utilisent des techniques d’apprentissage automatique dans leurs programmes de gestion des données peuvent :
- trouver des modèles de données critiques éléments plus rapidement et avec plus de précision, en tirant parti de l'apprentissage supervisé et non supervisé
- automatiquement scanner des ensembles de données plus volumineux plus rapidement pour une gouvernance à grande échelle
- appliquer des étiquettes pour une identification et une catégorisation plus rapides
Comment prendre de l'avance sur DCAM avec BigID
Voici quatre capacités essentielles que les organisations peuvent mettre en œuvre pour améliorer leur score de capacités DCAM.
1. Rechercher et inventorier automatiquement les données
Pour l'architecture métier et des données, les données des référentiels physiques doivent être localisées, documentées et inventoriées. Compte tenu du volume important de centres de données répartis dans des bureaux internationaux, la prolifération des données n'est pas simple à documenter avec les méthodes traditionnelles. découverte et cartographie.
La documentation manuelle et les méthodes d'enquête sont souvent utilisées pour maintenir à jour les référentiels physiques. Cette méthode est lente, gourmande en ressources et difficile à maintenir de manière à refléter fidèlement l'évolution du paysage des données.
Même après qu'une organisation a catalogué ses données physiques, les professionnels des données doivent encore comprendre le contenu sous-jacent des documents et des fichiers. Il s'agit d'un problème croissant. données non structurées, qui est généralement exclu des inventaires utilisant des méthodes manuelles.
BigID exploite l'apprentissage automatique avancé pour automatiquement inventorier toutes les données — structurées et non structurées — à l'échelle de l'entreprise. Cela permet aux organisations de saisir les données de base métadonnées sur la source de l'élément de données, le nom du champ et l'emplacement du champ, tous ces éléments étant nécessaires pour documenter l'architecture physique et des données.
Un inventaire automatisé piloté par l'IA fournit des preuves qui vérifient métadonnées basé sur son contenu de données sous-jacent — et le rend accessible aux parties prenantes et aux utilisateurs de l'entreprise dans un seul catalogue.
2. Identifier et mapper des données similaires dans plusieurs colonnes
Les organisations qui mesurent leurs scores de capacités DCAM peuvent exploiter l’IA/ML pour examiner de grands ensembles de données provenant de différentes sources de données, identifier des modèles et déduire des connexions.
Les données étant définies par l’identification de domaines de données logiques, de modèles et métadonnées, la correspondance de modèles à grande échelle peut aider à identifier les données en double.
BigID permet aux organisations de trouver automatiquement les données similaires, dupliquées et redondantes grâce à un ML avancé. Les informations issues de cette analyse automatisée permettent aux équipes de données de trouver et de corriger les données pertinentes, d'identifier les relations entre les ensembles de données et de formuler des recommandations sur les données appartenant au même domaine logique.
3. Découvrir et étiqueter les éléments de données critiques dans les ontologies
Pour combler les lacunes en matière de données, les organisations doivent identifier, définir, modéliser et normaliser leurs entités. Pour soutenir ces activités, les équipes de données doivent localiser et étiqueter toutes les données sensibles ou critiques dans leurs sources de données. carte Ces données sont classées selon des taxonomies internes et des normes mondiales. Étant donné que ces informations proviennent généralement de sources structurées et non structurées, l'automatisation est essentielle pour classer, étiqueter et documenter efficacement toutes les données à grande échelle.
L'originalité de BigID classification des données capacités allant de la classification floue à la PNL technologie basée sur les graphiques permettre aux organisations de découvrir et classez tous les types de données sensibles, critiques et commerciales, avec moins de faux positifs, une précision améliorée et un délai d'analyse plus rapide.
La prochaine génération de BigID classification optimise l'analyse pour se concentrer sur les données et les métadonnées, et trouver, étiqueter et associer les données. Il en résulte une amélioration de la confidentialité, de la sensibilité, des exigences de consentement et suivi des politiques.
4. Détecter les anomalies de qualité des données
Pour répondre aux capacités de gestion de la qualité des données du DCAM, les organisations peuvent s'appuyer sur l'automatisation pour identifier les valeurs aberrantes dans les grands ensembles de données. L'évaluation initiale du profilage de la qualité des données hiérarchise la portée des données en fonction de leur criticité et de leur matérialité.
BigID fournit des résultats d'analyse statistique sur un ensemble de données, tels que l'exhaustivité (ou l'identification des valeurs nulles), la plage de valeurs de données et l'écart type des valeurs numériques.
Pour maintenir davantage le niveau de maturité des capacités, ML identifie les règles pertinentes à vérifier pour l'ensemble de données, notamment en proposant des valeurs de tolérance ou de seuil acceptables et en affichant une analyse des tendances. la qualité des donnéesLes équipes de données peuvent démontrer qu’elles ont atteint une maturité plus élevée dans la gestion de la qualité des données en exploitant BigID pour surveiller en permanence les nouveaux ensembles de données entrants.
BigID pour DCAM
Les programmes de gestion des données traditionnels s’appuient sur des ressources manuelles pour inventorier, étiqueter, classer et définir des règles de qualité des données, ce qui a conduit à une lassitude générale dans l’attente que les programmes de données apportent une valeur commerciale.
Les professionnels de la gestion des données peuvent tirer parti de la technologie d'apprentissage automatique automatisée de BigID pour répondre aux capacités mesurées par DCAM, combler les écarts de maturité des données et, en fin de compte :
- maintenir leur inventaire des données
- Identifier et classer les données dont ils ont besoin pour gérer et surveiller
- carte aux domaines de données
- créer de nouvelles règles autour de la gestion de la qualité des données
- Améliorez votre posture de données pour des audits DCAM réussis
En savoir plus sur la façon dont BigID peut vous aider Votre programme de gestion des données permet de découvrir, de classer et de surveiller plus efficacement toutes les données de votre organisation, structurées et non structurées, et d'obtenir des résultats plus rapides et plus durables.