Métadonnées est l'élément vital de gestion moderne des données — C'est la clé pour pouvoir faire confiance à vos données, prendre de meilleures décisions et exploiter pleinement leur valeur. En termes simples, les métadonnées sont les données sur les données. Les métadonnées peuvent indiquer si les données sont sensibles (comme interne uniquement), financier (un numéro de carte de crédit) ou devant être protégé (données personnelles sur les clients) — et peuvent être classés comme techniques, commerciaux, opérationnels, augmentés et déduits.
Disciplines de gestion des données telles que la gouvernance des données, le client 360, DataOps, tissu de données La protection des données et la protection de la vie privée reposent toutes sur des métadonnées clés. Parallèlement, les initiatives de science des données et d'analyse s'appuient sur la capacité de rechercher des métadonnées à l'aide de l'intelligence artificielle pour faire émerger des résultats clés.
L'un des principaux défis des solutions traditionnelles de gestion des métadonnées réside dans le fait que de nombreuses activités reposent sur la recherche et le catalogage de métadonnées sous une forme statique (souvent manuelle). De nombreux référentiels de métadonnées sont obsolètes et ne répondent pas aux besoins en temps réel de la BI et de la data science. Cette approche passive des métadonnées n'est plus adaptée à la gouvernance et à la conformité des données, et n'est pas évolutive dans l'environnement de données actuel. Pire encore, l'incapacité à identifier précisément les métadonnées et les données sous-jacentes est beaucoup moins exploitable, que ce soit pour les programmes de sécurité, de confidentialité ou de gouvernance.
Pourquoi les métadonnées actives changent la donne
Les organisations dépendent de plus en plus de métadonnées activesLa partie « active » prolonge l'ancienne approche passive. Elle implique la découverte et la capture de métadonnées en temps réel, ce qui nécessite un catalogue de données toujours à jour et précis. « Active » fait également référence à l'inférence d'attributs de métadonnées permettant de relier des sources de données qui peuvent sembler différentes à première vue.
Un centre de métadonnées actif — Considérez-le comme un middleware de métadonnées — il exploite un catalogue de données enrichi par ML pour permettre l'orchestration, l'enrichissement et l'application des politiques. Cela implique non seulement la connexion et la capture de métadonnées provenant de diverses sources, mais aussi l'intégration à d'autres outils de gestion de données, permettant ainsi l'échange, l'enrichissement et le partage de métadonnées depuis un hub de métadonnées actif, qui devient alors la source de référence pour les métadonnées de l'organisation.
Pour être efficace, un hub de métadonnées actif doit être le cœur d'un écosystème ouvert, facilement accessible via des intégrations directes et des API et capable de s'intégrer à la pile technologique actuelle.
Tout est une question de données.
Les données sont vitales pour les entreprises. Il est donc plus important que jamais pour elles de connaître leurs données, de leur faire confiance et de les comprendre. Il est plus important que jamais pour les organisations de pouvoir répondre à des questions telles que :
- Puis-je faire confiance à mes données ?
- Est-ce que je comprends mes données ?
- Puis-je identifier, suivre et gérer les bons actifs de données dans la gouvernance des données, le client 360, DataOps, tissu de données, vie privée et sécurité outils?
- Mes données critiques sont-elles protégées de manière adéquate ?
Comment surmonter les défis courants lors de l'adaptation d'un hub de métadonnées
Changer de stratégie et de technologie n'est jamais simple, mais les données jouant un rôle prépondérant dans les entreprises, il est crucial de migrer vers une solution capable d'évoluer avec votre organisation. À propos de données : les différentes sources de données et les différents outils de gestion de données ont des schémas, des structures et des connectivités différents. Relier ces différentes sources de données, ainsi que leur contenu et leur contexte, à un hub de métadonnées actif peut s'avérer complexe.
Lors du traitement des données via ce middleware de métadonnées, il est important de garantir l'intégrité des données et des éléments de métadonnées à mesure que celles-ci sont enrichies. Il s'agit d'une nouvelle façon de gérer les métadonnées, et toute innovation nécessite souvent de nouveaux outils, approches et compétences pour réussir l'étape suivante.
Alors, par où commencer ? Identifiez les sources de données et les outils liés au projet, analysez l'état actuel et les lacunes de votre stratégie de données, et définissez des jalons clairs pour réussir. Une fois ces intérimaires formés, identifiez les outils, services et compétences permettant de combler ces lacunes de manière proactive. Veillez à harmoniser les initiatives existantes (minimisation, validation et migration des données) afin de tirer le meilleur parti de vos projets et ressources existants.
Conclusion
Les défis liés aux données sont complexes et évolutifs. Sans visibilité ni contrôle sur leurs données, les organisations sont laissées dans l'ignorance. En intégrant des métadonnées actives à leurs stratégies de données, les organisations peuvent s'éclairer, ce qui signifie :
- Déterminez quelles données sont importantes pour votre entreprise : toutes les données ne se ressemblent pas et toutes les données ne sont pas stockées ensemble.
- Collecter des métadonnées à partir de toutes les différentes sources de données dans votre environnement.
- Ajoutez un contexte commercial pour avoir une vue d’ensemble : le contexte est essentiel.
- Connectez les données, les métadonnées et l’activité pour approfondir la compréhension du quoi, du pourquoi et du qui.
- Enrichissez les outils existants avec une compréhension supplémentaire, en ajoutant des informations axées sur les risques et basées sur le contexte pour prendre de meilleures décisions.
Ces étapes sont essentielles pour la prochaine génération de gestion moderne des données — et pour l’avenir des données.