Skip to content
Voir tous les articles

Découverte de données : Un moyen pour une fin ou une fin pour un moyen ?

En matière de gestion et de gouvernance des données, « découverte de données » Le terme « data-resources » a toujours été vague. S'agit-il simplement de la capacité à se connecter et à créer un inventaire des données d'une entreprise, ou le processus implique-t-il davantage ?

En tant qu'analyste chez Gartner pendant 14 ans, j'ai reçu des centaines d'appels sur la découverte de données. Lorsqu'un client me demandait comment procéder, je demandais immanquablement : « Pourquoi ? » Pourquoi l'entreprise s'intéressait-elle à la découverte de données ? Certains indiquaient vouloir créer un inventaire pour identifier leurs données, ce qui était toujours un signe avant-coureur de l'échec du projet. Pourquoi ?

Inventaire des données vs catalogue de données

Commençons par ce qu'il adviendra des résultats de la découverte : où iront-ils ? On me demandait souvent quelle était la différence entre un inventaire des données et un catalogue de données, ce qui m’a amené à créer une analogie avec mes années d’université, à l’époque où Internet était à quelques années de sa phase embryonnaire.

À l'époque, la « recherche » consistait à se rendre à la bibliothèque et à rechercher des informations dans des livres et des ouvrages de référence papier. Un inventaire de données équivalait à une simple liste complète de tous les livres de la bibliothèque. C'est mieux que rien, mais lorsqu'il s'agit de centaines de milliers, voire de millions de livres, cette approche est peu pratique et peu utile.

Les bibliothèques utilisent le système décimal Dewey, qui est un moyen de classer et corrélatif Les livres sont classés selon une segmentation logique, de sorte que tous les ouvrages, par exemple sur la finance, soient regroupés dans une seule zone et puissent être facilement « découverts » et localisés en consultant un catalogue sur fiches. Ce principe est fondamentalement identique à celui du catalogue de données actuel, ce dernier étant sous forme électronique.

La découverte commence par le besoin de l'entreprise

Un inventaire de données en soi n'a que peu d'utilité, si ce n'est pour présenter une liste disparate d'actifs. Pour que ces actifs aient une quelconque valeur, les organisations doivent en savoir plus sur leurs données, au-delà de ce qu'elles possèdent. Cette initiative ne commence pas par l'interrogation des données, mais se déroule à l'autre bout de l'organisation : dans les initiatives métier. Pourquoi découvrir et inventorier des données si cet effort n'est pas lié aux objectifs métier et, une fois appliqué, ne contribue pas à leur réalisation ?

En tant qu'analyste sectoriel, lorsqu'on me demandait d'inventorier les données, je demandais immédiatement à quel indicateur clé de performance (ICP) l'initiative était liée. J'obtenais diverses réponses, mais très rarement un objectif concret ou un ICP répondant, par exemple, à l'une des questions suivantes :

  • Comment les données d’inventaire ont-elles spécifiquement aidé les ventes à atteindre les chiffres trimestriels ou le marketing à atteindre les objectifs de la campagne ?
  • Comment l'inventaire a-t-il contribué à respecter la confidentialité ? Demandes DSAR ?
  • Comment l’inventaire a-t-il mieux protégé l’organisation ?

Une fois que nous commençons à comprendre pourquoi nous faisons la découverte et ce qui est attendu de l'entreprise, nous pouvons alors commencer à poser des questions importantes sur les données elles-mêmes, comme :

  • Comment les données sont-elles interconnectées ?
  • Comment les données sont-elles utilisées ?
  • D'où vient-il ?

Un ensemble complet de fonctionnalités au-delà de l'inventaire

Afin de comprendre les réponses à ces questions, nous devons :

  • passer d'un simple inventaire dans le cadre de la découverte et commencer à creuser plus profondément dans le métadonnées — y compris les métadonnées déduites et implicites
  • comprendre étiquettes et balises de données, comment les données sont classées et comment elles doivent être classées avec des balises supplémentaires
  • corréler les données afin que nous puissions voir tous les éléments de données liés à une entité — comme un seul individu — afin que nous puissions soit commercialiser efficacement auprès de cette personne, soit protéger de manière holistique sa vie privée
  • données de cluster pour trouver, par exemple, tous les documents hypothécaires dans les partages de fichiers ou les numéros de compte client dans diverses bases de données dans toute l'organisation
  • couvrir toutes les données de l'entreprise — la moyenne 20% qui est structuré et le 80% qui est non structuré
  • construire un catalogue de données moderne dans le cadre de la gestion active des données dans le cadre du processus global.

Donc découverte de données Il ne s'agit pas simplement d'inventorier les données et d'espérer que l'organisation en trouve une utilité. La découverte des données commence à l'autre bout de l'organisation : au sein de l'entreprise, dans les indicateurs clés de performance marketing et commerciaux, et dans les initiatives de confidentialité et de sécurité. Elle peut être liée à des indicateurs clés de performance, des objectifs ou des initiatives établis.

Une fois que nous savons ce que nous voulons découvrir à partir des données, nous pouvons aller au-delà de la simple recherche pour les transformer en une valeur réelle qui peut être mesurée.

Contenu