Les données des consommateurs sont cruciales pour ceux qui les partagent, les entreprises qui les collectent et les traitent, et les gouvernements qui en supervisent la protection et l'utilisation. Les avis sur l'utilisation équitable des données ne sont en aucun cas unanimes. Rien qu'en mars, l'État de New York a adopté une nouvelle réglementation visant à renforcer la protection des données des consommateurs dans les services financiers, tandis que le Congrès a voté l'annulation des nouvelles protections de la FCC concernant le consentement à l'utilisation des données. Néanmoins, le fil conducteur de ces décisions, ainsi que des nouvelles réglementations internationales comme la loi chinoise sur la cybersécurité ou le RGPD de l'UE, est que données personnelles est de plus en plus un champ de bataille et les organisations devront gérer des priorités concurrentes et parfois divergentes des consommateurs, des entreprises et des gouvernements, à l’échelle mondiale.
Responsabilité par la comptabilité

Pour toute organisation, les clients sont le moteur de l'activité : sans clients, pas d'activité. De plus en plus, cette relation entre entreprise et consommateur repose sur les données. Les données sont la monnaie d'échange qui définit la manière dont le consommateur interagit et effectue des transactions avec une organisation. Il n'est donc pas surprenant que les consommateurs considèrent les organisations comme les gardiennes de leurs données, responsables de leur conservation et de leur utilisation équitable. Cette vision de l'entreprise comme gardienne des données est renforcée par l'évolution du paysage réglementaire, qui exige des entreprises une plus grande responsabilité en matière de protection et de confidentialité des données envers leurs clients et les régulateurs qui les défendent. Or, la responsabilité des données est impossible sans comptabilité des données.
Dans le monde des affaires actuel, connaître un client signifie connaître ses données. Pour la plupart des organisations, cela reste complexe. Les données sont collectées via de nombreuses applications et traitées de manières parfois peu évidentes. Les approches traditionnelles de découverte de données reposent sur des questionnaires imprécis ou des scanners obsolètes, qui ne permettent ni un inventaire ni une cartographie exhaustifs des données. Connaître un numéro à neuf chiffres dans une base de données relationnelle n'équivaut pas à connaître les données d'un individu. Connaître un client, ou une « personne concernée », signifie connaître l'intégralité de ses données, ainsi que le contexte de leur utilisation : où se trouvent-elles, qui y accède, où elles circulent, quel consentement a été recueilli, etc. La responsabilité des données est impossible sans comptabilité des données, et cette comptabilité nécessite un moyen de découvrir à la fois les données d'un individu et leur contexte d'utilisation.
Contenu et contexte

Les outils de découverte de données nouvelle génération comme BigID vont au-delà de la simple découverte des numéros de sécurité sociale. Trouver des données sensibles reste essentiel, mais dans le monde du commerce en ligne actuel, il est essentiel d'adopter une définition plus large du contenu sensible tout en comprenant le contexte de ces données afin de répondre aux priorités en matière de sécurité, de confidentialité et de gouvernance des données. Prenons l'exemple du RGPD européen : les droits des citoyens en matière de données qu'il garantit exigent des organisations qu'elles sachent quelles données elles collectent sur chaque individu, quel est leur consentement concernant les données, où elles résident, dans quelle mesure elles sont identifiables et à quelle fin elles sont utilisées. Pour y parvenir avec précision et à grande échelle, de nouvelles approches sont nécessaires, non seulement pour trouver, mais aussi pour inventorier et cartographier les données. Des outils comme BigID aident efficacement les organisations à créer un atlas de leurs données afin de pouvoir zoomer et dézoomer sur des caractéristiques et des relations spécifiques. Cela garantit à la fois la conformité aux réglementations émergentes et une meilleure connaissance des données clients.
Qualité des données au milieu de la quantité de données

Comme pour toute cartographie, la connaissance des données clients implique toujours des détails macro et micro. La gestion des données nécessite une vue d'ensemble de la manière dont les données arrivent dans une organisation, sont traitées et éliminées. Elle bénéficiera également d'un inventaire plus détaillé, pouvant être segmenté par type de données, personne concernée, consentement, application appelante, système, pays ou même réglementation applicable. Mais pour que les données soient véritablement utiles, il est également important de comprendre les interrelations détaillées entre les différents attributs de données collectées et traitées. Cela nécessite une approche granulaire permettant de déterminer, par exemple, comment un cookie est lié à un numéro de sécurité sociale.
Avoir cette vue granulaire permet également de répondre aux problèmes courants de qualité des données. données d'identité. Deux entités de table de données sont-elles des personnes différentes ou identiques si elles partagent certains attributs communs ; une adresse IP peut-elle être associée à un individu ; un ensemble de données anonymisées utilisé à des fins d'analyse est-il réidentifiable ?
La qualité des données repose sur une connaissance approfondie. Des outils comme BigID permettent aux organisations de mettre en lumière les informations clients au niveau de l'entreprise, des stocks d'actifs et des tables de données/champs à granularité fine. Il est tout aussi important de noter que ces outils sont conçus dès le départ pour fonctionner à l'échelle mondiale, couvrant des pétaoctets de centres de données et de magasins répartis (et gouvernés) au niveau régional, tout en s'adaptant à une définition toujours plus large des données d'identité. De plus, des outils de protection et de confidentialité axés sur la connaissance des données, comme BigID, offrent aux organisations une nouvelle façon d'analyser les données et de les réutiliser de manière moderne et centrée sur les services.