Skip to content
Voir tous les articles

Où est Charlie? Trouver l'identité dans le Big Data

Le Big Data pose d'importants problèmes pour la recherche d'informations d'identité. Alors que les organisations privilégient les interactions en ligne avec leurs clients, elles collectent des pétaoctets de données sur les individus à un rythme effréné. Les organisations souhaitent réagir rapidement, voire anticiper, les besoins de leurs clients. Cela implique d'offrir de plus en plus à leurs clients des services numériques sur le web, les appareils mobiles, la maison, la voiture, les objets connectés et l'IA. Des données personnelles de toutes sortes, allant des données hautement identifiables aux préférences et à la géolocalisation, sont collectées aux points de contact des applications, ce qui engendre une prolifération et une diffusion des données personnelles impossibles à suivre ou à retracer.

Et c'est là le hic : les données non comptabilisées sont effectivement inconnues. Pourtant, les données inconnues ne sont pas invisibles ; elles sont simplement vulnérables. Aujourd'hui, connaître un client exige qu'une entreprise connaisse ses données. Préserver sa fidélité exige qu'elle protège ses données. Or, on ne peut protéger ce qu'on ignore, et c'est pourquoi, aujourd'hui plus que jamais, les entreprises doivent connaître leurs données clients. Or, trouver des données clients spécifiques dans le Big Data peut s'apparenter à chercher Charlie dans un océan de Charlie, une multitude d'informations similaires sans pouvoir les distinguer.

 

Difficile ne veut pas dire impossible, et RGPD ne veut pas dire volontaire

Il fut un temps où, pour de nombreuses entreprises, connaître les données de leurs clients semblait plus contraignant qu'avantageux. La comptabilité des données impliquait une certaine responsabilisation, et mettre en lumière un élément trop sensible pouvait révéler des surprises, qui devenaient soudainement la responsabilité de l'entreprise. Mais les temps ont changé : les violations sont désormais monnaie courante, ce qui pousse les entreprises à agir pour rendre les données de leurs clients moins vulnérables. De plus, face à la concurrence en ligne, celui qui connaît le mieux le client le remportera. Si la connaissance est synonyme de pouvoir, la connaissance des données est un carburant pour les fusées.

Mais même si les revenus et la sécurité ne suffisent pas à motiver une entreprise à connaître les données de ses clients, de plus en plus d'organisations prennent conscience que la connaissance des données est une obligation légale. Partout dans le monde, de nouvelles réglementations en matière de confidentialité exigent des organisations qu'elles connaissent les données qu'elles détiennent sur un individu, et les sanctions en cas de non-connaissance sont lourdes. L'Europe en est peut-être le meilleur exemple, avec le droit à la vie privée est de plus en plus considéré comme un droit constitutionnel et le droit à la vie privée signifie un droit à ses données.

Avec l'introduction du Règlement général sur la protection des données (RGPD) de l'UE, les organisations sont légalement tenues de fournir ou de supprimer les données de leurs clients à leur demande. Les sanctions en cas de non-respect de cette obligation peuvent atteindre 4% de chiffre d'affaires mondial dans l'UE, voire 10% dans certains pays. Le RGPD consacre le principe selon lequel les entreprises ne sont que les dépositaires des données des consommateurs ou des employés. Ces données restent la propriété du citoyen. Le non-respect de cette norme peut handicaper une entreprise. La protection de la vie privée ne suffira peut-être pas à inciter toutes les organisations à identifier et à inventorier leurs données, mais des réglementations comme le RGPD constitueront certainement un levier de motivation pour les moins convaincues.

 

Avez-vous entendu parler de l'aiguille et de la botte de foin ?

Connaître ses données d'identité est bénéfique pour les entreprises, la sécurité et la confidentialité. C'est aussi une obligation légale dans un nombre croissant de pays à travers le monde. Mais trouver des données d'identité dans le big data est déjà difficile, trouver une identité dans le big data l'est encore plus.

Trouver certains types d'informations personnelles identifiables (IPI) n'est pas une tâche révolutionnaire. Les entreprises s'efforcent de trouver certains types d'IPI dans leurs données depuis des années, pour des raisons allant du marketing à la sécurité. Prenons l'exemple d'un identifiant national comme le numéro de sécurité sociale. Ces données sont à la fois hautement identifiables et extrêmement sensibles. Elles sont également protégées par la réglementation dans de nombreux secteurs. C'est pourquoi de nombreuses organisations se sont déjà lancées dans la recherche et le catalogage de ces données. Cependant, les outils nécessaires laissent beaucoup à désirer. Ils peuvent trouver des nombres à neuf chiffres dans des bases de données, mais ne peuvent pas couvrir toutes les sources de données. Généralement, ils ne peuvent pas distinguer des nombres similaires. Ils ne peuvent fournir aucune visibilité sur leur utilisation. Et surtout, ils ne peuvent pas déterminer à qui appartiennent les données.

Bien sûr, connaître les données de vos clients ne se limite pas à connaître leur numéro de sécurité sociale. Il s'agit de connaître leur nom, leur adresse, leurs préférences, leurs documents, leur géolocalisation, leur adresse IP – tout ce qui les concerne ou provient d'eux. C'est une tâche plus complexe. Cela exige de pouvoir trouver toutes sortes de données, parfois sans connaissance préalable, dans tous les endroits. C'est comme chercher plusieurs aiguilles dans plusieurs bottes de foin. Mais même dans ce cas, cela peut ne pas suffire, car pour satisfaire à des réglementations comme le RGPD, il est également nécessaire de savoir quelles aiguilles proviennent de quel paquet. Il s'agit de trouver les données difficiles à trouver et de les classer par personne ou « personne concernée ».

Atlas haussa les épaules

Trouver une identité dans le Big Data nécessite de pouvoir trouver des informations d'identité, puis de déterminer lesquelles appartiennent à quelle identité. Mais ce n'est pas tout. Pour vraiment connaître les données de vos clients, vous devez savoir ce qu'elles sont, où elles se trouvent, à qui elles appartiennent, où elles vont et où elles ont été. Si la connaissance est synonyme de pouvoir, alors pourquoi se contenter de cola et de bicarbonate de soude quand on peut avoir de l'hydrogène métallique ?

De nouveaux outils comme BigID bouleversent les approches traditionnelles de recherche, d'inventaire et de cartographie des données personnelles. Ils abandonnent les recherches structurées basées sur des expressions régulières archaïques. Ils s'appuient sur le contexte d'identité pour trouver et trier les données d'identité à grande échelle. BigID s'appuie sur le big data, l'apprentissage automatique et l'identité. corrélation Pour comprendre ce qui est quoi et qui est qui. Son objectif n'est pas de trouver un numéro de sécurité sociale, mais de cartographier tous les numéros de sécurité sociale et les informations d'identité associées dans un graphe d'identité. Il s'agit de construire un atlas : des cartes indiquant les localisations, les accès, les résidences et les flux de données.

Connaître ses clients commence par connaître leurs données. Mais pour les identifier, il faut une cartographie. Des outils comme BigID aident les entreprises à créer un atlas de données pour un meilleur service client, une sécurité accrue et une confidentialité renforcée.