Skip to content
Voir tous les articles

Rédaction des données ou masquage des données: Key Differences

En tant qu'entreprises, nous collectons et générons une quantité considérable de données. Pour avoir une idée précise de la quantité d'informations générées en 2024, 149 zettaoctets (soit 149 suivi de 21 zéros). Ce nombre devrait atteindre 394 zettaoctets d'ici 2028.

Une grande partie de cela est informations sensibles, et, en tant que tel, doit être protégé contre accès non autorisé using a robust data protection strategy. Some of it can be put behind le contrôle d'accès basé sur les rôles (RBAC) et l'authentification multifacteur (AMF). Cependant, certains cas d'utilisation nécessitent de partager certaines données personnelles avec d'autres, tout en en conservant une partie afin de limiter les risques d'exposition.

This is when data redaction involves more than just visual concealment; it plays a crucial role in data security and privacy compliance.

Qu'est-ce que la rédaction de données ?

You might have seen movies and documentaries where, say, the CIA released a document, but with parts of it blacked out. That’s data redaction.

Il s'agit d'une pratique de sécurité des données consistant à masquer ou à retenir de manière permanente des informations personnelles identifiables, médicales, confidentielles ou sensibles. En utilisant cette méthode sur papier, le document peut être partagé avec les personnes qui ont besoin d'en consulter une partie, mais pas l'intégralité.

Une fois réalisée numériquement, la communication peut être personnalisée en fonction du rôle et des besoins de chaque personne. Par exemple, vous pourriez vouloir communiquer l'adresse e-mail d'un client à un membre du service marketing, mais pas ses coordonnées bancaires. L'expédition des produits, quant à elle, n'a pas besoin de ces informations, mais l'adresse du domicile peut être nécessaire pour l'expédition des produits, tout en garantissant le respect des pratiques de gestion des données.

Effective data redaction is used in these scenarios to protect sensitive content without compromising operational efficiency or access to non-sensitive data.

Data redaction involves identifying and eliminating sensitive content in a way that ensures confidentiality while maintaining document usability where appropriate. It can also be helpful when sharing information with third parties. For example, you might want to withhold your IP address when sharing network logs to protect the details of your infrastructure.

Réduire les risques liés à l'accès aux données

Rédaction et masquage des données : les deux méthodes de confidentialité des données

La suppression et le masquage des données sont des méthodes visant à protéger les informations sensibles contre les personnes non autorisées à y avoir accès. Leur mise en œuvre est toutefois légèrement différente.

Comme nous l'avons vu, la rédaction des données masque complètement l'information. Elle « occulte » tout ce que le lecteur ne devrait pas être autorisé à voir, y compris le format et la longueur.

Data masking, on the other hand, replaces the information with something else. For example, replacing each character with an asterisk or an X. The masked data maintains its format or data structure, which makes it useful in cases where the data still needs to be functional or realistic, but not revealed, thus supporting a comprehensive data privacy strategy. While encryption transforms data into an unreadable format that requires a key to decode, masking conceals the actual values in a way that keeps the data usable. With data redaction, the other party cannot see anything, while masking conceals the actual values.

The difference between data masking and redaction comes down to format preservation versus complete concealment. Masking is ideal for situations when you need the information to be functional and hold its shape, but you don’t want it seen, thereby reducing the risk of data breaches. It might be used to share information with developers, testers, and analysts who need the data but not informations personnelles identifiables (PII).

La rédaction, en revanche, est plus appropriée lorsqu'un détail, notamment la longueur ou le format, pourrait exposer des informations sensibles. Elle offre un niveau de protection plus élevé en supprimant même les indices contextuels.

Par exemple, s'il s'agit d'un numéro de carte de crédit, tout le monde sait qu'il comporte 16 chiffres. Vous pouvez masquer chaque chiffre individuellement, mais peu importe que les gens puissent voir sa longueur. En revanche, s'il s'agit d'un diagnostic médical, même la simple vue d'une partie du mot ou de sa longueur pourrait permettre à quelqu'un de le deviner.

Quand expurger des données et quels types de données expurger

Vous devez rédiger des données sensibles, qui sont généralement protégées par les lois sur la confidentialité des données, mais vous avez également une responsabilité éthique envers vos clients.

Bien sûr, cela est pertinent par rapport à ce que vous avez collecté auprès d'eux ; il y a aussi vos informations commerciales sensibles.

Voici une liste des types de données que vous souhaiterez peut-être rédiger :

  • Informations personnelles identifiables : Il s'agit de tout élément permettant d'identifier la personne à laquelle il appartient, que ce soit seul ou en le combinant avec d'autres données. Par exemple, le numéro de sécurité sociale (SSN), le numéro de passeport, le nom complet (combiné à d'autres informations), etc.
  • Informations médicales protégées : Les PHI sont des informations médicales protégées par la Loi sur la portabilité et la responsabilité en matière d'assurance maladie (HIPAA). It includes medical record numbers, health plan beneficiary numbers, medical diagnoses, treatments, and conditions, etc.
  • Informations financières : Ce type d’informations comprend les numéros de carte de crédit ou de débit, les coordonnées bancaires, les informations sur les salaires ou les rémunérations, ou les numéros d’identification fiscale.
  • Informations juridiques ou gouvernementales : Les noms des témoins ou des victimes d’un crime, les informations sur les mineurs, l’identité des agents des forces de l’ordre et les témoignages sensibles peuvent être des informations qui doivent être protégées.
  • Informations pédagogiques et de recherche : Toutes les données qu'un établissement d'enseignement collecte sur un étudiant sont couvertes par la Loi sur les droits à l'éducation et à la vie privée de la famille (FERPA), mais des informations telles que les identifiants des sujets de recherche et les données expérimentales liées à un individu sont également des informations sensibles et doivent être expurgées.
  • Informations commerciales sensibles : Vous ne voudriez pas révéler des secrets commerciaux, des formules ou des algorithmes exclusifs, des communications internes ou des termes de contrats, que vous souhaiterez peut-être également rédiger.
  • Classified information: In government, military, or regulated industries, safeguarding classified information is a non-negotiable use case for redaction.

Rédaction statique ou dynamique

As we’ve discussed, redaction is used to any data that’s not meant to be shared. How you do it depends on whether you’re doing it on paper, manually on a digital document, or using automation.

Sur papier, la rédaction consiste souvent à utiliser un marqueur noir sur tout ce que l'on souhaite masquer. Les formats numériques comme le PDF permettent également de surligner le texte, même si cela est souvent plus complexe. s'est avéré inefficace plusieurs fois. Il est toutefois possible de masquer des informations dans ces documents grâce à l'outil « Rédaction ».

Of course, these are manual methods. If you’re an enterprise working with vast quantities of data, you would need to automate the process, because doing it manually is just not viable. There are several software programs and platforms that can automate redaction, including BigID. Simply provide the rules, and the tool will implement your data redaction policy. These redaction tools are being used across industries to streamline compliance and enhance security.

Rédaction de données statiques

Static redaction is a predefined, rule-based approach to protecting sensitive information. Here, sensitive information is permanently removed or obscured in a fixed version of the data, at the time of its export or when the document is prepared. Redaction is irreversible. Once redacted, the data is altered and cannot be restored. It’s typically used for documents or reports shared externally.

Rédaction dynamique des données

Dynamic redaction occurs in real time, applying redaction logic when data is accessed, based on user roles or contextual rules. The original data remains unchanged in storage. However, it appears redacted to unauthorized users. This approach is commonly used in applications or dashboards where you need to conditionally hide sensitive information based on the viewer’s permissions.

DSAR et rédaction de données

How to Use Data Redaction: Techniques For Data Protection

A modern data redaction strategy includes data masking, obfuscation, and anonymization. As such, some of these techniques listed might fall under one of the other categories. However, they are still useful for helping you comply with data privacy regulations such as the Règlement général sur la protection des données (RGPD), Loi californienne sur la protection des consommateurs (CCPA)ou HIPAA.

  • Rédaction de black-out : Dissimule visuellement les informations sensibles en superposant des cases noires ou des remplissages pleins dans les documents, couramment utilisés dans les dossiers juridiques et gouvernementaux.
  • Whiteout ou suppression de contenu : Efface le contenu sensible en le remplaçant par un espace vide, éliminant ainsi la visibilité sans perturber la mise en page environnante.
  • Correspondance et remplacement de motifs : Utilise des expressions régulières ou la détection de modèles pour identifier les informations sensibles et les remplacer par un texte d'espace réservé tel que « SUPPRIMÉ ».
  • Substitution de caractères : Remplace les caractères des données sensibles par des symboles (par exemple, des astérisques) tout en préservant un certain contexte, comme l'affichage uniquement des quatre derniers chiffres d'un numéro de carte de crédit.
  • Tokenisation des données : Convertit les valeurs sensibles en jetons aléatoires qui n'ont aucune signification sans un système de mappage sécurisé, masquant ainsi efficacement les données d'origine.
  • Mélange : Anonymise les données en réorganisant les valeurs au sein d'un ensemble de données tout en conservant la structure, couramment utilisé dans les environnements de test ou d'analyse.
  • Annulation : Supprime les informations sensibles en les remplaçant par des valeurs nulles ou vides, les effaçant ainsi efficacement de l'ensemble de données.
  • Généralisation: Remplace des données spécifiques par des catégories plus larges pour réduire l'identifiabilité, par exemple en modifiant les dates de naissance exactes en tranches d'âge.
  • Agrégation: Résume les données sensibles en totaux ou en informations au niveau du groupe, minimisant ainsi le risque d'identification des individus et protégeant les informations sensibles ou personnellement identifiables.
  • Pseudonymisation : Remplace les détails d'identification par des pseudonymes cohérents ou des identifiants artificiels, préservant ainsi la convivialité des données tout en protégeant les identités.
  • Rédaction de la reconnaissance d'entité nommée (NER) : Effets de levier AI et le traitement du langage naturel pour identifier et rédiger automatiquement les noms, les dates et d’autres entités dans un texte non structuré.
  • Rédaction basée sur des règles ou contextuelle : Utilise des règles personnalisées ou une logique métier pour rédiger des données en fonction du type de contenu, du niveau de sensibilité ou de l'accès des utilisateurs.
  • Rédaction des métadonnées : Supprime les métadonnées cachées telles que les noms d'auteur, les révisions de documents et les commentaires pour éviter les fuites de données involontaires.
  • Rédaction au niveau du champ de la base de données : Rédige ou masque des champs spécifiques dans les bases de données en fonction des rôles des utilisateurs ou des politiques d'accès, souvent en temps réel.
  • Rédaction imprimée : Applique la rédaction aux documents imprimés, souvent par le biais d'une révision manuelle et d'une rédaction physique avant la numérisation ou l'archivage.

Each technique plays a role in ensuring sensitive data remains protected while enabling necessary access or analysis.

Cas d'utilisation de la rédaction de données

Votre politique de rédaction de données peut être utilisée aux fins suivantes :

  • Conformité aux réglementations sur la confidentialité des données
  • Sécurisation des informations sensibles des clients
  • Protecting your internal company data

Sécurité des données avec BigID

La plateforme BigID offre une solution complète pour protéger les données sensibles détenues et stockées par votre entreprise. Elle offre non seulement de nombreuses options de masquage et de suppression des données d'entreprise, mais aussi des fonctionnalités de découverte et de cartographie des données.

Pour découvrir toutes les façons dont cette plateforme peut vous aider dans la sécurité et la gouvernance de vos données, planifiez une démo aujourd'hui !

Contenu

Comment pérenniser votre DSPM avec BigID DSP

Télécharger le résumé de la solution