Zum Inhalt springen
Alle Beiträge anzeigen

Datenredaktion vs. Datenmaskierung: Key Differences

Als Unternehmen sammeln und generieren wir eine immense Menge an Daten. Um ein Gefühl dafür zu bekommen, wie viel genau, betrug die Menge der im Jahr 2024 generierten Informationen 149 Zettabyte (das ist eine 149 gefolgt von 21 Nullen). Bis 2028 dürfte die Zahl auf 394 Zettabyte ansteigen.

Vieles davon ist sensible Informationenund muss daher geschützt werden vor unbefugter Zugriff using a robust data protection strategy. Some of it can be put behind rollenbasierte Zugriffskontrolle (RBAC) und Multi-Faktor-Authentifizierung (MFA). In bestimmten Anwendungsfällen müssen Sie jedoch einige personenbezogene Daten mit anderen teilen und gleichzeitig andere zurückhalten, um das Risiko einer Datenfreigabe zu minimieren.

This is when data redaction involves more than just visual concealment; it plays a crucial role in data security and privacy compliance.

Was ist Datenredaktion?

You might have seen movies and documentaries where, say, the CIA released a document, but with parts of it blacked out. That’s data redaction.

Dabei handelt es sich um die Datensicherheitspraxis, persönlich identifizierbare, vertrauliche oder sensible persönliche Informationen dauerhaft zu verbergen oder zurückzuhalten. Wenn Sie dies auf Papier tun, kann das Dokument mit Personen geteilt werden, die einen Teil des Inhalts sehen müssen, aber nicht den gesamten Inhalt.

Bei digitaler Abwicklung kann die Kommunikation an die jeweilige Rolle und die Bedürfnisse der Person angepasst werden. Beispielsweise möchten Sie möglicherweise die E-Mail-Adresse eines Kunden an die Marketingabteilung weitergeben, nicht jedoch dessen Kreditkartendaten. Der Produktversand benötigt diese Informationen zwar nicht, aber möglicherweise die Privatadresse für den Versand der Produkte, wobei die Einhaltung der Datenverwaltungspraktiken sichergestellt werden muss.

Effective data redaction is used in these scenarios to protect sensitive content without compromising operational efficiency or access to non-sensitive data.

Data redaction involves identifying and eliminating sensitive content in a way that ensures confidentiality while maintaining document usability where appropriate. It can also be helpful when sharing information with third parties. For example, you might want to withhold your IP address when sharing network logs to protect the details of your infrastructure.

Reduzieren Sie das Risiko beim Datenzugriff

Datenredaktion vs. Datenmaskierung: Die zwei Datenschutzmethoden

Sowohl die Datenredaktion als auch die Datenmaskierung sind Methoden, um vertrauliche Informationen vor Personen zu schützen, die keinen Zugriff darauf haben sollten. Die Vorgehensweise unterscheidet sich jedoch geringfügig.

Wie wir gesehen haben, werden durch die Datenredaktion die Informationen vollständig verborgen. Dabei wird alles „geschwärzt“, was der Betrachter nicht sehen soll – einschließlich Format und Länge.

Data masking, on the other hand, replaces the information with something else. For example, replacing each character with an asterisk or an X. The masked data maintains its format or data structure, which makes it useful in cases where the data still needs to be functional or realistic, but not revealed, thus supporting a comprehensive data privacy strategy. While encryption transforms data into an unreadable format that requires a key to decode, masking conceals the actual values in a way that keeps the data usable. With data redaction, the other party cannot see anything, while masking conceals the actual values.

The difference between data masking and redaction comes down to format preservation versus complete concealment. Masking is ideal for situations when you need the information to be functional and hold its shape, but you don’t want it seen, thereby reducing the risk of data breaches. It might be used to share information with developers, testers, and analysts who need the data but not persönlich identifizierbare Informationen (PII).

Eine Schwärzung hingegen ist sinnvoller, wenn Details wie Länge oder Format sensible Informationen preisgeben könnten. Sie bietet einen höheren Schutz, indem selbst kontextbezogene Hinweise entfernt werden.

Handelt es sich beispielsweise um eine Kreditkartennummer, weiß jeder, dass sie 16 Ziffern hat. Sie können die einzelnen Ziffern verbergen, aber es spielt keine Rolle, ob die Nummer sichtbar ist. Handelt es sich jedoch um eine medizinische Diagnose, kann selbst das Erkennen eines Teils des Wortes oder seiner Länge dazu führen, dass jemand die Nummer errät.

Wann und welche Datentypen geschwärzt werden müssen

Sie müssen vertrauliche Daten schwärzen, die normalerweise durch Datenschutzgesetze geschützt sind, aber Sie tragen auch eine ethische Verantwortung gegenüber Ihren Kunden.

Dies ist natürlich im Hinblick auf das relevant, was Sie von ihnen gesammelt haben; es geht auch um Ihre vertraulichen Geschäftsinformationen.

Hier ist eine Liste der Datentypen, die Sie möglicherweise schwärzen möchten:

  • Persönlich identifizierbare Informationen: Damit sind alle Daten gemeint, die eine Identifizierung der betreffenden Person ermöglichen, unabhängig davon, ob sie allein oder in Kombination mit anderen Daten vorliegen. Beispiele hierfür sind die Sozialversicherungsnummer (SSN), die Passnummer, der vollständige Name (in Kombination mit anderen Informationen) usw.
  • Geschützte Gesundheitsinformationen: PHI sind alle medizinischen Informationen, die geschützt sind durch Gesetz zur Portabilität und Rechenschaftspflicht von Krankenversicherungen (HIPAA). It includes medical record numbers, health plan beneficiary numbers, medical diagnoses, treatments, and conditions, etc.
  • Finanzielle Informationen: Zu dieser Art von Informationen gehören Kredit- oder Debitkartennummern, Bankkontodaten, Gehalts- oder Vergütungsinformationen oder Steueridentifikationsnummern.
  • Rechtliche oder behördliche Informationen: Namen von Zeugen oder Opfern eines Verbrechens, Informationen über Jugendliche, Identitäten von Polizeibeamten und vertrauliche Zeugenaussagen können Informationen sein, die geschützt werden sollten.
  • Bildungs- und Forschungsinformationen: Alle Daten, die eine Bildungseinrichtung über einen Schüler sammelt, unterliegen dem Gesetz über Bildungsrechte und Datenschutz (FERPA), aber auch Informationen wie Kennungen von Forschungssubjekten und experimentelle Daten, die mit einer Person verknüpft sind, sind sensible Informationen und sollten redigiert werden.
  • Vertrauliche Geschäftsinformationen: Sie möchten sicherlich keine Geschäftsgeheimnisse, geschützten Formeln oder Algorithmen, interne Kommunikationen oder Vertragsbedingungen preisgeben, die Sie möglicherweise auch redigieren möchten.
  • Classified information: In government, military, or regulated industries, safeguarding classified information is a non-negotiable use case for redaction.

Statische vs. dynamische Redaktion

As we’ve discussed, redaction is used to any data that’s not meant to be shared. How you do it depends on whether you’re doing it on paper, manually on a digital document, or using automation.

Auf dem Papier bedeutet Schwärzung oft nur, mit einem schwarzen Stift alles zu übermalen, was unkenntlich gemacht werden soll. Digitale Formate wie PDFs ermöglichen es Ihnen auch, den Text zu markieren, obwohl das als unwirksam erwiesen mehr als einmal. Es ist jedoch möglich, Informationen in solchen Dokumenten mit dem Tool „Schwärzen“ zu verbergen.

Of course, these are manual methods. If you’re an enterprise working with vast quantities of data, you would need to automate the process, because doing it manually is just not viable. There are several software programs and platforms that can automate redaction, including BigID. Simply provide the rules, and the tool will implement your data redaction policy. These redaction tools are being used across industries to streamline compliance and enhance security.

Redaktion statischer Daten

Static redaction is a predefined, rule-based approach to protecting sensitive information. Here, sensitive information is permanently removed or obscured in a fixed version of the data, at the time of its export or when the document is prepared. Redaction is irreversible. Once redacted, the data is altered and cannot be restored. It’s typically used for documents or reports shared externally.

Dynamische Datenredaktion

Dynamic redaction occurs in real time, applying redaction logic when data is accessed, based on user roles or contextual rules. The original data remains unchanged in storage. However, it appears redacted to unauthorized users. This approach is commonly used in applications or dashboards where you need to conditionally hide sensitive information based on the viewer’s permissions.

DSARs und Datenredaktion

How to Use Data Redaction: Techniques For Data Protection

A modern data redaction strategy includes data masking, obfuscation, and anonymization. As such, some of these techniques listed might fall under one of the other categories. However, they are still useful for helping you comply with data privacy regulations such as the Allgemeine Datenschutzverordnung (GDPR), Kalifornisches Verbraucherschutzgesetz (CCPA), oder HIPAA.

  • Blackout-Redaktion: Verbirgt vertrauliche Informationen optisch durch die Überlagerung von schwarzen Kästchen oder ausgefüllten Füllungen in Dokumenten, wie sie häufig in juristischen und behördlichen Aufzeichnungen verwendet werden.
  • Whiteout oder Inhaltsentfernung: Löscht vertrauliche Inhalte, indem sie durch Leerzeichen ersetzt werden. Dadurch wird die Sichtbarkeit eliminiert, ohne das umgebende Layout zu stören.
  • Mustervergleich und -ersetzung: Verwendet reguläre Ausdrücke oder Mustererkennung, um vertrauliche Informationen zu identifizieren und durch Platzhaltertext wie „ZENSIERT“ zu ersetzen.
  • Zeichenersetzung: Ersetzt Zeichen in vertraulichen Daten durch Symbole (z. B. Sternchen), wobei ein gewisser Kontext erhalten bleibt, z. B. indem nur die letzten vier Ziffern einer Kreditkartennummer angezeigt werden.
  • Daten-Tokenisierung: Wandelt vertrauliche Werte in zufällige Token um, die ohne ein sicheres Zuordnungssystem bedeutungslos sind, wodurch die Originaldaten effektiv verborgen werden.
  • Mischen: Anonymisiert Daten durch Neuanordnung der Werte innerhalb eines Datensatzes unter Beibehaltung der Struktur. Wird häufig in Test- oder Analyseumgebungen verwendet.
  • Nullung: Entfernt vertrauliche Informationen, indem sie durch Null- oder leere Werte ersetzt werden und so effektiv aus dem Datensatz gelöscht werden.
  • Verallgemeinerung: Ersetzt spezifische Daten durch breitere Kategorien, um die Identifizierbarkeit zu verringern, beispielsweise durch die Änderung genauer Geburtsdaten in Altersbereiche.
  • Aggregation: Fasst vertrauliche Daten in Gesamtwerte oder auf Gruppenebene zusammen, minimiert so das Risiko der Identifizierung einzelner Personen und schützt vertrauliche oder persönlich identifizierbare Informationen.
  • Pseudonymisierung: Ersetzt identifizierende Details durch einheitliche Pseudonyme oder künstliche Kennungen. So bleibt die Nutzbarkeit der Daten erhalten und die Identitäten werden geschützt.
  • Redaktion der Named Entity Recognition (NER): Hebel AI und natürliche Sprachverarbeitung, um Namen, Daten und andere Entitäten in unstrukturiertem Text automatisch zu identifizieren und zu schwärzen.
  • Regelbasierte oder kontextbezogene Redaktion: Verwendet benutzerdefinierte Regeln oder Geschäftslogik, um Daten je nach Inhaltstyp, Vertraulichkeitsstufe oder Benutzerzugriff zu schwärzen.
  • Metadatenredaktion: Entfernt versteckte Metadaten wie Autorennamen, Dokumentrevisionen und Kommentare, um unbeabsichtigte Datenlecks zu verhindern.
  • Schwärzung auf Datenbankfeldebene: Schwärzt oder verbirgt bestimmte Felder in Datenbanken basierend auf Benutzerrollen oder Zugriffsrichtlinien, oft in Echtzeit.
  • Druckbasierte Redaktion: Wendet Schwärzungen auf gedruckte Dokumente an, häufig durch manuelle Überprüfung und physische Schwärzung vor dem Scannen oder Archivieren.

Each technique plays a role in ensuring sensitive data remains protected while enabling necessary access or analysis.

Anwendungsfälle für die Datenredaktion

Ihre Datenredaktionsrichtlinie kann für folgende Zwecke verwendet werden:

  • Einhaltung der Datenschutzbestimmungen
  • Schutz vertraulicher Kundeninformationen
  • Protecting your internal company data

Datensicherheit mit BigID

Die BigID-Plattform bietet umfassende Möglichkeiten zum Schutz vertraulicher Unternehmensdaten. Sie bietet nicht nur zahlreiche Optionen zur Datenredaktion und -maskierung, sondern auch Funktionen zur Datenermittlung und -zuordnung.

Um herauszufinden, wie diese Plattform Sie bei Ihrer Datensicherheit und -verwaltung unterstützen kann, Vereinbaren Sie noch heute eine Demo!

Inhalt

So machen Sie Ihr DSPM mit BigID DSP zukunftssicher

Download Solution Brief