Als Unternehmen sammeln und generieren wir eine immense Menge an Daten. Um ein Gefühl dafür zu bekommen, wie viel genau, betrug die Menge der im Jahr 2024 generierten Informationen 149 Zettabyte (das ist eine 149 gefolgt von 21 Nullen). Bis 2028 dürfte die Zahl auf 394 Zettabyte ansteigen.
Vieles davon ist sensible Informationenund muss daher geschützt werden vor unbefugter ZugriffEiniges davon kann hinter sich gelassen werden rollenbasierte Zugriffskontrolle (RBAC) und Multi-Faktor-Authentifizierung (MFA). In bestimmten Anwendungsfällen müssen Sie jedoch einige personenbezogene Daten mit anderen teilen und gleichzeitig andere zurückhalten, um das Risiko einer Datenfreigabe zu minimieren.
Dies ist, wenn Datenredaktion kann bei der Einhaltung der Datensicherheit und des Datenschutzes helfen.
Was ist Datenredaktion?
Sie haben vielleicht Filme und Dokumentationen gesehen, in denen beispielsweise die CIA ein Dokument veröffentlicht hat, in dem Teile geschwärzt sind. Das ist Datenredaktion.
Dabei handelt es sich um die Datensicherheitspraxis, persönlich identifizierbare, vertrauliche oder sensible persönliche Informationen dauerhaft zu verbergen oder zurückzuhalten. Wenn Sie dies auf Papier tun, kann das Dokument mit Personen geteilt werden, die einen Teil des Inhalts sehen müssen, aber nicht den gesamten Inhalt.
Bei digitaler Abwicklung kann die Kommunikation an die jeweilige Rolle und die Bedürfnisse der Person angepasst werden. Beispielsweise möchten Sie möglicherweise die E-Mail-Adresse eines Kunden an die Marketingabteilung weitergeben, nicht jedoch dessen Kreditkartendaten. Der Produktversand benötigt diese Informationen zwar nicht, aber möglicherweise die Privatadresse für den Versand der Produkte, wobei die Einhaltung der Datenverwaltungspraktiken sichergestellt werden muss.
Auch beim Teilen von Informationen mit Dritten kann die Datenredaktion hilfreich sein. Beispielsweise möchten Sie Ihre IP-Adresse beim Teilen von Netzwerkprotokollen möglicherweise nicht offenlegen, um die Details Ihrer Infrastruktur zu schützen.
Datenredaktion vs. Datenmaskierung: Die zwei Datenschutzmethoden
Sowohl die Datenredaktion als auch die Datenmaskierung sind Methoden, um vertrauliche Informationen vor Personen zu schützen, die keinen Zugriff darauf haben sollten. Die Vorgehensweise unterscheidet sich jedoch geringfügig.
Wie wir gesehen haben, werden durch die Datenredaktion die Informationen vollständig verborgen. Dabei wird alles „geschwärzt“, was der Betrachter nicht sehen soll – einschließlich Format und Länge.
Bei der Datenmaskierung hingegen werden die Informationen durch etwas anderes ersetzt. Beispielsweise wird jedes Zeichen durch ein Sternchen oder ein X ersetzt. Die maskierten Daten behalten ihr Format oder ihre Struktur bei. Dies ist nützlich, wenn die Daten weiterhin funktional oder realistisch sein, aber nicht offengelegt werden müssen. Dies unterstützt eine umfassende Datenschutzstrategie. Bei der Datenredaktion kann die andere Partei nichts sehen, während die Maskierung die tatsächlichen Werte verbirgt.
Maskierung ist ideal, wenn die Informationen funktional sein und ihre Form behalten müssen, aber nicht sichtbar sein sollen. Dadurch wird das Risiko von Datenlecks verringert. Sie kann verwendet werden, um Informationen mit Entwicklern, Testern und Analysten zu teilen, die die Daten benötigen, aber nicht persönlich identifizierbare Informationen (PII).
Eine Schwärzung hingegen ist sinnvoller, wenn Details wie Länge oder Format sensible Informationen preisgeben könnten. Sie bietet einen höheren Schutz, indem selbst kontextbezogene Hinweise entfernt werden.
Handelt es sich beispielsweise um eine Kreditkartennummer, weiß jeder, dass sie 16 Ziffern hat. Sie können die einzelnen Ziffern verbergen, aber es spielt keine Rolle, ob die Nummer sichtbar ist. Handelt es sich jedoch um eine medizinische Diagnose, kann selbst das Erkennen eines Teils des Wortes oder seiner Länge dazu führen, dass jemand die Nummer errät.
Wann und welche Datentypen geschwärzt werden müssen
Sie müssen vertrauliche Daten schwärzen, die normalerweise durch Datenschutzgesetze geschützt sind, aber Sie tragen auch eine ethische Verantwortung gegenüber Ihren Kunden.
Dies ist natürlich im Hinblick auf das relevant, was Sie von ihnen gesammelt haben; es geht auch um Ihre vertraulichen Geschäftsinformationen.
Hier ist eine Liste der Datentypen, die Sie möglicherweise schwärzen möchten:
- Persönlich identifizierbare Informationen: Damit sind alle Daten gemeint, die eine Identifizierung der betreffenden Person ermöglichen, unabhängig davon, ob sie allein oder in Kombination mit anderen Daten vorliegen. Beispiele hierfür sind die Sozialversicherungsnummer (SSN), die Passnummer, der vollständige Name (in Kombination mit anderen Informationen) usw.
- Geschützte Gesundheitsinformationen: PHI sind alle medizinischen Informationen, die geschützt sind durch Gesetz über die Übertragbarkeit und Rechenschaftspflicht von Krankenversicherungen (HIPAA). Es umfasst Krankenaktennummern, Begünstigtennummern der Krankenversicherung, medizinische Diagnosen, Behandlungen und Erkrankungen usw.
- Finanzielle Informationen: Zu dieser Art von Informationen gehören Kredit- oder Debitkartennummern, Bankkontodaten, Gehalts- oder Vergütungsinformationen oder Steueridentifikationsnummern.
- Rechtliche oder behördliche Informationen: Namen von Zeugen oder Opfern eines Verbrechens, Informationen über Jugendliche, Identitäten von Polizeibeamten und vertrauliche Zeugenaussagen können Informationen sein, die geschützt werden sollten.
- Bildungs- und Forschungsinformationen: Alle Daten, die eine Bildungseinrichtung über einen Schüler sammelt, unterliegen dem Gesetz über Bildungsrechte und Datenschutz (FERPA), aber auch Informationen wie Kennungen von Forschungssubjekten und experimentelle Daten, die mit einer Person verknüpft sind, sind sensible Informationen und sollten redigiert werden.
- Vertrauliche Geschäftsinformationen: Sie möchten sicherlich keine Geschäftsgeheimnisse, geschützten Formeln oder Algorithmen, interne Kommunikationen oder Vertragsbedingungen preisgeben, die Sie möglicherweise auch redigieren möchten.

Statische vs. dynamische Redaktion
Wie bereits erwähnt, handelt es sich bei der Schwärzung um das Ausblenden von Daten, die nicht zur Weitergabe bestimmt sind. Die Vorgehensweise hängt davon ab, ob Sie die Schwärzung auf Papier, manuell in einem digitalen Dokument oder automatisiert durchführen.
Auf dem Papier bedeutet Schwärzung oft nur, mit einem schwarzen Stift alles zu übermalen, was unkenntlich gemacht werden soll. Digitale Formate wie PDFs ermöglichen es Ihnen auch, den Text zu markieren, obwohl das als unwirksam erwiesen mehr als einmal. Es ist jedoch möglich, Informationen in solchen Dokumenten mit dem Tool „Schwärzen“ zu verbergen.
Natürlich handelt es sich hierbei um manuelle Methoden. Wenn Sie in einem Unternehmen mit großen Datenmengen arbeiten, müssen Sie den Prozess automatisieren, da eine manuelle Durchführung schlichtweg nicht praktikabel ist. Es gibt verschiedene Softwareprogramme und Plattformen, die den Prozess für Sie automatisieren können, darunter BigIDGeben Sie einfach die Regeln an und das Tool implementiert Ihre Datenredaktionsrichtlinie.
Redaktion statischer Daten
Statische Schwärzung ist ein vordefinierter, regelbasierter Ansatz zum Schutz vertraulicher Informationen. Dabei werden vertrauliche Informationen beim Export oder bei der Dokumenterstellung dauerhaft entfernt oder in einer festen Version der Daten unkenntlich gemacht. Nach der Schwärzung sind die Daten verändert und können nicht wiederhergestellt werden. Diese Methode wird typischerweise für extern freigegebene Dokumente oder Berichte verwendet.
Dynamische Datenredaktion
Die dynamische Schwärzung erfolgt in Echtzeit. Beim Datenzugriff wird basierend auf Benutzerrollen oder Kontextregeln eine Schwärzungslogik angewendet. Die Originaldaten bleiben im Speicher unverändert. Für nicht autorisierte Benutzer erscheinen sie jedoch als geschwärzt. Dieser Ansatz wird häufig in Anwendungen oder Dashboards verwendet, in denen vertrauliche Informationen je nach den Berechtigungen des Betrachters bedingt ausgeblendet werden müssen.
Datenredaktionstechniken zum Datenschutz
Eine moderne Datenredaktionsstrategie umfasst Datenmaskierung, Verschleierung und Anonymisierung. Daher fallen einige der aufgeführten Techniken möglicherweise in eine der anderen Kategorien. Sie sind jedoch weiterhin nützlich, um die Privatsphäre unter Vorschriften wie dem zu schützen. Allgemeine Datenschutzverordnung (GDPR), Kalifornisches Verbraucherschutzgesetz (CCPA), oder HIPAA.
- Blackout-Redaktion: Verbirgt vertrauliche Informationen optisch durch die Überlagerung von schwarzen Kästchen oder ausgefüllten Füllungen in Dokumenten, wie sie häufig in juristischen und behördlichen Aufzeichnungen verwendet werden.
- Whiteout oder Inhaltsentfernung: Löscht vertrauliche Inhalte, indem sie durch Leerzeichen ersetzt werden. Dadurch wird die Sichtbarkeit eliminiert, ohne das umgebende Layout zu stören.
- Mustervergleich und -ersetzung: Verwendet reguläre Ausdrücke oder Mustererkennung, um vertrauliche Informationen zu identifizieren und durch Platzhaltertext wie „ZENSIERT“ zu ersetzen.
- Zeichenersetzung: Ersetzt Zeichen in vertraulichen Daten durch Symbole (z. B. Sternchen), wobei ein gewisser Kontext erhalten bleibt, z. B. indem nur die letzten vier Ziffern einer Kreditkartennummer angezeigt werden.
- Daten-Tokenisierung: Wandelt vertrauliche Werte in zufällige Token um, die ohne ein sicheres Zuordnungssystem bedeutungslos sind, wodurch die Originaldaten effektiv verborgen werden.
- Mischen: Anonymisiert Daten durch Neuanordnung der Werte innerhalb eines Datensatzes unter Beibehaltung der Struktur. Wird häufig in Test- oder Analyseumgebungen verwendet.
- Nullung: Entfernt vertrauliche Informationen, indem sie durch Null- oder leere Werte ersetzt werden und so effektiv aus dem Datensatz gelöscht werden.
- Verallgemeinerung: Ersetzt spezifische Daten durch breitere Kategorien, um die Identifizierbarkeit zu verringern, beispielsweise durch die Änderung genauer Geburtsdaten in Altersbereiche.
- Aggregation: Fasst vertrauliche Daten in Gesamtwerte oder auf Gruppenebene zusammen, minimiert so das Risiko der Identifizierung einzelner Personen und schützt vertrauliche oder persönlich identifizierbare Informationen.
- Pseudonymisierung: Ersetzt identifizierende Details durch einheitliche Pseudonyme oder künstliche Kennungen. So bleibt die Nutzbarkeit der Daten erhalten und die Identitäten werden geschützt.
- Redaktion der Named Entity Recognition (NER): Hebel AI und natürliche Sprachverarbeitung, um Namen, Daten und andere Entitäten in unstrukturiertem Text automatisch zu identifizieren und zu schwärzen.
- Regelbasierte oder kontextbezogene Redaktion: Verwendet benutzerdefinierte Regeln oder Geschäftslogik, um Daten je nach Inhaltstyp, Vertraulichkeitsstufe oder Benutzerzugriff zu schwärzen.
- Metadatenredaktion: Entfernt versteckte Metadaten wie Autorennamen, Dokumentrevisionen und Kommentare, um unbeabsichtigte Datenlecks zu verhindern.
- Schwärzung auf Datenbankfeldebene: Schwärzt oder verbirgt bestimmte Felder in Datenbanken basierend auf Benutzerrollen oder Zugriffsrichtlinien, oft in Echtzeit.
- Druckbasierte Redaktion: Wendet Schwärzungen auf gedruckte Dokumente an, häufig durch manuelle Überprüfung und physische Schwärzung vor dem Scannen oder Archivieren.
Anwendungsfälle für die Datenredaktion
Ihre Datenredaktionsrichtlinie kann für folgende Zwecke verwendet werden:
- Einhaltung der Datenschutzbestimmungen
- Schutz vertraulicher Kundeninformationen
- Schutz Ihrer internen Geschäftsinformationen
Datensicherheit mit BigID
Die BigID-Plattform bietet umfassende Möglichkeiten zum Schutz vertraulicher Unternehmensdaten. Sie bietet nicht nur zahlreiche Optionen zur Datenredaktion und -maskierung, sondern auch Funktionen zur Datenermittlung und -zuordnung.
Um herauszufinden, wie diese Plattform Sie bei Ihrer Datensicherheit und -verwaltung unterstützen kann, Vereinbaren Sie noch heute eine Demo!