Um Ihre Daten zu verwalten und zu schützen, müssen Sie nicht nur wissen, wo sie sind, sondern auch, wem sie gehören, und Was Das ist es. Traditionelle Klassifizierungsansätze konzentrieren sich entweder auf manuelles Tagging oder ressourcenintensives Musterabgleichsverfahren (das nicht immer zuverlässig ist). Angesichts der Geschwindigkeit und Vielfalt des Datenwachstums – ob in Big-Data-Repositorys oder zwischen Cloud-Speichern und Data Lakes – sind diese traditionellen Ansätze weder skalierbar noch nachhaltig und bieten nicht den notwendigen Kontext, um die Datenschutz- und Sicherheitsherausforderungen der heutigen Umgebung zu bewältigen.
Aus diesem Grund verfolgt BigID einen anderen Klassifizierungsansatz: Er basiert nicht auf dem, was in der Vergangenheit funktioniert hat, oder auf der Ermittlung dessen, was durch bestimmte Gesetze abgedeckt ist, sondern verfolgt einen von Grund auf neu entwickelten datenschutzorientierten Ansatz.
Das bedeutet, sich die Daten anzusehen – alle Daten, wo auch immer es sich befindet – und Wege zu finden, unterschiedliche Datenpunkte zu klassifizieren, zu markieren und zu sinnvollen Beziehungen, Identitäten und Profilen zu verknüpfen.
BigID verfolgt einen umfassenden und umfassenden Ansatz zur Datenerfassung: Es findet Daten, wo immer sie vorhanden sind, und ordnet sie in Kontext und Korrelation ein, um sie zu klassifizieren. Dieser Ansatz baut auf traditionelleren Klassifizierungsmethoden auf und erweitert diese. Er deckt verschiedene Arten sensibler Informationen ab – von persönlich identifizierbar Informationen zu Profil Informationen zu umfassenderen sensiblen Informationen.
Wie macht BigID das? Wir haben einige Möglichkeiten – alle speziell für die heutige Datenumgebung (und deren Volumen und Vielfalt) entwickelt.
Reguläre Ausdrücke und Mustervergleich
Bei dieser Technik handelt es sich um die traditionellste Klassifizierungsmethode für Daten. Sie gleicht bekannte Ausdrücke und Muster mit den in Ihren Daten enthaltenen Informationen ab.
MasterCard-Kreditkartennummern sind beispielsweise sechzehnstellige Zahlen, die mit 5262 beginnen. Daher ist es durchaus plausibel, dass jede sechzehnstellige Ganzzahlzeichenfolge, die mit 5262 beginnt, als MasterCard-Kreditkartennummer bezeichnet werden kann.
Auch musterbasierte Kennungen wie Postleitzahlen, IBAN-Nummern, Sozialversicherungsnummern und mehr können in diese Kategorie fallen: Wenn Sie die Struktur der Informationen, die Sie abgleichen möchten, bereits kennen, können Sie ähnliche Muster innerhalb eines Datensatzes erkennen.
Der herkömmliche Musterabgleich wird häufig durch Vorschriften festgelegt: Wenn beispielsweise PCI-DSS vorschreibt, dass Organisationen in der Lage sein müssen, Kreditkartennummern zu identifizieren, können Muster für Kreditkartennummern schnell analysiert und einem Satz Wörterbücher hinzugefügt werden.
Die Klassifizierung durch Mustervergleich ist keineswegs veraltet – es ist jedoch wichtig, mehr als nur die Mindestanforderungen zu berücksichtigen.
Wir haben beispielsweise Sicherheitskennungen hinzugefügt, damit Organisationen sicherheitsrelevante Datenpunkte wie API-Schlüssel, Anmeldeinformationen, Token und sogar gängige Passwörter identifizieren können.
Bei manchen Datentypen ist Mustervergleich also die Lösung.
Kontextuelle Klassifizierung
Wesentlich schwieriger zu klassifizieren sind Datensätze, die keinem vorgegebenen oder konsistenten Muster folgen: Es ist schwierig, „freundliche Namen“ zu identifizieren – geschweige denn, sie im Kontext einer bestimmten Identität zu sehen. Der Kontext ist auch entscheidend, um zwischen zwei Datenwerten zu unterscheiden, die zwar ähnliche Formate haben, aber zwei unterschiedliche Informationstypen darstellen (z. B. eine Sozialversicherungsnummer und eine Kontonummer).
Können Ihre herkömmlichen Klassifizierungstools eine bestimmte Sozialversicherungsnummer mit einem Vornamen, einer Augenfarbe, einem geografischen Standort und Bildungsinformationen korrelieren – alles im Zusammenhang mit einer einzelnen Person oder Identität?
Nein. Aber BigID kann das.
BigID nutzt Maschinelles Lernen (ML) und Named Entity Recognition (NER) um nicht nur sensible Informationen wie Wahlverhalten, Social-Media-Aktivitäten oder Körpergröße automatisch anhand von Schlussfolgerungen oder anderen Techniken zu identifizieren, sondern auch, um diese spezifischen sensiblen Informationen mit einer individuellen Identität oder einem individuellen Profil zu verknüpfen.
Die Gesetzgebung zum Datenschutz und zur Datensicherheit erweitert die Definition persönlicher Informationen (und damit auch, was Typ von Informationen muss geschützt werden), und das gilt auch für Ihre Klassifizierungs- und Discovery-Lösungen.
Dateiklassifizierer nach Typ
Angesichts des stetig wachsenden Datenvolumens ist es wichtig, die richtigen Arten von Informationen mit den richtigen Richtlinien zu schützen: Für juristische Dokumente gilt eine Richtlinie, für Finanzdokumente eine andere und so weiter und so fort.
Deshalb haben wir die Dateiklassifizierung nach Typ in unser Arsenal aufgenommen: BigID verfügt über Machine-Learning-Modelle, die Dokumente automatisch anhand von Inhalt und Struktur einer Datei klassifizieren – ohne auf einen bestimmten Datenklassifizierer beschränkt zu sein. Diese Modelle können sensible Dateitypen erkennen: von Finanzberichten über Bordkarten bis hin zu Entlassungsberichten. Fusions- und Übernahmedokumentation und mehr.
Damit Unternehmen sicherstellen können, dass sie über den richtigen Datenschutz verfügen, müssen sie diesen zunächst einfach und genau identifizieren können.
Richtlinienbasierte Klassifizierung
Unter allen Arten der Klassifizierung und Datenermittlung sind Datenschutzbestimmungen und Datenschutzbestimmungen der größte Treiber hierfür. Von GDPR gemäß CCPA NYDFS Von HIPAA über SOX bis GLBA (… die Liste geht weiter) müssen Organisationen in der Lage sein, bestimmte Datentypen zu identifizieren, die bestimmten Vorschriften unterliegen, und Richtlinien zur Verwaltung und zum Schutz dieser Daten zu erlassen.
BigID verfügt über integrierte Richtlinienbibliotheken, die die Klassifizierung, Verwaltung und den Schutz bestimmter Datentypen anhand von Richtlinien unterstützen: von ID-Nummern und Passwörtern, die unter den CCPA fallen, über nationale Identitätssysteme der DSGVO bis hin zu Kreditkarteninformationen, die unter PCI fallen. Die Klassifizierung und Verwaltung von Daten anhand von Richtlinien ermöglicht es Unternehmen, Workflows für diesen spezifischen Datentyp zu erstellen, den Zugriff zu verwalten, die Nutzung zu überwachen und sensible Daten vor möglichen Angriffen zu schützen.
Klassifizierung überall
Datenwachstum, Datenwert und Datenbedeutung entwickeln sich rasant – und die geltenden Richtlinien und Vorschriften folgen diesen Entwicklungen. Mit der Entwicklung der Datenwelt wächst auch der Wert personenbezogener und sensibler Daten sowie der Richtlinien zu deren Schutz. Deshalb denkt BigID die Klassifizierung neu: Es revolutioniert die Datenklassifizierung und Entdeckung mit einem erweiterbaren, datenzentrierten Ansatz.
Datenschutzbestimmungen wie der New Yorker SHIELD Act erweitern nicht nur die Definition „personenbezogener Daten“, sondern ergänzen die traditionellen Klassifizierungsempfehlungen um zusätzliche Ebenen: Organisationen müssen Daten – wie Benutzername und E-Mail-Adresse in Kombination mit einem Passwort oder einer Sicherheitsfrage – korrelieren können, um die empfohlenen Sicherheitsmaßnahmen anzuwenden. Der SHIELD Act, ein Vorbote der nächsten Welle von Gesetzen zur Meldung von Datenschutzverletzungen, erweitert sowohl die Art der abgedeckten Daten als auch die Definition dessen, was eine Datenschutzverletzung darstellt.
Erfolgreiche Automatisierung von Datenschutz und Privatsphäre hängt davon ab, alle sensiblen Informationen – unabhängig von ihrem Speicherort – präzise zu erkennen, zu klassifizieren, zu korrelieren und zu katalogisieren. Musterabgleich allein reicht nicht mehr aus: Unternehmen müssen Daten einer Identität zuordnen, Beziehungen zwischen einzelnen Instanzen sensibler Daten herstellen, sowohl direkte als auch abgeleitete sensible oder personenbezogene Informationen automatisch identifizieren und Prozesse und Richtlinien zum Schutz und zur Verwaltung dieser Daten etablieren können.
Die Erkennung, Klassifizierung und Korrelation von BigID erstreckt sich auf unstrukturierte, strukturierte und halbstrukturierte Daten im Petabyte-Bereich und gilt für alles von Cassandra bis Amazon S3 zu CIFS zu Gmail zu Couchbase zu Box zu Hadoop und überall dazwischen: Sie erhalten ein einheitliches Inventar Ihrer sensiblen Daten – alles an einem Ort.
Mit einem datenbasierten, innovativen Klassifizierungsansatz klassifiziert BigID sensible Daten und Dateien aller Art intelligent (und automatisch), unabhängig vom Speicherort – unternehmensweit. Möchten Sie es in Aktion sehen? Demo anfordern um zu sehen, wie BigID die Klassifizierung anders vornimmt.