Mehr als 2,5 Trillionen Bytes an Daten werden täglich erstellt und größtenteils nie gelöscht. Sie fließen in Form strukturierter und unstrukturierter Daten aus verschiedenen Geschäftseinheiten in zahlreiche Systeme und in Geschäftsanwendungen. Unternehmen erstellen Data Lakes und Data Warehouses für Business Intelligence und Analysezwecke, die Hunderttausende von Tabellen und Datenelementen mit Tausenden von Spalten enthalten. Einige davon werden maschinell generiert, andere aus anderen Basisdaten abgeleitet.
Es sind riesige Datenmengen, und Unternehmen haben Mühe, mit deren Erfassung Schritt zu halten. Die meisten großen Unternehmen wissen nicht, welche Daten sie unternehmensweit erfassen und wo sie gespeichert sind. Daten werden vom Aktivposten zur Belastung.
Das muss sich ändern, denn der Einsatz war noch nie so hoch. Neue Datenschutzbestimmungen in der EU, Kalifornien und weltweit erfordern Organisationen, alle von ihnen gespeicherten Daten und deren Speicherort zu kennen. Beispielsweise müssen Unternehmen in der Lage sein, alle Daten europäischer Bürger zu finden, um die GDPRSie müssen in der Lage sein, Informationen über Minderjährige zu finden und auf Anfrage die Daten jeder Person zu finden und zu löschen. Wie soll das gelingen, wenn man auf Petabytes an Daten sitzt? Wie kann man im Falle eines Datenlecks feststellen, wessen Daten gestohlen wurden? Wie kann man die Privatsphäre seiner Kunden angemessen schützen, wenn man nicht über eine ordnungsgemäße Erfassung aller gespeicherten Daten verfügt?
Traditionelle Data Discovery Tools helfen nicht viel, wenn es darum geht, PI/PII finden Sie müssen die Daten streamen, um sie zu scannen, was angesichts der großen Datenmengen, über die Unternehmen heute verfügen, nicht praktikabel ist. Sie können nur identifizierbare Informationen wie Sozialversicherungsnummer oder Telefonnummer finden, nicht aber kontextbezogene persönliche Informationen wie das Geburtsdatum. Sie können nicht bei den Rechten der betroffenen Personen helfen; sie geben nur Auskunft über die Art der Daten (Klassifizierung), können aber nicht sagen, wessen Daten es sind, um Einzelpersonen zu melden oder deren Daten zu löschen. Und sie bieten nur eingeschränkte Unterstützung für verschiedene DatenquellenWenn ein Datensubjekt gelöscht werden muss, muss es überall gelöscht werden, sei es in Hadoop, Snowflake, AWS EMR, SAP HANA, Cassandra oder MongoDB Atlas oder anderen Repositories. Durch den Einsatz von KI-Analysen und mehreren Eingabekanälen tauchen Daten wieder auf, was bedeutet, dass Sie die Löschung kontinuierlich validieren müssen.
Die BigID-Lösung – Big Data Native und Entity Centric

BigID schließt diese Lücken mit dem umfassendsten Angebot und ermöglicht es Unternehmen, alle ihre Daten zu finden und zu verwalten, unabhängig davon, wo sie gespeichert sind, um welchen Typ es sich handelt und in welchem Format sie vorliegen.
Der umfassendste Schutz – Die durch maschinelles Lernen gesteuerte Erkennung und Klassifizierung von Daten umfasst eine große Anzahl von Big Data-Repositories: Hadoop, Hive, HBase, Schneeflocke, AWS Redshift, AWS EMR, AWS DynamoDB, Cassandra, CouchBase, MongoDB, SAP HANA, ElasticSearch und Redis. Neben Big Data unterstützt BigID unstrukturierte Dateien in Windows-Freigaben, Exchange, Gdrive, Box, AWS S3, Azure Storage, NetApp und EMC. Alle wichtigen Geschäftsanwendungen werden unterstützt. Während Geschäftsanwendungen Daten in Big-Data-Repositories einspeisen und von dort nutzen, kann BigID diese Systeme scannen, um die Daten gesamtheitlich zu erfassen. BigID ist mit Collibra, ASG, SAP und Salesforce SFDC integriert. Microsoft, Ionisch, Immuta, ServiceNow, NetSuite, Werktag, Zendesk, Jira, ServiceNow, SurveyMonkey und andere.
Big Data Native – BigID bietet Flexibilität und ist in verschiedenen Umgebungen einsetzbar. Es läuft nativ in Big-Data-Umgebungen wie MapReduce oder als benutzerdefinierte Funktion in Data Warehouses und nutzt deren parallele Verarbeitungsfunktionen, um umfangreiche Scans durchzuführen, ohne die Daten aus dem Data Warehouse streamen zu müssen. Die Cloud-native Architektur ermöglicht den Einsatz von BigID in jeder Kubernetes-Umgebung mit automatisierter lateraler Skalierung, die hybride Bereitstellungen sowohl vor Ort als auch in der Cloud unterstützt. Intelligentes, KI-gestütztes Sampling liefert präzise Ergebnisse durch die Prüfung der Petabyte an Daten. KI nutzt diese, um Fehlalarme und Fehlalarme zu reduzieren und Datenqualitätsindikatoren bereitzustellen, die das Datenqualitätsmanagement im großen Maßstab unterstützen.
Entitätszentrierte Korrelation – Die ML-gesteuerte Identitätskorrelation ermöglicht es, alle Daten einer bestimmten Person in allen Datenquellen mit extrem hoher und messbarer Genauigkeit zu finden. Dies ermöglicht die Operationalisierung und Automatisierung von Anfragen betroffener Personen. Compliance-Funktionen validieren kontinuierlich und senden Warnmeldungen, wenn Daten einer Person, die deren Löschung beantragt hat, wieder auftauchen. Dateneigentümer werden über neue Datensätze informiert, sobald diese entdeckt werden. BigID erzwingt die Zustimmung und überprüft, ob Personen, deren Daten im Data Warehouse gefunden wurden, tatsächlich ihre Zustimmung erteilt haben.
Darüber hinaus kann BigID Ihnen im Falle einer Sicherheitsverletzung mitteilen, wessen Daten betroffen sind.
KI-gestützte PI-Erkennung – Organisationen können schnell und einfach die genauen Daten finden, nach denen sie suchen. Intelligentes, KI-gestütztes Sampling liefert präzise Ergebnisse durch die Prüfung der Petabyte an Daten. ML-gesteuerte Erkennung ermöglicht die Erkennung aller mit einer Person korrelierten Daten, nicht nur der sensiblen Daten an sich. So können alle Transaktionen, Laufwege, Geburtsdaten, Geschlecht, Religion usw. eines Benutzers ermittelt werden.
Angesichts des heutigen regulatorischen Umfelds können es sich Unternehmen nicht leisten, ihre Daten zu übersehen. Sie müssen genau wissen, über welche Daten sie verfügen, und dafür einen umfassenden und integrierten Ansatz verfolgen. Mit BigID können sie Vorschriften einhalten, ihre Daten schützen und den Datenschutz besser gewährleisten.