Zum Inhalt springen
Alle Beiträge anzeigen

Intelligentere Klassifizierung für Datenattribute, Metadaten und Dateien

BigID nutzt verschiedene Methoden zum Suchen und Kategorisieren von Daten. Dazu gehört die traditionelle musterbasierte Klassifizierung zum Auffinden von Daten einer bestimmten Form oder eines bestimmten Typs. Herkömmliche Klassifizierungstechnologien, wie sie in älteren DLP- oder Data Access Governance-Sicherheitstools zum Einsatz kommen, basieren hauptsächlich auf regulären Ausdrücken, um exakte Übereinstimmungen in Datenstrings wie Kreditkarten oder Personalausweisen zu finden. BigID modernisiert diese Ansätze mit neuer intelligenter Validierung und kombiniert sie gleichzeitig mit neueren ML- und KI-Ansätzen, um die Genauigkeit zu erhöhen und ihren Anwendungsbereich auf Metadaten und Dokumente auszuweiten.

BigID bietet Unternehmen eine erweiterbare Bibliothek vordefinierter Klassifizierungen mit intelligenten Regeln und Validierungsprüfungen zur Vermeidung von Fehlalarmen. BigID kombiniert diese Klassifizierungsmethode mit unscharfen Mustern und nutzt dabei maschinelles Lernen, um ähnliche strukturierte Datenentitätsnamen und -attribute präzise zu trennen. Darüber hinaus können die intelligenten Entitätsklassifizierer von BigID nicht nur mit unstrukturierten Dateien und strukturierten Datenbanken arbeiten, sondern mit nahezu allen Systemen, mit denen BigID eine Verbindung herstellen kann. Dazu gehören NoSQL, Big Data, SaaS, IaaS, Mainframe, Datenpipelines und -streams und mehr.

Doch BigID geht noch weiter: Da Data-Governance-Organisationen zunehmend Metadatenmanagement-Tools zur Steuerung ihres Informationslebenszyklus einsetzen, bietet BigID erstmals auch die intelligente Klassifizierung für das Metadatenmanagement an. BigID unterstützt Unternehmen nicht nur bei der Neuklassifizierung falsch kategorisierter Metadaten, sondern vereinfacht auch den mühsamen und fehleranfälligen Prozess der Zuordnung physischer Daten zu logischen Datendefinitionen. Mit BigID lassen sich vorhandene Register einfacher ihren tatsächlichen Datenattributen zuordnen. Wo keine logischen Datendefinitionen oder Register vorhanden sind, kann BigID zudem Definitionen aus den klassifizierten Metadaten und Datenattributen empfehlen.

Datenattribute, Entitäten und Metadaten sind jedoch nicht die einzigen Datenformate, die Unternehmen bei der Kategorisierung ihrer Informationen klassifizieren möchten. In den letzten Jahren erlebten Unternehmen eine explosionsartige Zunahme an unstrukturierten Dokumenten sowie der Erstellung und Speicherung von Formularen. In vielen Unternehmen repräsentieren diese Dokumente oder Dateien viele Petabyte an Informationen, die auf veralteten NAS-Systemen wie NetApp oder EMC oder modernen Dateispeichern wie Box, O365, GDrive, S3, Salesforce, SharePoint und anderen gespeichert sind. BigID hat daher eine Deep-Learning-basierte Dateiklassifizierung eingeführt, um Unternehmen bei der Kategorisierung und Kennzeichnung ihrer riesigen Mengen unstrukturierter Daten zu unterstützen. BigID bietet viele vortrainierte Dokumentklassifizierungen sofort einsatzbereit, bietet Unternehmen aber auch die Möglichkeit, die Dokumenten-KI von BigID anhand ihrer eigenen Daten zu trainieren.