
Ethische Grundlagen
Auf der Grundlage starker ethischer Prinzipien mit dem Leitprinzip, dass Entscheidungen bei der Entwicklung von KI-Funktionen auf Fairness, Respekt und Integrität beruhen.
Auf der Grundlage starker ethischer Prinzipien mit dem Leitprinzip, dass Entscheidungen bei der Entwicklung von KI-Funktionen auf Fairness, Respekt und Integrität beruhen.
Die Wahrung der Sicherheit und des Datenschutzes von Kundendaten hat von der Idee bis zur Implementierung aller KI-Funktionen Priorität. Die KI-Funktionen sind so konzipiert, dass die Kundendaten während des gesamten Datenlebenszyklus geschützt werden.
BigID hat sich verpflichtet, die Funktionsweise der KI-Funktionen transparent darzustellen, damit die Kunden verstehen, wie ihre Daten verwendet werden.
Die KI-Funktionen von BigID wurden entwickelt, um die Kontrolle in die Hände unserer Kunden zu legen und Ihnen Werkzeuge an die Hand zu geben, mit denen Sie fundierte Entscheidungen über die Verwendung Ihrer Daten treffen können.
Die optionalen KI-Komponenten innerhalb der BigID-Plattform dienen verschiedenen unterstützenden Funktionen, wie z. B. der Verbesserung der Dateneinsicht, der Beschleunigung von Scans und der Verbesserung der Produktnutzbarkeit. Die Plattform arbeitet nach dem Prinzip "Kenne deine Daten", und die KI-Funktionen verbessern das Datenverständnis, indem sie präzisere, umsetzbare Erkenntnisse liefern. Wenn sich Kunden für diese KI-Funktionen entscheiden, kann KI den Nutzern helfen, schneller ein tieferes Verständnis ihrer Daten zu erlangen, was die Datenverwaltung und die Einhaltung von Vorschriften erleichtert.
Alle AI-Funktionen in BigID sind standardmäßig deaktiviert, um die Kontrolle durch den Benutzer zu erleichtern. Es steht eine ausführliche Dokumentation zur Verfügung, die Kunden durch den Prozess der Aktivierung und Konfiguration von KI-Funktionen entsprechend den Präferenzen jedes Kunden führt. Kunden können die KI-Funktionen von BigID vor der Nutzung bewerten und diese Funktionen nur in Übereinstimmung mit den KI-Governance-Richtlinien ihres Unternehmens einsetzen.
Maschinelles Lernen ist eine Art der künstlichen Intelligenz, die es Systemen ermöglicht, Muster zu finden und Vorhersagen zu treffen, indem sie ohne explizite Programmierung aus Daten lernen. Die ML-Funktionen in der BigID-Plattform helfen dabei, die Effizienz und Präzision von Datenscans auf verschiedene Weise zu verbessern, wie in diesem Abschnitt näher beschrieben.
BigID entwickelt seine ML-Modelle in einer Laborumgebung mit öffentlich verfügbaren und synthetischen Daten. Zwei der ML-Funktionen der BigID-Plattform, Hyperscan und Classifiers, können mithilfe von Kunden-Metadaten weiter an die Umgebung des Kunden angepasst werden. Diese Modelle werden nur dann mithilfe von Kunden-Metadaten feinabgestimmt, wenn sich der Kunde ausdrücklich dafür entscheidet, seine Metadaten zu diesem Zweck zu verwenden. Hyperscan- und Classifiers-Modelle, die auf Basis von Kunden-Metadaten trainiert wurden, werden immer lokal gespeichert und ausgeführt, was bedeutet, dass sie auf die Umgebung des jeweiligen Kunden beschränkt sind und nur diesem zur Verfügung stehen. Feinabgestimmte Modelle werden nicht über Kundenumgebungen hinweg gemeinsam genutzt oder von BigID im Namen anderer Kunden verwendet. Kunden können alle anderen KI-Funktionen nutzen, auch wenn sie sich entscheiden, ihre Metadaten nicht zur Feinabstimmung der Hyperscan- und Classifier-Modelle auf ihre Umgebung zu verwenden.
Das Clustering von Dokumenten und Dateien ist ein unüberwachter Algorithmus für maschinelles Lernen, der ähnliche Dateien auf der Grundlage ihres Inhalts gruppiert. Diese Funktion hilft BigID-Nutzern, ihre Dokumente effizienter zu organisieren und zu verwalten. Durch die Analyse des Inhalts von Textdokumenten kann BigID Dateien wie Verträge, NDAs und Rechnungen in separaten Clustern gruppieren, ohne dass die Anzahl der Cluster im Voraus bekannt sein muss.
Predictive Discovery oder HyperScan ist ein ML-Modell, das den Zeitaufwand für das Scannen unstrukturierter Datenquellen verringert, indem es das Vorhandensein sensibler Informationen auf der Grundlage von Metadaten (z. B. Dateipfad, Eigentümer, Dateierweiterung) vorhersagt. BigID bietet seinen Kunden die Möglichkeit, sich dafür zu entscheiden, dass das Modell von den Metadaten lernt, die während der Datenscans gesammelt wurden, um Vorhersagen zu treffen. Durch die Verwendung von Metadaten beschleunigt dieses Modell den Scanprozess und ermöglicht es den Benutzern, Dateien mit sensiblen Informationen schneller zu identifizieren.
ML-Enhanced Classifiers in BigID wurden entwickelt, um falsch-positive Ergebnisse bei der RegEx-basierten Datenklassifizierung zu reduzieren. Durch die Analyse der Metadaten von echten und falschen Positivmeldungen lernt das Modell, die Klassifizierungsergebnisse anzupassen und Fehler zu reduzieren. Dieses Modell verbessert die Genauigkeit der Klassifizierung, die derzeit nur auf strukturierte Datenquellen anwendbar ist, und steigert so die Präzision der Datenerkennung.
NER ist eine Aufgabe der natürlichen Sprachverarbeitung (NLP), die benannte Entitäten (z. B. Personen, Orte) in unstrukturierten Daten (normalerweise in Dokumenten oder Freitextspalten) identifiziert. BigID verwendet NER, um persönliche Informationen durch die Analyse unstrukturierter Datenquellen zu klassifizieren. Die NER-Modelle werden mit Hilfe von Deep Learning entwickelt und lokal in den einzelnen BigID-Scannern der Kunden ausgeführt, um die Effizienz und Sicherheit zu erhöhen.
Column/Dataset Clustering ist ein unüberwachter Algorithmus, der ähnliche Spalten auf der Grundlage von Datenmustern gruppiert. So werden beispielsweise Spalten, die Telefonnummern enthalten, in einem Cluster zusammengefasst. Durch den Vergleich von Spaltenvektoren anhand der Kosinusähnlichkeit kann BigID große Datensätze effizienter verwalten und analysieren. Diese Funktion hilft auch dabei, nahezu doppelte Datensätze zu erkennen und qualitativ hochwertigere Daten für die Analyse vorzuschlagen.
BigID entwickelt seine auf dem Large Language Model (LLM) basierenden KI-Funktionen unter Verwendung von vortrainierten Modellen und unter Einhaltung strenger Sicherheitsverfahren und Privacy by Design-Prinzipien. BigID trainiert keine eigenen LLMs und gibt keine Kundendaten an Drittanbieter für die Entwicklung oder das Training von LLMs weiter. Die GenAI-Funktionen von BigID verwenden angemessene Sicherheitsmaßnahmen, einschließlich privater Netzwerke und privater Endpunkte. BigChat verwendet außerdem Limited Life Memory-Server, die keine übertragenen Prompts oder Antworten speichern. BigID nutzt Azure OpenAI GPT, um BigChat und die Business Asset Mapping-Funktion zu betreiben. BigChat und die Business Asset Mapping-Funktion sind nur über verschlüsselte Kanäle nutzbar, und die Verbindungen zu Azure werden über VPN verwaltet, damit der Datenverkehr nicht durch nicht vertrauenswürdige Netzwerke läuft.
Optional für Kunden und nur auf Opt-in-Basis
BigID hat einen Q&A-Bot namens BigChat eingeführt, der auf GenAI-Technologie basiert. Die Funktion von BigChat beschränkt sich auf die Unterstützung der Nutzer bei der Navigation und Fehlerbehebung auf der BigID-Plattform. BigChat interagiert nur mit der Softwaredokumentation und produktbezogenen Informationen von BigID und speichert oder verwendet keine gemeinsamen Benutzerinformationen oder Kundendaten, um das Modell zu trainieren oder zu optimieren.
Optional für Kunden und nur auf Opt-in-Basis
Mit dieser GenAI-Funktion kann BigID ein vom Kunden bereitgestelltes Geschäftsglossar aufnehmen und die Tabellenspalten der angeschlossenen Datenquellen mit den Begriffen des Glossars beschriften. Dazu werden die Inhalte der Tabelle, nahe gelegene Spalten und andere Kontextinformationen analysiert, um eine geeignete Bezeichnung zu ermitteln. Diese optionale Funktion zielt darauf ab, den manuellen Aufwand und die Fehler zu reduzieren, die mit der traditionellen Datenverwaltung verbunden sind, und ist auf die Parameter beschränkt, die von jedem Kunden anhand des von ihm bereitgestellten Geschäftsglossars festgelegt werden. Kunden können die von dieser Funktion vorgeschlagenen Bezeichnungen bearbeiten.
Die KI-Funktionen von BigID werden mit öffentlich zugänglichen und synthetischen Daten oder vorab trainierten Modellen entwickelt. BigID verwendet keine Benutzerinformationen oder Kundendaten, um generative KI-Funktionen oder die grundlegenden Machine-Learning-Modelle zu trainieren. Zwei der Machine-Learning-Funktionen der BigID-Plattform, Hyperscan und Classifiers, können anhand von Kunden-Metadaten auf die Umgebung des jeweiligen Kunden abgestimmt werden. Diese Modelle werden jedoch nur dann mithilfe von Kunden-Metadaten feinabgestimmt, wenn sich der Kunde ausdrücklich dafür entscheidet, seine Metadaten zu diesem Zweck zu verwenden. Darüber hinaus werden feinabgestimmte Modelle immer lokal gespeichert und ausgeführt, d. h. sie sind auf die Umgebung des einzelnen Kunden beschränkt und nur für diesen verfügbar. Feinabgestimmte Modelle werden niemals für andere Kundenumgebungen freigegeben oder von BigID im Namen anderer Kunden verwendet.
BigID hat maßgeschneiderte Sicherheitskontrollen und -tests implementiert, um die mit der KI-Nutzung innerhalb unserer Plattform verbundenen Risiken zu mindern. BigID führt bei allen Initiativen vor der Einführung KI-Bewertungen durch, wobei der Schwerpunkt auf der Minderung kritischer Risiken liegt. Bei diesen Bewertungen werden die vorhandenen Datenschutz- und Sicherheitskontrollen bewertet und auf algorithmische Voreingenommenheit und Diskriminierung geprüft, wobei die Einhaltung aller Gesetze und Vorschriften, die für die Bereitstellung der BigID-Plattform gelten, sowie die Ausrichtung an geltenden ethischen Standards Priorität haben. BigID legt auch die Kontrolle über die KI-Funktionen in die Hände des Nutzers, indem die KI-Funktionen standardmäßig deaktiviert werden.
BigID legt großen Wert auf die Einhaltung aller relevanten Gesetze und Vorschriften, die für die Bereitstellung der BigID-Plattform in den Ländern gelten, in denen wir tätig sind, einschließlich der geltenden Gesetze für die Entwicklung und Bereitstellung von KI-Funktionen. Wir wissen, wie wichtig die Einhaltung dieser Standards für den Schutz Ihrer Daten ist.
BigID ist bestrebt, seine KI-Funktionen regelmäßig zu aktualisieren und zu verbessern. Das Unternehmen verfolgt eine kontinuierliche Verbesserungsstrategie, zu der auch das Hinzufügen neuer optionaler Funktionen gehört, um den Dateneinblick zu verbessern und unseren Kunden leistungsfähigere Tools zur Verfügung zu stellen. Das Ziel von BigID ist es, die KI-Funktionen an der Spitze der Innovation zu halten und gleichzeitig weiterhin hohe Standards für Datenschutz und Sicherheit zu verfolgen.