KI-Agenten verhalten sich anders als herkömmliche KI oder Softwareanwendungen. Sie führen Aktionen aus, erweitern ihre Berechtigungen und interagieren mit externen Systemen – oft autonom. Werden sie wie Benutzer oder statische Dienste behandelt, kann ihr Risiko falsch eingeschätzt werden, wodurch Unternehmen Risiken wie dem sofortigen Einschleusen von Daten, der Manipulation von Systemen oder dem Datenverlust ausgesetzt sind.
Die Anpassung der Risikodefinitionen für Agenten bedeutet, sich auf deren Handlungsfähigkeit im Zeitverlauf, ihre Autonomie und ihr Agentenverhalten zu konzentrieren. Dies umfasst:
- Risikobewertung über Handlungsabläufe hinweg, nicht über einzelne Anfragen
- Berücksichtigung dynamischer Berechtigungsänderungen und der Nutzung von Werkzeugen
- Modellierung der kumulativen Auswirkungen anstatt nur des anfänglichen Zugangs
Ziel ist es, Risiko im Hinblick auf das Verhalten von KI-Agenten, Systeminteraktionen und Folgeeffekte neu zu definieren und so Transparenz hinsichtlich potenzieller Sicherheitsrisiken und der Offenlegung sensibler Informationen zu schaffen.
Wichtigste Erkenntnisse: Definitionen des Agentenrisikos
- KI-Agenten benötigen individuelle Risikodefinitionen, da sie Aktionen verketten, Berechtigungen eskalieren und autonom mit externen Systemen interagieren – generische Bewertungsmodelle erfassen nicht, wie Risiken in den Arbeitsabläufen der Agenten entstehen, und führen zu Fehlklassifizierungen.
- Für jeden Agenten müssen vier Kriterien bewertet werden: Zugriff auf sensible Daten, Berechtigungsstufen, externe Integrationen und autonome Aktionen – das Risiko ergibt sich aus der Kombination dieser Faktoren, nicht aus einem einzelnen.
- Hochrisiko-Agenten erfüllen zwei oder mehr der vier Kriterien – ein Agent, der auf PHI zugreift und einen externen LLM aufruft, gilt selbst dann als Hochrisiko-Agent, wenn er nur Daten liest, da der externe Aufruf einen unkontrollierten Ausgabepfad für regulierte Informationen schafft.
- Risikoklassifizierung ohne Richtlinienschwellenwerte ist lediglich eine Etikettierung – Schwellenwerte müssen die Bedingungen definieren, unter denen der Agentenzugriff gekennzeichnet, eingeschränkt oder widerrufen wird, und nicht nur überwacht werden.
- Die Durchsetzung des Prinzips der minimalen Berechtigungen auf Agentenebene ist unerlässlich – selbst Agenten mit umfassenden Zugriffsrechten müssen über Berechtigungen verfügen, die auf ihre spezifische Aufgabe beschränkt sind, um das Risiko zu minimieren.
- Die Aufdeckung von Schatten-KI ist eine Voraussetzung für ein effektives Risikomanagement – nicht autorisierte Akteure, die außerhalb des IT-Bereichs agieren, können im Rahmen keines Risikorahmens klassifiziert, überwacht oder kontrolliert werden.
Warum Agentenrisikodefinitionen nicht allgemein gehalten werden können
Agentenrisikodefinitionen klassifizieren das Schadenspotenzial eines KI-Agenten anhand seines Verhaltens, seines Datenzugriffs und seiner Berechtigungen. Im Gegensatz zu Benutzerrisikobewertungen müssen Agentenrisikodefinitionen autonome Aktionsketten und nicht nur den Zugriff in einer einzelnen Sitzung berücksichtigen.
Wirksame Definitionen sind an messbare Eingangsgrößen gebunden, wie zum Beispiel:
- Arten der abgerufenen Daten (z. B. sensible oder regulierte Daten)
- Aufgerufene Tools und externe Systeme
- Sequenzübergreifende Aktionen (Lesen, Transformieren, Schreiben)
Generische Scoring-Modelle erfassen oft nicht, wie Risiken in den Arbeitsabläufen von Agenten entstehen, was zu Fehlklassifizierungen und schwachen Kontrollen führt. Compliance-Rahmenwerke wie NIST AI RMF und EU-KI-Gesetz Artikel 10 Betonung der Steuerung von KI auf der Grundlage tatsächlicher Fähigkeiten und Dateninteraktionen.
Wichtige Kriterien zur Bewertung von KI-Agenten
Jeder Agent sollte anhand dieser vier Kriterien bewertet werden, bevor eine Risikostufe zugewiesen oder Schwellenwerte festgelegt werden:
- Zugriff auf sensible Daten: Liest, schreibt oder verschiebt regulierte Daten, z. B. personenbezogene Daten (PII), geschützte Gesundheitsdaten (PHI), Zahlungskarteninformationen (PCI), Zugangsdaten, Geheimnisse.
- Berechtigungsstufen: Funktioniert mit erweiterten Berechtigungen oder Konten mit umfassendem Zugriff.
- Externe Integrationen: Ruft APIs von Drittanbietern, externe KI-Modelle oder Systeme außerhalb Ihres Sicherheitsperimeters auf.
- Autonome Aktionen: Führt Vorgänge ohne menschliche Überprüfung durch, wie z. B. das Löschen von Datensätzen oder das Ändern von Konfigurationen.
Durch die Zuordnung Ihrer KI-Agenten zu diesen Kriterien wird die Transparenz hinsichtlich Agentenverhalten, Autonomie und Ausnutzungspotenzial erhöht, wodurch KI-Risiken vor dem Einsatz minimiert werden.
Die meisten Sicherheitsteams finden mindestens einen Agenten, der unerwartet sensible Informationen preisgeben oder ohne Aufsicht mit externen Systemen interagieren könnte.
Definition von Risikostufen
Risikostufen funktionieren nur, wenn die Definitionen präzise genug sind, um konsistente Klassifizierungsentscheidungen zu ermöglichen. Hier ist ein praktischer Ansatz, den Ihr Team sofort anwenden kann.
Hochrisiko-Agenten
Ein Agent gilt als Hochrisikoagent, wenn er zwei oder mehr der folgenden vier Kriterien erfüllt: Er greift auf regulierte Daten zu, verfügt über erhöhte Berechtigungen, ruft externe Systeme auf oder führt autonome Aktionen ohne Überprüfung aus.
Die Kombination ist entscheidend. Ein Agent, der auf PHI zugreift und ein externes LLM aufruft, birgt ein hohes Risiko, selbst wenn er Daten nur liest und nie schreibt, da der externe Aufruf einen unkontrollierten Ausgabepfad für regulierte Informationen schafft.
Agenten mit mittlerem Risiko
Agenten mit mittlerem Risiko greifen auf interne, nicht regulierte Daten zu, arbeiten mit Standardbenutzerberechtigungen und verfügen über begrenzte oder keine externen Integrationen.
Sie können zwar automatisierte Aktionen ausführen, diese sind jedoch begrenzt und reversibel. Der entscheidende Unterschied zu Hochrisikosystemen liegt im Fehlen einer Kombination aus regulierter Datenweitergabe und externen Systemaufrufen.
Agenten mit niedrigem Risiko
Agenten mit niedrigem Risiko haben nur Lesezugriff auf nicht sensible Informationen, tätigen keine externen Anrufe und erfordern eine menschliche Überprüfung, bevor auf irgendwelche Ergebnisse reagiert wird.
Diese Stufe verringert das Risiko von Sicherheitslücken oder Kompromittierungen und erhält gleichzeitig eine sinnvolle Autonomie aufrecht.
Richtlinienschwellenwerte für eingeschränkten Datenzugriff
Eine Risikoklassifizierung ohne Richtlinienschwellenwerte ist lediglich eine Etikettierung. Schwellenwerte definieren die Bedingungen, unter denen der Zugriff eines Agenten markiert, eingeschränkt oder widerrufen wird, nicht nur überwacht.
Verknüpfung von Schwellenwerten mit der Datenklassifizierung
Schwellenwerte sollten direkt mit den Klassifizierungen sensibler Informationen verknüpft sein. Beispielsweise löst der Zugriff auf mehr als das definierte PII-Volumen in einer einzelnen Sitzung Warnmeldungen, eine Zugriffssperrung oder Maßnahmen zur Behebung des Problems aus. KI-Risiken lassen sich durch die Durchsetzung von Schwellenwerten minimieren, die dynamisch auf Änderungen in Datensätzen oder im Verhalten von KI-Systemen reagieren.
Durchsetzung des Prinzips der minimalen Berechtigungen auf Agentenebene
Agenten sollten nur die für ihre Aufgabe erforderlichen Berechtigungen erhalten. Selbst wenn ein Agent unter einem Dienstkonto mit umfassenden Zugriffsrechten ausgeführt wird, reduziert das Prinzip der minimalen Berechtigungen die Anfälligkeit und begrenzt das Risiko von Sicherheitslücken. Automatisierte Aktualisierungen gewährleisten, dass die Schwellenwerte bei der Weiterentwicklung von KI-Systemen oder neuen Implementierungen stets angepasst bleiben.
Wie BigID eine richtlinienbasierte Agenten-Risikomanagementsteuerung ermöglicht
BigID verknüpft Risikodefinitionen direkt mit der automatisierten Durchsetzung und eliminiert so manuelle Prüfungen. Es erkennt Agenten, Modelle, Datensätze und Eingabeaufforderungen in Ihrer gesamten Umgebung – einschließlich Schatten-KI – und ordnet diese den Daten und Berechtigungen zu, auf die sie zugreifen.
Die Agenten werden automatisch bewertet, und bei Überschreitung von Richtlinienschwellenwerten werden sofortige Korrekturmaßnahmen eingeleitet. Zu diesen Maßnahmen gehören die Anpassung von Berechtigungen, die Isolierung von Daten, die Schwärzung von Geheimnissen oder die Delegierung von Aufgaben. Alle Vorgänge werden zu Prüfungs- und Compliance-Zwecken protokolliert.
Die kontinuierliche Überwachung gewährleistet, dass Risikobewertungen und Richtlinien stets aktuell bleiben, wenn sich die Akteure weiterentwickeln oder sich Datenklassifizierungen ändern.
Erfahren Sie, wie BigID Sie bei der automatischen Durchsetzung von Agentenrisikorichtlinien unterstützen und Ihnen helfen kann, sich ständig weiterentwickelnden Datenbedrohungen einen Schritt voraus zu sein.Starten Sie noch heute Ihre Bewertung.
Häufig gestellte Fragen zu Agentenrisikodefinitionen
Was macht einen KI-Agenten zu einem Hochrisiko-System?
Ein Agent gilt als risikoreich, wenn er zwei oder mehr Kriterien erfüllt: Zugriff auf sensible Informationen, erhöhte Berechtigungen, Aufruf externer Systeme über eine API oder Ausführung autonomer Aktionen. Das KI-Risiko ergibt sich aus der Kombination dieser Faktoren, nicht aus einem einzelnen Kriterium.
Wie lege ich Risikoschwellenwerte für KI-Agenten fest?
Die Schwellenwerte sollten an die Datenklassifizierungsstufen gekoppelt sein und potenzielle Risiken wie Kompromittierung, Einschleusung oder Vergiftung berücksichtigen. Maßnahmen sollten Risikominderungsmaßnahmen auslösen und nicht nur die Überwachung.
Auf welche Daten sollten KI-Agenten niemals zugreifen?
Mitarbeiter sollten nur auf die für ihre Aufgaben erforderlichen Daten zugreifen. Sensible Informationen wie personenbezogene Daten (PII), Gesundheitsdaten (PHI), PCI-Daten, Zugangsdaten oder Geschäftsgeheimnisse müssen streng kontrolliert werden, um die Gefährdung und Schwachstellen von KI-Systemen zu minimieren.
Wie kann ich im Verborgenen agierende KI-Agenten steuern, von denen ich nichts weiß?
Die Erkennung ist entscheidend. Automatisierte Systeme wie BigID identifizieren nicht autorisierte Agenten, wenden Ihr Risikomanagement-Framework an und minimieren potenzielle Sicherheitslücken vor der Bereitstellung.
Wie lässt sich das Prinzip der minimalen Privilegien auf KI-Agenten anwenden?
Die Beschränkung der Agentenautonomie auf die minimal erforderlichen Berechtigungen reduziert das KI-Risiko, verhindert Poisoning oder Prompt Injection und mindert Sicherheitsrisiken bei der Bereitstellung.

