Ir al contenido

¿Cómo personalizo las definiciones de riesgo de los agentes?

Los agentes de IA se comportan de manera diferente a las aplicaciones de IA o software tradicionales. Encadenan acciones, escalan privilegios e interactúan con sistemas externos, a menudo de forma autónoma. Tratarlos como usuarios o servicios estáticos puede llevar a una clasificación errónea de su riesgo, dejando a las organizaciones expuestas a riesgos asociados a los agentes de IA, como la inyección instantánea, el envenenamiento o la filtración de datos.

Personalizar las definiciones de riesgo de los agentes implica centrarse en lo que los agentes pueden hacer a lo largo del tiempo, su autonomía y su comportamiento. Esto incluye:

  • Evaluar el riesgo en secuencias de acciones, no en solicitudes aisladas.
  • Consideración de los cambios dinámicos de privilegios y el uso de herramientas
  • Modelar el impacto acumulativo en lugar de solo el acceso inicial.

El objetivo es redefinir el riesgo en términos del comportamiento de la IA como agente, las interacciones del sistema y los efectos posteriores, lo que permite tener visibilidad de los posibles riesgos de seguridad y la exposición de información confidencial.

Conclusiones clave: Definiciones de riesgo del agente

  • Los agentes de IA requieren definiciones de riesgo personalizadas porque encadenan acciones, escalan privilegios e interactúan con sistemas externos de forma autónoma; los modelos de puntuación genéricos no tienen en cuenta cómo surge el riesgo en los flujos de trabajo de los agentes y conducen a una clasificación errónea.
  • Se deben evaluar cuatro criterios para cada agente: acceso a datos sensibles, niveles de privilegio, integraciones externas y acciones autónomas; el riesgo surge de la combinación de estos factores, no de ninguno en particular.
  • Los agentes de alto riesgo cumplen dos o más de los cuatro criterios: un agente que accede a información de salud protegida (PHI) y llama a un sistema de gestión de llamadas externo (LLM) es de alto riesgo incluso si solo lee datos, porque la llamada externa crea una ruta de salida no controlada para información regulada.
  • La clasificación de riesgos sin umbrales de política es solo una etiqueta; los umbrales deben definir las condiciones bajo las cuales se marca, restringe o revoca el acceso del agente, no solo se supervisa.
  • La aplicación del principio de mínimo privilegio a nivel de agente es esencial: incluso los agentes que se ejecutan bajo cuentas de servicio de amplio acceso deben tener permisos limitados a su tarea específica para limitar la exposición.
  • El descubrimiento de la IA oculta es un requisito previo para la gobernanza del riesgo: los agentes no autorizados que operan fuera del conocimiento de TI no pueden ser clasificados, monitoreados ni controlados bajo ningún marco de riesgo.

Por qué las definiciones de riesgo del agente no pueden ser genéricas

Las definiciones de riesgo de los agentes clasifican el potencial de daño de un agente de IA en función de su comportamiento, acceso a datos y permisos. A diferencia de las puntuaciones de riesgo de los usuarios, las definiciones de riesgo de los agentes deben tener en cuenta las cadenas de acciones autónomas, no el acceso a sesiones individuales.

Las definiciones efectivas están vinculadas a insumos medibles como:

  • Tipos de datos a los que se accede (por ejemplo, datos sensibles o regulados)
  • Herramientas y sistemas externos invocados
  • Acciones realizadas en secuencias (leer, transformar, escribir)

Los modelos de puntuación genéricos a menudo no tienen en cuenta cómo surge el riesgo en los flujos de trabajo de los agentes, lo que da lugar a clasificaciones erróneas y controles débiles. Los marcos de cumplimiento como RMF de IA del NIST y Artículo 10 de la Ley de IA de la UE Hacer hincapié en la gobernanza de la IA basándose en las capacidades reales y las interacciones de datos.

Criterios clave para evaluar agentes de IA 

Antes de asignar un nivel de riesgo o establecer umbrales, se debe evaluar a cada agente según estos cuatro criterios:

  1. Acceso a datos confidenciales: Lee, escribe o transfiere datos regulados, por ejemplo, información de identificación personal (PII), información de salud protegida (PHI), información de tarjetas de pago (PCI), credenciales y secretos.
  2. Niveles de privilegio: Funciona con permisos elevados o cuentas de acceso amplio.
  3. Integraciones externas: Realiza llamadas a API de terceros, modelos de IA externos o sistemas fuera de su perímetro de seguridad.
  4. Acciones autónomas: Realiza operaciones sin intervención humana, como eliminar registros o modificar configuraciones.

Comparar los agentes de IA con estos criterios aumenta la visibilidad del comportamiento, la autonomía y el potencial de explotación de los agentes, lo que ayuda a mitigar el riesgo de la IA antes de su implementación. 

La mayoría de los equipos de seguridad encuentran al menos un agente que podría exponer información confidencial de forma inesperada o interactuar con sistemas externos sin supervisión.

Definición de niveles de riesgo 

Los niveles de riesgo solo funcionan si las definiciones son lo suficientemente específicas como para generar decisiones de clasificación coherentes. Aquí tienes un enfoque práctico que tu equipo puede aplicar hoy mismo.

Agentes de alto riesgo

Un agente se considera de alto riesgo cuando cumple dos o más de los cuatro criterios: accede a datos regulados, posee privilegios elevados, llama a sistemas externos o ejecuta acciones autónomas sin revisión. 

La combinación de factores es importante. Un agente que accede a información de salud protegida (PHI) y llama a un sistema de gestión de licencias externo (LLM) representa un alto riesgo, incluso si solo lee datos y nunca escribe, porque la llamada externa crea una ruta de salida no controlada para información regulada.

Agentes de riesgo medio

Los agentes de riesgo medio acceden a datos internos no regulados, operan con permisos de usuario estándar y tienen integraciones externas limitadas o nulas. 

Pueden realizar acciones automatizadas, pero estas son limitadas y reversibles. La principal diferencia con el alto riesgo radica en la ausencia de exposición de datos regulada y de llamadas a sistemas externos combinadas.

Agentes de bajo riesgo

Los agentes de bajo riesgo tienen acceso de solo lectura a información no confidencial, no realizan llamadas externas y requieren revisión humana antes de que se actúe en consecuencia.

Este nivel reduce la exposición a vulnerabilidades o compromisos, al tiempo que mantiene una autonomía útil.

Umbrales de política para el acceso restringido a los datos

La clasificación de riesgos sin umbrales de política es solo una etiqueta. Los umbrales definen las condiciones bajo las cuales el acceso de un agente se marca, restringe o revoca, no solo se supervisa.

Vincular umbrales a la clasificación de datos

Los umbrales deben vincularse directamente con las clasificaciones de información sensible. Por ejemplo, acceder a un volumen de información personal identificable (PII) superior al definido en una sola sesión activa alertas, la suspensión del acceso o medidas correctivas. El riesgo de la IA puede mitigarse mediante la aplicación de umbrales que respondan dinámicamente a los cambios en los conjuntos de datos o en el comportamiento de los sistemas de IA.

Aplicar el principio de mínimo privilegio a nivel de agente.

Los agentes solo deben recibir los permisos necesarios para su tarea. Incluso si un agente se ejecuta con una cuenta de servicio de amplio acceso, la aplicación del principio de mínimo privilegio reduce la vulnerabilidad y limita las posibles vulneraciones. Las actualizaciones automáticas garantizan que los umbrales se mantengan alineados a medida que evolucionan los sistemas de IA o se implementan nuevos sistemas.

Cómo BigID permite la gobernanza del riesgo de los agentes basada en políticas

BigID conecta las definiciones de riesgo directamente con la aplicación automatizada de la normativa, eliminando las revisiones manuales. Descubre agentes, modelos, conjuntos de datos y avisos en todo su entorno, incluida la IA oculta, y los relaciona con los datos y permisos a los que acceden.

Los agentes se evalúan automáticamente y, al superarse los umbrales de las políticas, se activan medidas correctivas inmediatas. Estas acciones incluyen ajustar permisos, aislar datos, ocultar información confidencial o delegar tareas, todo ello registrado para fines de auditoría y cumplimiento normativo.

La monitorización continua garantiza que las puntuaciones de riesgo y las políticas se mantengan actualizadas a medida que los agentes evolucionan o cambian las clasificaciones de datos.

Descubra cómo BigID puede ayudarle a aplicar automáticamente las políticas de riesgo de los agentes y a anticiparse a las amenazas de datos en constante evolución.Comience su evaluación hoy mismo.

Preguntas frecuentes sobre las definiciones de riesgo del agente

¿Qué hace que un agente de IA sea de alto riesgo?

Un agente se considera de alto riesgo cuando cumple dos o más criterios: acceso a información confidencial, privilegios elevados, llamadas a sistemas externos mediante API o realización de acciones autónomas. El riesgo de la IA surge de la combinación de estos factores, no de un solo criterio.

¿Cómo puedo establecer umbrales de riesgo para los agentes de IA?

Los umbrales deben estar vinculados a los niveles de clasificación de datos y considerar los posibles riesgos de vulneración, inyección o envenenamiento. Las acciones deben desencadenar medidas de mitigación, no solo de monitoreo.

¿A qué datos nunca deberían tener acceso los agentes de IA?

Los agentes solo deben acceder a los datos necesarios para sus tareas. La información confidencial, como la información de identificación personal (PII), la información de salud protegida (PHI), la información de tarjetas de pago (PCI), las credenciales o los secretos, debe controlarse estrictamente para reducir la exposición y las vulnerabilidades del sistema de IA.

¿Cómo puedo controlar agentes de IA ocultos de los que no tengo conocimiento?

La detección es fundamental. Los sistemas automatizados como BigID identifican agentes no autorizados, aplican su marco de gestión de riesgos y mitigan posibles vulnerabilidades antes de la implementación.

¿Cómo se aplica el principio de mínimo privilegio a los agentes de IA?

Limitar la autonomía de los agentes a los permisos mínimos necesarios reduce el riesgo de la IA, previene el envenenamiento o la inyección instantánea y mitiga los riesgos de seguridad en todas las implementaciones.

Contenido

Mejores prácticas para la gestión de datos de IA

Aprenda las mejores prácticas para la gestión de datos de IA, desde el descubrimiento y la clasificación hasta la gobernanza. Descargue el informe técnico de BigID y prepare sus datos para la IA.

Descargar el libro blanco