Ir al contenido

SLM, LLM, y la verdadera diferencia que importa en DSPM

Desde OpenAI Tras el lanzamiento de ChatGPT 3.5 a finales de 2022, los modelos de lenguaje han avanzado a un ritmo notable. Lo que comenzó como herramientas para la generación de texto ha evolucionado rápidamente hasta convertirse en sistemas capaces de razonar, supervisar y automatizar los flujos de trabajo empresariales.

Los primeros modelos de lenguaje grande (LLM) disponibles comercialmente llegaron a fines de 2023. Desde entonces, empresas como BigID han expandido su uso mucho más allá de las interfaces conversacionales, impulsando la interacción de estilo copiloto., automatización de agentes para la remediación de la seguridady identificación avanzada, clasificación, y categorización de datos empresariales.

A medida que los modelos lingüísticos adquieren cada vez más poder Gestión de posturas de seguridad de datos (DSPM), Ha surgido un debate familiar: Modelos de lenguaje pequeños (SLM) versus modelos de lenguaje grandes (LLM). Pero si bien esta forma de enfocar el asunto es común, pasa por alto un aspecto más importante.

La verdadera diferencia en DSPM no es simplemente cuestión de tamaño.

Se trata de cómo piensan los modelos y de lo que son capaces de comprender.

Poner en funcionamiento DSPM a escala empresarial

Por qué la división entre “Pequeño vs. Grande” no es la clave

En las conversaciones de mercado, SLM A menudo se describen como alternativas ligeras y específicas para cada tarea a los LLM. Estos, a su vez, se posicionan como más potentes, pero más costosos.

Este planteamiento es conveniente, pero incompleto.

En la práctica, tanto los SLM como los LLM pueden ser generativo. La distinción más significativa es entre:

  • Modelos predictivos y específicos para cada tareay
  • Modelos de lenguaje generativo capaces de razonar a través del contexto

Muchos sistemas comercializados como “SLM” en DSPM son en realidad modelos enmascarados o discriminativos—optimizados para clasificar o etiquetar datos dentro de tareas específicas y predefinidas. Los modelos de lenguaje generativo, en cambio, interpretan el significado, la intención y el contexto, lo que les permite generalizarse a medida que cambian los entornos.

Modelos predictivos: eficientes, pero rígidos

Los modelos predictivos o enmascarados son excelentes para problemas de clasificación bien definidos. En DSPM, se utilizan comúnmente para:

  • Aplicar etiquetas fijas
  • Detectar patrones conocidos
  • Aplicar reglas predefinidas

Cuando los tipos de datos son estables y los requisitos rara vez cambian, este enfoque puede ser eficiente. Estos modelos suelen ser más económicos de ejecutar y ofrecen un buen rendimiento en tareas repetitivas.

Sin embargo, esa eficiencia conlleva desventajas.

Los modelos predictivos requieren:

  • Datos de entrenamiento seleccionados
  • supervisión humana
  • Reentrenamiento a medida que evolucionan las políticas, las fuentes de datos o las regulaciones

Hacen exactamente lo que están entrenados para hacer y tienen dificultades cuando el mundo que los rodea cambia.

Modelos de lenguaje generativo: diseñados para la comprensión

Los modelos de lenguaje generativo funcionan de manera diferente. En lugar de predecir etiquetas basándose en patrones fijos,... La razón sobre el contexto y el significado.

En DSPM, esto permite capacidades que los modelos predictivos no pueden replicar fácilmente:

  • Entender por qué los datos son sensibles, no sólo que lo son
  • Adaptarse a nuevas regulaciones y contextos empresariales sin necesidad de reciclarse
  • Correlación de señales entre contenido, metadatos, acceso y políticas
  • Explicar decisiones en un lenguaje legible para humanos

Los modelos generativos, ya sean grandes o pequeños, son inherentemente más flexibles. No requieren un nuevo modelo para cada nuevo caso de uso. En cambio, se generalizan a distintos escenarios mediante el razonamiento.

Qué significa esto para los resultados del DSPM

DSPM no es un problema de clasificación estático. Es un Problema de comprensión dinámica.

Los equipos de seguridad y gobernanza necesitan:

Esto requiere más que una coincidencia de patrones eficiente. Requiere contexto.

Los modelos de lenguaje generativo ofrecen:

  • Mayor precisión contextual, lo que reduce los falsos positivos
  • Adaptabilidad al cambio, sin reingeniería constante
  • Correlación entre dominios, entre datos estructurados y no estructurados
  • Explicabilidad y gobernanza, a través de información clara y auditable

Por qué BigID adopta un enfoque generativo

Plataforma DSPM de BigID Se basa en una base centrada en los datos que prioriza la comprensión sobre la detección. Al aprovechar modelos de lenguaje generativo, BigID permite a las organizaciones clasificar y gestionar datos según su significado, contexto empresarial y riesgo, no solo reglas estáticas.

Este enfoque también ofrece flexibilidad. Los clientes pueden aprovechar las capacidades de IA de BigID y, al mismo tiempo, conservar la opción de usar sus propios modelos de lenguaje preferidos, evitando así la dependencia de sistemas rígidos y específicos para cada tarea.

Conclusión

El futuro de DSPM no se trata de elegir entre modelos pequeños y grandes.

Se trata de elegir entre predicción rígida y razonamiento flexible.

Los modelos predictivos tienen su lugar. Pero a medida que los ecosistemas de datos se vuelven más complejos y la adopción de la IA se acelera, la DSPM debe evolucionar desde la detección estática hacia la comprensión continua.

En ese cambio, los modelos de lenguaje generativo, grandes o pequeños, no son sólo una mejora.

Son un requisito.

¿Quieres saber más? Programar una reunión 1:1 ¡Con uno de nuestros expertos en IA y DSPM hoy mismo!

Contenido

[Identidad, datos e IA:] Resolviendo el problema de los tres cuerpos en seguridad

Descargue la guía completa para comprender el problema de los tres cuerpos de la seguridad moderna y cómo adelantarse a él.

Descargar el libro blanco

Puestos relacionados

Ver todas las entradas