
Base ética
Construida sobre una base de sólidos principios éticos, con el principio rector de que las decisiones que se tomen al diseñar las funciones de IA se ajusten a la equidad, el respeto y la integridad.
Construida sobre una base de sólidos principios éticos, con el principio rector de que las decisiones que se tomen al diseñar las funciones de IA se ajusten a la equidad, el respeto y la integridad.
Mantener la seguridad y la privacidad de los datos de los clientes es prioritario desde la concepción hasta la implementación de todas las funciones de IA. Las funciones de IA están diseñadas para proteger los datos de los clientes durante todo su ciclo de vida.
BigID se compromete a ser transparente sobre el funcionamiento de las funciones de IA, para que los clientes entiendan cómo se utilizan sus datos.
Las funciones de IA de BigID están diseñadas para poner el control en manos de nuestros clientes, dándoles herramientas para tomar decisiones informadas sobre cómo se utilizan sus datos.
Los componentes opcionales de IA de la plataforma BigID cumplen varias funciones de apoyo, como mejorar la comprensión de los datos, acelerar los escaneos y mejorar la usabilidad del producto. La plataforma se rige por el principio de "Conozca sus datos", y las funciones de IA mejoran aún más la comprensión de los datos proporcionando información más precisa y práctica. Cuando los clientes optan por utilizar estas funciones, la IA puede ayudar a los usuarios a comprender mejor sus datos con mayor rapidez, lo que facilita la gestión de los datos y el cumplimiento de las normativas.
Todas las funciones de IA de BigID están desactivadas por defecto para facilitar el control por parte del usuario. Existe documentación detallada para guiar a los clientes a través del proceso de habilitación y configuración de las funciones de IA según las preferencias de cada cliente. Los clientes pueden evaluar las funciones de IA de BigID antes de utilizarlas y desplegarlas únicamente de acuerdo con las políticas de gobernanza de IA de su organización.
El aprendizaje automático es un tipo de inteligencia artificial que permite a los sistemas encontrar patrones y hacer predicciones aprendiendo de los datos sin programación explícita. Las capacidades de ML en la plataforma BigID ayudan a mejorar la eficiencia y la precisión de los escaneos de datos de varias maneras, como se describe con más detalle en esta sección.
BigID desarrolla sus modelos ML en un entorno de laboratorio utilizando datos sintéticos y disponibles públicamente. Dos de las funciones de ML de la plataforma BigID, Hyperscan y Classifiers, pueden ajustarse aún más al entorno del cliente utilizando metadatos del cliente. Estos modelos sólo se ajustan utilizando los metadatos del cliente si éste opta específicamente por utilizar sus metadatos para este fin. Los modelos de Hyperscan y Classifiers entrenados con metadatos del cliente siempre se almacenan y ejecutan localmente, lo que significa que están limitados al entorno del cliente individual y sólo están disponibles para ese cliente. Los modelos ajustados no se comparten entre entornos de clientes ni son utilizados por BigID en nombre de ningún otro cliente. Los clientes pueden utilizar todas las demás funciones de IA, incluso si deciden no utilizar sus metadatos para ajustar los modelos Hyperscan y Classifiers a su entorno.
La agrupación de documentos y archivos es un algoritmo de aprendizaje automático no supervisado que agrupa archivos similares en función de su contenido. Esta función ayuda a los usuarios de BigID a organizar y gestionar sus documentos de forma más eficiente. Mediante el análisis del contenido textual de los documentos, BigID puede agrupar archivos como contratos, acuerdos de confidencialidad y facturas en clústeres separados sin necesidad de conocer de antemano el número de clústeres.
Predictive Discovery, o HyperScan, es un modelo de ML diseñado para reducir el tiempo necesario para escanear fuentes de datos no estructuradas mediante la predicción de la presencia de información sensible basada en metadatos (por ejemplo, ruta del archivo, propietario, extensión del archivo). BigID ofrece a los clientes la opción de que el modelo aprenda de los metadatos recopilados durante el escaneado de los datos con el fin de informar las predicciones. Al utilizar metadatos, este modelo acelera el proceso de escaneado y permite a los usuarios identificar más rápidamente los archivos con información confidencial.
Los clasificadores mejorados por ML en BigID están diseñados para reducir los falsos positivos en la clasificación de datos basada en RegEx. Analizando los metadatos de los verdaderos y falsos positivos, el modelo aprende a ajustar los resultados de la clasificación y a reducir los errores. Este modelo mejora la precisión de la clasificación, actualmente aplicable sólo a fuentes de datos estructuradas, mejorando así la precisión del descubrimiento de datos.
NER es una tarea de Procesamiento del Lenguaje Natural (PLN) que identifica entidades con nombre (por ejemplo, personas, lugares) en datos no estructurados (normalmente en documentos o columnas de texto libre). BigID utiliza NER para clasificar información personal mediante el análisis de fuentes de datos no estructurados. Los modelos NER se desarrollan mediante aprendizaje profundo y se ejecutan localmente dentro de los escáneres BigID exclusivos de cada cliente para mejorar la eficiencia y la seguridad.
La agrupación de columnas o conjuntos de datos es un algoritmo no supervisado que agrupa columnas similares basándose en patrones de datos. Por ejemplo, las columnas que contienen números de teléfono se agrupan juntas. Al comparar vectores de columnas mediante la similitud del coseno, BigID puede gestionar y analizar de forma más eficiente grandes conjuntos de datos. Esta función también ayuda a detectar conjuntos de datos casi duplicados y a sugerir datos de mayor calidad para su análisis.
BigID desarrolla sus funciones de IA basadas en Large Language Model (LLM) utilizando modelos preentrenados y siguiendo estrictos procedimientos de seguridad y principios de privacidad por diseño. BigID no entrena sus propios LLM ni comparte datos de clientes con terceros proveedores para el desarrollo o entrenamiento de LLM. Las funciones GenAI de BigID emplean medidas de seguridad adecuadas, incluidas redes privadas y puntos finales privados. BigChat también utiliza servidores de memoria de vida limitada, que no retienen ninguna solicitud o respuesta transmitida. BigID utiliza Azure OpenAI GPT para impulsar BigChat y la función Business Asset Mapping. BigChat y la función Business Asset Mapping sólo se pueden utilizar a través de canales cifrados, y las conexiones a Azure se gestionan mediante VPN para que el tráfico no atraviese redes que no sean de confianza.
Son opcionales para los clientes y sólo se aceptan si se desea.
BigID ha presentado un bot de preguntas y respuestas llamado BigChat, basado en la tecnología GenAI. La función de BigChat se limita a ayudar a los usuarios a navegar y solucionar problemas de la plataforma BigID. BigChat solo interactúa con la documentación del software de BigID y la información relacionada con los productos, y no almacena ni utiliza ninguna información compartida de los usuarios ni datos de los clientes para entrenar o ajustar el modelo.
Son opcionales para los clientes y sólo se aceptan si se desea.
Esta función de GenAI permite a BigID incorporar un glosario empresarial proporcionado por el cliente y etiquetar columnas de tablas de fuentes de datos conectadas utilizando los términos del glosario. Esto se lleva a cabo analizando el contenido de la tabla, las columnas cercanas y otras pistas contextuales para determinar una etiqueta adecuada. Esta función opcional pretende reducir el esfuerzo manual y los errores asociados a la administración de datos tradicional y se limita a los parámetros establecidos por cada cliente utilizando el glosario empresarial que proporciona. Los clientes pueden editar las etiquetas sugeridas por esta función.
Las características de IA de BigID se desarrollan utilizando datos sintéticos y disponibles públicamente o modelos preentrenados. BigID no utiliza información de los usuarios ni datos de los clientes para entrenar las funciones de IA generativa ni los modelos básicos de aprendizaje automático. Dos de las funciones de aprendizaje automático de la plataforma BigID, Hyperscan y Classifiers, pueden ajustarse al entorno de cada cliente utilizando metadatos del cliente. Sin embargo, estos modelos sólo se ajustan utilizando los metadatos del cliente si éste opta específicamente por utilizar sus metadatos para este fin. Además, los modelos ajustados siempre se almacenan y ejecutan localmente, lo que significa que se limitan al entorno de cada cliente y sólo están disponibles para él. Los modelos ajustados nunca se comparten entre entornos de clientes ni BigID los utiliza en nombre de otros clientes.
BigID ha implementado controles y pruebas de seguridad a medida para mitigar los riesgos asociados con el uso de la IA dentro de nuestra plataforma. BigID lleva a cabo evaluaciones de IA en todas las iniciativas antes de su despliegue, centrándose en la mitigación de riesgos críticos. Estas evaluaciones valoran los controles de privacidad y seguridad establecidos y revisan los sesgos algorítmicos y la discriminación, priorizando el cumplimiento de todas las leyes y normativas aplicables a la provisión de la plataforma BigID y la alineación con las normas éticas aplicables. BigID también pone en manos del usuario el control sobre las funciones de IA, desactivándolas por defecto.
BigID da prioridad al cumplimiento de todas las leyes y normativas pertinentes aplicables a la provisión de la plataforma BigID en las jurisdicciones en las que operamos, incluidas las leyes aplicables que rigen el desarrollo y la provisión de funciones de IA. Somos conscientes de la importancia de cumplir estas normas para proteger sus datos.
BigID se esfuerza por actualizar y mejorar regularmente sus capacidades de IA. La empresa persigue una estrategia de mejora continua, que incluye la adición de nuevas funciones opcionales para mejorar el conocimiento de los datos y proporcionar herramientas más potentes a nuestros clientes. El objetivo de BigID es mantener las capacidades de IA a la vanguardia de la innovación sin dejar de perseguir altos estándares de protección y seguridad de los datos.