
Base éthique
Elle repose sur des principes éthiques solides, le principe directeur étant que les décisions prises lors de la conception des fonctions d'IA doivent être équitables, respectueuses et intègres.
Elle repose sur des principes éthiques solides, le principe directeur étant que les décisions prises lors de la conception des fonctions d'IA doivent être équitables, respectueuses et intègres.
Le maintien de la sécurité et de la confidentialité des données des clients est une priorité depuis l'idéation jusqu'à la mise en œuvre de toutes les fonctions d'IA. Les fonctions d'IA sont conçues pour protéger les données des clients tout au long de leur cycle de vie.
BigID s'engage à être transparent sur le fonctionnement des fonctions d'IA, afin que les clients comprennent comment leurs données sont utilisées.
Les fonctions d'IA de BigID sont conçues pour mettre le contrôle entre les mains de nos clients, en leur donnant des outils pour prendre des décisions éclairées sur la façon dont leurs données sont utilisées.
Les composants IA optionnels de la plateforme BigID remplissent plusieurs fonctions de soutien, telles que l'amélioration de la compréhension des données, l'accélération des analyses et l'amélioration de la convivialité du produit. La plateforme fonctionne selon le principe "Know Your Data", et les fonctions d'IA améliorent encore la compréhension des données en fournissant des informations plus précises et exploitables. Lorsque les clients choisissent d'utiliser ces fonctions d'IA, l'IA peut aider les utilisateurs à obtenir plus rapidement une meilleure compréhension de leurs données, ce qui facilite la gouvernance et la conformité des données.
Toutes les fonctions d'intelligence artificielle de BigID sont désactivées par défaut afin de faciliter le contrôle par l'utilisateur. Une documentation détaillée est disponible pour guider les clients tout au long du processus d'activation et de configuration des fonctions d'IA en fonction des préférences de chacun. Les clients peuvent évaluer les fonctions d'IA de BigID avant de les utiliser et les déployer uniquement en conformité avec les politiques de gouvernance de l'IA de leur organisation.
L'apprentissage automatique est un type d'intelligence artificielle qui permet aux systèmes de trouver des modèles et de faire des prédictions en apprenant à partir des données sans programmation explicite. Les capacités d'apprentissage automatique de la plateforme BigID permettent d'améliorer l'efficacité et la précision des analyses de données de plusieurs manières, comme décrit plus en détail dans cette section.
BigID développe ses modèles de ML dans un environnement de laboratoire en utilisant des données synthétiques et accessibles au public. Deux des fonctions de ML de la plateforme BigID, Hyperscan et Classifiers, peuvent être affinées en fonction de l'environnement du client à l'aide des métadonnées de ce dernier. Ces modèles ne sont affinés à l'aide des métadonnées du client que si ce dernier choisit spécifiquement d'utiliser ses métadonnées à cette fin. Les modèles Hyperscan et Classifiers formés sur les métadonnées du client sont toujours stockés et exécutés localement, ce qui signifie qu'ils sont limités à l'environnement du client et ne sont disponibles que pour ce client. Les modèles affinés ne sont pas partagés entre les environnements des clients ni utilisés par BigID pour le compte d'autres clients. Les clients peuvent utiliser toutes les autres fonctions d'IA, même s'ils décident de ne pas utiliser leurs métadonnées pour adapter les modèles Hyperscan et Classifiers à leur environnement.
Le regroupement de documents et de fichiers est un algorithme d'apprentissage automatique non supervisé qui regroupe des fichiers similaires en fonction de leur contenu. Cette fonctionnalité permet aux utilisateurs de BigID d'organiser et de gérer leurs documents plus efficacement. En analysant le contenu textuel des documents, BigID peut regrouper des fichiers tels que des contrats, des accords de confidentialité et des factures dans des groupes distincts sans qu'il soit nécessaire de connaître le nombre de groupes à l'avance.
Predictive Discovery, ou HyperScan, est un modèle ML conçu pour réduire le temps nécessaire à l'analyse des sources de données non structurées en prédisant la présence d'informations sensibles sur la base des métadonnées (par exemple, le chemin d'accès au fichier, le propriétaire, l'extension du fichier). BigID offre à ses clients la possibilité d'opter pour l'apprentissage du modèle à partir de leurs métadonnées collectées lors de l'analyse des données afin d'éclairer les prédictions. En utilisant les métadonnées, ce modèle accélère le processus d'analyse et permet aux utilisateurs d'identifier plus rapidement les fichiers contenant des informations sensibles.
Les classificateurs ML-Enhanced Classifiers de BigID sont conçus pour réduire les faux positifs dans la classification des données basée sur RegEx. En analysant les métadonnées des vrais et des faux positifs, le modèle apprend à ajuster les résultats de la classification et à réduire les erreurs. Ce modèle améliore la précision de la classification, qui n'est actuellement applicable qu'aux sources de données structurées, améliorant ainsi la précision de la découverte des données.
Le NER est une tâche de traitement du langage naturel (NLP) qui identifie des entités nommées (par exemple, des personnes, des lieux) dans des données non structurées (généralement dans des documents ou des colonnes de texte libre). BigID utilise la NER pour classer les informations personnelles en analysant les sources de données non structurées. Les modèles NER sont développés à l'aide de l'apprentissage profond et exécutés localement dans les scanners BigID uniques de chaque client pour une efficacité et une sécurité accrues.
Le regroupement de colonnes/données est un algorithme non supervisé qui regroupe des colonnes similaires sur la base de modèles de données. Par exemple, les colonnes contenant des numéros de téléphone sont regroupées. En comparant les vecteurs de colonnes à l'aide de la similarité cosinus, BigID peut gérer et analyser plus efficacement de grands ensembles de données. Cette fonctionnalité permet également de détecter les ensembles de données presque en double et de suggérer des données de meilleure qualité pour l'analyse.
BigID développe ses fonctions d'IA basées sur le Large Language Model (LLM) en utilisant des modèles pré-entraînés et en suivant des procédures de sécurité strictes et les principes du Privacy by Design (protection de la vie privée dès la conception). BigID ne forme pas ses propres LLM et ne partage pas les données de ses clients avec des fournisseurs tiers pour le développement ou la formation de LLM. Les fonctions GenAI de BigID utilisent des mesures de sécurité appropriées, y compris des réseaux privés et des points d'extrémité privés. BigChat utilise également des serveurs à durée de vie limitée, qui ne conservent pas les invites ou les réponses transmises. BigID utilise Azure OpenAI GPT pour alimenter BigChat et la fonction Business Asset Mapping. BigChat et la fonction Business Asset Mapping ne sont utilisables que sur des canaux cryptés, et les connexions à Azure sont gérées par VPN afin que le trafic ne traverse pas de réseaux non fiables.
Facultatif pour les clients et fonctionnant uniquement sur la base de l'opt-in
BigID a lancé un robot de questions et réponses appelé BigChat, basé sur la technologie GenAI. La fonction de BigChat se limite à aider les utilisateurs à naviguer et à dépanner la plateforme BigID. BigChat n'interagit qu'avec la documentation du logiciel de BigID et les informations relatives aux produits, et il ne stocke ni n'utilise aucune information partagée sur les utilisateurs ou les données des clients pour former ou affiner le modèle.
Facultatif pour les clients et fonctionnant uniquement sur la base de l'opt-in
Cette fonctionnalité GenAI permet à BigID d'ingérer un glossaire commercial fourni par le client et d'étiqueter les colonnes des tables des sources de données connectées à l'aide des termes du glossaire. Cette opération s'effectue en analysant le contenu de la table, les colonnes voisines et d'autres indices contextuels afin de déterminer un libellé approprié. Cette fonction optionnelle vise à réduire les efforts manuels et les erreurs associés à la gestion traditionnelle des données et est limitée aux paramètres définis par chaque client à l'aide du glossaire commercial qu'il fournit. Les clients peuvent modifier les étiquettes suggérées par cette fonction.
Les fonctions d'IA de BigID sont développées à l'aide de données synthétiques accessibles au public ou de modèles pré-entraînés. BigID n'utilise pas d'informations sur les utilisateurs ou les données des clients pour former les fonctions d'IA générative ou les modèles d'apprentissage automatique de base. Deux des fonctions d'apprentissage automatique de la plateforme BigID, Hyperscan et Classifiers, peuvent être adaptées à l'environnement de chaque client à l'aide des métadonnées de ce dernier. Toutefois, ces modèles ne sont affinés à l'aide des métadonnées du client que si ce dernier choisit spécifiquement d'utiliser ses métadonnées à cette fin. En outre, les modèles affinés sont toujours stockés et exécutés localement, ce qui signifie qu'ils sont limités à l'environnement du client individuel et ne sont disponibles que pour ce client. Les modèles affinés ne sont jamais partagés entre les environnements des clients ni utilisés par BigID pour le compte d'autres clients.
BigID a mis en place des contrôles de sécurité et des tests adaptés pour atténuer les risques associés à l'utilisation de l'IA au sein de notre plateforme. BigID effectue des évaluations de l'IA sur toutes les initiatives avant leur déploiement, en mettant l'accent sur l'atténuation des risques critiques. Ces évaluations portent sur les contrôles de sécurité et de protection de la vie privée en place et sur les biais et discriminations algorithmiques, en privilégiant le respect de toutes les lois et réglementations applicables à la mise à disposition de la plateforme BigID et l'alignement sur les normes éthiques applicables. BigID confie également le contrôle des fonctions d'IA à l'utilisateur en désactivant par défaut les fonctions d'IA.
BigID donne la priorité au respect de toutes les lois et réglementations applicables à la fourniture de la plate-forme BigID dans les juridictions où nous opérons, y compris les lois applicables régissant le développement et la fourniture de fonctions d'IA. Nous comprenons l'importance de respecter ces normes pour protéger vos données.
BigID s'efforce de mettre à jour et d'améliorer régulièrement ses capacités d'IA. L'entreprise poursuit une stratégie d'amélioration continue, qui comprend l'ajout de nouvelles fonctionnalités optionnelles pour améliorer la compréhension des données et fournir des outils plus puissants à nos clients. L'objectif de BigID est de maintenir les capacités d'IA à la pointe de l'innovation tout en continuant à appliquer des normes élevées en matière de protection et de sécurité des données.