BigID utilise plusieurs méthodes pour rechercher et catégoriser les données. Cela inclut la classification traditionnelle basée sur des modèles pour localiser des données d'une forme ou d'un type spécifique. Les technologies de classification traditionnelles, telles que celles des anciens outils de sécurité DLP ou de gouvernance des accès aux données, s'appuient principalement sur des expressions régulières pour trouver des correspondances exactes dans des chaînes de données telles qu'une carte de crédit ou une pièce d'identité nationale. BigID modernise ces approches grâce à une nouvelle validation intelligente, tout en les combinant avec des approches plus récentes de ML et d'IA pour accroître la précision et élargir leur champ d'application aux métadonnées et aux documents.
BigID offre aux entreprises une bibliothèque extensible de classifications prédéfinies, avec des règles intelligentes et des contrôles de validation pour éliminer les faux positifs. BigID associe cette méthode de classification à des modèles plus flous utilisant le Machine Learning pour séparer avec précision les noms et attributs d'entités de données structurées similaires. De plus, les classificateurs d'entités intelligents de BigID fonctionnent non seulement sur les fichiers non structurés et les bases de données structurées, mais aussi sur tout ce à quoi BigID peut se connecter, c'est-à-dire presque tout. Cela inclut le noSQL, le Big Data, le SaaS, l'IaaS, le mainframe, les pipelines et flux de données, et bien plus encore.
Mais BigID ne s'arrête pas là : face à l'adoption croissante par les organisations de gouvernance des données d'outils de gestion des métadonnées pour gérer le cycle de vie de leurs informations, BigID a également intégré pour la première fois sa classification intelligente à la gestion des métadonnées. BigID peut non seulement aider les organisations à reclasser les métadonnées mal catégorisées, mais aussi simplifier le processus fastidieux et source d'erreurs de mappage de leurs données physiques à leurs définitions de données logiques. Grâce à BigID, les registres existants peuvent être plus facilement mappés à leurs attributs de données réels. De plus, en l'absence de définitions de données logiques ou de registre, BigID peut recommander des définitions à partir des métadonnées et des attributs de données classifiés.
Cependant, les attributs, entités et métadonnées de données ne sont pas les seuls formats de données que les organisations souhaitent classer pour catégoriser leurs informations. Ces dernières années, les entreprises ont été confrontées à une explosion de la création et du stockage de documents et de formulaires non structurés. Dans de nombreuses entreprises, ces documents ou fichiers représentent des pétaoctets d'informations stockés sur des systèmes NAS traditionnels comme NetApp ou EMC, ou sur des entrepôts de fichiers modernes comme Box, O365, GDrive, S3, Salesforce, Sharepoint, etc. BigID a donc introduit une classification de fichiers basée sur l'apprentissage profond pour aider les organisations à catégoriser et étiqueter leur vaste volume de données non structurées. BigID propose de nombreuses classifications de documents pré-entraînées prêtes à l'emploi, mais offre également aux entreprises la possibilité d'entraîner l'IA documentaire de BigID à partir de leurs propres données.