
Linha de base ética
Construído sobre uma base de princípios éticos sólidos, com o princípio orientador de que as decisões tomadas ao projetar recursos de IA se alinham com justiça, respeito e integridade.
Construído sobre uma base de princípios éticos sólidos, com o princípio orientador de que as decisões tomadas ao projetar recursos de IA se alinham com justiça, respeito e integridade.
A manutenção da segurança e da privacidade dos dados dos clientes é priorizada desde a concepção até a implementação de todos os recursos de IA. Os recursos de IA são projetados para proteger os dados dos clientes durante todo o ciclo de vida dos dados.
A BigID tem o compromisso de ser transparente sobre como os recursos de IA funcionam, para que os clientes entendam como seus dados são usados.
Os recursos de IA da BigID foram projetados para colocar o controle nas mãos de nossos clientes, oferecendo ferramentas para tomar decisões informadas sobre como seus dados são usados.
Os componentes opcionais de IA da plataforma BigID atendem a várias funções de suporte, como melhorar os insights dos dados, acelerar as varreduras e aprimorar a usabilidade do produto. A plataforma opera sob o princípio de "Conheça seus dados" e os recursos de IA aprimoram ainda mais a compreensão dos dados, fornecendo percepções mais precisas e acionáveis. Quando os clientes optam por usar esses recursos de IA, a IA pode ajudar os usuários a obter uma compreensão mais profunda de seus dados mais rapidamente, facilitando a governança e a conformidade dos dados.
Todos os recursos de IA do BigID são desativados por padrão para facilitar o controle do usuário. Uma documentação detalhada está disponível para orientar os clientes no processo de habilitação e configuração dos recursos de IA de acordo com as preferências de cada cliente. Os clientes podem avaliar os recursos de IA da BigID antes de usá-los e implantá-los somente de acordo com as políticas de governança de IA de sua organização.
O aprendizado de máquina é um tipo de inteligência artificial que permite que os sistemas encontrem padrões e façam previsões aprendendo com os dados sem programação explícita. Os recursos de ML na plataforma BigID ajudam a melhorar a eficiência e a precisão das varreduras de dados de várias maneiras, conforme descrito em mais detalhes nesta seção.
A BigID desenvolve seus modelos de ML em um ambiente de laboratório usando dados sintéticos e disponíveis publicamente. Dois dos recursos de ML da plataforma BigID, Hyperscan e Classifiers, podem ser ajustados ainda mais ao ambiente do cliente usando metadados do cliente. Esses modelos só são ajustados usando metadados do cliente se o cliente optar especificamente por usar seus metadados para essa finalidade. Os modelos do Hyperscan e dos Classificadores treinados nos metadados do cliente são sempre armazenados e executados localmente, o que significa que são limitados ao ambiente do cliente individual e estão disponíveis somente para esse cliente. Os modelos ajustados não são compartilhados entre os ambientes do cliente ou usados pela BigID em nome de outros clientes. Os clientes podem usar todos os outros recursos de IA, mesmo que decidam não usar seus metadados para ajustar os modelos do Hyperscan e dos Classificadores ao seu ambiente.
O agrupamento de documentos e arquivos é um algoritmo de aprendizado de máquina não supervisionado que agrupa arquivos semelhantes com base em seu conteúdo. Esse recurso ajuda os usuários da BigID a organizar e gerenciar seus documentos com mais eficiência. Ao analisar o conteúdo textual dos documentos, a BigID pode agrupar arquivos como contratos, NDAs e faturas em clusters separados sem a necessidade de saber o número de clusters com antecedência.
O Predictive Discovery, ou HyperScan, é um modelo de ML projetado para reduzir o tempo necessário para a varredura de fontes de dados não estruturados, prevendo a presença de informações confidenciais com base em metadados (por exemplo, caminho do arquivo, proprietário, extensão do arquivo). A BigID oferece aos clientes a opção de optar por fazer com que o modelo aprenda com seus metadados coletados durante as varreduras de dados para informar as previsões. Ao usar metadados, esse modelo acelera o processo de varredura e permite que os usuários identifiquem mais rapidamente os arquivos com informações confidenciais.
Os classificadores aprimorados por ML no BigID foram projetados para reduzir os falsos positivos na classificação de dados baseada em RegEx. Ao analisar os metadados de verdadeiros e falsos positivos, o modelo aprende a ajustar os resultados da classificação e a reduzir os erros. Esse modelo melhora a precisão da classificação, atualmente aplicável somente a fontes de dados estruturados, aumentando assim a precisão da descoberta de dados.
NER é uma tarefa de processamento de linguagem natural (NLP) que identifica entidades nomeadas (por exemplo, pessoas, locais) em dados não estruturados (geralmente em documentos ou colunas de texto livre). O BigID usa NER para classificar informações pessoais analisando fontes de dados não estruturados. Os modelos NER são desenvolvidos usando aprendizagem profunda e executados localmente nos scanners BigID exclusivos de cada cliente para aumentar a eficiência e a segurança.
O agrupamento de colunas/conjuntos de dados é um algoritmo não supervisionado que agrupa colunas semelhantes com base em padrões de dados. Por exemplo, colunas que contêm números de telefone são agrupadas. Ao comparar vetores de colunas usando a similaridade de cosseno, o BigID pode gerenciar e analisar grandes conjuntos de dados com mais eficiência. Esse recurso também ajuda a detectar conjuntos de dados quase duplicados e sugere dados de maior qualidade para análise.
A BigID desenvolve seus recursos de IA baseados em Large Language Model (LLM) usando modelos pré-treinados e seguindo rigorosos procedimentos de segurança e princípios de Privacy by Design. A BigID não treina seus próprios LLMs nem compartilha dados de clientes com fornecedores terceirizados para desenvolvimento ou treinamento de LLMs. Os recursos de GenAI da BigID empregam medidas de segurança apropriadas, incluindo redes privadas e pontos de extremidade privados. O BigChat também usa servidores Limited Life Memory, que não retêm nenhum prompt ou resposta transmitida. A BigID utiliza o Azure OpenAI GPT para alimentar o BigChat e o recurso de Mapeamento de Ativos Empresariais. O BigChat e o recurso Business Asset Mapping só podem ser usados em canais criptografados, e as conexões com o Azure são gerenciadas via VPN para que o tráfego não passe por redes não confiáveis.
Opcional para os clientes e operando apenas com base na adesão
A BigID lançou um bot de perguntas e respostas chamado BigChat, baseado na tecnologia GenAI. A função do BigChat limita-se a ajudar os usuários a navegar e solucionar problemas da plataforma BigID. O BigChat interage apenas com a documentação do software da BigID e com informações relacionadas ao produto, e não armazena nem usa nenhuma informação compartilhada do usuário ou dados do cliente para treinar ou ajustar o modelo.
Opcional para os clientes e operando apenas com base na adesão
Esse recurso GenAI permite que o BigID ingira um glossário de negócios fornecido pelo cliente e rotule colunas de tabelas de fontes de dados conectadas usando os termos do glossário. Isso é feito por meio da análise do conteúdo da tabela, das colunas próximas e de outras dicas de contexto para determinar um rótulo apropriado. Esse recurso opcional tem como objetivo reduzir o esforço manual e os erros associados à administração de dados tradicional e está limitado aos parâmetros definidos por cada cliente usando o glossário comercial fornecido por ele. Os clientes podem editar os rótulos sugeridos por esse recurso.
Os recursos de IA da BigID são desenvolvidos usando dados sintéticos e publicamente disponíveis ou modelos pré-treinados. A BigID não utiliza nenhuma informação do usuário ou dados do cliente para treinar os recursos de IA generativa ou os modelos básicos de Machine Learning. Dois dos recursos de aprendizado de máquina da plataforma BigID, Hyperscan e Classifiers, podem ser ajustados ao ambiente de cada cliente usando metadados do cliente. No entanto, esses modelos só são ajustados usando metadados do cliente se o cliente optar especificamente por usar seus metadados para essa finalidade. Além disso, os modelos de ajuste fino são sempre armazenados e executados localmente, o que significa que são limitados ao ambiente individual do cliente e estão disponíveis somente para esse cliente. Os modelos ajustados nunca são compartilhados entre ambientes de clientes ou usados pela BigID em nome de outros clientes.
A BigID implementou controles e testes de segurança personalizados para mitigar os riscos associados ao uso de IA em nossa plataforma. A BigID realiza avaliações de IA em todas as iniciativas antes da implantação, com foco na mitigação de riscos críticos. Essas avaliações avaliam os controles de privacidade e segurança em vigor e analisam o viés e a discriminação algorítmica, priorizando a conformidade com todas as leis e regulamentos aplicáveis ao fornecimento da plataforma BigID e o alinhamento com os padrões éticos aplicáveis. A BigID também coloca o controle sobre os recursos de IA nas mãos do usuário ao desativar os recursos de IA por padrão.
A BigID prioriza a conformidade com todas as leis e regulamentos relevantes aplicáveis ao fornecimento da plataforma BigID nas jurisdições onde operamos, incluindo as leis aplicáveis que regem o desenvolvimento e o fornecimento de recursos de IA. Entendemos a importância de atender a esses padrões para proteger seus dados.
A BigID se esforça para atualizar e aprimorar regularmente seus recursos de IA. A empresa busca uma estratégia de melhoria contínua, que inclui a adição de novos recursos opcionais para aprimorar as percepções de dados e fornecer ferramentas mais poderosas para nossos clientes. O objetivo da BigID é manter os recursos de IA na vanguarda da inovação e, ao mesmo tempo, continuar a buscar altos padrões de proteção e segurança de dados.