
Linha de base ética
Fundamentado em princípios éticos sólidos, com o princípio orientador de que as decisões tomadas durante a concepção de funcionalidades de IA estejam alinhadas com a justiça, o respeito e a integridade.

Fundamentado em princípios éticos sólidos, com o princípio orientador de que as decisões tomadas durante a concepção de funcionalidades de IA estejam alinhadas com a justiça, o respeito e a integridade.

Manter a segurança e a privacidade dos dados do cliente é uma prioridade desde a concepção até a implementação de todos os recursos de IA. Os recursos de IA são projetados para proteger os dados do cliente durante todo o ciclo de vida dos dados.

A BigID está empenhada em ser transparente sobre o funcionamento dos recursos de IA, para que os clientes entendam como seus dados são utilizados.

Os recursos de IA da BigID foram projetados para colocar o controle nas mãos de nossos clientes, fornecendo ferramentas para que você tome decisões informadas sobre como seus dados são usados.
Os componentes opcionais de IA dentro da plataforma BigID desempenham diversas funções de suporte, como aprimorar a compreensão dos dados, acelerar as análises e melhorar a usabilidade do produto. A plataforma opera sob o princípio de "Conheça seus dados", e os recursos de IA aprimoram ainda mais a compreensão dos dados, fornecendo insights mais precisos e acionáveis. Quando os clientes optam por usar esses recursos de IA, a IA pode ajudá-los a obter uma compreensão mais profunda de seus dados com mais rapidez, facilitando a governança e a conformidade dos dados.
Todos os recursos de IA do BigID estão desativados por padrão para facilitar o controle do usuário. Documentação detalhada está disponível para orientar os clientes no processo de ativação e configuração dos recursos de IA de acordo com as preferências de cada um. Os clientes podem avaliar os recursos de IA do BigID antes de usá-los e implementá-los somente em conformidade com as políticas de governança de IA de sua organização.
O aprendizado de máquina é um tipo de inteligência artificial que permite que os sistemas encontrem padrões e façam previsões aprendendo com os dados sem programação explícita. Os recursos de aprendizado de máquina na plataforma BigID ajudam a melhorar a eficiência e a precisão das análises de dados de diversas maneiras, conforme descrito em mais detalhes nesta seção.
A BigID desenvolve seus modelos de aprendizado de máquina em um ambiente de laboratório usando dados sintéticos e disponíveis publicamente. Dois dos recursos de aprendizado de máquina da plataforma BigID, o Hyperscan e os Classificadores, podem ser ainda mais ajustados ao ambiente do cliente usando metadados do cliente. Esses modelos são ajustados com metadados do cliente somente se o cliente optar especificamente por usá-los para esse fim. Os modelos do Hyperscan e dos Classificadores treinados com metadados do cliente são sempre armazenados e executados localmente, o que significa que são limitados ao ambiente individual do cliente e estão disponíveis apenas para esse cliente. Os modelos ajustados não são compartilhados entre ambientes de clientes nem usados pela BigID em nome de outros clientes. Os clientes podem usar todos os outros recursos de IA, mesmo que decidam não usar seus metadados para ajustar os modelos do Hyperscan e dos Classificadores ao seu ambiente.
O agrupamento de documentos e arquivos é um algoritmo de aprendizado de máquina não supervisionado que agrupa arquivos semelhantes com base em seu conteúdo. Esse recurso ajuda os usuários do BigID a organizar e gerenciar seus documentos com mais eficiência. Ao analisar o conteúdo textual dos documentos, o BigID pode agrupar arquivos como contratos, acordos de confidencialidade e faturas em clusters separados sem precisar saber o número de clusters antecipadamente.
A Descoberta Preditiva, ou HyperScan, é um modelo de aprendizado de máquina projetado para reduzir o tempo necessário para a análise de fontes de dados não estruturadas, prevendo a presença de informações confidenciais com base em metadados (por exemplo, caminho do arquivo, proprietário, extensão do arquivo). A BigID oferece aos clientes a opção de habilitar o modelo para que ele aprenda com os metadados coletados durante as análises de dados, a fim de aprimorar as previsões. Ao utilizar metadados, esse modelo acelera o processo de análise e permite que os usuários identifiquem arquivos com informações confidenciais mais rapidamente.
Os classificadores aprimorados por aprendizado de máquina (ML) do BigID são projetados para reduzir falsos positivos na classificação de dados baseada em expressões regulares (RegEx). Ao analisar metadados de verdadeiros e falsos positivos, o modelo aprende a ajustar os resultados da classificação e reduzir erros. Esse modelo melhora a precisão da classificação, atualmente aplicável apenas a fontes de dados estruturados, aumentando assim a precisão da descoberta de dados.
O NER é uma tarefa de Processamento de Linguagem Natural (PLN) que identifica entidades nomeadas (por exemplo, pessoas, locais) em dados não estruturados (geralmente em documentos ou colunas de texto livre). A BigID utiliza o NER para classificar informações pessoais por meio da análise de fontes de dados não estruturados. Os modelos de NER são desenvolvidos utilizando aprendizado profundo e executados localmente nos scanners BigID exclusivos de cada cliente, para maior eficiência e segurança.
O agrupamento de colunas/conjuntos de dados é um algoritmo não supervisionado que agrupa colunas semelhantes com base em padrões de dados. Por exemplo, colunas que contêm números de telefone são agrupadas. Ao comparar vetores de coluna usando a similaridade de cosseno, o BigID consegue gerenciar e analisar grandes conjuntos de dados com mais eficiência. Esse recurso também ajuda a detectar conjuntos de dados quase duplicados e a sugerir dados de maior qualidade para análise.
A BigID desenvolve seus recursos de IA baseados em Modelos de Linguagem Amplos (LLM) usando modelos pré-treinados e seguindo procedimentos de segurança rigorosos e os princípios de Privacidade por Design. A BigID não treina seus próprios LLMs nem compartilha dados de clientes com fornecedores terceirizados para desenvolvimento ou treinamento de LLMs. Os recursos GenAI da BigID empregam medidas de segurança apropriadas, incluindo redes privadas e endpoints privados. O BigChat também utiliza servidores de Memória de Vida Limitada (LLM), que não retêm nenhuma mensagem ou resposta transmitida. A BigID utiliza o Azure OpenAI GPT para alimentar o BigChat e o recurso de Mapeamento de Ativos de Negócios. O BigChat e o recurso de Mapeamento de Ativos de Negócios só podem ser usados em canais criptografados, e as conexões com o Azure são gerenciadas via VPN para que o tráfego não trafegue por redes não confiáveis.

Opcional para os clientes e funciona apenas mediante adesão prévia.
A BigID lançou um chatbot de perguntas e respostas chamado BigChat, baseado na tecnologia GenAI. A função do BigChat se limita a auxiliar os usuários na navegação e na resolução de problemas na plataforma BigID. O BigChat interage apenas com a documentação do software e informações relacionadas ao produto da BigID, e não armazena nem utiliza nenhuma informação compartilhada do usuário ou dados do cliente para treinar ou ajustar o modelo.

Opcional para os clientes e funciona apenas mediante adesão prévia.
Este recurso do GenAI permite que o BigID ingira um glossário de negócios fornecido pelo cliente e rotule as colunas das tabelas das fontes de dados conectadas usando os termos do glossário. Isso é feito analisando o conteúdo da tabela, as colunas próximas e outras pistas contextuais para determinar um rótulo apropriado. Este recurso opcional visa reduzir o esforço manual e os erros associados à gestão de dados tradicional e está limitado aos parâmetros definidos por cada cliente usando o glossário de negócios que ele fornece. Os clientes podem editar os rótulos sugeridos por este recurso.
Os recursos de IA da BigID são desenvolvidos usando dados sintéticos e disponíveis publicamente ou modelos pré-treinados. A BigID não utiliza nenhuma informação do usuário ou dados do cliente para treinar os recursos de IA generativa ou os modelos básicos de aprendizado de máquina. Dois dos recursos de aprendizado de máquina da plataforma BigID, Hyperscan e Classificadores, podem ser ajustados ao ambiente de cada cliente usando metadados do cliente. No entanto, esses modelos são ajustados usando metadados do cliente somente se o cliente optar especificamente por usar seus metadados para esse fim. Além disso, os modelos ajustados são sempre armazenados e executados localmente, o que significa que são limitados ao ambiente individual do cliente e estão disponíveis apenas para esse cliente. Os modelos ajustados nunca são compartilhados entre ambientes de clientes ou usados pela BigID em nome de outros clientes.
A BigID implementou controles de segurança e testes personalizados para mitigar os riscos associados ao uso de IA em nossa plataforma. A BigID realiza avaliações de IA em todas as iniciativas antes da implementação, com foco na mitigação de riscos críticos. Essas avaliações analisam os controles de privacidade e segurança em vigor e verificam a presença de viés e discriminação algorítmica, priorizando a conformidade com todas as leis e regulamentações aplicáveis ao fornecimento da plataforma BigID e o alinhamento com os padrões éticos aplicáveis. A BigID também coloca o controle sobre os recursos de IA nas mãos do usuário, desativando-os por padrão.
A BigID prioriza a conformidade com todas as leis e regulamentações relevantes aplicáveis ao fornecimento da plataforma BigID nas jurisdições em que operamos, incluindo as leis que regem o desenvolvimento e o fornecimento de recursos de IA. Entendemos a importância de atender a esses padrões para proteger seus dados.
A BigID se esforça para atualizar e aprimorar regularmente seus recursos de IA. A empresa adota uma estratégia de melhoria contínua, que inclui a adição de novos recursos opcionais para aprimorar os insights de dados e fornecer ferramentas mais poderosas para nossos clientes. O objetivo da BigID é manter os recursos de IA na vanguarda da inovação, ao mesmo tempo em que continua a buscar altos padrões de proteção e segurança de dados.