Como empresas, coletamos e geramos uma quantidade imensa de dados. Para termos uma ideia exata de quanto, em 2024, a quantidade de informações geradas foi 149 zetabytes (149 seguido de 21 zeros). Espera-se que o número chegue a 394 zettabytes até 2028.
Muito disso é informações sensíveis, e, como tal, precisa ser protegido de acesso não autorizado using a robust data protection strategy. Some of it can be put behind controle de acesso baseado em função (RBAC) e autenticação multifator (MFA). No entanto, certos casos de uso exigem que você compartilhe alguns dados pessoais com outras pessoas, enquanto retém partes deles para mitigar os riscos de exposição de dados.
This is when data redaction involves more than just visual concealment; it plays a crucial role in data security and privacy compliance.
O que é redação de dados?
You might have seen movies and documentaries where, say, the CIA released a document, but with parts of it blacked out. That’s data redaction.
É a prática de segurança de dados que consiste em ocultar ou reter permanentemente informações pessoais identificáveis, de saúde, confidenciais ou sensíveis. Quando feito em papel, o documento pode ser compartilhado com pessoas que precisam ver parte do conteúdo, mas não todo.
Quando feito digitalmente, pode ser personalizado de acordo com a função e as necessidades de cada pessoa. Por exemplo, você pode querer compartilhar o endereço de e-mail de um cliente com alguém do departamento de marketing, mas não os dados do cartão de crédito. Já o departamento de expedição de produtos não precisa dessas informações, mas pode precisar do endereço residencial para o envio dos produtos, garantindo, ao mesmo tempo, o cumprimento das práticas de gerenciamento de dados.
Effective data redaction is used in these scenarios to protect sensitive content without compromising operational efficiency or access to non-sensitive data.
Data redaction involves identifying and eliminating sensitive content in a way that ensures confidentiality while maintaining document usability where appropriate. It can also be helpful when sharing information with third parties. For example, you might want to withhold your IP address when sharing network logs to protect the details of your infrastructure.
Redação de dados vs. mascaramento de dados: os dois métodos de privacidade de dados
Tanto a ocultação quanto o mascaramento de dados são métodos de proteção de informações confidenciais contra aqueles que não deveriam ter acesso a elas. Mas a forma como isso é feito é um pouco diferente.
A ocultação de dados, como vimos, oculta completamente as informações. Ela "oculta" tudo o que o visualizador não deveria ver — incluindo formato e comprimento.
Data masking, on the other hand, replaces the information with something else. For example, replacing each character with an asterisk or an X. The masked data maintains its format or data structure, which makes it useful in cases where the data still needs to be functional or realistic, but not revealed, thus supporting a comprehensive data privacy strategy. While encryption transforms data into an unreadable format that requires a key to decode, masking conceals the actual values in a way that keeps the data usable. With data redaction, the other party cannot see anything, while masking conceals the actual values.
The difference between data masking and redaction comes down to format preservation versus complete concealment. Masking is ideal for situations when you need the information to be functional and hold its shape, but you don’t want it seen, thereby reducing the risk of data breaches. It might be used to share information with developers, testers, and analysts who need the data but not informações de identificação pessoal (PII).
A redação, por outro lado, é mais apropriada quando qualquer detalhe, incluindo o comprimento ou o formato, pode expor informações sensíveis. Ela oferece um nível de proteção mais forte, removendo até mesmo pistas contextuais.
Por exemplo, se for um número de cartão de crédito, todos sabem que tem 16 dígitos. Você pode ocultar os números individualmente, mas não importa se as pessoas conseguem ver o tamanho. No entanto, se for um diagnóstico médico, até mesmo ver parte da palavra ou seu comprimento pode permitir que alguém a adivinhe.
Quando redigir dados e quais tipos de dados redigir
Você precisa redigir dados confidenciais, que geralmente são protegidos por leis de privacidade de dados, mas também tem uma responsabilidade ética para com seus clientes.
Claro, isso é relevante para o que você coletou deles; há também suas informações comerciais confidenciais.
Aqui está uma lista dos tipos de dados que você pode querer redigir:
- Informações de identificação pessoal: Refere-se a qualquer coisa que possa identificar a pessoa a quem pertence, seja isoladamente ou combinada com outros dados. Por exemplo, o número do Seguro Social (SSN), número do passaporte, nome completo (quando combinado com outras informações) de uma pessoa, etc.
- Informações de saúde protegidas: PHI é qualquer informação médica protegida pela Lei de Portabilidade e Responsabilidade de Seguro Saúde (HIPAA). It includes medical record numbers, health plan beneficiary numbers, medical diagnoses, treatments, and conditions, etc.
- Informações financeiras: Esse tipo de informação inclui números de cartão de crédito ou débito, detalhes de contas bancárias, informações sobre salário ou remuneração ou números de identificação fiscal.
- Informações legais ou governamentais: Nomes de testemunhas ou vítimas de um crime, informações sobre menores, identidades de policiais e depoimentos confidenciais podem ser informações que devem ser protegidas.
- Informações educacionais e de pesquisa: Todos os dados que uma instituição educacional coleta sobre um aluno são cobertos pela Lei de Direitos Educacionais e Privacidade da Família (FERPA), mas informações como identificadores de sujeitos de pesquisa e dados experimentais vinculados a um indivíduo também são informações confidenciais e devem ser redigidas.
- Informações comerciais confidenciais: Você não gostaria de revelar segredos comerciais, fórmulas ou algoritmos proprietários, comunicações internas ou termos de contratos, que você também pode querer redigir.
- Classified information: In government, military, or regulated industries, safeguarding classified information is a non-negotiable use case for redaction.

Redação estática vs. dinâmica
As we’ve discussed, redaction is used to any data that’s not meant to be shared. How you do it depends on whether you’re doing it on paper, manually on a digital document, or using automation.
No papel, a redação geralmente consiste apenas em usar um marcador preto sobre qualquer coisa que você queira ocultar. Formatos digitais como PDFs também permitem destacar o texto, embora isso seja comprovadamente ineficaz mais de uma vez. No entanto, é possível ocultar informações nesses documentos usando a ferramenta “Redigir”.
Of course, these are manual methods. If you’re an enterprise working with vast quantities of data, you would need to automate the process, because doing it manually is just not viable. There are several software programs and platforms that can automate redaction, including BigID. Simply provide the rules, and the tool will implement your data redaction policy. These redaction tools are being used across industries to streamline compliance and enhance security.
Redação de Dados Estáticos
Static redaction is a predefined, rule-based approach to protecting sensitive information. Here, sensitive information is permanently removed or obscured in a fixed version of the data, at the time of its export or when the document is prepared. Redaction is irreversible. Once redacted, the data is altered and cannot be restored. It’s typically used for documents or reports shared externally.
Redação dinâmica de dados
Dynamic redaction occurs in real time, applying redaction logic when data is accessed, based on user roles or contextual rules. The original data remains unchanged in storage. However, it appears redacted to unauthorized users. This approach is commonly used in applications or dashboards where you need to conditionally hide sensitive information based on the viewer’s permissions.
How to Use Data Redaction: Techniques For Data Protection
A modern data redaction strategy includes data masking, obfuscation, and anonymization. As such, some of these techniques listed might fall under one of the other categories. However, they are still useful for helping you comply with data privacy regulations such as the Regulamento Geral sobre a Proteção de Dados (GDPR), Lei de Proteção ao Consumidor da Califórnia (CCPA), ou HIPAA.
- Redação Blackout: Oculta visualmente informações confidenciais sobrepondo caixas pretas ou preenchimentos sólidos em documentos, comumente usados em registros legais e governamentais.
- Remoção de conteúdo ou whiteout: Apaga conteúdo confidencial substituindo-o por espaço em branco, eliminando a visibilidade sem interromper o layout ao redor.
- Correspondência e substituição de padrões: Usa expressões regulares ou detecção de padrões para identificar informações confidenciais e substituí-las por texto de espaço reservado como “REDIGIDO”.
- Substituição de Personagem: Substitui caracteres em dados confidenciais por símbolos (por exemplo, asteriscos), preservando algum contexto, como exibir apenas os últimos quatro dígitos de um número de cartão de crédito.
- Tokenização de dados: Converte valores confidenciais em tokens aleatórios que não têm sentido sem um sistema de mapeamento seguro, ocultando efetivamente os dados originais.
- Embaralhamento: Torna dados anônimos reorganizando valores dentro de um conjunto de dados, mantendo a estrutura, comumente usado em ambientes de teste ou análise.
- Anulação: Remove informações confidenciais substituindo-as por valores nulos ou vazios, efetivamente apagando-as do conjunto de dados.
- Generalização: Substitui dados específicos por categorias mais amplas para reduzir a identificabilidade, como alterar datas de nascimento exatas para faixas etárias.
- Agregação: Resume dados confidenciais em totais ou insights em nível de grupo, minimizando o risco de identificar indivíduos e protegendo informações confidenciais ou de identificação pessoal.
- Pseudonimização: Substitui detalhes de identificação por pseudônimos consistentes ou identificadores artificiais, preservando a usabilidade dos dados e protegendo as identidades.
- Redação de Reconhecimento de Entidade Nomeada (NER): Alavancas IA e processamento de linguagem natural para identificar e redigir automaticamente nomes, datas e outras entidades em texto não estruturado.
- Redação contextual ou baseada em regras: Usa regras personalizadas ou lógica de negócios para redigir dados dependendo do tipo de conteúdo, nível de sensibilidade ou acesso do usuário.
- Redação de metadados: Remove metadados ocultos, como nomes de autores, revisões de documentos e comentários para evitar vazamentos de dados não intencionais.
- Redação em nível de campo do banco de dados: Redige ou oculta campos específicos em bancos de dados com base em funções de usuário ou políticas de acesso, geralmente em tempo real.
- Redação baseada em impressão: Aplica redação a documentos impressos, geralmente por meio de revisão manual e redação física antes da digitalização ou arquivamento.
Each technique plays a role in ensuring sensitive data remains protected while enabling necessary access or analysis.
Casos de uso de redação de dados
Sua política de redação de dados pode ser usada para os seguintes propósitos:
- Conformidade com os regulamentos de privacidade de dados
- Protegendo informações confidenciais do cliente
- Protecting your internal company data
Segurança de dados com BigID
A plataforma BigID é uma maneira abrangente de proteger dados confidenciais de propriedade e armazenados pela sua empresa. Ela não só oferece diversas opções de ocultação e mascaramento de dados corporativos, como também oferece recursos de descoberta e mapeamento de dados.
Para descobrir todas as maneiras pelas quais esta plataforma pode ajudá-lo com a segurança e governança de seus dados, agende uma demonstração hoje mesmo!