Privacidade tem tudo a ver com gerenciamento de dados. Você precisa saber com que tipo de informação está lidando e o que realmente acontece com ela no backend. Catálogos de dados podem ajudar você a ver o que realmente está acontecendo e visualizar o que acontece com seus dados.
Para identificação de PII, a única tarefa em que os métodos NLU superaram o bom e velho Regex foi o Reconhecimento de Entidades de Nome (como identificar nomes de pessoas). Não é surpresa que ferramentas profissionais como o BigId usem expressões regulares como o primeiro método para classificar informações privadas, seguido por clustering e outras IAs sofisticadas.