Cinco leituras dignas: Privacidade diferenciada — o que significa para as empresas

24

Cinco leituras dignas é uma coluna regular sobre cinco itens notáveis que descobrimos enquanto pesquisamos trending e tópicos atemporais. Nesta edição, exploramos uma das técnicas de aprimoramento da privacidade em evolução chamada privacidade diferencial e como ela está sendo aproveitada pelas organizações para proteger dados confidenciais de serem expostos.

Tecnologias de ponta baseadas em inteligência artificial e machine learning vêm ganhando força nos últimos anos. As organizações estão se tornando mais dependentes delas para operações internas, pesquisa e previsão das necessidades dos clientes. No entanto, essas tecnologias são alimentadas por dados, especialmente dados do usuário final.

Embora a análise de dados forneça a visão necessária para oferecer um melhor atendimento ao cliente, manter a privacidade do usuário é o maior obstáculo que as empresas precisam superar. É aí que técnicas como privacidade diferencial (DP) entram em jogo. O DP ajuda a processar e compartilhar dados sem revelar as identidades individuais dos usuários, empregando ruídos estatísticos, que são alterações aleatórias feitas aos dados originais.

Aqui está um caso de uso simples: Um estudo precisa ser feito para analisar se os millennials preferem usar pasta de dente ou enxaguante bucal para higiene dental. Os participantes devem escolher qualquer uma das duas opções. Antes de registrar suas respostas, o algoritmo diferencialmente privado aplicará uma técnica de randomização semelhante ao lançamento de uma moeda. Se forem cabeças, a resposta original do participante, vamos supor pasta de dente, será mantida. Se for cauda, o enxaguante bucal será registrado como a resposta selecionada pelo participante. No caso de qualquer vazamento de dados, um invasor terá dificuldade em diferenciar entre os dados originais e os dados modificados gerados pelo algoritmo. A intercalação das respostas (ruído) seria feita apenas em quantidades aceitáveis que não causariam variações significativas nos resultados agregados.

Gigantes da tecnologia como Apple e Google usam o DP para identificar padrões comportamentais dos usuários sem divulgar suas identidades. A Apple emprega DP para acumular insights como uso de mecanismos de busca, uso de emojis e uso de palavras que não estão na biblioteca de palavras-chave de dispositivos como iPhones, iPads e Macs. O Google Maps usa DP para coletar informações sobre o tráfego nas cidades. Recentemente, o Google o usou em seus relatórios de mobilidade comunitária, que capturam tendências de movimento geográfico durante o COVID-19. O LinkedIn o usa para gerar análises de marketing e insights de audiência para anunciantes sem revelar os dados de seus membros. A Amazon usa-o para acessar o histórico de compras dos usuários sem comprometer suas identidades, a fim de fornecer sugestões mais personalizadas.

São apenas alguns casos de uso. Aqui estão cinco leituras interessantes sobre privacidade diferencial e o que isso significa para as empresas.

O que é Privacidade Diferencial? Como isso afetará nosso trabalho?

As pessoas estão cada vez mais preocupadas com a forma como seus dados estão sendo armazenados e usados. DP é uma das técnicas utilizadas para lidar com isso. Embora não seja um conceito totalmente novo, poucos o implementaram em grande escala. Entender os principais componentes do DP e como ele se relaciona com o seu objetivo de pesquisa é vital para aplicá-lo em uma escala maior.

A privacidade diferencial é a técnica ideal de computação que melhora a privacidade para o seu negócio?

Existem muitas técnicas de computação que melhoram a privacidade sendo desenvolvidas e testadas por grandes empresas. DP é um que está ganhando mais tração. Vamos analisar quais setores devem considerar a implementação disso e como ele está sendo usado em diferentes indústrias.

Provas Automáticas de Privacidade Diferencial

Certos bugs de implementação podem fazer com que algoritmos diferencialmente privados falhem com seu propósito. Testes automatizados e provas manuais são alguns dos métodos conhecidos para resolver esse problema. Neste artigo, exploramos outra opção chamada prova automática. Ferramentas automáticas de prova analisam um programa e tentam construir provas de que ele não deixará os algoritmos falharem.

Privacidade diferencial: Prós e contras de casos de uso empresarial

Misturar dados confidenciais com quantidades específicas de dados modificados aleatoriamente fornecerá mais segurança do que simplesmente criptografá-los. Este artigo discute as formas potenciais que as empresas podem aproveitar essa técnica para proteger dados valiosos, bem como os prós e contras dessas abordagens.

A privacidade diferencial está morta? Caso censitário tem aulas-chave

Este artigo explora o conceito de DP e como ele está sendo empregado por empresas de diferentes setores. Também compartilha os principais aprendizados do uso de DP pelo Census Bureau dos EUA.

Empresas que lidam com informações confidenciais podem reduzir o risco de exposição a dados combinando DP com outras tecnologias que melhoram a privacidade. Grandes marcas como Apple e Google já estão testando novos algoritmos diferencialmente privados como parte de suas medidas de proteção de dados. Empresas e governos começaram a explorar seu potencial para apoiar o intercâmbio seguro de dados confidenciais. No entanto, as empresas precisarão entender até que ponto o ruído (dados alterados) pode ser injetado para que esse método seja eficaz.