A última IA do Facebook não apenas detecta falsificações profundas, ela sabe de onde vieram

185

A plataforma de mídia social trabalhou com uma equipe do Estado de Michigan para desenvolver o sistema.

Até o Deep Tom Cruise acha que esta última geração de rostos fabricados digitalmente saiu do vale estranho e passou direto para o fotorealismo. Embora as possibilidades de entretenimento usando essa tecnologia sejam ilimitadas, vídeos falsos profundos têm o potencial de perturbar severamente a confiança do público no governo e em nossos funcionários eleitos – até mesmo a capacidade de acreditar em nossos próprios olhos. Na quarta-feira, o Facebook e a Universidade Estadual de Michigan estrearam um novo método de não apenas detectar falsificações profundas, mas descobrir qual modelo generativo o produziu pela engenharia reversa da própria imagem.

Além de dizer se uma imagem é uma falsa profunda ou não, muitos sistemas de detecção atuais podem dizer se a imagem foi gerada em um modelo que o sistema viu durante seu treinamento — conhecido como classificação “close-set”. O problema é que, se a imagem foi criada por um modelo generativo no que o sistema de detector não foi treinado, então o sistema não terá a experiência anterior para ser capaz de detectar o falso.

A técnica de engenharia reversa FB-MSU, embora não seja exatamente uma metodologia de ponta, “depende de descobrir os padrões únicos por trás do modelo de IA usado para gerar uma única imagem falsa profunda”, explicou a equipe em um post no blog de quarta-feira.

“Começamos com a atribuição da imagem e depois trabalhamos na descoberta de propriedades do modelo que foi usado para gerar a imagem”, continuou a equipe. “Ao generalizar a atribuição de imagem ao reconhecimento de conjunto aberto, podemos inferir mais informações sobre o modelo generativo usado para criar um deepfake que vai além de reconhecer que ele não foi visto antes.”

Além disso, este sistema pode comparar e rastrear semelhanças em uma série de falsificações profundas, permitindo que os pesquisadores rastreiem grupos de imagens falsificadas de volta a uma única fonte geradora, o que deve ajudar os moderadores de mídia social a rastrear melhor as campanhas coordenadas de desinformação.

Para executar essa técnica de detecção, os pesquisadores da FB-MSU executaram pela primeira vez um conjunto de imagens falsas profundas através de uma Rede de Estimativa de Impressões Digitais. FeNs são capazes de discernir padrões sutis impressos em imagens pelo dispositivo específico que o fez. Para fotografias digitais, cada um desses padrões é único devido a variações na fabricação de suas câmeras. O mesmo vale para as falsificações profundas — cada modelo generativo tem suas próprias peculiaridades que são impressas em suas criações que podem ser usadas para descobrir a identidade do modelo com base na própria imagem.

Como há efetivamente um número ilimitado de modelos generativos nas selvas da internet, os pesquisadores tiveram que generalizar sua busca por essas impressões digitais de imagem. “Estimamos impressões digitais usando diferentes restrições baseadas em propriedades de uma impressão digital em geral, incluindo a magnitude da impressão digital, natureza repetitiva, faixa de frequência e resposta de frequência simétrica”, explicou a equipe. Essas restrições foram então alimentadas de volta ao FEN, “para impor as impressões digitais geradas para ter essas propriedades desejadas”.

Uma vez que o sistema poderia consistentemente separar as impressões digitais genuínas das falsificações profundas, ele pegou todas essas impressões falsas e despejou-as em um modelo de análise para suss fora seus vários hiperparmetros. Os hiperparmetros de um modelo generativo são as variáveis que ele usa para orientar seu processo de autoaprendigo. Então, se você pode descobrir quais são os vários hiperparmetros, você pode descobrir que modelo os usou para criar essa imagem. A equipe do Facebook compara isso a ser capaz de identificar os vários componentes do motor de um carro apenas ouvindo-o ocioso.

Uma vez que a equipe da FB-MSU está pisando em águas de pesquisa inexploradas com este estudo, não há nenhuma linha de base específica para comparar seus resultados de teste. Assim, em vez disso, a equipe criou a sua própria e encontrou “uma correlação muito mais forte e generalizada entre as imagens geradas e o espaço de incorporação de hiper parômetros de arquitetura significativa e tipos de função de perda, em comparação com um vetor aleatório do mesmo comprimento e distribuição”. Então, basicamente, eles não podem dizer objetivamente o quão bom é o sistema deles, já que não há literalmente nenhuma outra pesquisa para compará-lo, mas eles sabem que é mais eficaz do que a sorte cega.

você pode gostar também