Veja se uma pessoa existe de verdade: olhe nos olhos dela
Qual destes rostos é real? Você está em um programa de TV comandando por um robô, e essa é a pergunta que pode lhe dar 1 milhão de dólares. Você dá um zoom nas imagens, balança a cabeça e escolhe uma das quatro fotos. Descobrirá se acertou alguns minutos depois, mas, primeiro, o robô apresentador lhe diz que existe um jeito eficiente de reconhecer um boneco, e o segredo está nos olhos. Se der um zoom, você perceberá que as pupilas das pessoas que não existem são estranhas. A maioria delas não é redonda, e elas precisam ser circulares em humanos saudáveis.
Os pesquisadores desenvolveram uma ferramenta para extrair os contornos das pupilas em fotos e verificar se elas têm formato elíptico. Eles a testaram com sucesso em duas mil imagens — metade era de rostos de verdade, e a outra metade foi produzida artificialmente. Mas parece que a tecnologia usada para criar esses “humanos falsos” ainda não entende totalmente a anatomia do olho humano. E isso pode ajudar a proteger o mundo do uso malicioso de fotos que parecem realistas, aplicadas para enganar as pessoas na internet. As fotos de humanos que não existem foram criadas com GANs, que são Redes Gerativas Adversárias. Em 2014, o pesquisador de Inteligência Artificial, Doutor Ian Goodfellow, decidiu criar um modelo de aprendizagem profunda que conseguiria gerar dados falsos. Ele funcionaria usando duas redes neurais, que competiriam entre si.
A tarefa da primeira rede seria gerar imagens falsas usando uma série de dados já existentes. A tarefa da segunda rede seria identificar a diferença entre imagens reais e falsas. Assim, as duas redes aprenderiam uma com a outra. Quanto melhor a primeira se tornasse em produzir imagens, melhor a segunda seria em identificar quais delas eram falsas. O Doutor Goodfellow teve essa ideia enquanto saía com seus amigos. Assim que ele chegou em casa, escreveu um código para ela, e tudo deu certo desde a primeira tentativa.
Há muita preocupação de que as GANs espalhem dados falsos pelo mundo. Mas elas podem ser muito úteis para gerar objetos 3D, criar personagens de animação, gerar novas poses humanas para sites de compra virtual, editar fotos, converter fotos para emojis, traduzir texto em imagens, e muitas outras atividades similares.
A tecnologia está ficando cada vez melhor em criar rostos humanos realistas. Ela continua aprendendo com seus próprios erros, então está ficando cada vez mais difícil distinguir um rosto falso de um verdadeiro. Existe uma função conhecida como “transferência de estilo”, que permite que o sistema processe diferentes fragmentos da imagem separadamente. Isso quer dizer que ela pode pegar certo formato de rosto e de tipo de cabelo e misturar, para formar algo mais realista.
Mas, caso você não tenha certeza se a foto de alguém que você está vendo na internet é verdadeira, há algumas pistas para verificar. Fotos geradas por GAN, sobretudo as mais antigas, são levemente assimétricas. O cabelo é embaçado em apenas um lado, e há brincos ou outros acessórios em apenas um lado do rosto.
Você também pode perceber fios de cabelo descontextualizados no rosto, ou em outro lugar, ou ter a sensação de que a imagem foi pintada com um pincel enorme, ou tinta acrílica. Os fios de cabelo parecem retos demais. Há uma auréola estranha acima da cabeça, ou até uma mancha fluorescente.
É também muito difícil para os algoritmos criar óculos simétricos e realistas. Pode haver uma diferença no estilo da moldura nos lados direito e esquerdo. A moldura também pode parecer estar torta. Os algoritmos podem errar a quantidade ou a direção dos dentes, e colocá-los em sentido contrário. Pode haver um terceiro dentinho ou outras anomalias. O plano de fundo também pode denunciar uma imagem falsa. Ele é gerado pela mesma tecnologia, mas sem muita atenção aos detalhes, podendo apresentar estruturas e estampas estranhas, como formas cúbicas caóticas, ou algo igual a uma foto rasgada.
Às vezes você percebe que tem alguma coisa errada com as roupas do seu novo amigo virtual. O rosto pode estar impecável, e a roupa também, mas aquele casaco de inverno estranho não combina com o ambiente, nem com as sombras.
Os algoritmos da geração mais antiga deixaram manchas brilhantes, parecidas com bolhas de sabão, que podem surgir em qualquer parte da imagem, mas sobretudo entre o cabelo e o plano de fundo.
Você pode ver um monte de retratos gerados por computador em sites especiais. Tem um de gatos que não existem, com milhares de carinhas fofinhas e falsas de felinos. Tem outro site que permite que você veja fotos de apartamentos que não existem.
As redes neurais também são capazes de gerar vídeos que misturam rostos e corpos de pessoas diferentes.
Existe um algoritmo que consegue criar novas poses a partir de uma só foto. Ele rastreia traços faciais marcantes, como olhos, nariz e lábios, e gera novas fotos semelhantes. Aí, pega essas novas fotos com poses diferentes e junta tudo, para criar um vídeo. Assim, podemos ver como seria a Mona Lisa em um vídeo, movimentando-se e parecendo mais realista que qualquer humana.
Muitas pessoas temem que esse tipo de tecnologia seja usado para fins criminosos, como vídeos falsos que prejudicam a imagem de alguém na internet. Mas os pesquisadores veem essa tecnologia como algo positivo que pode ser usado em videoconferências, jogos com múltiplos jogadores, e na indústria de efeitos especiais. Victor Riparbelli, CEO e cofundador da empresa de software Synthesia, acredita que isso pode elevar o nível das produções cinematográficas. As versões de atores geradas por computador podem ser tão perfeitas, que você poderia jurar que são de verdade.
Quando essa tecnologia foi testada, 3 a 4 minutos foram suficientes para criar um modelo digital de um ator falando para a câmera. Ela se lembra de como o rosto mexe, e consegue recriar os movimentos.
Voltando ao nosso programa de TV, o apresentador robô diz que é hora de saber se você ganhou o prêmio de um milhão tentando distinguir uma imagem real de 3 criadas por GANS. E... você acertou! Há confete por todos os lados, e uma surpresa — você ganhou um bônus, e vai passar um dia com um robô realista! Eles estão ficando mais realistas a cada dia que passa. Falam como a gente, andam como a gente, e até têm uma grande variedade de emoções. Mas tenho certeza de que ainda dá pra notar as diferenças depois de passar um dia com ele.
O primeiro dos robôs dentre os quais você pode escolher é a primeira âncora android de telejornal. Ela foi apresentada para o mundo no Japão, em 2014. Fez uma participação ao vivo, na televisão, e depois se aposentou no Museu Nacional de Ciência e Inovação, em Tóquio. Lá, ela ajuda visitantes e coleta dados para estudos sobre a interação entre robôs e humanos. Sua irmã caçula, a Érica, deu um passo além, e é puro carisma. Ela fica conectada a um sistema computadorizado que está sempre escaneando a pessoa. Ela capta a direção do rosto humano e a expressão facial dele, e consegue entender quem é quem. Além disso, ela consegue conversar apropriadamente com humanos sobre vários assuntos. A Érica tem expressões faciais, e consegue mexer pescoço, ombros e cintura de forma independente. Também foi escalada recentemente para um papel principal em um filme de ficção científica, e recebeu um treinamento especial para o papel. Seus criadores tiveram que simular seus movimentos e emoções por meio de sessões individuais, para ensiná-la a controlar a velocidade dos movimentos e desenvolver sua própria personalidade.
BINA48 é uma robô humanoide da Hanson Robotics, feita à semelhança da esposa de um de seus criadores. Eles passaram mais de cem horas elaborando todas as lembranças, os sentimentos e as crenças dela. Em 2017, a BINA48 se tornou o primeiro robô a se inscrever e a concluir com sucesso uma aula de nível superior na Califórnia. Ela viajou pelo mundo, aparecendo em vários programas de TV. Sophia é provavelmente o projeto mais famoso da Hanson Robotics, e o robô parecido com humano mais avançado que eles têm. Ela se tornou o primeiro robô a receber cidadania de um país de verdade — a Arábia Saudita. Também é a primeira embaixadora da Inovação Robótica do Programa das Nações Unidas para o Desenvolvimento. Ela tem uma gama variada de emoções, e consegue expressá-las por meio do rosto, com o braço, e com gestos manuais. Ela fala em conferências mundo afora, e é uma verdadeira celebridade.
E o último robô disponível é Douglas, chamado de Humano Digital Autônomo por seus criadores. Ele está sendo desenvolvido pela Digital Domain, a empresa por trás dos efeitos visuais de alguns filmes famosos. O Douglas foi feito para quebrar as barreiras entre humanos e máquinas, falando com facilidade e naturalidade, e mudando de expressões como um camaleão. Douglas deve ser de grande ajuda para empresas que precisam responder perguntas dos clientes ou ajudá-los com tarefas repetitivas. Você escolhe o Douglas para te ajudar em uma prova de Ciências, e deixa tudo com seu novo amigo robô.