Voltar para notícias

35º CBM: projeto usa aprendizado de máquina no combate ao abuso sexual

Na sessão temática “Visão e Computação Gráfica”, realizada nesta segunda-feira (28), no 35º Colóquio Brasileiro de Matemática (CBM), a professora do ICMC/USP, Instituto De Ciências Matemáticas e de Computação da Universidade de São Paulo, Leo Ribeiro apresentou um projeto que pode auxiliar na detecção de abuso sexual sem acesso a dados sensíveis. Com base em aprendizado de máquina e rede neural, o trabalho propõe o treinamento de modelos sem o uso de dados do Comitê Setorial de Acesso à Informação (CSAI). 

Para preservar informações sensíveis, eles treinaram os modelos com características, não com imagens. “A ideia é extrair dados estatísticos, na maioria das vezes automatizados, da base de dados da Polícia Federal. Quantas pessoas costumam ter? Qual é o gênero percebido das pessoas que aparecem nessas fotos? Qual é a idade média das pessoas? A gente costuma ter crianças e adultos? Costuma ter só crianças? Costuma ter só adultos nessas imagens? Esse tipo de informação geral que não descreve nenhuma imagem individual, a gente pode ter”, explicou Leo.

Sem acesso aos dados sigilosos, a ideia é treinar modelos, a partir de uma base de teste, que possam ser utilizados nas tarefas do mundo real. “Teremos um hardware limitado, então essas redes não podem ser muito grandes. Elas não podem ser LMMs, por exemplo, a não ser que muito quantizadas, é o máximo que a polícia consegue rodar localmente. A gente não pode usar cloud de forma alguma. E a gente tem também problemas em geral sobre a cara das imagens. Então, baixa iluminação, a distribuição das imagens reais é bem diferente da distribuição dos dados públicos que a gente tem para treinar os nossos modelos.”

A realização da pesquisa procura driblar problemáticas diversas. Entre elas, a apologia ao crime, à pedofilia, mediante a divulgação dessas imagens; e também os danos ao psicológico dos agentes da lei que precisam lidar com essa base de dados, com o armazenamento dessas imagens. A equipe procura minimizar o problema por meio de recursos de reconhecimento automático, triagem e análise de dados. 

O doutorando do IMPA Daniel Perazzo acompanhou a palestra e chamou a atenção para as estratégias de obtenção de dados sem recorrer aos materiais sensíveis. “Achei a palestra muito interessante pela importância do problema e também pela forma como a equipe contornou o fato de não poder ter acesso aos dados. Como eles cooperaram com a Polícia Federal e como a equipe da professora desenvolveu uma técnica muito interessante para o problema que eles tinham”.

Leia mais: 35º CBM reúne expoentes para debater avanços científicos