Voltar para notícias

Centro Pi apresenta projetos em sessão temática do 35º CBM

O Centro Pi (Centro de Projetos e Inovação IMPA) apresentou dois trabalhos na sessão temática “Visão e Computação Gráfica” realizada na tarde desta segunda-feira (28) no 35º Colóquio Brasileiro de Matemática. Organizada pelos pesquisadores do Visgraf (Laboratório de Visão e Computação Gráfica do IMPA) Luiz Velho, Tiago Novello e Luiz Henrique de Figueiredo, a sessão contou com oito palestras que abordaram temas variados. 

Abrindo a Sessão Temática, a equipe do Centro Pi apresentou um projeto de automação da correção dos cartões-resposta da 1ª fase da OBMEP (Olimpíada Brasileira de Matemáticas das Escolas Públicas). A pesquisa utiliza métodos de visão computacional para processar os cartões-resposta dos participantes da OBMEP e obter as informações de forma automatizada. O projeto utiliza métodos clássicos de computação gráfica como homografias para alinhamento de imagens e redes neurais para reconhecimento de caracteres, assim como técnicas modernas de autoencoders

“A utilização de métodos automáticos de leitura das informações do cartão-resposta da primeira fase pode levar a uma redução significativa de custos e trabalhos da OBMEP. Pensando no contexto de uma Olimpíada presente em 99.9% dos municípios brasileiros, concluímos que este trabalho terá um grande impacto nas edições futuras da prova,” disse Lucas Nissenbaum, cientista de projetos do IMPA.

A extração automatizada das informações da prova encara desafios diversos, especialmente considerando um universo de 18 milhões de participantes. Otávio Moreira, doutorando do IMPA, explica que as marcações realizadas pelos alunos nos cartões-resposta, muitas vezes, fogem do padrão esperado para leitura pelos sistemas computacionais.

“É muito comum que as crianças não coloquem espaço entre os nomes, por exemplo. Elas também costumam colocar mais um caractere por espaço. Muitos adotam diferentes marcações no cartão com a intenção de indicar qual é a resposta correta. Tem respostas inesperadas, como colocar a letra no CPF e frases que excedem o  espaço que foi determinado, entre outros desafios”, explicou Moreira.

Matematicamente, o grupo está usando um sistema de pipeline de processamento para o projeto, dividida em duas etapas principais. A primeira consiste em um sistema de retificação, no qual é feito um recorte e o alinhamento da imagem original. O ponto relevante é realizar o melhor alinhamento possível para dar seguimento às demais etapas. O trabalho tem sido feito com sucesso, de acordo com a equipe do Centro Pi. Já a segunda etapa da pipeline utiliza os recortes feitos da imagem alinhada para realizar a previsão do conteúdo. Os modelos usados na segunda etapa do projeto são variáveis.


“A gente começa tentando achar correspondências de alguma forma e computar uma transformação de mudança de perspectiva. Ou seja, a famosa homografia. Nós temos um cartão que inicialmente não está alinhado, e então a gente realiza o encontro de pontos e consegue fazer um leve ajuste fino da imagem, melhorando um pouco os resultados. E aí nós temos o resultado final do cartão para podermos partir para outras tarefas”, explicou Daniel Perazzo, doutorando do IMPA.

Um dos ajustes mais recentes na pesquisa foi o desenvolvimento de estratégias para refinar as previsões do modelo e melhorar um pouco a sua acurácia. A ideia trabalha com um modelo de construção de uma medida de probabilidade a partir dos resultados dos logits associados a cada dígito. Esta probabilidade é refinada a partir de dados de sintaxe.

“Tendo essa probabilidade refinada, podemos um novo máximo dentre as opções válidas ou prováveis e conseguir uma previsão melhor. Com isso, conseguimos chegar a uma acurácia do CPF de 99%. Do nome, fomos de 78% para 84%. No nascimento, de 91% para 94%. Isso considerando a acurácia do campo inteiro.” concluiu Rodrigo Schuller. 

Aprendizado de Máquina Científico: Redes Neurais na Modelagem de Dinâmicas Físicas

O Centro Pi também apresentou os resultados do projeto “Aprendizado de Máquina Científico: Redes Neurais na Modelagem de Dinâmicas Físicas”. Na palestra, a equipe realizou uma exposição das ideias por trás das Redes Neurais Informadas por Física (PINN) na sua formulação original de 2019. O grupo demonstrou diversas aplicações em problemas como propagação de calor e propagação de ondas acústicas. Depois, a equipe apresentou algumas variações da pesquisa que estão sendo desenvolvidas pelo laboratório do IMPA, como as novas Arquiteturas Neuro-Espectrais.

“Basicamente, uma rede neural recebe um input que é um vetor — um vetor do R2, do R3, ou de qualquer espaço. Esse vetor é passado para a primeira camada, uma camada de neurônios. Cada um desses neurônios tem um vetor de pesos e um viés. O vetor que está vindo da primeira camada, a gente faz o produto interno em cada um dos neurônios, soma um viés e passa uma função de ativação para a próxima camada repetir a operação. Matematicamente, é uma multiplicação por uma matriz, mais a soma de um vetor,  e em cada coordenada resultante a gente passa a função de ativação, que vai introduzir a não linearidade. Depois a gente pega esse vetor resultante da primeira camada e passa para a próxima, e passa para a próxima, e passa para a próxima, e por aí vai, até que o output é outro vetor, ou um número, conforme você queira definir a arquitetura. Depois que você faz essa rede neural, esses pesos e esses vieses são parâmetros da sua rede neural”, explicou Victor Balestro, professor da UFF e pós-doutorando do IMPA, sobre o funcionamento de redes neurais. 

Em uma PINN, estes pesos são treinados para minimizar perdas relacionadas à satisfação da equação diferencial e suas condições iniciais e de bordo. Essa base conceitual está sendo utilizada em diversas aplicações.

“Podemos por exemplo usar uma equação de transferência de calor, e as equações de Navier-Stokes que modelam o comportamento do ar enquanto flui. O que pode ser visto é que a PINN consegue modelar muito bem a temperatura. A PINN consegue aprender muito bem o comportamento qualitativo da temperatura, isso visualmente fica muito claro, mas quantitativamente também a gente tem um resultado muito bom, consistente com o esperado da dinâmica física”, explica Leonardo Mendonça, aluno de mestrado do IMPA.

Em uma aplicação desenvolvida pelo Centro Pi, os alunos demonstraram o poder de utilizar condições de borda absorvente em conjunto com amostragem adaptativa, exercendo um papel regularizador sobre o comportamento da rede neural. “O uso de amostragem adaptative permite que possamos atingir a mesma acurácia com um número menor de amostras do domínio da equação. O suporte de propagação de uma onda é um pequeno pedaço do produto espaço-tempo, então não utilizar um método de amostragem adaptativa faz com que a rede tenha menos tendência a convergir para a solução nula trivial. Dito isso, esta também aumenta a chance de overfit da solução. As condições de bordo funcionam para reduzir este efeito, assim como prevenir interferências de fora do domínio, gerando uma solução final mais acurada”, explica Márcio Marques, aluno de doutorado do IMPA. Este trabalho foi apresentado na Underwater Acoustics Conference and Exhibition (UACE2025) na Grécia. 

O Centro Pi também está trabalhando no desenvolvimento de novas arquiteturas, focadas na solução de equações de evolução como a equação diferencial parcial de propagação da onda em meio heterogêneo. “O desenvolvimento de novas arquiteturas focadas nestas aplicações, frequentemente inspiradas em métodos numéricos, permitem que atinjamos uma acurácia muito alta com um tempo de treinamento mais baixo,” disse Leonardo Moreira, aluno de doutorado da UERJ que está participando do projeto do Centro Pi.

Leia também: Palestras de divulgação combinam didática e simpatia no 35º CBM