Navegar

26/07/2022

Centro Pi desenvolve projeto de IA em parceria com a Globo

Integrantes do Centro Pi apresentaram projeto para técnicos da Globo.

Atento às perspectivas do setor de entretenimento, o Centro Pi (Centro de Projetos e Inovação IMPA) realizou um trabalho em conjunto com a Globo com foco em extração automática e enriquecimento de metadados a partir de modelos de inteligência artificial. Este trabalho tem o potencial de apoiar a empresa em seus desafios de negócio, permitindo melhorias nos seus sistemas de recomendações.

Neste mês, pesquisadores e alunos que atuam no centro visitaram a empresa para apresentar o projeto a parte de suas equipes de técnicos.

Leia mais: Prolímpico chega à sua quinta edição em agosto
Divulgados os classificados para vaga de Especialista de TI
Ex-aluna do IMPA é selecionada para doutorado nos EUA

Junto aos dados providenciados pela Globo, o grupo agregou múltiplas bases de metadados para construir seu sistema, com mais de 1,5 milhão de filmes e séries. A partir dessa imensidão de informação, os pesquisadores e alunos desenvolveram algoritmos de machine learning para extrair palavras-chave capazes de caracterizar cada um dos títulos de maneira acurada e extensiva. Como aplicação dessas descrições, o grupo desenvolveu métodos de recomendação de títulos a partir de palavras-chave e outras informações técnicas disponíveis.

Pesquisador do IMPA, Paulo Orenstein apresentou um resumo executivo do projeto. “Nosso objetivo, em primeiro lugar, era extrair um entendimento profundo de uma imensa quantidade de informações e, a partir disso, fazer um sistema de recomendação consistente e interpretável que gerará valor ao público consumidor da Globo”. 

Além dele, estiveram presentes no encontro o pesquisador Roberto Imbuzeiro, o tecnologista Roberto Beauclair, o pós-doc Lucas Nissenbaum, e os bolsistas Alex Akira, Lucas Resende, Lucas Schwengber, Thiago Ramos e Rodrigo Schuller.

Bolsistas do Centro Pi Lucas Resende, Lucas Schwengber, Thiago Ramos e Alex Akira.

A primeira etapa consistiu no enriquecimento dos dados providenciados pela Globo, quando os colaboradores do Centro Pi compilaram e agregaram múltiplas bases de metadados. Alex Akira, um dos integrantes do projeto, ressaltou que “erros de agregação têm um custo altíssimo em todas as etapas seguintes”. Por isso, o grupo se dedicou a limar problemas recorrentes desta área, como a dissociação de filmes diferentes que possuem muitos dados em comum. 

A extração de keywords é outro pilar fundamental do sistema elaborado pelo Centro Pi. Além de desenvolver seus próprios modelos para relacionar conteúdos com precisão, o grupo distribuiu as palavras-chave em diferentes categorias, como gênero, temas, estrutura técnica, pessoas envolvidas, lugares retratados e muito mais.

“Ter uma base ampla de metadados de conteúdos é fundamental para nosso negócio e poder incrementar esta base através da extração automática é um grande avanço. Além disso, estabelecer parcerias com centros de pesquisa relevantes como o IMPA aceleram o desenvolvimento e trazem muito valor às nossas soluções baseadas em dados” , diz Carlos Octávio Queiroz, Diretor de Estratégia Corporativa e Arquitetura da Globo.

Além da contribuição para o mercado, o projeto gerou inspiração para novas ideias de pesquisa acadêmica, ressaltou Lucas Nissenbaum. “Trabalhando no sistema, começamos a pensar em novas abordagens para o problema de record linkage, um problema clássico da ciência de dados que busca formas rápidas e precisas para agregar bases de dados sobre os mesmos objetos, mas com informações diferentes em cada uma delas. É um campo muito rico matematicamente, onde podemos fazer uma contribuição concreta a partir do trabalho que desenvolvemos nesse semestre”, explicou.

Leia também: INCTMat vai financiar eventos científicos com até R$ 20 mil
Viana fala sobre empacotamento de esferas em coluna na Folha