Professor da Uema desenvolve método inovador para imputação de dados em classificação multi-rótulo


Por em 17 de fevereiro de 2025



instagram: @uema.ppg

O Departamento de Computação do Centro de Ciências Tecnológicas da Universidade Estadual do Maranhão (CCT/Uema) está celebrando um marco importante na área de aprendizagem de máquina. O professor Antonio Fernando Lavareda Jacob Junior, em colaboração com outros pesquisadores, teve seu artigo publicado na renomada revista Plos One, um periódico classificado como A1 no Qualis e com um Fator de Impacto de 3.7. 

O artigo, intitulado “EvoImp: Imputação Múltipla de Dados de Classificação Multirótulo com um Algoritmo Genético”, é fruto de anos de pesquisa e está diretamente vinculado à tese de doutorado do Professor Jacob Junior, intitulada “Algoritmos Genéticos para Imputação Múltipla de Dados na Classificação Multirrótulo”. A tese foi orientada pelo Prof. Dr. Ewaldo Santana da Uema e co-orientada pelo Prof. Dr. Fábio Lobato, da Universidade Federal do Oeste do Pará. 

A Classificação Multi-Rótulo (MLC) é um tipo de tarefa de aprendizado de máquina em que uma instância de dados pode ser associada a múltiplas classes simultaneamente. Ao contrário da classificação tradicional, onde uma instância é atribuída a apenas uma classe, a classificação multi-rótulo permite a associação de várias etiquetas ou rótulos a uma única instância. A MLC difere da Classificação de Rótulo Único ao permitir que uma instância seja associada a múltiplas classes, como no caso da classificação de filmes, que podem ser categorizados como “drama” e “biografia” simultaneamente. 

Assim, a pesquisa “EvoImp: Imputação Múltipla de Dados de Classificação Multirótulo com um Algoritmo Genético”, aborda um problema crucial na análise de dados: a falta de dados. Esse problema é especialmente desafiador na MLC, onde apenas algumas técnicas têm explorado eficazmente dados faltantes. Para lidar com esse desafio, o Professor Jacob Junior propôs um novo método de imputação múltipla de dados, adaptado ao cenário de classificação multi-rótulo, preenchendo esta patente lacuna na literatura. O método, denominado EvoImp, é baseado em um algoritmo genético multi-objetivo que busca otimizar os valores a serem imputados. 

A eficácia do EvoImp foi extensivamente avaliada e os resultados demonstraram consistentemente que o EvoImp superou estratégias de imputação presentes no estado da prática. Esses resultados promissores confirmam que o EvoImp representa uma solução viável e robusta para o tratamento de dados perdidos na aprendizagem multi-rótulo. O impacto dessa pesquisa não apenas contribui significativamente para o avanço do conhecimento científico, mas também oferece soluções práticas para uma variedade de aplicações da vida real que dependem da análise de dados. O Prof. Jacob complementa destacando: “a fim de aumentar a visibilidade do trabalho, uma das contribuições focou na replicabilidade do estudo. Nesse caso, todos os produtos gerados (códigos, bases de dados) estão disponíveis nas plataformas mais utilizadas pela comunidade científica”. 

O Professor Fábio Lobato, co-orientador do Prof. Jacob, expressou sua satisfação com os resultados e destacou a importância de continuarem a explorar novas abordagens e técnicas para enfrentar os desafios em constante evolução no campo da aprendizagem de máquina.  

“O EvoImp se mostrou bastante competitivo e agora iremos trabalhar para traduzi-lo para a linguagem de programação Python de modo a possibilitar a incorporação do EvoImp em bibliotecas de aprendizado de máquina, facilitando seu pleno uso pela comunidade e, consequentemente, ampliando o impacto do estudo. Este é apenas um dos resultados da Tese do Prof. Jacob, há outros conhecimentos construídos no processo de doutoramento dele que estamos trabalhando para publicação. Durante a sua defesa, os membros da banca também contribuíram com sugestões que certamente renderão outros frutos. Particularmente, estou muito feliz com os resultados alcançados até agora. As perspectivas são promissoras”, destacou o Professor Fábio Lobato. 

A tese defendida pelo professor Jacob Junior não apenas destaca a excelência acadêmica da Uema, mas também reforça o compromisso da instituição em promover a inovação e contribuir para o avanço da ciência e da tecnologia. 

Aprendizagem de Máquina 

A aprendizagem de máquina, também conhecida como machine learning, em inglês, é uma abordagem para analisar dados que automatiza a criação de modelos analíticos. Pertencente ao campo da inteligência artificial, essa abordagem parte da premissa de que sistemas têm a capacidade de aprender com dados, reconhecer padrões e tomar decisões com pouca intervenção humana. 

O aprendizado de máquina não é uma tecnologia isolada; ele utiliza softwares, como os de mineração de dados e análise avançada, para processar grandes quantidades de dados e gerar valor aos negócios. 

Leia a matéria completa na REVISTA UEMA (Clique aqui)

Por: Karla Almeida



Últimas Postagens