FORMANDO ENGENHEIROS E LÍDERES

FORMANDO ENGENHEIROS E LÍDERES

Doutorando Ruben Glatt e a professora Anna Reali Costa desenvolvem um estudo sobre técnicas de aprendizado de máquinas

Com informações da Jornalismo Júnior, por Lázaro Campos

O doutorando Ruben Glatt e a professora Anna Helena Reali Costa, do Laboratório de Técnicas Inteligentes (LTI), conquistaram a prorrogação do prêmio Google Research Awards in Latin America, ganho em 2015. Trata-se de um incentivo da empresa norte-americana a pesquisas de tecnologia de ponta na América Latina. O reconhecimento veio a partir do projeto de doutorado de Glatt, com o tema “Improving Deep Reinforcement Learning through Knowledge Transfer”.

O estudo feito por Ruben consiste em unir técnicas de aprendizado de máquinas a fim de que o computador possa conhecer e operar diversas tarefas com maior rapidez. O objetivo é gerar agentes inteligentes. Para isso, através da combinação da técnica de reforço (Reinforciment Learning – RL), combinada à técnica aprendizado profundo (Deep Learning – DL), um algoritmo poderá executar diversas tarefas por transferência de conhecimento (Transfer Learning – TL). Glatt explica utilizando-se do exemplo de uma criança: se ela já sabe andar, ela vai usar essa habilidade já adquirida para aprender a correr, porque entre essas duas ações existem aspectos comuns. “Mas, na Inteligência Artificial, ainda é difícil extrair um conhecimento e aplicá-lo em outra tarefa”, diz.

No primeiro ano de pesquisa, foi utilizado o domínio de jogos digitais. Com emulador de Atari 2600, foram feitos experimentos. “A maior diferença foi que ano passado nós tínhamos uma visão geral, não bem definida. Agora nós publicamos um paper, temos uma ideia mais específica e sabemos o que precisamos fazer para chegar ao nosso objetivo”, diz Glatt.

Perguntado sobre o que planeja fazer nesse ano de extensão do prêmio, Ruben responde que deseja adaptar um método clássico da área chamado Policy Reuse (Política de Reuso) e aplicá-lo aos seus experimentos. Além disso, ele pretende comparar esse método clássico com outros, mais recentes, para saber qual é mais eficiente no caso de seu estudo.

Quanto ao objetivo final, que é o de conseguir um algoritmo capaz de executar diversas tarefas, Glatt afirma: “O mais difícil é como determinar a similaridade entre as tarefas para escolher o próprio conhecimento a ser transferido para o aprendizado de uma nova tarefa”. Ele acredita que é possível alcançar o seu objetivo, com mais uma extensão do prêmio: “Temos uma grande oportunidade para criar bons resultados. Acho que já fizemos bastante progresso.”

O prêmio também contribui para o reconhecimento do Departamento de Computação e Sistemas Digitais da Poli (PCS) e do LTI, segundo Ruben. “O prêmio não é só meu, a professora Anna também ganha o prêmio em conjunto. A Anna dá o ambiente, eu dou o projeto”, diz. “Isso também mostra que temos aqui um ambiente muito legal para fazer pesquisa com alto impacto, o que é muito importante. Temos mais um vencedor do prêmio no mesmo escritório, de um total de 24 vencedores da América Latina”, conclui.

Print Friendly, PDF & Email