FORMANDO ENGENHEIROS E LÍDERES

FORMANDO ENGENHEIROS E LÍDERES

Programa desenvolvido por pesquisador da Poli-USP identifica com
83% de acerto emoções como tristeza, tédio ou raiva na voz humana.

Um programa de computador que “ouve” uma pessoa e é capaz de definir, com 83% de acerto em média, se ela está feliz, triste ou entediada ou ainda com raiva, nojo ou medo, pode se tornar uma ferramenta valiosa para as empresas de contact centers ao identificar situações de conflito nas ligações. Desenvolvido por um pesquisador da Escola Politécnica da Universidade de São Paulo (Poli-USP), o programa apresentou taxas de reconhecimento elevadas e comparáveis ao que de melhor se conseguiu com outros sistemas no mundo.
Nos testes, foram utilizados gravações em formato de áudio padrão. Utilizando uma base de dados pública, a Berlin Database of Emocional Speech, que contém gravações de áudio com atores interpretando determinadas emoções, o autor do projeto, o engenheiro Rafael Iriya, processou e extraiu dos sinais parâmetros que caracterizam a voz em determinada emoção – trato vocal, frequência da voz, intensidade sonora etc.

“Para cada emoção, estes parâmetros apresentam configurações diferentes, que evoluem de maneira diversa conforme a pessoa entona uma frase”, explica Iriya. Assim, para evitar um modelo genérico, o pesquisador utilizou vários tipos de entonação, de forma que a máquina pudesse reconhecer quais alterações na voz caracterizam cada emoção. “Foram utilizadas várias frases, faladas por diferentes pessoas, para criar o modelo de cada emoção”, conta.

Aplicação na prática – Para empresas de contact center, em tempo real, possibilitaria que um supervisor interviesse para ajudar o operador durante uma ligação que apresentasse uma situação de conflito. No pós-atendimento, poderia ser usado como ferramenta de controle de qualidade ou para treinamento, visto que o programa possibilitaria triar rapidamente as gravações.

Na prática, a aplicação deste programa requererá uma base de dados mais ampla, com milhares de gravações em áudio na língua desejada. Ou mais especificamente, uma base de dados em um contexto parecido com o do cenário prático, como as próprias gravações de um contact center. “Os algoritmos são os mesmos, só precisamos utilizá-los com dados de entrada diferentes.”

Inteligência artificial – Segundo Iriya , outra aplicação do programa são os jogos interativos. “Os mais modernos já são capazes de reconhecer quem é o jogador que está falando e qual o comando que o mesmo executa por meio da voz”, conta. “Ao incorporar o elemento emotivo no sistema de recepção, este terá uma resposta muito mais apropriada, aumentando a sensação de realidade e proporcionando um maior entretenimento.”

O programa também poderia ser usado como detector de mentira ou como ferramenta para acompanhar a evolução de um paciente em depressão ou com outro problema psicológico, verificando como sua voz se altera com o tempo. “No futuro, espera-se incrementar a inteligência artificial de máquinas e robôs, para que eles possam apresentar um comportamento mais humano, reconhecendo e simulando emoções.”

Print Friendly, PDF & Email