Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11624/533
Autor(es): Bublitz, Carlos Fabiel
Título: Sistema de reconhecimento de locutor integrado a comunicação e controle dos movimentos de um robô humanoide.
Data do documento: 2015
Resumo: A fala é uma das formas de comunicação mais efetivas e utilizadas por seres humanos. Quando adotada em sistemas computacionais como forma de entrada, torna qualquer interação homem-máquina em princípio mais natural. De acordo com essa tendência, sistemas de Reconhecimento Automático de Locutor (RAL) foram criados com o intuito de identificar o indivíduo emissor de um determinado sinal de voz, através da análise das características desse sinal. Uma das aplicações na utilização desses sistemas permite que se adicionem níveis de segurança à comunicação, através da autenticação de usuários e suas permissões. Em vista disso, o objetivo deste trabalho é embarcar um sistema de reconhecimento automático de locutor em um robô humanoide, no qual se permita a comunicação apenas por pessoas autorizadas. Esta comunicação poderá ser realizada de duas formas, sendo uma delas através de comandos para controlar a movimentação do robô, e também pela interpretação de simples perguntas, nas quais o robô deve ser capaz de processar uma resposta. Ao final, obteve-se uma aplicação com níveis aceitáveis de reconhecimento de locutor, sendo capaz de controlar, através da fala, a movimentação do robô e estabelecer uma comunicação simplificada na forma de perguntas e respostas. Para as etapas de extração de características do sinal de voz e identificação do locutor, são utilizados os métodos de Coeficientes Mel-Cepstrais e Gaussian Mixture Models, considerados o estado da arte pela literatura.
Resumo em outro idioma: Speech is one of the most effective and used ways of communication by humans. When adopted in computer systems as a form of input, it makes any human-machine interaction, in principle, more natural. According to this trend, Automatic Speaker Recognition systems were created in order to identify the sender of a particular individual voice signal, by analyzing the characteristics of that signal. One of the applications of these systems, allows us to add differents security levels to communications by authenticating users and their permissions. In view of this, the objective of this work is to develop an automatic speaker recognition into a humanoid robot, which should allow communication only by authorized people. This communication may be done in two ways, one being through commands to control the movement of the robot, and also for the interpretation of a simple question, which the robot must be able to process an answer. In the end, there was obtained an application with acceptable levels of speaker recognition and also it was able to control, through speech, the humanoid movements and providing a simplified communication in form of question and answers. For the extracting features of the speech signal and identifying speaker steps, the methods of Mel-Cepstral Coefficients and Gaussian Mixture Models are applied, which are considered state of art in the literature.
Nota: Inclui bibliografia.
Instituição: Universidade de Santa Cruz do Sul
Curso/Programa: Curso de Ciência da Computação
Tipo de obra: Trabalho de Conclusão de Curso
Assunto: Reconhecimento automático da voz
Interação homem-máquina
Robôs
Orientador(es): Molz, Rolf Fredi
Aparece nas coleções:Engenharia de Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TC2_Carlos_Bublitz.pdf995.19 kBAdobe PDFVisualizar/Abrir


Este item está licenciado sob uma Licença Creative Commons Creative Commons