Please use this identifier to cite or link to this item:
http://repositorio.unitau.br/jspui/handle/20.500.11874/6438
metadata.dc.type: | Trabalho de Graduação |
Title: | Treinamento de máquinas para classificar os latidos através de ondas sonoras |
Other Titles: | Machine training to classify barks using sound waves |
Authors: | Souza, Ramom Dias dos Santos Landim de, 2000- Lorençon, Sarah Rejane Ribeiro, 1999- |
Abstract: | Resumo: Este trabalho demonstra a pesquisa e implementação de técnicas de aprendizado de máquina em aplicações de reconhecimento de sons de cães em termos de expressões animais: fome, chamar a atenção, brincar etc. Para a realização deste, houve o estudo de diversas técnicas de processamento de áudio e análise de alguns ambientes de desenvolvimento. A base de dados utilizada está disponível no site Freesounds, onde os áudios dos latidos utilizados foram armazenados. Para este trabalho foi utilizado, sete classes de latidos, criados a partir dessa base e foram separados em folders locais a fim de, variar a quantidade de classes disponíveis e o tempo de duração dos sinais de áudio nos testes, selecionando somente vocalizações do áudio original. Além disso, foi utilizado a linguagem de programação Python no ambiente do Visual Studio Code. Foi utilizado também métodos de decisão para o reconhecimento do padrão acústico, com a aplicação do coeficiente cepstral de frequência mel (MFCC), o qual é uma maneira de representar o som e foi criado em
seguida o modelo e estrutura da RNA, utilizando especificamente Redes Neurais Convolucionais (CNN) através da biblioteca de código aberto TensorFlow. Após aplicação do modelo selecionado, o presente projeto conseguiu realizar o seu objetivo, no qual é o desenvolvimento de uma ferramenta capaz de classificar os padrões de latidos de um cachorro com a base já pré-classificada. Abstract: This work demonstrates the research and implementation of machine learning techniques in applications of sound recognition of dogs in terms of animal expressions: hunger, calling attention, playing etc. To accomplish this, there was the study of several audio processing techniques and the analysis of some development environments. The database used is available on the Freesounds site, where the audios of the barks used were stored. For this work we used seven classes of barks, created from this database, and separated in local folders in order to vary the amount of classes available and the duration time of the audio signals in the tests, selecting only vocalizations of the original audio. In addition, the Python programming language was used in the Visual Studio Code environment. Decision methods were also used for acoustic pattern recognition, with the application of the honey frequency cepstral coefficient (MFCC), which is a way to represent sound, and then the ANN model and structure was created, specifically using Convolutional Neural Networks (CNN) through the open source TensorFlow library. After applying the selected model, the present project achieved its goal, which is the development of a tool capable of classifying the barking patterns of a dog with an already pre-classified base. |
Keywords: | Inteligência artificial Som Redes neurais |
metadata.dc.language: | Português |
metadata.dc.rights: | Acesso Aberto |
URI: | http://repositorio.unitau.br/jspui/handle/20.500.11874/6438 |
Issue Date: | 2022 |
Appears in Collections: | Engenharia de Computação - Trabalhos de Graduação |
Files in This Item:
File | Size | Format | |
---|---|---|---|
TG - Ramon, Sarah pdfA.pdf | 828.41 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.