Download - RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

Transcript
Page 1: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

ULISSES NAIRNE DE ALMEIDA

RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE

DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA

Canoas, 2009

Page 2: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

ULISSES NAIRNE DE ALMEIDA

RECONHECIMENTO DE RITMO

MUSICAL POR ANÁLISE DE SINAIS

DE ÁUDIO DE AMPLITUDE E

FREQUÊNCIA

Trabalho de conclusão apresentado para

banca examinadora do curso de Ciência da

Computaçãodo Centro Universitário La Salle

- Unilasalle, como exigência parcial para

obtenção do grau de Bacharel em Ciência da

Computação.

Orientação: Profa. Dra. Márcia Häfele Islabão Franco

Canoas, 2009

Page 3: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

ULISSES NAIRNE DE ALMEIDA

RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE

DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA

Trabalho de conclusão apresentado para

banca examinadora do curso de Ciência da

Computaçãodo Centro Universitário La Salle

- Unilasalle, como exigência parcial para

obtenção do grau de Bacharel em Ciência da

Computação.

Aprovado pela banca examinadora em 28 de novembro de 2009

BANCA EXAMINADORA:

Prof. Me. Abraham Lincoln Rabelo de SousaCentro Universitário La Salle - Unilasalle

Prof. Me. Rafael KunstCentro Universitário La Salle - Unilasalle

Page 4: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

AGRADECIMENTOS

Agradeço principalmente aos meus pais, Salvador Assis de Almeida e Maria

Nairne de Almeida, pelo amor, apoio, suporte, compreensão e imprescindível

ajuda durante todas as épocas de minha vida. Ao meu irmão, Leonardo, pela

amizade incondicional que venceu obstáculos severos e por todos os bons mo-

mentos proporcionados em sua companhia.

A todos os colegas e professores da faculdade pelos grandes ensinamentos e

informações compartilhadas, pelo companheirismo, pelas risadas e por tudo que

me proporcionaram vivenciar enquanto colega de classe, profissional e aprendiz.

Agradeço a Sirlei Belling, minha namorada, por todo amor e carinho dedica-

dos, presentes em cada momento decisivo. Por acreditar na minha capacidade

acima de tudo e por sempre elevar a patamares mais altos o ânimo para contin-

uar, ainda que sob as pressões e frustrações sofridas ao longo caminho.

Agradeço à minha orientadora, ou melhor dizendo amiga, Márcia Häfele Is-

labão e a todos os professores do Centro Universitário La Salle que de uma forma

ou outra contribuíram com a direção correta para as pesquisas científicas real-

izadas nesse trabalho.

Page 5: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

RESUMO

Hoje em dia existem muitos trabalhos que buscam encontrar uma maneira

mais confiável e apropriada de classificar automaticamente a crescente quanti-

dade de músicas no formato de áudio digital. Vislumbrando num futuro não tão

longínquo, é provável que todo o conteúdo de áudio gerado pelo homem esteja

de alguma maneira na Internet ou para compra ou para fazer download gratuito.

Neste pensamento, a classificação automática de músicas estará mais presente

no cotidiano dos usuários de computador, já que atualmente um dos maiores

divertimentos é ouvir músicas no formato digital. Entretanto, existem várias pro-

postas para a classificação automática mas a maioria delas necessita da presença

de um especialista, ou seja, manualmente. Sabe-se que este método é lento e com

um alto custo, além de produzir muitas inconsistências e principalmente proble-

mas relacionados a padronização. Este trabalho propõe-se a estudar as técnicas

baseadas em amplitude, frequência produzidas pela música e redes neurais para

a classificação automática de ritmos musicais. Com isso, busca-se produzir uma

nova abordagem com o intuito de obter saídas mais significativas e padronizadas

das existentes.

Palavras-chave: Técnicas de Fourier, Redes Neurais, Classificação, Técnicas de

Fisher, Técnicas de K-Vizinhos.

Page 6: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

ABSTRACT

Nowadays there are many searches that aim at finding a more reliable and ap-

propriate way of classifying automatically the increasing amount of songs in the

digital audio format. Seeking for a future not so distant, it is likely that all audio

content generated by the mankind is somehow free for sale or download on the

Internet. On this track, the autoatic classification of songs will be more present

daily for computer users, as nowadays one of the hoghest entertainments is to lis-

ten to music in the digital format. However, there are many proposals on how ti

classify them automatically but most need a specialist, in other words manually.

It´s known this method is slow and high cost, besides producing many incon-

sistencies and specially problems related to standardization. This work aims at

studying the techniques based on amplitude, frequency produced by the songs

and neural networks to an automatic classification of rhythms. As a result, we

seek at producing a new approach in order to obtain more meaningful outputs

and standardized form the existing.

Keywords: Fourier techniques, Artificial Neural Network, Classification, Fisher

techniques, KNN techniques.

Page 7: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

SUMÁRIO

LISTA DE SÍMBOLOS E ABREVIATURAS . . . . . . . . . . . . . . . . . . 6

LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.1 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.2 Visão Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2 FUNDAMENTAÇÃO TEÓRICA . . . . . . . . . . . . . . . . . . . . . . 11

2.1 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.1.1 Funções de Ativação . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.1.2 Aprendizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2 Processamento Digital de Sinais . . . . . . . . . . . . . . . . . . . . . 15

2.2.1 Magnitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2.2 Análise de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . . . 20

4 RECONHECIMENTO DE ESTILO MUSICAL . . . . . . . . . . . . . . 22

5 EXPERIMENTOS REALIZADOS . . . . . . . . . . . . . . . . . . . . . . 27

5.1 Método de Fisher (FDLF) . . . . . . . . . . . . . . . . . . . . . . . . . 27

5.2 Método de K-Vizinhos (KNN) . . . . . . . . . . . . . . . . . . . . . . 28

6 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

6.1 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

Page 8: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

LISTA DE SÍMBOLOS E ABREVIATURAS

PDS - Processamento Digital de Sinais

IA - Inteligência Artificial

RNA - Redes Neurais Artificiais

WAV - Windows Audio Video

FS - Série de Fourier

FT - Transformada de Fourier

DTFS - Série de Fourier de Tempo Discreto

DTFT - Transformada de Fourier de Tempo Discreto

AM - Amplitude modulada

FM - Frequência modulada

MUGRAT - Music Genre Recognition

MP3 - MPEG Audio Layer-3

FFT - Fast Fourier Transform

KNN - K Nearest Neighbor

FDLF - Função discriminante linear de Fisher

SVM - Support Vector Machine

RBF - Radial Basis Function

Page 9: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

LISTA DE FIGURAS

Figura 1 - Modelo de um neurônio artificial de McCulloch e Pits . . . . . . . 12

Figura 2 - Aprendizado supervisionado . . . . . . . . . . . . . . . . . . . . . 14

Figura 3 - Aprendizado não-supervisionado . . . . . . . . . . . . . . . . . . 15

Figura 4 - Comparativo entre frequências e amplitudes . . . . . . . . . . . . 18

Figura 5 - Pré-Modelo de concepção de estudos realizados . . . . . . . . . . 22

Figura 6 - Projeção de Fisher em diferentes subespaços . . . . . . . . . . . . 27

Figura 7 - Projeções de Fisher 3D . . . . . . . . . . . . . . . . . . . . . . . . . 28

Figura 8 - Experimentos com o ritmo Axé . . . . . . . . . . . . . . . . . . . . 31

Figura 9 - Experimentos com o ritmo Black Music . . . . . . . . . . . . . . . 31

Figura 10 - Experimentos com o ritmo Clássica . . . . . . . . . . . . . . . . . 31

Figura 11 - Experimentos com o ritmo Eletrônica . . . . . . . . . . . . . . . . 32

Figura 12 - Experimentos com o ritmo Dance . . . . . . . . . . . . . . . . . . 32

Figura 13 - Experimentos com o ritmo Hard Rock . . . . . . . . . . . . . . . 32

Figura 14 - Experimentos com o ritmo Heavy Metal . . . . . . . . . . . . . . 33

Figura 15 - Experimentos com o ritmo Blues / Jazz . . . . . . . . . . . . . . . 33

Figura 16 - Experimentos com o ritmo Pop . . . . . . . . . . . . . . . . . . . 33

Figura 17 - Experimentos com o ritmo Reggae . . . . . . . . . . . . . . . . . 34

Figura 18 - Experimentos com o ritmo Samba . . . . . . . . . . . . . . . . . . 34

Figura 19 - Experimentos com o ritmo Pagode . . . . . . . . . . . . . . . . . 34

Figura 20 - Experimentos com o ritmo Sertaneja . . . . . . . . . . . . . . . . 35

Figura 21 - Experimentos com o ritmo MPB . . . . . . . . . . . . . . . . . . . 35

Figura 22 - Experimentos com o ritmo Gauchesca . . . . . . . . . . . . . . . 35

Figura 23 - Comparação do aprendizado de todos os ritmos musicais . . . 36

Figura 24 - Comparação da taxa de erro de todos os ritmos musicais . . . . 36

Page 10: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

LISTA DE TABELAS

Tabela 1 - As principais tarefas que as RNA podem executar e alguns exemplos

de aplicação (Haykin and Veen, 2001). . . . . . . . . . . . . . . . . . . 13

Tabela 2 - Relação entre propriedades de tempo de um sinal e a represen-

tação de Fourier (Haykin and Veen, 2001). . . . . . . . . . . . . . . . . 17

Tabela 3 - Representação da saída da RNA . . . . . . . . . . . . . . . . . . . 23

Tabela 4 - Tabela de ritmos musicais usados no estudo . . . . . . . . . . . . . 29

Page 11: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

1 INTRODUÇÃO

Música é a arte e a ciência de combinar os sons de modo agradável ao ouvido

(Ferreira, 2009), ou seja, a arte de representar o mundo e se relacionar com ele

(Moraes, 1983).

Na essência de uma música pode-se encontrar diversos elementos, entre eles:

ritmo, sons, ruídos, altura, intensidade, timbre e até mesmo silêncio. Esses elementos

podem ser encontrados quando uma música é executada em um computador na

forma de sinais digitais. Esses sinais digitais podem ser analisados por uma das

áreas de estudo deste trabalho que é Processamento Digital de Sinais (PDS)(Digital

Signal Processing) .

Processamento Digital de Sinais é a ciência empregada para usar aplicações

computacionais para compreender estes tipos de dados, chamados de sinais. Esta

análise inclui uma gama de objetivos, como: filtragem, reconhecimento de voz,

compressão de dados e inteligência artificial (Smith, 1997).

Segundo (Sage, 1990) o princípio da Inteligência Artificial (IA) é o desen-

volvimento de paradigmas ou algoritmos que requeiram máquinas para realizar

tarefas cognitivas, para as quais os humanos são atualmente melhores.

Uma das áreas de estudos da IA, a qual foi usada como base neste trabalho é

a de Redes Neurais Artificiais (RNA) (Artificial Neural Network) .

As Redes Neurais Artificiais são sistemas paralelos distribuídos compostos

por unidades de processamento simples (neurônios artificiais) que calculam de-

terminadas funções matemáticas (normalmente não-lineares). As redes neurais

podem ser utilizadas para realizar classificação, categorização, aproximação, pre-

visão e otimização.

Este trabalho tem como finalidade, utilizando os conhecimentos obtidos em

RNA e PDS, desenvolver uma solução para o problema de identificação automática

do estilo musical ao qual um arquivo do tipo Windows Audio Video (WAV) per-

tence.

1.1 Metodologia

A realização deste trabalho deu-se utilizando do estudo e da aplicação das

distintas áreas correlacionadas. De um lado as RNA, da qual fez-se o uso dos

recursos de criação, treinamento e outros mecanismos necessários para a finaliza-

ção do trabalho. Já na área de PDS, usou-se os conceitos de amplitude, frequência

modular para processamento dos arquivos no formato do tipo WAV e extraiu-se o

dados necessários para a avaliação. Após o levantamento bibliográfico finalizado

Page 12: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

10

foram realizados as seguintes etapas:

1. Pré-Processamento: A etapa utilizou-se as técnicas de análise de amplitude

modular e frequência modular para extrair informações para a realização

da etapa de seleção de características;

2. Seleção de Características: Nesta etapa após ter concluído a etapa anterior,

foi montada a base de conhecimento para obtenção das características de

cada estilo musical;

3. Classificação: Esta etapa foi responsável pelo confrontamento de informações

entre os dados da base conhecimento e os dados da base de treinamento e a

partir destas avaliações foram gerados os resultados para classificação dos

estilos musicais da música;

1.2 Visão Geral

Este trabalho está organizado da seguinte maneira:

• O capítulo 2 aborda os conceitos básicos para uma melhor compreensão

do leitor em relação as técnicas utilizadas nos experimentos deste trabalho,

além de explicar algumas definições e elementos importantes das áreas en-

trelaçadas neste trabalho. Como por exemplo, as RNA e suas funções de

ativação e aprendizado e o PDS e seus cálculos de magnitude do sinal e

análises de Fourier.

• Os trabalhos relacionados, os quais foram utilizados como base para a construção

e enriquecimento deste trabalho, encontram-se melhor detalhados no capí-

tulo 3.

• O capítulo 4 apresenta e explicita a proposta de trabalho, os Softwares de

apoio utilizados para a extração de características das músicas, as técnicas

utilizadas e como foi realizado o trabalho.

• Os experimentos e resultados obtidos são apresentadas no capítulo 5.

• O capítulo 6 lista as conclusões sobre os experimentos realizados e apre-

senta os trabalhos futuros.

Page 13: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

2 FUNDAMENTAÇÃO TEÓRICA

Este capítulo apresenta, de forma dinâmica os conceitos que foram utiliza-

dos como base para realização deste trabalho. A seção 2.1 trabalha a parte de

Inteligência Artificial, mais especificamente Redes Neurais Artificiais, dando uma

introdução sobre o assunto e nos sub-tópicos seguintes um apanhado geral de

seu funcionamento e classificação.

A seção 2.2 trabalha a parte de Processamento Digital de Sinais, mais especifi-

camente Transformadas de Fourier, apresentando um estudo elementar sobre as

técnicas de análise da representação dos sinais.

2.1 Redes Neurais Artificiais

As Redes Neurais Artificiais (RNA) são sistemas paralelos distribuídos com-

postos por unidades de processamento simples (neurônios artificiais) que cal-

culam determinadas funções matemáticas (normalmente não - lineares). Tais

unidades são dispostas em uma ou mais camadas interligadas por um grande

número de conexões, geralmente unidirecionais. Na maioria dos modelos essas

conexões estão associadas a pesos, os quais armazenam o conhecimento adquirido

pelo modelo e servem para ponderar a entrada recebida por cada neurônio da

rede (Braga et al., 2007).

As RNA são compostas por no mínimo um e no máximo n neurônio(s) ar-

tificial(is). Cada neurônio é composto pelos seguintes elementos: um conjunto

de valores de entrada, um conjunto de pesos, funções de ativação e uma saída

(Barrone, 2003).

• Os valores de entrada (Xi): são valores dos quais são fornecidos pelas funções

de ativação ou de uma outra fonte de dados, que são passados de um

neurônio para outro durante o treinamento;

• O conjunto de pesos (Wki): são os elementos os quais possuem conhecimento

da rede, que são adaptados durante os processos de treinamentos da rede;

• A função de ativação (ϕ): calcula o valor de ativação de cada neurônio, em

função de seus pesos e dados de entrada (Barrone, 2003);

• A saída (yk): é a saída fornecida pela RNA como resposta aos cálculos realizados

entre os valores de entrada, pesos e funções de ativação: y = F(WX) (Bar-

rone, 2003).

Page 14: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

12

A figura 1 ilustra um modelo de um neurônio artificial (Mcculloch and Pitts,

1943).

Figura 1: Modelo de um neurônio artificial de McCulloch e Pits

As cinco principais tarefas de uma RNA, conforme (Braga et al., 2007) são:

classificação, categorização, aproximação, previsão e otimização.

• Classificação: é a tarefa de atribuir uma classificação desconhecida de uma

entre as várias classes conhecidas;

• Categorização: é a tarefa de atribuir um padrão desconhecido de uma entre

várias classes desconhecidas, envolvendo tipicamente o aprendizado não

supervisionado;

• Aproximação: é o aprendizado supervisionado;

• Previsão: se caracteriza tipicamente pela estimativa de situações futuras

com base nos estados atuais e anteriores do sistema a ser modelado;

• Otimização: é a tarefa de minimização ou maximização de uma função de

custo.

A tabela 1 ilustra algumas das principais aplicações de redes neurais artificiais

e os seus paradigmas de aprendizado.

2.1.1 Funções de Ativação

A função de ativação, como o próprio nome já diz é a função pela qual uma

RNA é induzida, ou seja, ativada. A função de ativação é responsável por gerar a

saída y do neurônio a partir de valores dos vetores de peso w = (w1, w2, . . . , wn)t

e de entrada x = (x1, x2, . . . , xn)t (Braga et al., 2007).

Segundo (Haykin, 2001), é possível identificar três tipos básicos de funções de

ativação no modelo MCP (ilustrado na figura 1):

1O DNA é a substância que forma os genes onde estão inscritas, em código, as informaçõeshereditárias (Amabis, 1997).

Page 15: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

13

Tabela 1: As principais tarefas que as RNA podem executar e alguns exemplos deaplicação (Haykin and Veen, 2001).

Tarefas Algumas AplicaçõesClassificação Reconhecimento de caracteres

Reconhecimento de imagensDiagnóstico(médico, equipamentos, etc.)

Análise de risco de créditoDetecção de Fraudes

Detecção de falhas em sistemas industriaisCategorização Agrupamentos de sequências de DNA 1

Mineração de dadosAnálise de expressão genética

Agrupamentos de clientesPrevisão Previsão do tempo

Previsão financeira (câmbio, bolsa, etc.)Modelagem de sistemas dinâmicos

Previsão de sequências de DNA

• Função de Limiar: A saída da função de ativação pode assumir apenas dois

valores. O valor 1, se o campo induzido daquele neurônio é não-negativo, e

0 caso contrário. Esta afirmação define a propriedade tudo-ou-nada do modelo

MCP. Na equação 2.1 visualiza-se a definição em notação matemática;

ϕ(v) =

1, se v ≥ 0

0, se v < 0(2.1)

• Função Linear por partes: É uma função Limiar até ultrapassar os valores mínimos

e máximos de saturação, ou seja, quando se obtêm uma saída constante. Na

equação 2.2 visualiza-se a definição em notação matemática;

ϕ(v) =

1, se v ≥ +12

v, se + 12 > v > −1

2

0, se v ≤ −12

(2.2)

• Função Sigmoide: É uma função que possui o seu gráfico de saída em forma

de "S". Esta função é uma função contínua diferencial e monotônica es-

tritamente crescente que tem como característica um bom balanceamento

entre as funções de ativação lineares e não-lineares. Segundo (Haykin, 2001),

é a forma mais utilizada de função de ativação em RNA. Na equação 2.3

visualiza-se a definição em notação matemática.

ϕ(v) =1

1 + exp(−av)(2.3)

Page 16: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

14

2.1.2 Aprendizado

As RNA tem como característica principal a sua capacidade de aprender por

meio de exemplos. Conforme (Mendel and Fu, 1970) aprendizado é o processo

pelo qual os parâmetros livres de uma rede neural são ajustados por meio de

uma forma contínua de estímulo pelo ambiente externo, sendo o tipo específico

de aprendizado definido pela maneira particular de como ocorrem os ajustes dos

parâmetros livres.

Nesta etapa é importante destacar que o conceito de aprendizado está rela-

cionado com a melhoria do desempenho da rede segundo algum critério preesta-

belecido (Braga et al., 2007). Em RNA existem vários algoritmos para treina-

mento, os quais são agrupados em dois paradigmas principais: aprendizado su-

pervisionado e aprendizado não-supervisionado.

O Aprendizado Supervisionado tem como priori a existência de um supervisor,

ou um professor externo que terá como tarefas estimular as entradas da rede por

meio de padrões de entrada e verificar a saída calculada, comparando-as com a

saída desejada. A figura 2 apresenta um modelo deste aprendizado.

Figura 2: Aprendizado supervisionado

O treinamento do aprendizado supervisionado pode ser desenvolvido de dois

modos:

• Off-line: a base de conhecimento da rede não muda, ou seja, uma vez obtida

uma solução para a rede, esta deve permanecer fixa;

Page 17: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

15

• On-line: ao contrário do modo Off-line o conhecimento da rede muda constantemente,

e a rede deve estar em um contínuo processo de adaptação.

Existem vários algoritmos que empregam a teoria de aprendizado supervi-

sionado, mas o mais famoso é a regra delta (Widrow and Hoff, 1960) e a sua

generalização para redes de múltiplas camadas, e o algoritmo back-propagation

(Rumelhart et al., 1986).

O Aprendizado Não-Supervisionado ao contrário do aprendizado supervisionado

não requer um supervisor externo para acompanhar o processo de aprendizado.

A figura 3 apresenta um modelo deste aprendizado.

Figura 3: Aprendizado não-supervisionadoFonte: Autoria própria, 2009

Segundo (Braga et al., 2007) no treinamento de uma RNA de aprendizado não-

supervisionado somente os padrões de entrada estão disponíveis para a rede, ao

contrário do aprendizado supervisionado, cujo o conjunto de treinamento possui

pares de entrada e saída.

O aprendizado não-supervisionado destina-se a problemas que propõe-se à

descoberta de características estatisticamente relevantes nos dados de entrada,

como, a descoberta de agrupamentos ou classes.

Existem vários algoritmos que empregam a teoria de aprendizado não-supervisionado,

mas os mais famosos são os mapas auto-organizativos de Kohonen (Kohonen,

1982), os modelos ART (Carpenter and Grossberg, 1988) e os algoritmos basea-

dos na regra de Hebb (Hebb, 1949). Esses algoritmos citados não são o foco de

estudo deste trabalho, pois não apresentam as características necessárias para o

trabalho.

2.2 Processamento Digital de Sinais

Segundo (Rabiner and Schafer, 1978) e (Oppenheim and Willsky, 1996), a maior

das preocupações dos estudos realizados em Processamento Digital de Sinais

(PDS) é representar o sinal de forma discreta para, dessa forma, poder trabalhar

convenientemente.

Os primeiros estudos e aplicações das técnicas de sistemas digitais foram a

área de processamento de voz, com a visão de aparentar o comportamento de

Page 18: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

16

sistemas analógicos complexos. Com a facilidade dos pesquisadores em simular

o comportamento deste tipo de sistemas em computadores evitava-se a necessi-

dade de construí-los para fazer os seus experimentos. Além disso, evitando os

altos custos envolvidos na construção de sistemas analógicos.

Nesta mesma linha de pesquisa, com o avanço da tecnologia na área de Hardware

e Software, permitiu que estudos fossem aplicados na área de PDS.

Ao trabalhar-se com o processamento digital de sinais é praticamente inevitável

o uso de ferramentas matemáticas, tais como:

• Transformadas de Fourier diretas e inversas (Haykin and Veen, 2001);

• Transformadas Wavelets (Haykin and Veen, 2001);

• Tranformadas Z (Zwillinger, 1989) e afins.

Este fato é bastante comum, pois a área de processamento digital de sinais deve

grande parte de toda a sua evolução as áreas da matemática e da física. Como o

estudo do comportamento de sinais é uma área muito abrangente e este trabalho

faz o uso de uma série de conceitos tais como: Magnitude e Análise de Fourier.

As próximas seções explanam de forma breve cada um destes conceitos.

2.2.1 Magnitude

A magnitude de um sinal é sempre um dado positivo apto a identificar al-

gumas características quantitativas como, por exemplo, o seu próprio volume

em decibéis. Além disso, frequentemente uma série de operações matemáticas,

como por exemplo, soma e subtração podem serem feitas entre magnitudes de

sinais em diversos fins, das quais se destacam a suavização de altas frequências

para o auxílio na averiguação do início e do fim das zonas de silêncio do sinal

(i.e., ruído de fundo).

Ao confrontar as magnitudes é comum o uso de equações logarítmicas. E

estas equações em processamento digital de sinais são determinadas pelo resul-

tado da Transformada de Fourier empregada no sinal de entrada preliminarmente

amostrado. Segundo (Rabiner and Schafer, 1978), este tipo de procedimento é

utilizado em aplicações que trabalham com o processamento de voz. Onde a

suavização do sinal se faz necessária no tratamento posterior da classificação dos

segmentos de voz produzidos, sem a vibração das cordas vocais (son unvoiced) ou

com a vibração das cordas vocais (sons voiced).

Conforme (Rabiner and Schafer, 1978), a representação matemática da magni-

tude de um sinal discreto é dada pela formula 2.4:

M =∞

∑m=−∞

|x [m]| (2.4)

Page 19: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

17

• Onde:

|x [m]| é o valor da amplitude do sinal no ponto m.

2.2.2 Análise de Fourier

A representação de sinais como uma superposição ponderada de senoides

complexas não somente leva a uma expressão útil da saída de um sistema como

também fornece uma caracterização muito criteriosa dos sinais e sistemas. O

estudo de sinais e sistemas, usando sistemas senoidais, é denominado Análise de

Fourier 2 (Haykin and Veen, 2001).

Na música, o som produzido por um instrumento musical ou pela combi-

nação de vários instrumentos constituem uma Série de Fourier. Na partitura mu-

sical de uma orquestra contêm partes para instrumentos que possuem diferentes

faixas de frequência, como, por exemplo, um baixo de cordas, o qual produz uma

frequência muito baixa, e um pícolo 3, que produz um som de frequência muito

elevada. O som que percebemos quando ouvimos uma orquestra representa a

superposição de sons gerados por cada instrumento (Haykin and Veen, 2001).

Fourier em seus estudos definiu a periodicidade de um sinal em quatro classes

distintas, conforme a tabela 2:

Tabela 2: Relação entre propriedades de tempo de um sinal e a representação deFourier (Haykin and Veen, 2001).

Propriedade de tempo Periódica Não PeriódicaContinuo Série de Fourier Transformada de Fourier

(FS) (FT)Discreto Série de Fourier de Transformada de Fourier de

Tempo Discreto Tempo Discreto(DTFS) (DTFT)

Onde:

• A (FS) se aplica a sinais periódicos de tempo continuo. Ela representa o sinal

como uma soma ponderada de um número infinito de senoides complexas

de tempo contínuo cujas as frequências são múltiplos inteiros da frequência

fundamental do sinal;

• A (FT) representa sinais de tempo não periódicos como uma integral pon-

derada de senoides complexas de tempo contínuo cujas frequências variam

continuamente de −∞ a ∞ ;

2Jean Baptiste Joseph Fourier (1768 - 1830), foi o primeiro físico e matemático a descobrir a con-tinuidade periodicidade do sinal.

3Pícolo (pequeno em italiano) também conhecido como flautim, é um instrumento musical dafamília da flauta, soando uma oitava acima da flauta soprano.

Page 20: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

18

• A (DTFS) se aplica a sinais de período N de tempo discreto e representa o

sinal como uma soma ponderada de N senoides complexas de tempo dis-

creto cujas frequências são múltiplas inteiros da frequência fundamental do

sinal;

• A (DTFT) representa sinais de tempo discreto não periódicos como uma in-

tegral ponderada de senoides complexas de tempo discreto cujas frequên-

cias variam continuamente ao longo de um intervalo de 2π.

A figura 4 ilustra a decomposição de sessenta segundos da musica "É uma par-

tida de futebol do grupo musical brasileiro de pop SKANK"em plano um carte-

siano, onde o eixo das ordenadas representa a amplitude e o eixo das abscissas

representa a frequência, utilizando software de apoio a ensino da computação

Matlab R© (MathWorks, 2009).

0 0.5 1 1.5 2 2.5 3

x 106

−1

−0.5

0

0.5

1Amostragem sem aplicar Fourier

Frequência

Am

plit

ude

0 0.5 1 1.5 2 2.5 3

x 106

−4

−2

0

2

4x 10

−7 Amostragem aplicando Fourier

Frequência

Am

plit

ude

Canal Direito

Canal Esquerdo

B)

A)

Figura 4: Comparativo entre frequências e amplitudes

A imagem "A", referente a figura 4, ilustra a frequência e amplitude em seu

estado normal e já a imagem "B"demonstra também a frequência e a amplitude

só que aplicando a DTFS Fourier.

A representação de Fourier usada neste trabalho é a DTFS, pois conforme

(Haykin and Veen, 2001) é a única que pode ser avaliada e manipulada numeri-

camente em um computador. Isso ocorre porque tanto a representação do sinal

no domínio de tempo, na equação (2.5), como a no domínio da frequência, na

equação (2.6), são caracterizados por um conjunto finitos de números N.

x[n] = ∑k=(N)

X[k]ejkΩ0n (2.5)

X[k] =1N ∑

n=(N)

x[n]e−jkΩ0n (2.6)

Page 21: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

19

Onde:

• X[k]: são os coeficientes da série de Fourier de tempo discreto para x[n];

• ejkΩ0n: é a transformada de Fourier de tempo discreto de x[n].

A equação de representação da série de Fourier de tempo discreto selecionada

para fazer parte deste trabalho é a equação (2.6), pois a mesma representa o

domínio da frequência o qual faz parte de qualquer música.

As propriedades de representação de Fourier relacionam o efeito de uma ação

sobre o sinal de domínio de tempo com a correspondente mudança na represen-

tação de domínio de frequência.

Page 22: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

3 TRABALHOS RELACIONADOS

Este capítulo apresenta alguns dos trabalhos já realizados na área que servi-

ram como base para a construção deste trabalho.

Na área de reconhecimento da fala destaca-se (Zeng et al., 2004) que a partir de

análise da amplitude e frequência modular dos sons emitidos pela fala humana

estuda uma maneira de reconhecimento da fala. Neste estudo, foi descoberto a

partir de diversos testes de estímulos de modulações diferentes que as bandas

espectrais AM podem ser suficientes para o reconhecimento da fala no silêncio

e que a FM aumenta o reconhecimento da fala no ruído.

No mesmo segmento de pesquisa tem-se o trabalho de (Wang and Levon,

2006), "Improving Tone Recognition with Combined Frequency and Amplitude

Modeling", o qual foca o estudo em uma estratégia centrada nas regiões influ-

enciadas pelas co-articulações (Silva et al., 2001)1 das regiões dos tons canônicos

visualizados através da melhoria da amplitude da representação da segmentação

da sílaba destes tons emitidos.

Na área de análise léxica, tem-se o estudo do uso dos conhecimentos sobre

análise léxica da entonações dos tons de voz emitidos, usando o alfabeto man-

darim como base; Analisando a frequência fundamental e propondo um novo

modelo processamento paralelo o qual foi chamado de PENTA model (Xu, 2004).

O trabalho de (Silla Jr. et al., 2007), apresenta um estudo sobre o reconheci-

mento de ritmos usando um conjunto de classificadores, o qual tem como base

o trabalho da (Kosina, 2002). Neste estudo a classificação musical realiza-se ex-

traindo de uma música qualquer os 30 segundos iniciais, mais 30 segundos do

meio e por fim os 30 segundos finais. Após ter extraído esses valores, coloca-

se esses valores em conjuntos de vetores distintos e treina-se cada segmento de

forma separada, classifica e por último faz um somatório de todos os segmentos.

Outro trabalho na área de classificação de estilos musicais, é o trabalho de

(Filho, 2006) que propõe a geração de uma nova abordagem utilizando a com-

binação das técnicas de dois softwares: o (Tzanetakis, 2003) para a extração dos

dados para a análise e o (Hall et al., 2009) para a simulação dos classificadores.

O trabalho ao qual serve de inspiração para realização do trabalho proposto é

(Kosina, 2002). Este trabalho apresenta um sistema de recognição de gêneros mu-

sicais, baseado exclusivamente no conteúdo do sinal de áudio de três segundos

1Entendida, num sentido mais amplo, simplesmente como a influência decorrente da so-breposição de um segmento sobre o outro durante a produção da cadeia da fala, a coarticulaçãopode ser vista tanto como um fenômeno que pertence como um fenômeno que não pertence aodomínio linguístico.

Page 23: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

21

de tamanho escolhido randomicamente aplicando o algoritmo k-nearest neigh-

bors (KNN). O qual foi batizado de Music Genre Recognition by Analysis of Texture,

ou simplesmente MUGRAT .

O trabalho proposto apresenta uma nova abordagem para o tema de classi-

ficação de ritmos musicais, utilizando as técnicas de processamento digital de

sinais e inteligência artificial. A técnica utilizada em PDS foi a Transformada

da Série de Fourier de tempo discreto (DTFS) para extração das informações da

música. Já na área de IA a técnica utilizada foi RNA. Onde também foram apli-

cadas os métodos de KNN e Fisher.

Page 24: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

4 RECONHECIMENTO DE ESTILO MUSICAL

Este capítulo apresenta o desenvolvimento do trabalho proposto. Este tra-

balho pretende, apontar uma solução para o problema de reconhecimento de es-

tilos musicais, por análise de sinais de áudio contidos em uma música.

A figura 5 ilustra o modelo proposto para o desenvolvimento deste trabalho.

Figura 5: Pré-Modelo de concepção de estudos realizadosFonte: Autoria própria, 2009

Onde, na figura 5 tem-se:

1. Processamento Digital de Sinais (DSP)

Entrada: músicas no formato de arquivo do tipo WAV;

Análise: seção onde foram aplicada as técnicas de Fourier;

Saída: dados de entrada para formação da base de conhecimento da

RNA;

2. Rede Neural Artificial

Entrada: seção onde foram agrupadas as saídas da área de processa-

mento digital de sinais, assim formando a base de conhecimento da RNA;

Análise: onde foram aplicadas as técnicas de RNA e os métodos de

Fisher e KNN para a classificação do ritmo musical;

Saída: local onde apresenta a possível definição do ritmo musical. Um

exemplo ilustrativo de saída é apresentado na tabela 3.

Page 25: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

23

Tabela 3: Representação da saída da RNA

Música Garota Nacional50% Pop25% Reggae15% Dance10% Samba

Nesta tarefa de análise, foi utilizado as técnicas de Fourier para se extrair

padrões, os quais serviram de entrada para a RNA. A rede neural artificial com

posse destes padrões foi capaz analisar os dados e ter como saída o ritmo musical

a qual a música pertence, fazendo o uso de algoritmos para classificação 1.

No trabalho para a criação das bases de conhecimento, da base de testes e

criação dos métodos de classificação foi utilizado o software Matlab R©. Na con-

versão dos arquivos musicais MP3 para WAV foi utilizado software Sound Forge

9.0 R© da Sony Corporation of America.

A técnica de Fourier, a qual foi utilizada neste trabalho como mencionado na

seção 2.2.2 foi a Transformada da Série de Fourier de tempo discreto (DTFS). Com a

ajuda do software Matlab R©.

No software Matlab R© foi utilizado o comando fft (na linha 3 da listagem

4.1) que representa a técnica computada com o nome de Transformada de Fourier

Rápida, representada pelo acrônico FFT (Fast Fourier Transform) .

O algoritmo implementado no Matlab R© para a extração destes padrões pode

ser acompanhado na listagem 4.1.

Listing 4.1: Algoritmo implementado no Matlab R© para prover as entradas da

RNA%Lendo noventa segundos da música do d i s c o

1 . musica = wavread ( s t r c a t ( pathMusica , nomeMusica ) ,2 . [1 ( 4 4 1 0 0∗9 0 ) ] ) ;

%A p l i c a n d o F o u r i e r na música l i d a

% A i m p l e m e n t a ç ã o do a l g o r i t m o pa ra c á l c u l o d e s t a t r a n s f o r m a d a pode s e r e n c o n t r a d o na

%pá g i na h t t p : / / cnx . org / c o n t e n t / m16336 / l a t e s t

3 . m u s i c a f f t = f f t ( musica ) ;

%T r a b a l h a n d o em s e p a r a d o com os c a n a i s

4 . musicaEsquerda = m u s i c a f f t ( : , 1 ) ;5 . musicaDire i ta = m u s i c a f f t ( : , 2 ) ;

% P e r c o r r e n d o t o d o o c a n a l e s q u e r d o da música . Para

%f a z e r s o m a t ó r i o dos v a l o r e s que s ã o m a i o r e s que

%zero , ou s e j a , a u d í v e i s ao o uv i do

6 . for nroMusicaBits = 1 : s ize ( m u s i c a f f t )% V e r i f i c a n d o s e o v a l o r do e s q u e r d o

%é maior que 0 , s e sim soma

7 . i f ( musicaEsquerda ( nroMusicaBits ) > 0)8 . ladoEsquerdo = ladoEsquerdo +9 . musicaEsquerda ( nroMusicaBits ) ;1 0 . qtdLadoEsquerdo = qtdLadoEsquerdo + 1 ;1 1 . end ;1 2 . end ;

1Um algoritmo de classificação é um procedimento para selecionar hipóteses de um conjuntode alternativas que melhor se adequa a um conjunto de observações

Page 26: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

24

% P e r c o r r e n d o t o d o o c a n a l d i r e i t o da música . Para

%f a z e r s o m a t ó r i o dos v a l o r e s que s ã o m a i o r e s que

%zero , ou s e j a , a u d í v e i s ao o uv i do

1 3 . for nroMusicaBits = 1 : s ize ( m u s i c a f f t )% V e r i f i c a n d o s e o v a l o r do d i r e i t o

%é maior que 0 , s e sim soma

1 4 . i f ( musicaDire i ta ( nroMusicaBits ) > 0)1 5 . l a d o D i r e i t o = l a d o D i r e i t o +1 6 . musicaDire i ta ( nroMusicaBits ) ;1 7 . qtdLadoDireito = qtdLadoDireito + 1 ;1 8 . end ;1 9 . end ;

% Fazendo a média dos s o m a t ó r i o s dos c a n a i s ,

%os q u a i s s e r v i r a m de e n t r a d a pa ra a

%r e d e n e u r a l a r t i f i c i a l

2 0 . somatorioLadoEsquerdo = ladoEsquerdo/qtdLadoEsquerdo ;2 1 . somatorioLadoDireito = l a d o D i r e i t o/qtdLadoDireito ;

Matematicamente falando,

Ent(x) =

x, se x > 0

0, se x ≤ 0(4.1)

y =∑Ent(x)

QtdEnt(x)(4.2)

Para cada posição do vetor retornado, após a aplicação da FFT, é passado pela

equação 4.1 e após passar pela última posição do vetor é executada a equação 4.2.

Este processo deve ser executado para cada um dos dois canais da música. Com

isso obtêm-se as duas entradas para a RNA.

Neste mesmo algoritmo implementado, foram realizados outros testes na ten-

tativa de uma melhor classificação dos ritmos musicais. Essas modificações realizadas

não obtiveram uma melhor generalização dos dados da qual apresentada na

listagem 4.1. As alterações realizadas basicamente afetam dois pontos, na linha 2

onde têm-se a aplicação do comando de "musicafft = fft(musica);"foi substituído

por "musicafft = fft(musica)/(44100 * 90);", ou seja, pelo período da música. Mas

o retorno foi insatisfatório.

Outra alteração realizada foi mantendo a alteração da na linha 2, mencionada

no parágrafo anterior, e tirando-se a média final ficando apenas com o somatório

dos períodos, mas também gerando dados insatisfatórios.

Após a construção deste algoritmo, mencionado na listagem 4.1, chegou a

etapa da construção da base de conhecimento da RNA. Esta tarefa foi executada

da seguinte forma:

• Selecionou-se algumas músicas, ao todo 480 músicas, 15 estilos musicais

distintos e para cada estilo 22 músicas de artistas diversos, baseados em

trabalhos anteriores como os (Silva et al., 2001) e de (Filho, 2006);

• Para cada música foi executado o algoritmo, da listagem 4.1, o qual gerou

duas saídas um para cada canal;

Page 27: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

25

• As saídas foram colocadas em uma tabela por agrupamento de estilo mu-

sical e pela quantidade de ocorrências. Com este mapeamento foi possível

classificar os 15 estilos musicais, os quais foram: Axé, Black Music, Clássica,

Eletrônica, Dance, Hard Rock, Heavy Metal, Blues / Jazz, Pop, Reggae, Samba,

Pagode, Sertanejo, MPB, Gauchesco.

Terminada a parte de extração de informações para a formação da base de

conhecimento da RNA. Transformou-se os agrupamentos gerados em pesos para

que os algoritmos possam ser treinados e verificar qual deles trouxe melhor re-

sultado na classificação destes agrupamentos.

Os algoritmos mais utilizados para a tarefa de classificação de agrupamentos

de informações foram: K vizinhos mais próximos (K Nearest Neighbor - KNN) e

o da Função discriminante linear de Fisher (FDLF) .

O algoritmo KNN foi originalmente proposto por (Cover and Hart, 1966). Os

autores usam uma função de distância para determinar o quão está próximo um

novo conjunto de dados de entrada y está a cada instância da memória. O KNN,

utiliza as instâncias mais próximas para deduzir a classe de saída de y.

A fase de treinamento do algoritmo KNN, funciona da seguinte forma: para

cada instância x determinada pelo valor do ritmo R (classe wRx) adiciona-se o

exemplo de treinamento (x, wRx) no estilo do ritmo E. Já na fase de classificação

para cada nova instância fornecida de a no vetor de exemplos a serem mapeados:

Seja x0, . . . , xn as instâncias do ritmo que são mais semelhantes (próximas) a

a, o mapeamento desta instância com relação a E é:

WRa =

n

∑x=0

WRx ∗ Tna

n

∑x=0

Tna

(4.3)

A equação 4.3 é a representação matemática do KNN. Tna é a função de simi-

laridade definida pela equação 4.4:

Tα,β =

r

∑i=0

µi ∗ Γi(αi, βi)

r

∑i=0

µi

(4.4)

Onde:

• µi é o peso do atributo i;

• Γi(αi, βi) define a similaridade entre os ritmos α e β com relação ao atributo

i.

Page 28: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

26

O significado das palavras descriminar e classificar foi introduzida na Estatís-

tica por Ronald A. Fisher, no primeiro tratamento moderno de conjuntos na dé-

cada de 30 (Johnson and Wichern, 2007). O método de Fisher tem o seguinte

funcionamento:

• Considere duas populações (Classes) π1 e π2;

• Tome como base que os objetos ou observações são frequentemente sepa-

rados ou classificados com base nos pesos associados a uma variável pré-

denominada de X, a mesma de dimensão px1;

• Os valores de X diferem de uma população para outra;

• Considere que se os valores de X não forem totalmente diferentes dos valores

das populações π1 e π2, as populações obtidas serão impossíveis de diferen-

ciar e novas populações poderiam ser selecionadas aleatoriamente a qual-

quer uma das populações;

• As duas classes (populações), π1 e π2, podem ser representadas respectiva-

mente pelas funções de densidade de probabilidade f1(x) e f2(x).

Fisher, tinha como ideia principal transformar as observações diversas de X

em variações diversificadas de Y, tais que as Y’s resultadas a partir das classes (π1

e π2) fossem o mais afastadas possíveis (Züge and Chaves Neto, 1999).

A equação 4.5, representa matematicamente a ideia de Fisher.

Y =

[

−1

∑(

µ1 − µ2

)

]′

X (4.5)

Onde:

• µ1 é a média dos Y’s obtidos dos X’s pertencentes a π1;

• µ2 é a média dos Y’s obtidos dos X’s pertencentes a π2;

Page 29: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

5 EXPERIMENTOS REALIZADOS

Neste capítulo encontra-se a descrição detalhada dos experimentos realizados

com os algoritmos de classificação de agrupamentos de informações. Os métodos

de Fisher (FDLF) e K-vizinhos (KNN), escolhidos e apresentados anteriormente.

5.1 Método de Fisher (FDLF)

No final da implementação do algoritmo de Fisher, na linguagem Matlab R©,

foi constatado que este algoritmo de classificação de agrupamentos não se adapta

para a solução do problema proposto neste trabalho.

Segundo (Duda et al., 2000), o cálculo do discriminante de Fisher se adapta

melhor quando se tem classes com intervalos bem definidos, situação na qual

não acontece neste trabalho. As classes mapeadas podem uma estar contida no

intervalo da outra causando assim um overlapping.

Um exemplo da técnica de projeção de classes de Fisher com boa separação

pode ser visualizada na figura 6:

Figura 6: Projeção de Fisher em diferentes subespaços

Na figura 7 tem-se o exemplo pelo qual o algoritmo de classificação de Fisher

não se adapta quando não se têm uma boa separação entre as classes das quais

deseja se classificar. Observa-se que na projeção da amostra de vetores W1 tridi-

mensionalmente num subespaço bidimensional formando o vetor de amostra W2

encontra-se o overlapping entre as três classes.

Na figura 7 tem-se três distribuições tridimensional as quais são projetadas

num subespaço bidimensional, descritas pelos vetores W1 e W2. Informalmente

métodos sobre discriminantes múltiplos procuram um ótimo subespaço, por exemplo,

aquele com o maior separação das distribuições projetadas para um total emitido

no prazo de matriz de dispersão, como o exemplo ilustrado na figura 7.

Page 30: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

28

Figura 7: Projeções de Fisher 3D

5.2 Método de K-Vizinhos (KNN)

O método KNN é um algoritmo que pode ser utilizado para classificação de

observações, com uma ou n variáveis divididos em uma ou n classes. A principal

característica deste método é que o mesmo relaxa as condições de normalidade

para as classes que estão sendo analisadas e também faz a designação de uma

dada análise para a classe as quais pertencem à maioria dos seus vizinhos mais

próximos.

O cálculo do KNN, segundo (Duda et al., 2000), é dada pela estimação da

probabilidade posteriori. A avaliação da f(x) em determinado ponto x é dada pela

estimativa da densidade que é representada pela equação 5.1:

fn(x) =Kn

Vnn(5.1)

Onde:

• Kn: a amostragem da vizinhança mais próxima de x a ser analisada;

• Vn: determina a extensão do volume da região que cresce proporcional-

mente o crescimento da vizinhança.

No método KNN, um dos aspectos mais importantes é a escolha do k. O

resultado da execução do método é afetado pelo valor de k, não existe um critério

preciso para a escolha de k. Se a amostragem de k for muito grande obtém-se

uma avaliação mais suave de f(x). Ao contrário se o valor de k for menor pode

produzir uma avaliação errada de f(x). Para a validação do algoritmo descrito,

necessita-se seguir alguns passos. Conforme descrito abaixo:

• Separa-se do conjunto de exemplos em dois conjuntos menores, ou seja,

subconjuntos, o de Treinamento (TR) e o de Teste (TS);

• Cria-se a estrutura de um modelo sobre o TR;

• Determina-se a percentagem de erro aplicada ao TS;

Page 31: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

29

• Repete-se os passos anteriores diversas vezes com diferentes tamanhos de

TS e TR tendo os recursos escolhidos aleatoriamente.

No final da implementação do algoritmo de KNN, na linguagem Matlab R©, foi

constatado que este algoritmo de classificação de agrupamentos se adapta para a

solução do problema proposto neste trabalho.

Nos experimentos realizados deste trabalho foram utilizados os seguintes da-

dos:

• Número de Classes : 15 ritmos musicais, conforme a tabela 5.1;

Tabela 4: Tabela de ritmos musicais usados no estudo

Código Nome do ritmoC01 AxéC02 Black MusicC03 ClássicaC04 EletrônicaC05 DanceC06 Hard RockC07 Heavy MetalC08 Blues / JazzC09 PopC10 ReggaeC11 SambaC12 PagodeC13 SertanejaC14 MPBC15 Gauchesca

• Número de Atributos (Entradas) : Duas entradas, lado esquerdo e lado direito;

• Número de Instâncias da base treinamento (TR): 480 músicas dividas entre os

15 ritmos musicais;

• Número de Instâncias da base teste (TS): 20 músicas para cada ritmo musical;

• Medida de espaço utilizada: Euclidiana;

• Variações de k: 1, 3, 5, 7, 9, 15, 31, 43 e 99

Com base nos dados fornecidos acima, foram realizados os experimentos que

obtiveram os seguintes resultados:

Page 32: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

30

Observando as imagens nota-se que nos experimentos com variação de K = 1,

foi onde obtive-se os melhores resultados com 53.33% de percentual de apren-

dizado, pois quanto maior o número de K menor é o percentual de aprendizado

isto deve-se porque quanto maior a amostragem maior é a possibilidade de se

encontrar saídas incoerentes.

Os ritmos musicais: Axé (ver figura 8), Black Music (ver figura 9), Clássica (ver

figura 10), Eletrônica (ver figura 11), Dance (ver figura 12), Hard Rock (ver figura 13),

Heavy Metal (ver figura 14) e Blues / Jazz (ver figura 15) foram os que apresentaram

a melhor percentual de aprendizado, alcançando um percentual superior à 90%.

Nos ritmos Pop (ver figura 16), Reggae (ver figura 17), Samba (ver figura 18),

Pagode (ver figura 19), Sertaneja (ver figura 20), MPB (ver figura 21) e Gauchesca (ver

figura 22), nota-se que os experimentos não foram bem sucedidos para K = 1. Isto

é obtivemos uma maior taxa de erro do que acerto na classificação.

Nos experimentos restantes variando a taxa de k entre os valores de 3, 5, 7, 9,

15, 31, 43 e 99, não obteve-se resultados satisfatórios na classificação do ritmo mu-

sical. Apenas no ritmo Clássico (ver figura 10) obteve-se resultados satisfatórios

de acerto com experimentos de k entre os valores 3, 5, 7, 9, 15, 31. Isto deve-se

do fato de que o ritmo musical Clássico é o mais homogêneo nas características

extraídas de cada música. Enquanto nos outros ritmos musicais as características

extraídas são mais heterogêneas, ou seja, não seguem um padrão e também por

este motivo não foi possível utilizar a técnica de Fisher para a classificação.

Na figura 23, onde temos a visualização dos percentuais de aprendizado de

todos os ritmos musicais em relação a k, nota-se a homogeneidade do apren-

dizado, principalmente no ritmo clássico que manteve um percentual acima de

50% na variação de k entre os valores de 1 à 9. Este fato pode ser melhor expli-

cado se confrontarmos os apredenizados dos ritmos clássico (melhor percentual

de aprendizado) e pop (pior percentual de aprendizado).

Na figura 24, onde temos a visualização da Taxa de Erro de todos os ritmos mu-

sicais em relação a k, nota-se a heterogeneidade do aprendizado (a evolução da

taxa de erro). Principalmente no ritmo musical pop que manteve um taxa acima

de 60% nas variações de k. Este fato pode ser melhor explicado ao confrontarmos

os aprendizados dos ritmos pop (maior taxa de erro) e clássico (menor taxa de

erro).

Page 33: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

31

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Axé

% Aprendizado

% Taxa de Erro

Figura 8: Experimentos com o ritmo AxéFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Black Music

% Aprendizado

% Taxa de Erro

Figura 9: Experimentos com o ritmo Black MusicFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Clássico

% Aprendizado

%Taxa de Erro

Figura 10: Experimentos com o ritmo ClássicaFonte: Autoria própria, 2009

Page 34: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

32

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Eletrônica

% Aprendizado

% Taxa de Erro

Figura 11: Experimentos com o ritmo EletrônicaFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Dance

% Aprendizado

% Taxa de Erro

Figura 12: Experimentos com o ritmo DanceFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Hard Rock

% Aprendizado

% Taxa de Erro

Figura 13: Experimentos com o ritmo Hard RockFonte: Autoria própria, 2009

Page 35: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

33

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Heavy Metal

% Aprendizado

% Taxa de Erro

Figura 14: Experimentos com o ritmo Heavy MetalFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Blues / Jazz

% Aprendizado

% Taxa de Erro

Figura 15: Experimentos com o ritmo Blues / JazzFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com ritmo Pop

% Aprendizado

% Taxa de Erro

Figura 16: Experimentos com o ritmo PopFonte: Autoria própria, 2009

Page 36: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

34

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Reggae

% Aprendizado

% Taxa de Erro

Figura 17: Experimentos com o ritmo ReggaeFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Samba

% Aprendizado

% Taxa de Erro

Figura 18: Experimentos com o ritmo SambaFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Pagode

% Aprendizado

% Taxa de Erro

Figura 19: Experimentos com o ritmo PagodeFonte: Autoria própria, 2009

Page 37: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

35

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com ritmo Sertanejo

% Aprendizado

% Taxa de Erro

Figura 20: Experimentos com o ritmo SertanejaFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo MPB

% Aprendizado

% Taxa de Erro

Figura 21: Experimentos com o ritmo MPBFonte: Autoria própria, 2009

1 3 5 7 9 15 31 43 990

10

20

30

40

50

60

70

80

90

100

k

Experimentos com o ritmo Gauchesco

% Aprendizado

% Taxa de Erro

Figura 22: Experimentos com o ritmo GauchescaFonte: Autoria própria, 2009

Page 38: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

36

Figura 23: Comparação do aprendizado de todos os ritmos musicaisFonte: Autoria própria, 2009

Figura 24: Comparação da taxa de erro de todos os ritmos musicaisFonte: Autoria própria, 2009

Page 39: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

6 CONCLUSÃO

Ao final deste trabalho, o principal objetivo foi trabalhar uma nova alterna-

tiva para o problema da classificação automática de áudio digital empregando

experimentos e propostas já apresentadas no meio acadêmico, no intuito de en-

contrar uma solução mais padronizada para resolver algumas necessidades pen-

dentes apontadas nos estudos antecessores.

Nas abordagens antecedentes encontraram obstáculos em classificar algum

ritmo musical em especial, dada a pequena quantidade de características reti-

radas dos sinais de aúdio. Algumas abordagens trabalhavam na diferenciação ou

separação dos ruídos de fundo encontrados nos sinais de áudio e mesmo assim

encontravam dificuldades extremas e saídas não muito claras devida a seleção do

conjunto de características pobres. Porém, outros estudos trabalhavam apenas na

classificação de segmentos de voz.

Neste trabalho foi utilizado duas técnicas para o reconhecimento de estilo

musical através de sinais de áudio, o método KNN e o de Fisher. A escolha

das técnicas foram fundamentadas em uma pesquisa extensiva em um grande

número de trabalhos relacionados à área, onde foi possível definir que as duas

técnicas escolhidas apresentavam saídas mais significativas e satisfatórias na solução

do problema.

Nos experimentos foi constatado que a técnica de Fisher não se adaptaria a

solução do problema proposto. Isto porque as classes envolvidas na análise ocor-

ria muito overlapping, ou seja, não tinha-se uma boa divisão entre as classes a

serem classificadas. Já na técnica KNN verificou-se que a técnica se adapta a

solução do problema principalmente quando trabalha-se com o variação de K =

1. Apesar destas saídas obtidas com a técnica KNN a taxa de aprendizado para

o reconhecimento do estilo musical foi menor que a esperada, pois trabalhando

com a área de Redes Neurais, onde a taxa de aprendizado são, comumente, próxi-

mas a 70%.

6.1 Trabalhos Futuros

Ademais, ao longo deste estudo fica claro que este é um tema que necessita

de um estudo mais incisivo no problema de classificação de ritmos musicais, na

evolução das técnicas de separação e cognitivas das bases. Esta evolução pode

ser conseguida com o progresso do poder dos extratores de características, para

que estes possam ser capazes de conseguir ainda mais dados importantes para a

clareza das classes e, por fim, um estudo mais extensivo e mais aprimorado com

Page 40: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

38

outras técnicas de classificação. Como Máquinas de vetor de suporte (SVM) , Trans-

formadas Wavelet na substituição da técnica de Fourier (utilizada neste trabalho),

Redes de Funções de Base Radiais (RBF) , regras de separação taxonômica de dados.

Por fim, outra proposta para aprimorar as saídas obtidas, é fazer o uso de teo-

rias mais aprimoradas da estatística e da matemática como a Teoria dos Grandes

Números (Law Of Large Numbers), segundo (E. and Katz, 1963), para o aprimora-

mento do pré-processamento das bases de dados, fazendo com que os erros mé-

dios e quadráticos diminuam e aumente a taxa de aprendizado na classificação.

Page 41: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

REFERÊNCIAS

Amabis, J. M. (1997). Fundamentos da biologia moderna. Editora Moderna, São

Paulo.

Barrone, D. A. C. (2003). Sociedades artificiais: a nova fronteira da inteligência nas

máquinas. Bookman, Porto Alegre.

Braga, A. d. P., Ferreira de Carvalho, C. P. d. L., and Ludemir, T. B. (2007). Redes

neurais artificiais: teoria e aplicações. LTC, Rio de Janeiro.

Carpenter, G. and Grossberg, S. (1988). The art of adaptive pattern recognition by

a self-organizing neural network. IEEE Computer Society Press Los Alamitos, CA,

USA.

Cover, T. M. and Hart, P. E. (1966). Nearest neighbor pattern classification. IEEE

Transactions on Information Theory, page 21 and 27.

Duda, R. O., Hart, P. E., and Stork, D. G. (2000). Pattern Classification. Wiley-

Interscience, second edition.

E., B. L. and Katz, M. (1963). Convergence rates in the law of large numbers.

Institute for defense analyses.

Ferreira, A. B. H. (2009). O novo dicionário aurélio da língua portuguesa.

Filho, M. d. C. S. (2006). Classificação automática de gêneros de Áudio digital.

Escola Politécnica de Pernambuco.

Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., and Witten, I. H.

(2009). The weka data mining software: An update; sigkdd explorations, volume

11, issue 1.

Haykin, S. (2001). Redes Neurais: Princípios e prática. Bookman, São Paulo.

Haykin, S. and Veen, B. V. (2001). Signals and Systems. Bookman, São Paulo.

Hebb, D. O. (1949). The organization of behavior : a neuropsychological theory / D.O.

Hebb. Wiley, New York :.

Johnson, R. A. and Wichern, D. W. (2007). Applied Multivariate Statistical Analysis,

volume 6. New Jersey, Prentice-Hall.

Kohonen, T. (1982). Self-organized formation of topologically correct feature

maps. Biological Cybernetics.

Page 42: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

40

Kosina, K. (2002). Music Genre Recognition. PhD thesis, Mediente Chnik UND

Design in Hangberg.

MathWorks, T. (2009). Matlab 2009.

Mcculloch, W. S. and Pitts, W. (1943). A logical calculus of the ideas immanent in

nervous activity. Bulletin of Mathematical Biophysic, 5:115–133.

Mendel, J. M. and Fu, K. S. (1970). Adaptive, learning, and pattern recognition sys-

tems; theory and applications. Academic Press, New York.

Moraes, J. J. d. (1983). O que é música. Editora Brasiliense, São Paulo.

Oppenheim, A. V. and Willsky, A. S. (1996). Signals and Systems. Prentice Hall.

Rabiner, L. R. and Schafer, R. W. (1978). Digital Signal Processing of Speech Signals.

Prentice-Hall, Inc.

Rumelhart, D. E., Hinton, G. E., and Willians, R. J. (1986). Learning representa-

tions by back-propagation error. Nature.

Sage, A. P. (1990). Concise Encyclopedia of Information Processing in System Organi-

zations. Pergaman, New York.

Silla Jr., C. N., Kaestner, C. A. A., and Koerich, A. L. (2007). Automatic music

genre classification using ensemble of classifiers. IEEE International Conference on

Systems, Man, and Cybernetics.

Silva, A., Pacheco, V., and Oliveira, L. (2001). Por uma abordagem dinâmica dos

processos fônicos. Revista Letras, Curitiba.

Smith, S. W. (1997). The Scientist and Engineer’s Guide to Digital Signal Processing.

California.

Tzanetakis, G. (2003). Marsyas: music analysis, retrival and synthesis for audio

signals.

Wang, S. and Levon, G.-A. (2006). Improving tone recognition with combined

frequency and amplitude modeling. University of Chicago, USA.

Widrow, B. and Hoff, M. E. (1960). Adaptative switching circuits. Institute of Radio

Engineers, Western Eletronic Show and Convention.

Xu, Y. (2004). Transmitting tone and intonation simultaneously and the parallel

encoding and target approximation (penta) model. Haskins Laboratories.

Page 43: RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE … · RECONHECIMENTO DE RITMO MUSICAL POR ANÁLISE DE SINAIS DE ÁUDIO DE AMPLITUDE E FREQUÊNCIA Trabalho de conclusão apresentado

41

Zeng, F.-G., Nie, K., Stickney, G. S., Kong, Y.-Y., Vongphoe, M., Bhargave, A.,

and Wei, Chaogang andCao, K. (2004). Speech recognition with amplitude and

frequence modulations. Mediente Chnik UND Design in Hangberg.

Züge, M. and Chaves Neto, A. (1999). Utilização dos métodos estatísticos multi-

variados na avaliação do desempenho empresarial. Instituto Paranaense de Desen-

volvimento Econômico e Social, page 11.

Zwillinger, D. (1989). Handbook of Differential Equations. pub-AP, Boston, MA,

USA.