Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy...

Post on 18-Apr-2015

104 views 0 download

Transcript of Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy...

Large-Scale Music Annotation and Retrieval: Learning to

Rank in Joint Semantic Spaces

Journal New Research Music – 2012 Citado por 3 artigos

Alex Amorim Dutra

Jason Weston, Samy Bengio, and Philippe Hamel

Google, USA

Large-Scale Music Annotation and Retrieval: Learning to Rank in Joint Semantic Spaces

Trabalhos relacionados/Serviços Vantagens Algoritmo Resultados Conclusões Referências

Sumário

Predição de artistas

Predição de músicas

Artistas similares

Músicas similares

Predição de tags: retorna uma lista de tags, (e.g. rock, guitar, fast, . . . ).

Large-Scale Music Annotation and Retrieval

LastFm, Pandora, iTunes

Sugestões da próxima música que irá tocar.

Sugestão de artistas dado um conjunto de ratings de artistas, músicas e albuns.

Pesquisa por genero, estilos, humor.

Trabalhos Relacionados e Serviços

Aplicado ao mundo real.

Exibiu altas perfomances em todas tarefas propostas.

Melhores performances sobre o baseline.

Baixo consumo de memória.

Vantagens

Encontrar os melhores parâmetros.

Minimizar a função:

Utilizou AUC Margin Ranking Loss e WARP Loss.

Fase de treinamento

Como utilizado stochastic gradient descent cada modelo aprende parametros com valores um pouco diferentes.

A média das funções:

Emsemble

Algoritmo

Meta dados - Cold start se utilizar somente filtragem colaborativa.

Baseada em conteúdo: MFCCs (Mel Frequency Cepstral Coefficient) e (SAI) Stabilized Auditory Image.

Features

TagATune – Tem um conjunto de clips contendo 30 segundos. Tem anotações associadas. Coletado por usuários em forma de jogo.

TagATune usado no MIREX 2009 desafio de classificação de tags.

Para comparação utilizado mesmas tags e bases de treino.

Base de testes

Base de testes

precision@k

number of true positives in the top k positionk

Medida de performance

Resultados

Resultados

Resultados

Resultados

Otimizando p@k melhora performance.

Os dados apresentam a distribuição de cauda longa.

O modelo tem respostas rápidas e baixa consumo de memória.

Conclusões

Weston, J., Bengio, S., Usunier, N.: Large scale image annotation: Learning to rank with joint word-image embeddings. In: European conference on Machine Learning. (2010)

Robbins, H., Monro, S.: A stochastic approximation method. Annals of Mathematical Statistics 22 (1951) 400–407

Pampalk, E., Dixon, S., Widmer, G.: On the evaluation of perceptual similarity measures for music. In: Intl. Conf. on Digital Audio Effects. (2003)

Law, E., West, K., Mandel, M., Bay, M., Downie, J.S.: Evaluation of algorithms using games: the case of music tagging. In: Proceedings of the 10th International Conference on Music Information Retrieval (ISMIR). (October 2009) 387–392

Foote, J.T.: Content-based retrieval of music and audio. In: SPIE. (1997) 138–147

Referências

Dúvidas?