Publication
Image-based music genre classification using convolutional neural networks
datacite.subject.fos | Ciências Sociais::Economia e Gestão | pt_PT |
dc.contributor.advisor | Bertani, Nicolò | |
dc.contributor.author | Gallego Villamarin, Juan Sebastian | |
dc.date.accessioned | 2023-11-24T10:11:20Z | |
dc.date.available | 2024-11-24T01:31:29Z | |
dc.date.issued | 2023-10-18 | |
dc.date.submitted | 2023-09-12 | |
dc.description.abstract | This dissertation presents a full investigation into the application of machine learning, specifically Convolutional Neural Networks (CNNs), in the music genre classification using vinyl album covers. Leveraging the latest advancements in deep learning and computer vision, the study introduces two models: one employing batch normalization and another utilizing Concept Whitening (CW) techniques to enhance model interpretability. The main objectives are to evaluate these models' classification accuracy and interpretability. Using robust evaluation parameters, both models exhibit good accuracy rates in classifying music genres based on vinyl album covers. Notably, the concept whitening model adds another layer of interpretability, unraveling the black-box features found in standard neural networks. Empirical findings indicate that concept whitening enhances model interpretability and competes effectively in predictive performance. This project serves in the pursuit of reliable and transparent image-based music genre classification systems. By comparing the two models on both accuracy and interpretability fronts, the study shines a light on the viability of incorporating concept whitening into standard CNN architectures for more explainable AI applications. | pt_PT |
dc.description.abstract | Esta dissertação apresenta uma investigação abrangente sobre a aplicação da aprendizagem de uma máquina, especificamente Redes Neuronais Convolucionais (CNNs), no campo da classificação de géneros musicais usando capas de álbuns de vinil. Aproveitando os avanços mais recentes em aprendizagem profunda e visão computacional, o estudo apresenta dois modelos: um que utiliza Batch Normalization (BN) e outro que emprega técnicas de Concept Whitening (CW) para aprimorar a interpretabilidade do modelo. Os principais objetivos são avaliar a precisão na classificação desses modelos e a sua interpretabilidade. Usando parâmetros robustos de avaliação, ambos os modelos demonstram boas taxas de precisão na classificação de géneros musicais com base em capas de álbuns de vinil. Notavelmente, o modelo de concept whitening adiciona outra camada de interpretabilidade, desvendando as características de caixa-preta encontradas em redes neurais padrão. Resultados empíricos indicam que o concept whitening não apenas aprimora a interpretabilidade do modelo, mas também compete eficazmente em termos de desempenho preditivo. Este projeto visa a criação de sistemas confiáveis e transparentes de classificação de géneros musicais baseados em imagens. Ao comparar os dois modelos em termos de precisão e interpretabilidade, o estudo destaca a viabilidade de incorporar o concept whitening em arquiteturas padrão de CNN para aplicações de IA mais explicáveis. | pt_PT |
dc.identifier.tid | 203378270 | pt_PT |
dc.identifier.uri | http://hdl.handle.net/10400.14/43177 | |
dc.language.iso | eng | pt_PT |
dc.subject | Convolutional neural networks | pt_PT |
dc.subject | Music genre classification | pt_PT |
dc.subject | Image-based classification | pt_PT |
dc.subject | Deep learning | pt_PT |
dc.subject | Interpretability | pt_PT |
dc.subject | Explainability | pt_PT |
dc.subject | Redes neuronais convolucionais | pt_PT |
dc.subject | Classificação de géneros musicais | pt_PT |
dc.subject | Classificação baseada em imagens | pt_PT |
dc.subject | Aprendizagem profunda | pt_PT |
dc.subject | Interpretabilidade | pt_PT |
dc.subject | Explicabilidade | pt_PT |
dc.title | Image-based music genre classification using convolutional neural networks | pt_PT |
dc.title.alternative | Classificação de géneros musicais baseada em imagens usando redes neuronais convolucionais | pt_PT |
dc.type | master thesis | |
dspace.entity.type | Publication | |
rcaap.rights | openAccess | pt_PT |
rcaap.type | masterThesis | pt_PT |
thesis.degree.name | Mestrado em Análise de Dados para Gestão | pt_PT |