Repository logo
 
Publication

Image-based music genre classification using convolutional neural networks

datacite.subject.fosCiências Sociais::Economia e Gestãopt_PT
dc.contributor.advisorBertani, Nicolò
dc.contributor.authorGallego Villamarin, Juan Sebastian
dc.date.accessioned2023-11-24T10:11:20Z
dc.date.available2024-11-24T01:31:29Z
dc.date.issued2023-10-18
dc.date.submitted2023-09-12
dc.description.abstractThis dissertation presents a full investigation into the application of machine learning, specifically Convolutional Neural Networks (CNNs), in the music genre classification using vinyl album covers. Leveraging the latest advancements in deep learning and computer vision, the study introduces two models: one employing batch normalization and another utilizing Concept Whitening (CW) techniques to enhance model interpretability. The main objectives are to evaluate these models' classification accuracy and interpretability. Using robust evaluation parameters, both models exhibit good accuracy rates in classifying music genres based on vinyl album covers. Notably, the concept whitening model adds another layer of interpretability, unraveling the black-box features found in standard neural networks. Empirical findings indicate that concept whitening enhances model interpretability and competes effectively in predictive performance. This project serves in the pursuit of reliable and transparent image-based music genre classification systems. By comparing the two models on both accuracy and interpretability fronts, the study shines a light on the viability of incorporating concept whitening into standard CNN architectures for more explainable AI applications.pt_PT
dc.description.abstractEsta dissertação apresenta uma investigação abrangente sobre a aplicação da aprendizagem de uma máquina, especificamente Redes Neuronais Convolucionais (CNNs), no campo da classificação de géneros musicais usando capas de álbuns de vinil. Aproveitando os avanços mais recentes em aprendizagem profunda e visão computacional, o estudo apresenta dois modelos: um que utiliza Batch Normalization (BN) e outro que emprega técnicas de Concept Whitening (CW) para aprimorar a interpretabilidade do modelo. Os principais objetivos são avaliar a precisão na classificação desses modelos e a sua interpretabilidade. Usando parâmetros robustos de avaliação, ambos os modelos demonstram boas taxas de precisão na classificação de géneros musicais com base em capas de álbuns de vinil. Notavelmente, o modelo de concept whitening adiciona outra camada de interpretabilidade, desvendando as características de caixa-preta encontradas em redes neurais padrão. Resultados empíricos indicam que o concept whitening não apenas aprimora a interpretabilidade do modelo, mas também compete eficazmente em termos de desempenho preditivo. Este projeto visa a criação de sistemas confiáveis e transparentes de classificação de géneros musicais baseados em imagens. Ao comparar os dois modelos em termos de precisão e interpretabilidade, o estudo destaca a viabilidade de incorporar o concept whitening em arquiteturas padrão de CNN para aplicações de IA mais explicáveis.pt_PT
dc.identifier.tid203378270pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.14/43177
dc.language.isoengpt_PT
dc.subjectConvolutional neural networkspt_PT
dc.subjectMusic genre classificationpt_PT
dc.subjectImage-based classificationpt_PT
dc.subjectDeep learningpt_PT
dc.subjectInterpretabilitypt_PT
dc.subjectExplainabilitypt_PT
dc.subjectRedes neuronais convolucionaispt_PT
dc.subjectClassificação de géneros musicaispt_PT
dc.subjectClassificação baseada em imagenspt_PT
dc.subjectAprendizagem profundapt_PT
dc.subjectInterpretabilidadept_PT
dc.subjectExplicabilidadept_PT
dc.titleImage-based music genre classification using convolutional neural networkspt_PT
dc.title.alternativeClassificação de géneros musicais baseada em imagens usando redes neuronais convolucionaispt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Análise de Dados para Gestãopt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
203378270.pdf
Size:
7.15 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.44 KB
Format:
Item-specific license agreed upon to submission
Description: