Repository logo
 
No Thumbnail Available
Publication

Towards an interpretable advertisement click prediction

Use this identifier to reference this record.
Name:Description:Size:Format: 
203252810.pdf914.78 KBAdobe PDF Download

Advisor(s)

Abstract(s)

In the new era of computational advertising, Click prediction models are used to anticipate a click response and guide marketers’ decisions about whom to target and how to personalize. The more prediction tasks achieve impressive performances, the more trust is put in black models to make important decisions in a business domain. Due to the complexity and lack of transparency of the models, posterior explanation methods are needed to identify features’ contributions that envision a global explanation of the model. This thesis develops an advertisement Click prediction using a supervised machine learning framework and uses the KernelSHAP method to provide feature importance insights on the predictions made by the model. The thesis aims to answer: 1) how can marketers integrate Click prediction in their businesses; 2) which are the most impactful features for a click response; 3) how advertisement categories differ from an overall model. For that purpose, is used a publicly available ADS dataset (2016) to train a neural network. The results showed the overall model performance is not substantially different from a segmented categories performance. The output of KernelSHAP showed that even though the visual content is impactful for the likelihood of a Click for all models, each category has its own feature importance pattern influenced by the product the category promotes. The performance metrics presented a high ratio of true negative to true positive due to a class imbalance problem. To mitigate the cost of misclassification is suggested an individual analysis that better fit target business model.
Na era da publicidade computacional, os modelos de previsão Clique são utilizados para antecipar uma resposta de clique e guiar decisões­chave como a quem publicitar. Quanto mais preciso é o desempenho, mais confiança é depositada em modelos para tomar decisões importantes num domínio empresarial. Devido à complexidade e falta de transparência dos modelos, são necessários métodos de explicação posteriores para identificar como cada atributo contribuiu para a previsão. Esta tese desenvolve um modelo aprendizagem automática que prevê o Clique em anúncios e utiliza o método KernelSHAP que explica quais os atributos mais relevantes à previsão. A tese tem como objetivo responder a: 1) como podem os profissionais de publicidade integrar a previsão de clique nos seus negócios; 2) quais são as características mais impactantes para obter um Clique; 3) como as categorias de publicidade diferem de um modelo global. Para esse efeito, é utilizado um conjunto de dados publicamente disponível ­ ADS(2016)­ para treinar uma rede neural. Os resultados mostraram que o desempenho global do modelo não é substancialmente diferente do desempenho segmentado de categorias. Os resultados do KernelSHAP mostraram que, embora o conteúdo visual seja impactante para a probabilidade de um Clique em todos os modelos, cada categoria tem o seu próprio padrão de atributos mais importantes para a classificação. Estes são influenciados pelo produto que a categoria promove. As métricas de avaliação apresentam uma discrepância entre previsões corretas entre classes. Para mitigar o custo de uma classificação errada, sugere­se uma análise individual que melhor se ajuste ao modelo de negócio.

Description

Keywords

Computational advertising Advertising click prediction Explainable AI KernelSHAP Neural network Publicidade computacional Previsão de click em anúncios Inteligência artificial explicável Rede neuronal

Pedagogical Context

Citation

Research Projects

Organizational Units

Journal Issue