| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 914.78 KB | Adobe PDF |
Advisor(s)
Abstract(s)
In the new era of computational advertising, Click prediction models are used to anticipate a
click response and guide marketers’ decisions about whom to target and how to personalize.
The more prediction tasks achieve impressive performances, the more trust is put in black
models to make important decisions in a business domain. Due to the complexity and lack of
transparency of the models, posterior explanation methods are needed to identify features’
contributions that envision a global explanation of the model. This thesis develops an
advertisement Click prediction using a supervised machine learning framework and uses the
KernelSHAP method to provide feature importance insights on the predictions made by the
model. The thesis aims to answer: 1) how can marketers integrate Click prediction in their
businesses; 2) which are the most impactful features for a click response; 3) how advertisement
categories differ from an overall model. For that purpose, is used a publicly available ADS
dataset (2016) to train a neural network. The results showed the overall model performance is
not substantially different from a segmented categories performance. The output of
KernelSHAP showed that even though the visual content is impactful for the likelihood of a
Click for all models, each category has its own feature importance pattern influenced by the
product the category promotes. The performance metrics presented a high ratio of true negative
to true positive due to a class imbalance problem. To mitigate the cost of misclassification is
suggested an individual analysis that better fit target business model.
Na era da publicidade computacional, os modelos de previsão Clique são utilizados para antecipar uma resposta de clique e guiar decisõeschave como a quem publicitar. Quanto mais preciso é o desempenho, mais confiança é depositada em modelos para tomar decisões importantes num domínio empresarial. Devido à complexidade e falta de transparência dos modelos, são necessários métodos de explicação posteriores para identificar como cada atributo contribuiu para a previsão. Esta tese desenvolve um modelo aprendizagem automática que prevê o Clique em anúncios e utiliza o método KernelSHAP que explica quais os atributos mais relevantes à previsão. A tese tem como objetivo responder a: 1) como podem os profissionais de publicidade integrar a previsão de clique nos seus negócios; 2) quais são as características mais impactantes para obter um Clique; 3) como as categorias de publicidade diferem de um modelo global. Para esse efeito, é utilizado um conjunto de dados publicamente disponível ADS(2016) para treinar uma rede neural. Os resultados mostraram que o desempenho global do modelo não é substancialmente diferente do desempenho segmentado de categorias. Os resultados do KernelSHAP mostraram que, embora o conteúdo visual seja impactante para a probabilidade de um Clique em todos os modelos, cada categoria tem o seu próprio padrão de atributos mais importantes para a classificação. Estes são influenciados pelo produto que a categoria promove. As métricas de avaliação apresentam uma discrepância entre previsões corretas entre classes. Para mitigar o custo de uma classificação errada, sugerese uma análise individual que melhor se ajuste ao modelo de negócio.
Na era da publicidade computacional, os modelos de previsão Clique são utilizados para antecipar uma resposta de clique e guiar decisõeschave como a quem publicitar. Quanto mais preciso é o desempenho, mais confiança é depositada em modelos para tomar decisões importantes num domínio empresarial. Devido à complexidade e falta de transparência dos modelos, são necessários métodos de explicação posteriores para identificar como cada atributo contribuiu para a previsão. Esta tese desenvolve um modelo aprendizagem automática que prevê o Clique em anúncios e utiliza o método KernelSHAP que explica quais os atributos mais relevantes à previsão. A tese tem como objetivo responder a: 1) como podem os profissionais de publicidade integrar a previsão de clique nos seus negócios; 2) quais são as características mais impactantes para obter um Clique; 3) como as categorias de publicidade diferem de um modelo global. Para esse efeito, é utilizado um conjunto de dados publicamente disponível ADS(2016) para treinar uma rede neural. Os resultados mostraram que o desempenho global do modelo não é substancialmente diferente do desempenho segmentado de categorias. Os resultados do KernelSHAP mostraram que, embora o conteúdo visual seja impactante para a probabilidade de um Clique em todos os modelos, cada categoria tem o seu próprio padrão de atributos mais importantes para a classificação. Estes são influenciados pelo produto que a categoria promove. As métricas de avaliação apresentam uma discrepância entre previsões corretas entre classes. Para mitigar o custo de uma classificação errada, sugerese uma análise individual que melhor se ajuste ao modelo de negócio.
Description
Keywords
Computational advertising Advertising click prediction Explainable AI KernelSHAP Neural network Publicidade computacional Previsão de click em anúncios Inteligência artificial explicável Rede neuronal
