Silva, Vera Lúcia Miguéis Oliveira ePortela, Maria da Conceição Andrade da SilvaMagalhães, SusanaSilva, Ana Paula Teixeira da2017-11-282017-11-282017-07-042017http://hdl.handle.net/10400.14/23560Este trabalho foi desenvolvido na EDP Distribuição, no âmbito da validação e disponibilização de dados, com o objetivo de colmatar as falhas de registos de potência de consumo nos diagramas de carga dos Postos de Transformação e Distribuição (PTD's) de Energia em Portugal. Para esse efeito, os PTD’s foram segmentados através do algoritmo de Clustering K-Means, tendo para isso sido utilizados os valores de potência de consumo registados ao longo do período de um ano. Estes valores de potência foram previamente normalizados para que fosse possível considerar apenas a forma dos perfis aquando da segmentação, e posteriormente agrupados por hora e por dia da semana-tipo em cada mês, com o intuito de reduzir o número de variáveis a processar pelo R. Da análise de Clustering, resultaram três perfis, sob a forma de séries temporais que correspondiam ao período de um ano, representativos de todos os PTD’s. Estes perfis foram utilizados para estimar os valores de potência do ano seguinte. No final, testou-se o procedimento desenvolvido para efetuar as previsões para o mês de Novembro de 2016. Obteve-se um erro entre previsões e valores reais de 27,3%, excluindo possíveis outliers, para aquele mês. Considerou-se aceitável este resultado e, portanto, assumiu-se que este método poderia ser utilizado para inferir as falhas de registos de potência de consumo nos diagramas de carga.This work was developed at EDP Distribuição, in the field of data validation and availability, aiming to handle failures of electric power consumption records from smart meters data electric power transformer stations (PTD’s) in Portugal. For that purpose, the PTD’s were segmented using K-Means (a Clustering technique) using the power consumption records recorded over the period of a year. These values were previously normalized, in order to consider only the profile’s shape during the segmentation phase, and were grouped by hour and by typical week in each month, in order to reduce the number of variables to be processed by R. As result of Clustering, 3 typical profiles were obtained, under the shape of time series that corresponded to the period of a year, representative of all PTD’s. These profiles were used to estimate the power consumption records for the next year. In the end, the developed procedure was tested to make the predictions for next year’s (2016) November. Concerning this month’s predictions, it was obtained an error between predictions and real values of 27,3%, excluding possible outliers. This result was considered acceptable and thus, it was assumed this procedure could be used to fulfil the defined goals.porPostos de transformação e distribuição de energiaData miningClusteringClassificaçãoSmart metersSegmentationClassificationSegmentação dos postos de transformação e distribuiçãomaster thesis201747871