UNIVERSIDAD DE CASTILLA-LA MANCHADepartamento de Sistemas Informaticos
Metodos de aprendizaje maquina aplicados a laprediccion del consumo electrico de edificios
Gonzalo Vergara PlaInstituto de Investigacion en Informatica de Albacete
Albacete, 29 de junio de 2016
Indice
1 Motivacion
2 Preprocesado
3 Metodos globales
4 Metodos de agregacion
5 Conclusiones y trabajo futuro
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 2 / 31
Indice
1 Motivacion
2 Preprocesado
3 Metodos globales
4 Metodos de agregacion
5 Conclusiones y trabajo futuro
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 3 / 31
Motivacion
Figura: Energıa consumida a nivel global. Fuente: Eurostat and EIA.
En paıses desarrollados los edificios representan el 40 % de la energıa totalconsumida.En edificios: calentamiento, ventilacion y aire acondicionado (HVAC) constituye masdel 50 % de la energıa utilizada.Eficiencia energetica: beneficios ambientales y economicos, se estima que en 2050se reduciran las emisiones de CO2 en 12.9 Gt y el consumo energetico en 1509Mtep. Fuente IEA.Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 4 / 31
Motivacion
Figura: Energıa consumida por edificios. Fuente: Eurostat y EIA.
En Espana los edificios universitarios han aumentado su consumo desde 85 ktep en2007 hasta 94 ktep en de 2010. Fuente: IDAE.Objetivos de este trabajo:
1. Mejorar las predicciones de los metodos clasicos de series temporales.2. Construir modelos lineales y no lineales comparando con modelos clasicos.3. Investigar metodologıas de clustering y agregacion de modelos.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 5 / 31
Conjunto de datos
Universidad de Leon (914.7 m), 30 edificios.
E1
E2
E3 E4
E18E19
E17
E23
E15
E10
E16
E11
E12
E14
E13
E20
E21E22
E30
E5
E6
E7
E8
E9
UNIVERSIDAD DE LEÓNCampus de Vegazana
N-1
20
N-6
21
AP-66(Asturias)
A-66(Madrid)
AP-71(Astorga)
A-231(Burgos)A-66
(Madrid)
(Asturias)
(Can
tabr
ia)
(Valladolid)
(Ponferrada)
E24
E25E26 E28
E29
E27
CampusVegazana
Ciudad de León
0 50 100m
Figura: Distribution de edificios en la Universidad de Leon. Cortesıa de S. Alonso.
Datos temporales, ambientales y electricos durante 13 meses desde el 01/03/10.Temperatura en 2010 = [−10, 34] oC.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 6 / 31
Indice
1 Motivacion
2 Preprocesado
3 Metodos globales
4 Metodos de agregacion
5 Conclusiones y trabajo futuro
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 7 / 31
Preprocesado: variables
Variables temporales:Hora h −→ [hx , hy ] = [sin(2πh/24), cos(2πh/24)].d: dıa.m: mes.l: laborable (0/1).Variables ambientales: (∆ = 2 min −→ ∆ = 1 h)T: temperatura externa(oC).H: humedad relativa ( %).R: radiacion solar (W/m2).Variables electricas: (∆ = 2 min −→ ∆ = 1 h)P: potencia activa horaria (kW).D: desviacion estandar de la potencia activa horaria (kW).
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 8 / 31
Preprocesado: edificios
1. Analisis de componentes principales (PCA).2. Clustering k-medoides.
−8 −6 −4 −2 0 2
−2
−1
01
Componente 1
Com
ponente
2
1
2
3
45
6
7
8
9
10
11
12
13 14
15
16
1718
19
20
2122
23
24
25
26
27
28
29
30
Grupo 1
Grupo 3Grupo 2
Figura: Agrupamiento de los edificios de la Universidad de Leon.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 9 / 31
Preprocesado: edificios seleccionados
1. Analisis de componentes principales (PCA)2. Clustering k-medoides
−8 −6 −4 −2 0 2
−2
−1
01
Componente 1
Componente
2
1
2
3
45
6
7
8
9
10
11
12
13 14
15
16
1718
19
20
2122
23
24
25
26
27
28
29
30
Grupo 1
Grupo 3Grupo 2
Biología
Filosofía
ColegioMayor
Figura: Agrupamiento de los edificios de la Universidad de Leon.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 10 / 31
Preprocesado: edificios seleccionados
Se han seleccionado tres edificios, un edificio por grupo:
Grupo Edificio No Tipo Superficie Potencia activautil (m2) media (kW)
1Centro Datos 1 APO 4034 105.60 ± 30.82Veterinaria 11 FAC 17100 142.46 ± 55.66Biologıa 13 FAC 12480 72.54 ± 31.70Agrıcolas 24 INV 10204 71.88 ± 28.88
2Industriales 3 FAC 8470 16.94 ± 16.54Tecnologico 5 INV 11500 36.31 ± 18.26Filosofıa 6 FAC 14700 27.73 ± 26.78... (10 edificios)
......
......
3Colegio Mayor 25 APO 5500 14.12 ± 9.25Rectorado 26 SER 9020 29.98 ± 15.49C. Serna 27 INV 1265 22.57 ± 6.67... (16 edificios)
......
......
Tabla: Caracterısticas de los edificios de la Universidad de Leon.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 11 / 31
Indice
1 Motivacion
2 Preprocesado
3 Metodos globales
4 Metodos de agregacion
5 Conclusiones y trabajo futuro
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 12 / 31
Metodos globales lineales
1. Metodos autorregresivos (AR):Modelo ARMA(p,q):
yt = φ1 yt−1 + φ2 yt−2 + · · ·+ φp yt−p + et − θ1 et−1 − θ2 et−2 − · · · − θq et−q,
2. Regresion lineal (LR):
Y = Xβ + e,
Metodo de mınimos cuadrados:N∑
i=1
e2i = ete = (Y− Xβ)t(Y− Xβ).
Estimador de mınimos cuadrados:
β = (XtX)−1XtY.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 13 / 31
Metodos globales no lineales
1. Perceptron multicapa (MLP):
ENTRADAS
SALIDA
CAPA DE ENTRADA CAPA OCULTA
CAPA DE SALIDA
Salida de la k-esima neurona de una capa oculta:
zk = φ
(n∑
i=0
wik · xi
)Calculo de los pesos: algoritmo de retropropagacion de Levenberg-Marquardt.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 14 / 31
Metodos globales no lineales
2. Maquinas de vectores soporte (SVM):
y
y + ǫ
y − ǫ
y(x)
x
ξ > 0
ξ > 0
Funcion de coste a minimizar:12‖w‖
2 + C∑
i
(ξi + ξi ),
w : vector de pesosC : factor de penalizacionCondiciones:
yi − w · x− b ≤ ε+ ξi ,
w · x + b − yi ≤ ε+ ξi ,
ξi , ξi ≥ 0.3. Metodos basados en arboles: Se basan en arboles de decision constituidos por:
nodos de decision y nodos hoja o terminales.Arboles de regresion (RT): la salida es un valor de potencia o desviacion de potencia.Arboles de modelos (MT): la salida es una regresion lineal de la potencia o de ladesviacion de potencia.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 15 / 31
Experimentos: equipo y medidas realizadas
Equipo utilizado: procesador Intel R©CoreTMi7 3770 a 3.4 GHz sobre el sistemaoperativo OS X con 8 GB de memoria RAM.Software utilizado: Matlab v2010 y v2012, Weka, Java y R.Variables a predecir: potencia y desviacion de potencia a 1 h.Complejidad de los modelos: parametros caracterısticos de cada modelo.Tiempo de aprendizaje promedio.Diagramas de dispersion: representacion XY de los valores de la variable deseadaen funcion de los valores reales.Diagramas de residuos: diagramas de caja de los residuos para los conjuntos deentrenamiento, validacion, de test y total.Medidas de error (kW) para los conjuntos total y de dıas laborables deentrenamiento, validacion y test:
MAE =∑N
i=1 |yi − yi |N y RMSE =
√∑Ni=1(yi − yi )2
NPerfiles de potencia y desviacion de potencia.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 16 / 31
Experimentos: metodos multivariantes
Reordenaciones aleatorias: 10.Division de conjuntos totales en:
entrenamiento (55 %).validacion (15 %).test (30 %).
Division de conjuntos de dıas laborables (L) en:validacion (11 dıas).test (2 dıas).
Variables seleccionadas:hx , hy , d, m, l, T, H, R, P y D.Estandarizacion de variables (salvo en arboles).
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 17 / 31
Experimentos: construccion de perfiles
t [hx, hy, d, m, l, T, H, R, P, D]t−1 P t
1 P1 =P1
2 [hx, hy, d, m, l, T, H, R, P, D]1 P2
3 [hx, hy, d, m, l, T, H, R, P, D]2 P3
4 [hx, hy, d, m, l, T, H, R, P, D]3 P4
. . .
. . .
. . .
24 [hx, hy, d, m, l, T, H, R, P, D]23 P24
(a) Potencia.
t [hx, hy, d, m, l, T, H, R, P, D]t−1 Dt
1 D1 =D1
2 [hx, hy, d, m, l, T, H, R, P, D]1 D2
3 [hx, hy, d, m, l, T, H, R, P, D]2 D3
4 [hx, hy, d, m, l, T, H, R, P, D]3 D4
. . .
. . .
. . .
24 [hx, hy, d, m, l, T, H, R, P, D]23 D24
(b) Desviacion de potencia.
Figura: Generacion de perfiles diarios.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 18 / 31
Indice
1 Motivacion
2 Preprocesado
3 Metodos globales
4 Metodos de agregacion
5 Conclusiones y trabajo futuro
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 19 / 31
Metodos de agregacion
La combinacion de modelos permite una reduccion de la varianza y/o aumento de laprecision.
1. Bagging: (Breiman 96)Bagging = Bootstrap aggregation:Muestreo bootstrap + agregacion de modelos.
2. Random forest: (Breiman 01)Random forest = bagging de arboles de regresion con seleccion aleatoria de
√n
variables en cada modelo a combinar.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 20 / 31
Metodos de agregacion
3. Maquinas de aprendizaje extremo aleatorias RELM:B = numero de bootstraps.F = factor = numero de neuronas / numero de variables = H/n.
...
CONJUNTOGLOBAL
...
CONJUNTODE DIASLABORABLES
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 21 / 31
Experimentos de agregacion
1. Random forest.2. Bagging ELM: Se prueban distintas combinaciones de variables incluyendo siempre
hx, hy y potencia o desviacion.3. RELM:Fase 1: barrido en F desde 50 a 150 y B desde 10 a 100 con incrementos de 10.Fase 2: se probaron diferentes estadısticos hasta llegar a p0= 55 (cercano a la mediana)
6 12 18 240
20
40
60
80
100
120
Tiempo (h)
Pote
ncia
activa (
kW
)
Figura: Efecto del parametro p durante validacion en el edificio de Filosofıa (L 25/10/10),datos= *, p=50, p=55, p=60.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 22 / 31
Comparacion de modelos: potencia
Modelo k t(s) MAEe MAEv MAEt RMSEt MAEL,v MAEL,t2LP 10/12 280 ± 30 2.85 2.82 2.81 3.92 6.95 4.97SVR 3847 120 ± 5 2.12 3.63 3.81 5.78 5.59 6.12RT 133 0.7 ± 0.4 3.50 3.81 3.98 6.03 18.22 6.43MT 58 0.36 ± 0.03 3.02 3.07 3.39 5.04 6.77 6.85CELML 90 410 ± 50 2.87 3.22 2.97 5.16 26.76 31.99RELM 130/20 181 ± 12 2.71 3.21 3.33 4.93 5.08 4.79
(a) Edificio de Biologıa (P = 73.06 ± 30.75 kW).
Modelo k t(s) MAEe MAEv MAEt RMSEt MAEL,v MAEL,t2LP 16/20 197 ± 22 1.91 1.79 1.80 2.81 3.85 3.14SVR 3108 127 ± 3 1.67 2.23 2.27 3.85 5.28 5.83RT 198 0.6 ± 0.3 2.20 2.72 2.77 4.64 13.07 13.07MT 48 0.36 ± 0.05 2.10 2.23 2.33 3.87 5.96 6.39CELML 180 1340 ± 110 1.83 1.98 2.17 4.47 14.56 13.02RELM 140/20 198 ± 9 1.64 2.08 2.05 3.38 4.03 2.91
(b) Edificio de Filosofıa (P = 27.84 ± 26.74 kW).
Modelo k t(s) MAEe MAEv MAEt RMSEt MAEL,v MAEL,t2LP 6/20 131 ± 13 1.50 1.46 1.48 2.26 2.95 2.63SVR 3183 84 ± 14 1.47 1.67 1.82 2.72 3.11 2.20RT 129 0.52 ± 0.03 1.67 1.86 1.91 2.83 3.82 2.98MT 39 0.52 ± 0.04 1.59 1.62 1.79 2.63 3.37 2.17CELML 220 1220 ± 50 1.27 1.28 1.34 2.31 4.79 4.37RELM 80/10 55 ± 4 1.49 1.60 1.70 2.58 2.70 2.05
(c) Edificio de Colegio Mayor (P = 14.22 ± 7.44 kW).
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 23 / 31
Resultados de agregacion: potencia
6 12 18 240
20
40
60
80
100
120
140
160
180
Tiempo (h)
Pote
ncia
activa (
kW
)
(a) Edificio de Biologıa.
6 12 18 240
20
40
60
80
100
120
Tiempo (h)
Pote
ncia
activa (
kW
)(b) Edificio de Filosofıa.
6 12 18 240
5
10
15
20
25
30
35
40
45
50
Tiempo (h)
Pote
ncia
activa (
kW
)
(c) Colegio Mayor.
6 12 18 240
20
40
60
80
100
120
140
160
180
Tiempo (h)
Pote
ncia
activa (
kW
)
6 12 18 240
20
40
60
80
100
120
Tiempo (h)
Pote
ncia
activa (
kW
)
6 12 18 240
5
10
15
20
25
30
35
40
45
50
Tiempo (h)
Pote
ncia
activa (
kW
)
Figura: Perfiles de potencia: perceptron 2LP (arriba) y RELM (abajo) (X 27/10/10).
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 24 / 31
Indice
1 Motivacion
2 Preprocesado
3 Metodos globales
4 Metodos de agregacion
5 Conclusiones y trabajo futuro
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 25 / 31
Conclusiones:
MODELOS
GLOBALES LOCALES AGREGACION
Autorregresivos
Lineales
Perceptron
SVM
Arboles
Lineales
SVM
ELM
Random forests
Bagging
RELM
Modelos globales destacables:2LP: el mejor modelo en el conjunto total pero costoso.SVM: buenas predicciones en el conjunto total y L (potencia Colegio Mayor).RT y MT: buenas predicciones en desviacion (y potencia L Colegio Mayor) y muyrapidos de entrenar.
Modelos locales destacables:CELML: el mejor modelo en potencia (Colegio Mayor) pero malos perfiles.CLRTP: el mejor modelo en desviacion pero malos perfiles.
Modelos de agregacion:RELM: el mejor modelo en dıas laborables y mas rapido que 2LP (potencia).
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 26 / 31
Trabajo futuro:
Analisis adicional de series diarias.
Extender el horizonte de prediccion de los modelos.
Aplicar otros metodos de clustering en regiones de potencias altas.
Investigar metodos tipo random forest con arboles de modelos.
Hacer agregaciones de SVMs.
Investigar tecnicas con un nivel adicional de aleatoriedad en los parametros delmodelo.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 27 / 31
Aportaciones:
Aportaciones bibliograficas:G. Vergara, J.I. Alonso-Barba, E. Soria-Olivas, J.A. Gamez y M. Domınguez “Randomextreme learning machines to predict electric load in buildings”, Progress in ArtificialIntelligence, 5(2), 129-135, Springer.G. Vergara, J.J. Carrasco, J. Martınez-Gomez, M. Domınguez, J.A. Gamez, y E.Soria-Olivas. “Global and local clustering-based regression models to forecast powerconsumption in buildings”, Handbook of Research on Emerging Technologies forElectrical Power Planning, Analysis, and Optimization, IGI Global (aceptado).J.J. Carrasco, J. Caravaca, M. Millan-Giraldo, G. Vergara, J.M. Martınez-Martınez, J.Sanchis, E. Soria-Olivas. “Prediction of Temperature in Buildings Using MachineLearning Techniques”. Advanced Computational Techniques for Simulation-BasedEngineering, IGI Global (aceptado).
Aportaciones a congresos:G. Vergara, J. Cozar, C. Romero-Gonzalez, J.A. Gamez y E. Soria-Olivas. “ComparingELM against MLP for electrical power prediction in buildings”. 6th InternationalWork-Conference on the Interplay between Natural and Artificial Computation(IWINAC). Elche, junio 2015.J. Cozar, G. Vergara, J.A. Gamez y E. Soria-Olivas. “Comparing TSK-1 FRBS againstSVR for electrical power prediction in buildings”. 9th Conference of the EuropeanSociety for Fuzzy Logic and Technology (EUSFLAT). Gijon, junio 2015.G. Vergara, J.A. Alonso-Barba, E. Soria-Olivas y J.A. Gamez. “Maquinas deaprendizaje extremo aleatorias para la prediccion del consumo electrico de edificios”.XVI Conferencia de la Asociacion Espanola para la Inteligencia Artificial (CAEPIA).Albacete, noviembre 2015.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 28 / 31
Otras aportaciones:
Prediccion de temperatura interior de edificios:J.J. Carrasco, J. Caravaca, M. Millan-Giraldo, G. Vergara, J.M. Martınez-Martınez, J.Sanchis, E. Soria-Olivas. “Prediction of Temperature in Buildings Using MachineLearning Techniques”. Advanced Computational Techniques for Simulation-BasedEngineering, IGI Global (aceptado).
Prediccion de averıas en maquinaria:J. Gomez-Sanchis, A. Serrano-Lopez; M. Martınez-Sober, J.J. Garces-Iniesta, E.Soria-Oivas, G. Vergara-Pla, J.M. Martınez-Martınez. “Sistema experto de ayuda almantenimiento de maquinas enfardadoras basado en aprendizaje automatico”,Proceedings CAEPIA.
Gonzalo Vergara Pla (UCLM) Prediccion del consumo electrico de edificios 29 de junio de 2016 29 / 31
UNIVERSIDAD DE CASTILLA-LA MANCHADepartamento de Sistemas Informaticos
Metodos de aprendizaje maquina aplicados a laprediccion del consumo electrico de edificios
Gonzalo Vergara PlaInstituto de Investigacion en Informatica de Albacete
Albacete, 29 de junio de 2016
Top Related