Se connecter

Ou se connecter avec
Fin du challenge :
15 juillet 2017

Prévision de la consommation électrique

RTE réalise quotidiennement des prévisions de consommation d’électricité qui permettent d’assurer à tout instant l’équilibre entre l’offre et la demande d’électricité et, ainsi, de garantir la sûreté du système électrique.
L'objectif de ce challenge est d'effectuer une prévision déterministe à court terme de la consommation nationale et régionale d’électricité en France.

Classement
1. (7) Gauss Score 2,66447%
2. (1) jlesuffleur Score 3,40876%
3. (5) Nicolas Gaude Score 3,43633%
Fin du challenge :
15 juillet 2017

18 000

€ 

151

contributions

354

participants

49

plus que
jours restants
49
jours

Depuis de nombreuses années, RTE (http://www.rte-france.com) réalise des prévisions de consommation d’électricité qui permettent d’assurer à tout instant l’équilibre entre l’offre et la demande d’électricité et, ainsi, de garantir la sûreté du système électrique.

Avec la transition énergétique, de nouveaux facteurs ayant un impact sur la consommation d’électricité apparaissent et la rendent plus difficile à prévoir : autoconsommation, développement de nouveaux usages (véhicule électrique, pompes à chaleur…), réglementations sur l’isolation des bâtiments, nouvelles offres de fourniture, possibilité pour chaque consommateur de suivre sa consommation et de la maîtriser...

Dans ce contexte de flexibilité croissante et d’harmonisation des règles de marché au niveau européen, RTE souhaite réaliser un état de l’art des modèles de prévision existants et évaluer la performance des nouvelles approches dynamiques et adaptatives de la Data Science.

RTE lance donc ce challenge de prévision de la consommation d’électricité. L’objectif est de prévoir au mieux la consommation d’électricité aux mailles nationale et régionale pour 10 journées sur la période du challenge, à l’horizon J+1 et au pas quart d’heure. Suite au classement final et à condition de fournir une note A4 méthodologique décrivant les grands principes du modèle et la nature des données utilisées, les trois meilleurs classés recevront les récompenses suivantes :

  • 1er prix : 10 000 €
  • 2e prix : 5 000 €
  • 3e prix : 3 000 €

Les inscriptions au challenge sont ouvertes jusqu’au 24 mai 2017. Les participants auront à prévoir les 10 journées suivantes :

  • Jeudi 25 mai (Ascension), Vendredi 26 mai
  • Lundi 5 juin (Pentecôte), Samedi 10 juin, Vendredi 16 juin, Jeudi 22 juin, Mercredi 28 juin
  • Mardi 4 juillet, Jeudi 13 juillet, Vendredi 14 juillet (Fête Nationale)

La prévision du jour J est à remettre au plus tard à 21h le jour J-1. Pour chaque participant, les 9 journées ayant permis d’obtenir les meilleurs scores, seront retenues pour l’élaboration du classement final (voir onglet correspondant).

Afin de se préparer, les participants auront la possibilité de s’entraîner sur 5 jours consécutifs, les 18, 19, 20, 21 et 22 mai en envoyant également leur prévision du jour J au plus tard à 21h le jour J-1.

Description de la variable à prévoir

L'équilibre entre production et consommation étant réalisé à tout instant, la mesure en temps réel de la consommation d’électricité est réalisée de façon indirecte à partir des télémesures disponibles sur les centrales de production des réseaux de transport et de distribution, ainsi que sur les lignes d'interconnexion avec l'étranger.

La variable à prévoir correspond ainsi à la consommation d’électricité représentant l'ensemble des puissances consommées par les clients raccordés au réseau de RTE ainsi que les pertes sur le réseau, diminuée de la puissance prélevée pour le pompage par les installations hydroélectriques.

Description des données

Afin de prévoir la consommation d’électricité, les participants ont à disposition des données de consommation nationale et régionales ainsi que des données météorologiques. Ils peuvent aussi utiliser d’autres données (publiques ou privées). Cependant, il est interdit d’utiliser les prévisions de consommation J-1 de RTE, quelle que soit la source de publication.

Les données de consommation sont publiées par RTE et téléchargeables au format Excel sur le site Eco2mix (http://www.rte-france.com/fr/eco2mix/eco2mix-telechargement), pour la France entière et pour les 12 nouvelles régions administratives.

Les données en temps réel (télémesures) sont disponibles pendant 1 mois, puis elles sont remplacées par les données consolidées (basées sur des comptages) durant 1 an avant d’être finalement remplacées par les données définitives (basées sur l’ensemble des comptages). Durant la période du challenge, les données seront donc amenées à évoluer, les données les plus récentes écrasant les anciennes.

Le participant peut télécharger les données du mois en cours en temps réel au pas de temps 15 min, de l’année en cours, c’est-à-dire 2016 et le début de l’année 2017 consolidées au pas de temps 30 min, et l’historique annuel entre 2012 et 2015 des données définitives au pas de temps 30 min.

Noter qu’à la maille régionale, les incertitudes associées à la mesure des données en temps réel et en particulier aux frontières entre les régions, entraîne d’une part l’existence de données manquantes ou aberrantes, d’autre part un biais entre la somme des consommations régionales et la consommation nationale.

Une note explicative plus détaillée est présente sur le site Eco2mix.

Les données météorologiques, utilisées en opérationnel pour la prévision à RTE et fournies par Météo France (http://www.meteofrance.com/), seront mises à disposition des participants sous forme de fichiers horaire lors de l’ouverture du challenge, suite à un accord avec Météo France.

Ces fichiers comportent pour chaque heure H les réalisés (H-5 à H) et les prévisions (H+1 à H+72) des chroniques de températures et nébulosités de 35 stations météorologiques réparties sur la France entière. Les historiques sur 5 ans sont fournis le jour de l’ouverture du challenge. Puis, durant le challenge, les 24 derniers fichiers horaires sont mis à disposition des participants sur la plateforme Datascience.net chaque jour vers 17h. Un script R permettant de lire ces fichiers est mis à disposition des participants.

Une note explicative plus détaillée est fournie.

Mesure de la performance

La mesure de performance sera établie sur la base du Mean Absolute Percentage Error (MAPE). 

$$M = \frac{100\%}{n} \sum_{i=1}^n | \frac{C_i - {C_i}^*}{C_i} |\ $$

où \(C_i\) est la consommation réelle constatée, \({C_i}^*\) la consommation estimée par le modèle, et \(n\) l'effectif de l'échantillon (pour un jour donné, \(n\) = 13*96).

(lire en anglais : http://en.wikipedia.org/wiki/Mean_absolute_percentage_error)

Cette métrique sera appliquée pour calculer votre performance sur chacune des 10 journées à prévoir mais vous serez classés sur la base de la moyenne des 9 journées les plus performantes que vous aurez réussi, ceci afin de vous permettre une erreur opérationnelle pendant la durée du challenge.

Remarque : la métrique est calculée à partir des données réelles disponibles sur eco2mix. Si une valeur est manquante dans le fichier eco2mix, celle-ci n'est pas prise en compte dans le calcul.


Format du fichier à fournir

Le fichier que doit fournir le candidat est un fichier au format .csv, dont la structure est la suivante :

region.code;date;hour;forecast
France;2017-05-18;00:00;500000
France;2017-05-18;00:15;500000
............

La prévision doit être un nombre entier.

Le code.region doit être identique à celui fourni par eco2mix. Pour mémoire, voici la liste des codes région :

France
France
ACA
Grand-Est
ALP
Nouvelle-Aquitaine
ARA
Auvergne-Rhône-Alpes
BFC
Bourgogne-Franche-Comté
BRE
Bretagne
CEN
Centre-Val de Loire
IDF
Ile-de-France
LRM
Occitanie
NPP
Hauts-de-France
NOR
Normandie
PLO
Pays-de-la-Loire
PAC
PACA
1. (7) Gauss 1 contribution Score 2,66447%
2. (1) jlesuffleur 2 contributions Score 3,40876%
3. (5) Nicolas Gaude 2 contributions Score 3,43633%
4. (9) fan de regression 2 contributions Score 3,69054%
5. (14) Geert Scholma 2 contributions Score 3,78690%
6. (2) Malo Huard 2 contributions Score 3,79304%
7. (6) Pierre Nowak 2 contributions Score 3,80640%
8. (10) Nicolas Cavallo 2 contributions Score 3,93944%
9. (11) Florian Laroumagne 2 contributions Score 3,96701%
10. (17) Dmitry Ulyanov 2 contributions Score 4,15277%
11. (15) Daniel 2 contributions Score 4,16804%
12. (19) Amastan 2 contributions Score 4,34261%
13. (3) Serge Rigori 2 contributions Score 4,39559%
14. (4) Mohamed Bibimoune 2 contributions Score 4,39888%
15. (23) Isabelle P. 2 contributions Score 4,52219%
16. (13) Martinus 2 contributions Score 4,55218%
17. (12) Romain Ayres 2 contributions Score 4,56808%
18. (8) Adrien DEPRES 2 contributions Score 4,61807%
19. (16) Mário Castro 2 contributions Score 4,85115%
20. (18) Elo . 2 contributions Score 4,92751%
21. (21) Valentin Cadoret 2 contributions Score 5,04621%
22. (31) xiaomilovekg 2 contributions Score 5,27394%
23. EL 1 contribution Score 5,28652%
24. (32) Jean-Paul LE 2 contributions Score 5,32545%
25. (20) Maïté Garcia 2 contributions Score 5,60419%
26. (28) Matthieu Scordia 2 contributions Score 5,60598%
27. (25) Quentin Morel 2 contributions Score 5,60686%
28. (34) IIK 1 contribution Score 5,71273%
29. Alexandra GIGON 1 contribution Score 5,76022%
30. (27) fabien daniel 2 contributions Score 5,77545%
31. (39) Cédric BONNET 2 contributions Score 6,00452%
32. (22) Thomas Berthou 2 contributions Score 6,10361%
33. (24) Victor 2 contributions Score 6,23170%
34. (26) Cedric Gouy-Pailler 2 contributions Score 6,41110%
35. (30) Michel Taupin 2 contributions Score 6,57374%
36. Joachim Zentici 1 contribution Score 6,59343%
37. abc test 1 contribution Score 6,60862%
38. Actuarix 1 contribution Score 7,06423%
39. (33) Francesco Benvenuto 2 contributions Score 7,18246%
40. (35) Tran Bach 2 contributions Score 7,34462%
41. LEPLATOIS Pierre 1 contribution Score 7,41709%
42. (37) Lucie Montuelle 2 contributions Score 7,46569%
43. (38) Hoai Minh Le 2 contributions Score 7,63059%
44. (42) Remi Roblot 2 contributions Score 8,16889%
45. (46) ayinon 2 contributions Score 8,40961%
46. (36) Alexis GEROSSIER 2 contributions Score 8,88770%
47. (29) Romain Benassi 2 contributions Score 9,25334%
48. (45) Igor Swiecicki 1 contribution Score 9,31934%
49. (44) Pierre 2 contributions Score 10,01584%
50. Saint-Pierre Yoan 1 contribution Score 10,26151%
51. (41) Yazan Markabawi 2 contributions Score 10,35823%
52. Jacques Peeters 1 contribution Score 10,55573%
53. (40) Mohamed Hassanudeen Abdul Samad 2 contributions Score 10,75747%
54. Bastien Claude 1 contribution Score 11,87018%
55. (47) Antoine Sauvage 1 contribution Score 12,20184%
56. Emilie L. 1 contribution Score 12,83965%
57. Gergo Barta 1 contribution Score 12,90625%
58. Hossein Sangrody 1 contribution Score 13,27207%
59. (48) Sébastien Lamy de la Chapelle 2 contributions Score 13,88791%
60. (53) MA 2 contributions Score 14,06596%
61. (50) Patrice Mazel 2 contributions Score 14,41135%
62. (49) Frull 1 contribution Score 14,82450%
63. (43) Paco R. 2 contributions Score 15,27416%
64. (51) Yao Zhang 1 contribution Score 16,95204%
65. (57) duducheng 2 contributions Score 17,73064%
66. (52) chasseur 1 contribution Score 19,86396%
67. (56) Antoine Jeanjean 2 contributions Score 20,25662%
68. (54) MarcusV 1 contribution Score 21,99368%
69. (55) Nour D 2 contributions Score 23,93110%
70. (60) Pierre Tano 2 contributions Score 27,87479%
71. Sami Tazi 1 contribution Score 30,48148%
72. (59) Raul Viruez 2 contributions Score 41,25482%
73. (61) Philippe LONJOUX 2 contributions Score 44,90820%
74. Wilder Lopes 1 contribution Score 46,59696%
75. Simon 1 contribution Score 55,72458%
76. (58) Mar Am 2 contributions Score 64,57049%
Discussions
loading... Chargement...