Se connecter

Ou se connecter avec
Fin du challenge :
10 février 2018

Prévision probabiliste de la consommation électrique hivernale
(volet 2)

RTE réalise quotidiennement des prévisions de consommation d’électricité qui permettent d’assurer à tout instant l’équilibre entre l’offre et la demande d’électricité et, ainsi, de garantir la sûreté du système électrique. L'objectif de ce challenge est d'effectuer une prévision probabiliste à court terme de la consommation nationale d’électricité en France.

Classement

Personne n'a encore proposé de solution valide pour ce challenge.

Soyez le premier à contribuer !

Fin du challenge :
10 février 2018

14 000

€ 

4

contributions

139

participants

19

plus que
jours restants
19
jours

Depuis de nombreuses années, RTE (http://www.rte-france.com/) réalise des prévisions de consommation d’électricité qui permettent d’assurer à tout instant l’équilibre entre l’offre et la demande d’électricité et, ainsi, de garantir la sûreté du système électrique.

Avec la transition énergétique, de nouveaux facteurs ayant un impact sur la consommation d’électricité apparaissent et la rendent plus difficile à prévoir : autoconsommation, développement de nouveaux usages (véhicule électrique, pompes à chaleur…), réglementations sur l’isolation des bâtiments, nouvelles offres de fourniture, possibilité pour chaque consommateur de suivre sa consommation et de la maîtriser...

Dans ce contexte de flexibilité croissante et d’harmonisation des règles de marché au niveau européen, RTE souhaite réaliser un état de l’art des modèles de prévision existants et évaluer la performance des nouvelles approches dynamiques et adaptatives de la Data Science.

Un premier challenge, lancé en 2017, a porté sur la prévision déterministe à court terme de la consommation nationale et régionale d’électricité. En 2018, RTE lance un second challenge au périmètre national qui porte cette fois sur une prévision avec incertitude associée pour la période hivernale.

Néanmoins, deux challenges en parallèle sont lancés : un sur la prévision déterministe et un autre sur une prévision avec incertitude, tous les deux au périmètre de la France métropolitaine. Ce présent challenge concerne la prévision avec incertitude.

Suite au classement final et à condition de fournir une note méthodologique décrivant les grands principes du modèle et la nature des données utilisées, les trois meilleurs classés recevront les récompenses suivantes :

  • 1er prix : 8 000 €
  • 2e prix : 4 000 €
  • 3e prix : 2 000 €

Les inscriptions au challenge sont ouvertes jusqu’au 21 Janvier 2018.

Ce challenge consistera pour les participants, sur la période du 22 Janvier 2018 au 10 février 2018, à réaliser, au moyen de techniques de leur choix, des prévisions de la distribution probabiliste de la consommation quart d’heure par quart d’heure en J-1 pour J et ce pour les 15 jours suivants :

  • Mardi 23, Mercredi 24, Jeudi 25, Vendredi 26, Samedi 27, Mardi 30 et Mercredi 31 du mois de Janvier
  • Jeudi 1, Vendredi 2, Samedi 3, Mardi 6, Mercredi 7, Jeudi 8, Vendredi 9 et Samedi 10 du mois de Février.

Les participants posteront donc sur la plateforme leur meilleure estimation des quantiles à 1, 5, 10, 25, 50, 75, 90, 95 et 99%) de leur prévision de consommation pour une journée J avant 21h CET la journée J-1 (soumission de 9 x 4 x 24 valeurs).

Pour se préparer, les participants pourront s’exercer du 3 au 21 Janvier en envoyant les prévisions du 9, 10, 11, 12, 13 Janvier et ce également au plus tard à 21h CET le jour J-1.

Description de la variable à prévoir

L'équilibre entre production et consommation étant réalisé à tout instant, la mesure en temps réel de la consommation d’électricité est réalisée de façon indirecte à partir des télémesures disponibles sur les centrales de production des réseaux de transport et de distribution, ainsi que sur les lignes d'interconnexion avec l'étranger.

La variable à prévoir correspond ainsi à la consommation d’électricité représentant l'ensemble des puissances consommées par les clients raccordés au réseau de RTE ainsi que les pertes sur le réseau, diminuée de la puissance prélevée pour le pompage par les installations hydroélectriques.

Description des données

Afin de prévoir la consommation d’électricité, les participants ont à disposition des données de consommation nationale ainsi que des données météorologiques. Ils peuvent aussi utiliser d’autres données (publiques ou privées). Cependant, il est interdit d’utiliser les prévisions de consommation J-1 de RTE, quelle que soit la source de publication.

Les données de consommation

  • Un historique de 5 années de consommations nationales à la maille demi-horaire disponible sous licence d’exploitation RTE et téléchargeables au format Excel sur le lien suivant (http://www.rte-france.com/fr/eco2mix/eco2mix-telechargement).
  • En continu les données de consommation à la maille horaire par Eco2mix, sous licence d’exploitation RTE et téléchargeables au format Excel sur le lien suivant (http://www.rte-france.com/fr/eco2mix/eco2mix-telechargement), pour la France entière. Les données en temps réel (télémesures) sont disponibles pendant 1 mois, puis elles sont remplacées par les données consolidées (basées sur des comptages) durant 1 an avant d’être finalement remplacées par les données définitives (basées sur l’ensemble des comptages). Durant la période du challenge, les données seront donc amenées à évoluer, les données les plus récentes écrasant les anciennes.

Le participant peut télécharger les données de consommation du mois en cours en temps réel au pas de temps 15 min, le début de l’année 2017 consolidées au pas de temps 30 min, et l’historique annuel entre 2013 et 2016 des données définitives au pas de temps 30 min.

Une note explicative plus détaillée est présente sur le site Eco2mix.

Note : Les données de consommation disponibles sur la plateforme ECO2MIX sont basées sur le fuseau CET/CEST (Central European Time ou Central European Summer Time pendant l'heure d'été).

Les données météorologiques

  • Un historique de 5 années de conditions climatiques prévues et réalisées (données Météo France) au pas horaire par station météo sera disponible directement sur la plateforme datascience.net.
  • Chaque jour vers 16h, les prévisions Météo France (http://www.meteofrance.com/) seront disponibles pour les prochaines journées sous un format brut.
  • Datascience.net mettra à la disposition des participants une documentation permettant d’exploiter ces données.

Les participants s’engageront contractuellement à ne pas utiliser ces données (historiques et temps réel) en dehors du cadre du présent challenge, par la signature d’une licence d’utilisation définie par Météo France.

En résumé, les données suivantes seront disponibles chaque jour :

  • la consommation d’électricité nationale en temps réel,
  • la météo réalisée sur J-1 et sur le début de la journée J,
  • les prévisions météo de la journée J+1.

Ils pourront aussi proposer d’utiliser des données complémentaires dans leur modèle sous conditions de disponibilité dans un processus opérationnel.

Mesure de la performance

Les concurrents seront évalués sur leur capacité à prévoir, à l’aide de données connues en J, la consommation à J+1 au pas quart horaire et ce en réalisant une estimation des quantiles 1, 5, 10, 25, 50, 75, 90, 95 et 99% associés à cette dernière.

La prévision fournie par chaque concurrent sera comparée au réalisé pendant toute la journée J au fur et à mesure de la disponibilité des données sur le réalisé et le classement sera actualisé à 4 reprises :

  • En J vers 9 ou 10h, sur la base du réalisé de minuit à 8h [Voir conventions de nommage sur Eco2Mix pour les plages horaires]
  • En J vers 13 ou 14h, sur la base du réalisé de minuit à 12h
  • En J vers 19 ou 20h, sur la base du réalisé de minuit à 18h
  • En J+1 avant 9h, sur la base du réalisé de toute la journée.

La métrique sera une métrique de perte quantile pour ce volet 2 du challenge. 

$$PQ = \frac{1}{n} \sum_{i=1}^n \sum_{\tau\in\{1\%,5\%,...,99\%\}} |C_i - C_{i,\tau}^*| * (\tau \mathbb{1}_{\{C_i > C_{i,\tau}^* \}} + (1 - \tau) \mathbb{1}_{\{C_i < C_{i,\tau}^* \}}) $$

où \(C_i\) est la consommation réelle constatée, \({C_i}^*\) la consommation estimée par le modèle, \(n\) l'effectif de l'échantillon (pour un jour donné, \(n\) = 24*4) et \(\tau\) le quantile (1, 5, ..., 99%).

Le classement final de chacun des deux challenges tiendra compte de la moyenne réalisée sur 13 meilleures journées par chaque concurrent parmi les 15 journées ainsi prévues.

A l’issue du challenge, les 3 concurrents les mieux classés seront invités à fournir une description détaillée de leur méthode de prévision et des données utilisées. Les documents remis seront évalués par un jury d’experts mixte comprenant des experts RTE et des académiques.


Format du fichier à fournir

Le fichier que doit fournir le candidat est un fichier au format .csv, dont la structure est la suivante :

date;hour;quantile;forecast
2017-05-18;00:00;1;10000
2017-05-18;00:00;5;10000
............

La prévision doit être un nombre entier.

Liste des classements par journée

Classement pour la journée du 10/01/2018

1. Les Consommateurs Score 3 564,822


Classement pour la journée du 11/01/2018

1. Arnault Score 1 879,082
2. Jérémy Lesuffleur Score 1 970,578


Classement pour la journée du 12/01/2018

1. Les Consommateurs Score 1 246,988
2. Jérémy Lesuffleur Score 1 556,854
3. Florian Laroumagne Score 2 219,798
4. Jirong Score 2 938,323
5. Arnault Score 3 862,373
6. Nicolas Gaude Score 4 158,463
7. Valentin Cadoret Score 8 336,812


Classement pour la journée du 13/01/2018

1. Romain Ayres Score 1 005,517
2. Nicolas Gaude Score 2 169,742
3. Quentin Morel Score 2 902,935
4. Florian Laroumagne Score 3 011,181
5. EL Score 18 618,66


Aucun classement à afficher pour l'instant.
Discussions
loading... Chargement...