Se connecter

Ou se connecter avec
Date limite de participation :
15 septembre 2014

Modéliser les consommations électriques de sites B2B

Ecometering, filiale du Groupe GDF SUEZ, conçoit, développe et opère des solutions innovantes, clé en main, pour la maîtrise et le pilotage intelligent de l’énergie, adaptées à tous les segments de marché au niveau Européen (particuliers, professionnels, industrie/tertiaire). L’objectif de ce challenge est de disposer de modèles prédictifs permettant d’estimer la consommation électrique d’un ensemble de sites industriels ou tertiaires, à partir de leurs historiques de consommations et des données de météo.

Classement
1. (7) Arnaud de Myttenaere Score 16,60267%
2. (8) Matt Sco Score 16,87978%
3. (5) Mohamed Bibimoune Score 17,12162%
Ce challenge est terminé.

7 000

€ 

1459

contributions

284

participants

terminé
terminé
Parmi son éventail d’activité d’opérateur de services d’efficacité énergétique smart, Ecometering a développé des solutions sur l’agrégation de flexibilité, soit l’optimisation des consommations en annulant, anticipant ou reportant tout ou partie de la consommation électrique des sites.

Dans le cadre de cette activité, l’objectif est de disposer de modèles prédictifs permettant d’estimer la consommation électrique d’un ensemble de sites industriels ou tertiaires, à partir de leurs historiques de consommations et des données de météo.

Le(s) modèle(s) doit être prédictif à un horizon de un à dix jours à un pas temporel très fin (10 minutes) afin de permettre à Ecometering de maximiser la valeur de son portefeuille d’actifs. L’objectif est d’obtenir des prévisions les plus précises possibles en minimisant les délais de calibration des modèles. Ces problématiques de prévision de consommation sont transverses au Groupe GDF SUEZ, les résultats du challenge seront suivis attentivement par de nombreuses entités au sein du Groupe.

Le challenge a donc pour objectif de proposer un algorithme de prévision permettant de prendre en compte la spécificité de chaque site tout en garantissant une applicabilité maximale dans des conditions opérationnelles (rapidité de calibration, adaptabilité, etc.).

Ce challenge est assorti des récompenses suivantes :
  • Première place : 4 500 €
  • Deuxième place : 1 000 €
  • Troisième, quatrième et cinquième place : 500 €

Ce challenge se déroulera en deux phases. La première permettra de sélectionner les 5 meilleurs contributeurs au travers d’une métrique quantitative basée sur la MAPE pondérée (Mean Absolute Percentage Error, cf. onglet "Critère de performance").

Une fois les 5 meilleurs contributeurs sélectionnés, ceux-ci transmettront à datascience.net une note méthodologique décrivant leur solution. Un jury composé d’experts de datascience.net et d’un représentant d’Ecometering évaluera les méthodologies utilisées afin de s’assurer de leur adaptation au contexte opérationnel. Ce jury effectuera un classement des 5 premiers.

La note finale sera obtenue par la formule suivante :
$$N = 51\% * N_1 + 49\% * N_2$$

Où :
  • \(N_1\) représente le rang de classement sur la base de la métrique quantitative,
  • \(N_2\) représente le rang de classement des méthodologies par le jury.

La meilleure note est alors la note la plus basse.

Les salariés de GDF SUEZ SA ou de ses filiales ainsi que toutes autres personnes ayant accès à des sources de données de GDF SUEZ SA et de ses filiales, ne peuvent participer à ce challenge.

Dans le package de données téléchargeable, vous trouverez 4 fichiers :

Donnees_Ecometering_Description_sites.xlsx
Ce fichier contient le référentiel des sites à estimer. Il comporte 5 colonnes : 
  • L’identifiant du site (IDnn),
  • Le secteur d’activité du site (code NAF),
  • Le libellé du secteur d’activité associé 
  • La date de début des données fournies,
  • La date de fin des données fournies.

Donnees_Ecometering_Courbes-de-charges.csv
Ce fichier contient les données de puissance observées pour chaque site au pas 10 minutes :
  • Une colonne de date-heure DATE_LOCAL  au format JJ/MM/AAAA hh:mm,
  • Une colonne par site (en-tête = identifiant du site) contenant la puissance moyenne soutirée, en kW, sur la période [DATE_LOCAL, DATE_LOCAL+10 minutes[

Donnees_Ecometering_Temperature-par-site.xlsx
Ce fichier contient les données de température moyenne observée sur chaque site au pas tri-horaire (une donné toutes les 3 heures) :
  • Une colonne de date au format JJ/MM/AAAA hh:mm (Jour)
  • Une colonne par site (en-tête = identifiant du site) contenant la température observée, en °C  pour le site et l’heure considérée.

Poids.xlsx
Ce fichier contient les poids applicables à chaque pas de temps pour chaque site pour l’évaluation de la métrique :
  • Une colonne reprenant l’identifiant du site (ID),
  • Une colonne de date heure (Date)
  • Une colonne du poids appliqué pour le calcul de la métrique (Poids)

La base fournie contient les données pour 43 sites. Tous les sites n’ont pas la même portée de données disponibles, ce qui correspond au cas réel d’utilisation puisqu’Ecometering peut ne disposer que d’un jeu de données limité pour établir ses prévisions (par exemple lors de l’entrée en portefeuille d’un nouveau site).

Le classement public sera réalisé sur un échantillon représentatif comprenant environ 1/3 des sites de la base, le classement privé sur l’autre partie.

Calcul de la métrique

Chaque contribution se fera sous la forme d’un fichier de données au format CSV, avec séparateur point-virgule (« ; ») comprenant 3 colonnes et 61 921 lignes :
  • Une ligne d’en-tête comprenant les en-têtes suivantes : ID, DATE, VALEUR
  • 61 920 lignes de données prévues (1 440 données prévues par site * 43 sites).
  • La première colonne fournira l’identifiant du site prévu (« IDnn »)
  • La seconde colonne fournira la date-heure de prévision (JJ/MM/AAAA hh:mm) correspondant à chaque pas 10 minutes des 10 journées suivant la date de fin des données disponibles pour le site considéré,
  • La troisième colonne fournira la valeur prévue par votre modèle, en kW, en valeur entière.
Exemple :

ID;DATE;ESTIMATION
ID01;25/07/2012 00:00;1111
ID01;25/07/2012 00:10;1111
...
......
ID01;03/08/2012 23:50;1111
ID02;12/02/2012 00:00;2222
...
......
Si l'on note alors
  • \((P_{i,j})_{ \begin{array}{r c l} 1 \leq i \leq 1440 \\ 1 \leq j \leq 43 \end{array} } \)  la prévision pour le site j sur le temps i,
  • \((W_i)_{1 \leq i \leq 1440}\)  le poids de l’indice de temps i,
  • \((R_{i,j})_{ \begin{array}{r c l} 1 \leq i \leq 1440 \\ 1 \leq j \leq 43 \end{array} } \)  la consommation réelle pour le site j sur le temps i (non fournie pour la période demandée),
  • \(n_{echant}\) la taille de l’échantillon \(echant\) de sites sur lequel est appliquée la métrique
La métrique d’évaluation \(N_1\) sur l’échantillon \(echant\) sera alors la suivante :
$$N_1 = \frac{1}{\sum_i W_i} \cdot \frac{1}{n_{echant}} \cdot \sum_{j \in echant} \left ( \sum_i W_i \frac{|P_{i,j}-R_{i,j}|}{R_{i,j}} \right ) $$

Plan de la note méthodologique attendue en phase 2

1/ Description générale de la méthode
Description littéraire de la méthode utilisée, en ½ page maximum.

2/ modèles et algorithmes utilisés
Liste des modèles mathématiques et statistiques utilisés et du processus associé le cas échéant (si par exemple utilisation d’un algorithme de clusterisation des sites pour les faire rentrer dans une famille de modèle).
1 page maximum

3/ Outils informatiques utilisés
Liste des logiciels utilisés et description des packages ou modules utilisés le cas échéant.
½ page maximum.

4/ temps de traitement observés
Fourniture du temps observé pour la calibration des modèles et leur exécution, et description sommaire de la plateforme technique utilisée.

Le jury Ecometering s'est réuni le 6 octobre 2014, et a établi le classement suivant des notes méthodologiques proposées par les candidats :
  1. Arnaud de Myttenaere
  2. Matthieu Scordia
  3. Boris Sanchot
  4. Predictive Layer 
  5. Team F&H
Le classement final, prenant en compte à la fois le classement de la performance pure et le classement des notes méthodologiques, est donc le suivant :
  1. Arnaud de Myttenaere
  2. Matthieu Scordia
  3. Predictive Layer
  4. Boris Sanchot
  5. Team F&H
Tous les participants seront bientôt invités par Ecometering à venir discuter avec les lauréats autour d'un verre. Encore bravo à tout le monde pour votre participation !
1. (7) Arnaud de Myttenaere 46 contributions 15/09/14 09:33 Score 16,60267%
2. (8) Matt Sco 20 contributions 12/09/14 10:04 Score 16,87978%
3. (5) Mohamed Bibimoune 96 contributions 04/08/14 00:05 Score 17,12162%
4. (1) Boris Sanchot 150 contributions 11/09/14 19:18 Score 17,16143%
5. (16) Team F&H 11 contributions 07/09/14 15:29 Score 17,55814%
6. (3) lpk 59 contributions 06/09/14 22:20 Score 17,57119%
7. (4) N H 64 contributions 15/09/14 23:49 Score 17,58758%
8. (9) Thierry 57 contributions 13/09/14 12:46 Score 17,61507%
9. (6) Serge Rigori 54 contributions 15/09/14 20:24 Score 17,65482%
10. (13) Philippe LONJOUX 25 contributions 13/09/14 22:17 Score 17,79709%
11. (10) Alexis Marceau 61 contributions 15/09/14 23:42 Score 17,89549%
12. (2) Follet Maxime 113 contributions 17/08/14 14:46 Score 18,27457%
13. (11) Florian Brunet 15 contributions 15/09/14 16:23 Score 18,41531%
14. (19) GJ 27 contributions 31/07/14 21:10 Score 18,46026%
15. (14) Sadate Ham Hining 3 contributions 07/09/14 19:38 Score 18,61575%
16. (12) Stéphane Soulier 15 contributions 23/07/14 09:17 Score 18,70765%
17. (23) DL 32 contributions 03/08/14 17:31 Score 18,75807%
18. (27) Eric Biernat 14 contributions 10/09/14 01:08 Score 18,78830%
19. (17) Olga S. 33 contributions 04/09/14 06:00 Score 18,92977%
20. (25) J. 6 contributions 27/08/14 13:55 Score 19,34434%
21. (26) Alexandre Crayssac 12 contributions 24/07/14 19:29 Score 19,46185%
22. (24) Romain Ayres 3 contributions 28/06/14 17:22 Score 19,60878%
23. (15) CNS D. MOA 36 contributions 29/08/14 15:42 Score 19,81027%
24. (32) Thierry Moudiki 29 contributions 30/08/14 09:49 Score 19,91996%
25. (29) Lilian Sanselme 22 contributions 12/09/14 17:25 Score 19,92821%
26. (21) Ody 13 contributions 14/09/14 10:45 Score 20,04829%
27. (18) dizz 42 contributions 24/07/14 20:49 Score 20,21188%
28. (22) Ee 13 contributions 14/09/14 00:11 Score 20,25491%
29. (30) Felix Chopin 4 contributions 15/09/14 21:20 Score 20,36735%
30. (28) Patrick Barret 10 contributions 12/07/14 22:37 Score 20,73207%
31. (35) philippe beaune 5 contributions 07/09/14 17:17 Score 20,97891%
32. (33) LEPLATOIS Pierre 5 contributions 19/07/14 18:41 Score 21,11586%
33. (20) Oo 19 contributions 11/09/14 17:00 Score 21,34188%
34. (36) Alexis D 14 contributions 28/08/14 18:47 Score 22,13329%
35. (31) A.J NKWANKAM 24 contributions 23/07/14 17:39 Score 22,39624%
36. (41) EDORH Rodrigue 12 contributions 25/07/14 14:48 Score 22,89235%
37. (38) Eric 34 contributions 30/08/14 23:38 Score 23,30258%
38. (42) Sam HOURI 3 contributions 03/08/14 14:31 Score 23,53209%
39. (37) Amine Benhalloum 13 contributions 19/08/14 10:28 Score 23,97305%
40. (34) Adel Meguellati 6 contributions 12/09/14 15:28 Score 24,58787%
41. (46) Green_team 1 contribution 30/07/14 10:39 Score 25,91515%
42. (47) Thomas Vial 1 contribution 14/09/14 23:20 Score 26,03085%
43. (45) Bach Klee 1 contribution 03/07/14 10:46 Score 26,65163%
44. (39) Antoine Guillot 24 contributions 08/07/14 11:09 Score 27,38585%
45. (40) Julien B 4 contributions 15/08/14 19:08 Score 29,51701%
46. (43) Benjamin Mahé 9 contributions 11/08/14 00:20 Score 31,74441%
47. (44) Marouane Azlaf 2 contributions 25/06/14 00:34 Score 32,53120%
48. (50) AshtonIzmev 3 contributions 01/07/14 00:55 Score 35,10446%
49. (48) Chris Aude 1 contribution 16/07/14 18:34 Score 41,88967%
50. (49) CR 1 contribution 29/07/14 17:52 Score 52,69520%
51. (51) Matthieu T 1 contribution 25/06/14 15:32 Score 1832,12761%
Discussions
loading... Chargement...