Se connecter

Ou se connecter avec

FAQ

Si vous avez d'autres questions, n'hésitez pas à nous contacter !

Pour participer à un challenge, vous devez créer un compte sur datascience.net. Cliquez sur le bouton « Se connecter » en haut à droite de l écran et cliquez sur le lien « Créer un compte ». Vous pouvez également utiliser votre compte Google, LinkedIn ou Facebook pour vous identifier.

Choisissez votre challenge et lisez bien la description de la question qui est posée, et sur quel critère de performance les modèles seront évalués. Pour participer au challenge, vous devez accepter et valider le règlement.

Téléchargez les données. Vous aurez besoin de deux jeux de données : le jeu vous permettant d évaluer votre modèle, et l'échantillon de test sur lequel vous testerez votre modèle.

Une fois que vous avez estimé les résultats obtenus par votre modèle sur l'échantillon de test, vous pouvez poster le fichier contenant ces résultats en cliquant sur le lien « Envoyer ». Lisez attentivement la description du format du fichier attendu. Si celui-ci ne correspond pas exactement, la plateforme ne pourra pas correctement évaluer la performance de votre modèle et votre fichier sera rejeté. Complétez votre soumission par un bref descriptif de la méthode employée, ou par tout commentaire que vous jugerez pertinent (ce champ n est pas obligatoire).

Toutes les solutions sont évaluées à l'aide d'un critère objectif, déterminé et décrit à l'avance, et détaillé pour chaque challenge. De cette façon, vous pouvez optimiser vos modèles selon le même critère de performance que celui qui sera utilisé.

Les critères d'évaluation peuvent être différents d'un challenge à l'autre, en fonction de l'objectif recherché.

Il n'existe pas de limites aux nombre de challenges auxquels on peut être inscrit.

Vous pouvez proposer autant de modèles que vous le souhaitez. Vous êtes même encouragé à toujours essayer de proposer un meilleur modèle, afin de gagner des places au classement, ou de consolider votre place de leader !

En revanche, vous ne pouvez pas participer à un challenge sous plusieurs comptes différents.

Les modèles sont évalués sur la base d'un échantillon de données, connu de la seule plateforme.

Sauf exception, les mesures de performance d'un modèle seront réalisées en deux temps :

  • Pendant toute la durée du challenge, les scores et le classement ne seront établis que sur une petite partie des données de validation. Le classement affiché ne sera donc qu'un classement estimatif, en attendant le classement réel final.
  • En parallèle, les scores seront également évalués sur l'ensemble des données de validation, mais demeureront secrets jusqu'à la fin du challenge. C'est sur cette base que sera établi le classement final.

De cette façon, les contributions s'appuyant sur une forme de sur-apprentissage pourront améliorer temporairement le classement du candidat, mais risquent de détériorer les performances du modèle quand il sera évalué sur l’échantillon complet... et potentiellement faire perdre des places au candidat dans le classement final.