 
              Florian Robinet
Data Scientist
 
                Facebook Recruiting IV: Human or Robot ?
Description
Dans cette compétition, vous traquerez des robots sur un site d'enchères en ligne. Les enchérisseurs humains sur le site deviennent de plus en plus frustrés par leur incapacité à remporter des enchères par rapport à leurs homologues contrôlés par des logiciels. En conséquence, l'utilisation par la base de clients principale du site est en chute libre.
Afin de restaurer le bonheur des clients, les propriétaires du site doivent éliminer les enchères générées par ordinateur. Leur tentative de construire un modèle pour identifier ces enchères en utilisant des données comportementales, y compris la fréquence d'enchère sur de courtes périodes de temps, s'est révélée insuffisante.
L'objectif de cette compétition est d'identifier les enchères en ligne placées par des "robots", aidant ainsi les propriétaires du site à signaler facilement ces utilisateurs pour les supprimer de leur site afin de prévenir toute activité d'enchère déloyale.
Résultats
| Model | Public LB | Private LB | Date | Commit | 
|---|---|---|---|---|
| Bid number statistical analysis ==> Xgboost classifier | 0.89928 | 0.90050 | 9th January 2018 | Script 1 | 
| Bid number and bid time statistical analysis ==> Xgboost classifier | 0.88477 | 0.91041 | 10th January 2018 | Script 2 | 
| Bid number and bid time statistical analysis ==> Xgboost classifier (optimization) | 0.88546 | 0.91498 | 10th January 2018 | Script 3 | 
| Bid number, bid argmax and bid time statistical analysis (normalize continuous data) ==> Xgboost classifier | 0.91249 | 0.92072 | 14th January 2018 | Script 4 | 
| Bid number, bid argmax, bid time statistical analysis (normalize continuous data) and PCA features ==> Xgboost classifier | 0.91146 | 0.92437 | 14th January 2018 | Script 5 | 
| Bid number, bid argmax, bid time statistical analysis (normalize continuous data), PCA features, feature selection and polynomial features ==> Xgboost classifier | 0.90661 | 0.92988 | 14th January 2018 | Script 6 | 
Classement
94/985 (private leaderboard)
Pistes à explorer
- Extraire davantage de caractéristiques statistiques
- Méthodes ensemblistes
- Stacking (Tpot)
- Gridsearch
En savoir plus ...