Portfolio — Data Science
Sports
Analytics
Analyse de données sportives personnelles — Strava · Withings · Nolio
Python
pandas
scikit-learn
XGBoost
Plotly
Folium
SQLAlchemy
MySQL
Jupyter
01
Performance Predictor — CTL / ATL / TSB
Reproduction du modèle Fitness-Fatigue (TrainingPeaks) sur 11 ans de données. Calcul du TSS par activité, courbes CTL/ATL/TSB, puis prédiction du temps de course via XGBoost avec cross-validation Leave-One-Out.
2 969
séances
·
21
courses
·
MAE run :
±16 min
·
2014 → 2026
02
Geospatial Route Clustering
Décodage de 2 257 traces GPS (670 000 points), visualisation interactive par sport, heatmap de densité et clustering DBSCAN des zones d'entraînement géographiques. 4 cartes interactives Folium générées.
2 257
routes
·
670k
points GPS
·
28
clusters DBSCAN
·
93% clusterisées
03
Composition corporelle × Performance
Analyse des corrélations entre composition corporelle (Withings) et performances en course sur 176 semaines. Corrélations glissantes 12 semaines, profil corporel des meilleures courses, scatter plots.
618
pesées
·
176
semaines
·
Masse grasse r=
+0.235**
·
Poids r=
+0.179*
Cartes interactives — Projet 2
🗺️
Routes par sport
800 routes colorées par discipline
🔥
Heatmap densité
Zones les plus fréquentées
📍
Clusters DBSCAN
28 zones d'entraînement identifiées
📅
Progression annuelle
Toggle par année 2014–2026