🚀 Entraînement ML
Pipeline d'entraînement avec contexte de prix réels — split 70/15/15 ordonné dans le temps
⚙️ Paramètres d'entraînement
Données : articles de sentiment de la DB · exclusion 7 derniers jours
Features : TF-IDF + VADER + prix (MA20, ret J-1, ret 7j, volatilité)
Sélection : meilleur modèle choisi sur jeu de validation (R² val)
Données
⚠️ Serveur 1 GB RAM — recommandé : max 3 000 échantillons, TF-IDF ≤ 150, arbres ≤ 50. Au-delà le conteneur peut crasher.
Cible d'entraînement
Split temporel
Modèles à entraîner
TF-IDF
Plus de features = plus lent, mais potentiellement plus précis
Random Forest
Gradient Boosting
Ridge Regression
Plus grand = plus de régularisation (évite l'overfitting)
📊 Statut
Inactif
🤖 Modèles disponibles
Chargement…
💰 Données prix ETF
Chargement…
📝 Logs d'entraînement
Aucun log disponible