MACHINE LEARNING

 Plan du module :

  • Tour d’horizon des problèmes & types d’apprentissage (supervisé/non supervisé, classification/régression, single/multi output, structuré/non structuré, statistiques ou non, etc.).
  • Principaux modèles et algorithmes d’apprentissage supervisé (modèles linéaires, réseaux de neuronnes, arbres de décision, Bagging, Random Forest, Boosting) et d’apprentissage non  supervisé (K-means, clustering hiérarchiques, etc.)
  • Les concepts importants préparation de données, fonctions coût, critères de performance, overfitting, dilemme biais-variance, validation croisée, données déséquilibrées, données manquantes, création des variables, etc..
  • Sélection de variables et de modèles
  • Apprentissage multi-label et multi-régression
  • Détection d’anomalies
  • Text Mining : Préparation de données, TF-IDF, LSI, Word Embedding, etc.
  • Mise en pratique sur des jeux de données avec scikit-learn[1] sous Python sur des cas d’études réels.