Aquantic training - Formation

Analyse de données avec Python

Icône DuréeDurée

4 jours - 28 heures

Icône EuroPrix

2860 € HT

Icône RéférenceRéférence

AQ-ADP-1

Icône TypeType

🏢 Intra

Public

Responsables Infocentre (Datamining, Marketing, Qualité...), utilisateurs et gestionnaires métiers de bases de données.

Pré-requis

Connaissances de base en Python. Connaissances de base en statistiques ou avoir suivi le stage "Statistiques, maîtriser les fondamentaux" (Référence Aquantic SMF).

Objectifs

À la fin de la formation, le participant sera capable de :

  • Comprendre le concept de modélisation statistique.
  • Sélectionner la régression ou la classification selon le type de données.
  • Juger les performances prédictives d'un algorithme.
  • Créer des sélections et des classements dans de larges ensembles de données pour identifier des tendances.

Programme

Introduction à la modélisation

  • Initiation au langage Python.
  • Découverte du logiciel Jupiter Notebook.
  • Processus de création d'un modèle.
  • Algorithmes supervisés et non supervisés.
  • Décision entre la régression et la classification.  Pratique: Installation de Python 3, Anaconda et Jupiter Notebook.

Méthodes d'évaluation de modèles

  • Techniques de ré-échantillonnage pour l'apprentissage, la validation et le test de sets.
  • Test de la représentativité des données d'apprentissage.
  • Mesures de la performance des modèles prédictifs.
  • Matrices de confusion et de coût, courbes ROC et AUC.  Pratique : Implémentation d'échantillonnage de sets de données. Réaliser des tests d'évaluation sur divers modèles fournis.

Les algorithmes supervisés

  • Concept de la régression linéaire univariée.
  • La régression multivariée.
  • Régression polynomiale.
  • Régression régularisée.
  • Naive Bayes.
  • Régression logistique.  Pratique: Application des régressions et des classifications sur différentes sortes de données.

Les algorithmes non supervisés

  • Clustering hiérarchique.
  • Clustering non hiérarchique.
  • Approches mixtes.  Pratique : Exécution de clustering non supervisé sur divers sets de données.

Analyse en composantes

  • Analyse en composantes principales.
  • Analyse factorielle des correspondances.
  • Analyse des correspondances multiples.
  • Analyse factorielle pour données mixtes.
  • Classification hiérarchique sur composantes principales.  Pratique: Mise en application de la réduction du nombre de variables et identification des facteurs sous-jacents aux dimensions avec une grande variabilité.

Analyse de textes

  • Collecte et prétraitement de données textuelles.
  • Extraction d'entités primaires, d'entités nommées et résolution de la référence.
  • Étiquetage grammatical, analyse syntaxique et sémantique.
  • Lemmatisation.
  • Représentation vectorielle de textes.
  • Pondération TF-IDF.
  • Word2Vec. Pratique : Exploration du contenu d'une base de textes via l'analyse sémantique latente.

Modalités et informations pratiques

Analyse de données avec Python

Icône DuréeDurée

4 jours - 28 heures

Icône EuroPrix

2860 € HT

Icône RéférenceRéférence

Icône TypeType

Intra

Public

Responsables Infocentre (Datamining, Marketing, Qualité...), utilisateurs et gestionnaires métiers de bases de données.

Pré-requis

Connaissances de base en Python. Connaissances de base en statistiques ou avoir suivi le stage "Statistiques, maîtriser les fondamentaux" (Référence Aquantic SMF).

Objectifs

À la fin de la formation, le participant sera capable de :

  • Comprendre le concept de modélisation statistique.
  • Sélectionner la régression ou la classification selon le type de données.
  • Juger les performances prédictives d'un algorithme.
  • Créer des sélections et des classements dans de larges ensembles de données pour identifier des tendances.

Programme

Introduction à la modélisation

  • Initiation au langage Python.
  • Découverte du logiciel Jupiter Notebook.
  • Processus de création d'un modèle.
  • Algorithmes supervisés et non supervisés.
  • Décision entre la régression et la classification.  Pratique: Installation de Python 3, Anaconda et Jupiter Notebook.

Méthodes d'évaluation de modèles

  • Techniques de ré-échantillonnage pour l'apprentissage, la validation et le test de sets.
  • Test de la représentativité des données d'apprentissage.
  • Mesures de la performance des modèles prédictifs.
  • Matrices de confusion et de coût, courbes ROC et AUC.  Pratique : Implémentation d'échantillonnage de sets de données. Réaliser des tests d'évaluation sur divers modèles fournis.

Les algorithmes supervisés

  • Concept de la régression linéaire univariée.
  • La régression multivariée.
  • Régression polynomiale.
  • Régression régularisée.
  • Naive Bayes.
  • Régression logistique.  Pratique: Application des régressions et des classifications sur différentes sortes de données.

Les algorithmes non supervisés

  • Clustering hiérarchique.
  • Clustering non hiérarchique.
  • Approches mixtes.  Pratique : Exécution de clustering non supervisé sur divers sets de données.

Analyse en composantes

  • Analyse en composantes principales.
  • Analyse factorielle des correspondances.
  • Analyse des correspondances multiples.
  • Analyse factorielle pour données mixtes.
  • Classification hiérarchique sur composantes principales.  Pratique: Mise en application de la réduction du nombre de variables et identification des facteurs sous-jacents aux dimensions avec une grande variabilité.

Analyse de textes

  • Collecte et prétraitement de données textuelles.
  • Extraction d'entités primaires, d'entités nommées et résolution de la référence.
  • Étiquetage grammatical, analyse syntaxique et sémantique.
  • Lemmatisation.
  • Représentation vectorielle de textes.
  • Pondération TF-IDF.
  • Word2Vec. Pratique : Exploration du contenu d'une base de textes via l'analyse sémantique latente.

Modalités et informations pratiques

Sauf indication contraire, le prix indiqué est valable pour une session complète de formation Inter-entreprises dans nos locaux, et par personne. Pauses café offertes. Déjeuner en option. Pour l'adapation d'une formation en Intra-entreprises vous pouvez nous consulter pour établir un devis.

Au démarrage de la session, le formateur échangera avec le(s) stagiaire(s) afin d'effectuer une analyse de leurs attentes, de leurs besoins et de leurs acquis.

  • Apports théoriques et mises en pratique.
  • Chaque point du programme fait l'objet d'une explication théorique appuyée d'une démonstration. Elle est suivie d'une mise en pratique par le biais d'exercices concrets
  • Un ordinateur équipé des logiciels et outils nécessaires à la réalisation de la formation
  • Un formateur possédant plusieurs années d'expérience

Une feuille d'émargement fournie par Aquantic sera signée par les stagiaires à chaque début de session (matin et après-midi). Elle sera transmise avec l'ensemble des documents relatifs à la formation à Aquantic.

  • Une évaluation de la formation sera complétée par le stagiaire au terme de la session.
  • Le formateur évaluera les acquis des stagiaires tout au long de la formation par des mises en situations pratiques.

📝 Pour nous faire part de vos retours, merci de compléter notre formulaire en ligne. 💭 Vos commentaires sont essentiels pour nous améliorer !

Contact

Logo Aquantic