Intitulé et niveau de la formation
- Intitulé de la formation : Initiation à la Data Science
- Catégorie : Nouvelles technologies
- Niveau de la formation : Débutant
- Durée en heures : 14 Heures soit 2 Jours
Details d’organisation de la formation
- Délai : 4 à 6 semaines
- Public : Tout public
- Prérequis : Aucun
- Lieu : A définir avec le client
- Modalité : Formation en Présentiel
- Modalités d’apprentissage : 60% de théorie 40% de pratique
- Accessibilité : Cette formation peut être adaptée aux personnes en situation de handicap. Contactez notre référent handicap : Laurence Joubert
Objectifs pédagogiques et méthode
Objectifs
Connaître les principes de base de la data science et l’organisation de la démarche
Comprendre comment utiliser les outils de la data science et développer les modèles à des fins professionnelles
Nota bene : Le plan de formation est prévisionnel et peut être modifié en fonction de l’émergence de nouveaux besoins du groupe.
Méthode pédagogique
Nos formateurs pratiquent une pédagogie active, basée sur l’expérience des stagiaires. Aussi, de nombreux exercices et cas pratiques sont proposés pendant le déroulé de la formation.
Notre méthode est composée de 3 phases :
- Présentation de la fonctionnalité,
- Prise en main de la fonctionnalité avec des exercices, de difficulté croissante,
- Un échange avec chaque stagiaire durant les exercices permet d’évaluer la maitrise de la fonctionnalité.
Le client peut proposer des types d’exercices en lien avec le poste ou le domaine d’activité des stagiaires. Le formateur proposera alors des exercices correspondants.
Contenu de la formation
Jour 1
Introduction à la Data Science
- Qu’est-ce que la Data Science ?
- Rôle et responsabilité d’un Data Scientiste
- Applications de la Data science dans divers domaines
- Outils et technologies utilisés en data Science
Bases de programmation en Python
- Introduction à Python et à son écosystème pour la Data Science
- Les structures de données de base en Python
- Les concepts de contrôle de flux
- Introduction aux bibliothèques Python pour la Data Science
Jour 2
Analyse exploratoire des données
- Collecte et importation des données
- Nettoyage des données
- Exploration des données à l’aide de graphiques et de statistiques descriptives
- Introduction à la visualisation des données
Manipulation des données avec Pandas
- Utilisation de la bibliothèque Pandas pour la manipulation des données
- Filtrage, tri, regroupement et agrégation des données
- Jointures de tables et fusion de données
- Création de nouvelles variables dérivées
Cas pratiques
Exercices d’application simples permettant de manipuler chacun des items séparément.
Modalités d’évaluation
Échanges individuels entre le formateur et chacun des stagiaires.
Sur le poste de travail du stagiaire, le formateur s’assure de la réussite des exercices, si besoin, il complète individuellement sa formation en traitant des points de blocages avec le stagiaire.
Tarif: A partir de 1300 Euros / Jour