Topic outline
- General
General
- Fiche Contact
Fiche Contact
CHARGE DE COURS : Bambrik Ilyas CONTACT: ilyas9111@yahoo.fr
INTITULE DU COURS : Data Science
FILIERE/SPECIALITE : Master 1 Informatique
LANGUE DU COURS : Français
VOLUME HORAIRE HEBDOMADAIRE : 1h30 Cours, 1h30 TD, 3h00 TP
DUREE SEMESTRIELLE TOTALE DU COURS : 15 semaines (22h30 Cours, 45h00 TP)
MODALITÉ D’ ÉVALUATION: Sommative (Deux Test TP+ Examen) et Formative (Auto Évaluations)
- Objectifs du cours
Objectifs du cours
L'objectif général de ce cours est de introduire l’étudiant au domaine de la science des données. En parallèle, l’étudiant sera initié à la programmation réseau avec Python.
A l'issue de ce cours l'apprenant doit être capable de:
- Appliquer les fonctionnalités pandas pour transformer les données.
- Distinguer entre les différents types de graphiques.
- Utiliser seaborn pour visualiser les données tabulaires.
- Manipuler les données géographiques.
Descriptif Et Structure:
- Chapitre I Introduction à Pandas:
Bref introduction aux objets Series et Dataframe.
- Chapitre II Transformation des données:
Ce chapitre couvrira différentes transformations que nous pouvons appliquer à nos données ainsi que les fonctions sommaire.
- Chapitre III Data Cleaning:
Exploite les méthodes de détection des inconsistances dans les données et des entrées manquantes.
- Chapitre IV Visualisation des données:
Ce chapitre couvrira différentes transformations que nous pouvons appliquer à nos données ainsi que les fonctions sommaire.
- Chapitre IV Visualisation des données:
Dans ce chapitre explore seaborn et la visualisation de données.
- Chapitre V Web Scraping:
Ce chapitre couvrira la récolte de données avec requests et BeautifulSoup.
- Chapitre VI Données Géospaciales:
Ce chapitre introduit geopandas qui est un module développé spécialement pour la visualisation et manipulation des données géospatiales.
- Chapitre VII Big Data:
Ce chapitre introduit le paradigme Mapreduce et le traitement parallèle du Big Data avec pySpark.
Ressources D'Aide
a) Forums et plateformes d’apprentissage Online :
• Datacamp: https://www.datacamp.com/, Cours gratuits
• Kaggle : https://www.kaggle.com/learn/, Cours gratuits
• Freecodecamp : https://www.freecodecamp.org/learn/data-analysis-with-python/#data-analysis-with-python-course
- Chapitre I Introduction à Pandas
Chapitre I Introduction à Pandas
- Ce Chapitre est une introduction au module pandas. Les objectifs de ce chapitres sont:
- Apprendre à lire les données csv avec pandas;
- Apprendre à manipuler les objets Dataframe/Series;
- Chapitre II Transformation des données
Chapitre II Transformation des données
- Ce Chapitre présente les transformations possibles grâce aux méthodes des objets Dataframe / Series. Les objectifs de ce chapitres sont:
- Apprendre à utiliser les fonctions sommaires et interpréter leurs résultats;
- Apprendre à transformer les colonnes d'un Dataframe;
- Apprendre à combiner des Dataframe;
- Chapitre III Data Cleaning
Chapitre III Data Cleaning
- Ce Chapitre est dédié à la détection des inconsistances / valeurs manquantes et nettoyage des données. Les objectifs de ce chapitres sont: :
- Apprendre à détecter et interpréter les valeurs manquantes;
- Apprendre à détecter les valeurs aberrantes;
- Apprendre à remplacer les valeurs manquantes / aberrantes;
- Apprendre à uniformiser les chaines de caractères grâce aux accesseurs;
- Chapitre IV Visualisation des données
Chapitre IV Visualisation des données
- Ce Chapitre est dédié à la visualisation des données avec seaborn. Les objectifs de ce chapitres sont: :
- Comprendre l'utilité des différents types de graphe;
- Utiliser le module seaborn pour tracer et personnaliser les graphes;
- Chapitre V Web Scraping
Chapitre V Web Scraping
- Ce Chapitre est dédié à la collection des données. Les objectifs de ce chapitres sont: :
- Apprendre à collecter les données à partir d'un serveur HTTP avec le module requests;
- Apprendre à extraire les données d'une page web avec le module BeautifulSoup;
- Chapitre VI Données Géospatiales
Chapitre VI Données Géospatiales
- Ce Chapitre est dédié au traitement des données géospatiales. Les objectifs de ce chapitres sont: :
- Apprendre à utiliser le module geopandas ;
- Apprendre à manipuler les données géospatiales ;
- Chapitre VII Big Data
Chapitre VII Big Data
- Ce Chapitre est une introduction à aux principes fondamentaux du Big Data. Les objectifs de ce chapitres sont:
- Comprendre le modèle de traitement distribué;
- Comprendre le modèle de calcul MapReduce;