Data Sciences avec python
Du fait de sa puissance de calcul, Python est devenu le langage de référence en mathématiques et donc pour les datas sciences.
Langage open source, Python possède de plus d’excellentes librairies pour les calculs mathématiques dont numpy, scipy, matploblib et pandas.
Cette formation vous apprendra à utiliser ces librairies et lancer des traitements en parallèle pour vos calculs distribués
Durée
.
Publics cibles
Développeurs, Data analystes
Pré-requis
Python
Objectifs
- Comprendre les problématiques de la programmation scientifique.
- Enrichir sa boîte à outils pour la Data Science.
- Manipuler les librairies Python permettant de faire de l’exploration de données et du calcul scientifique.
- Produire du code Python robuste et de qualité
Informations
Cette formation est accessible en présentiel et à distance (classe virtuelle)
Programme détaillé
Introduction
- Les avantages de Python pour le calcul scientifique
- Présentation des librairies principales
- Les data sciences
- Installation des outils
Numpy
- Introduction
- Les tableaux
- Création de tableaux
- Sélection de données,Calculs
- Filtres
- Association de tableaux
- Entrée / Sortie : formats de fichier standard
- Fonctions
Scipy
- Présentation
- Champs d’application
- Lien avec Numpy
- Fonctions spéciales
- Intégration
- Optimisation
- Algèbre Linéaire
Matplotlib
- Présentation
- Liens avec Numpy et scipy
- Graphiques
- Figures
- Line 2D
- Histogramme
- Camenbert
- Chemin
- Barre
- Figure avec plusieurs graphiques
Pandas
- Les Séries
- Les DataFrames
- Création de Série et de DataFrame
- Sélection des données
- Agrégation
- Entrées et sorties via les fichiers .csv
- Fusion de DataFrame
- Manipulation de série temporelles
- Utilisation d'une base de données
Parallélisme
- Principes de base de la parallélisation
- Python et la parallélisation
- Mutlti-threading
- Qu'est ce qu'un thread ?
- Accès concurrentiel aux données
- Les verrous
- Les sémaphores
- Deadlock
- File d'attente
- Limites du Multi-threading en Python
- Multi-processing
- Qu'est ce qu'un process ?
- Mémoire partagée
- Verrous et sémaphores
- File d'attente
- Communication
- Barrière
- Pool