Data Sciences avec python

Du fait de sa puissance de calcul, Python est devenu le langage de référence en mathématiques et donc pour les datas sciences.
Langage open source, Python possède de plus d’excellentes librairies pour les calculs mathématiques dont numpy, scipy, matploblib et pandas.
Cette formation vous apprendra à utiliser ces librairies et lancer des traitements en parallèle pour vos calculs distribués

Durée

.

Publics cibles

Développeurs, Data analystes

Pré-requis

Python

Objectifs

  • Comprendre les problématiques de la programmation scientifique.
  • Enrichir sa boîte à outils pour la Data Science.
  • Manipuler les librairies Python permettant de faire de l’exploration de données et du calcul scientifique.
  • Produire du code Python robuste et de qualité

Informations

Cette formation est accessible en présentiel et à distance (classe virtuelle)

Programme détaillé

Introduction

  • Les avantages de Python pour le calcul scientifique
  • Présentation des librairies principales
  • Les data sciences
  • Installation des outils

Numpy

  • Introduction
  • Les tableaux
  • Création de tableaux
  • Sélection de données,Calculs
  • Filtres
  • Association de tableaux
  • Entrée / Sortie : formats de fichier standard
  • Fonctions

Scipy

  • Présentation
  • Champs d’application
  • Lien avec Numpy
  • Fonctions spéciales
  • Intégration
  • Optimisation
  • Algèbre Linéaire

Matplotlib

  • Présentation
  • Liens avec Numpy et scipy
  • Graphiques
  • Figures
  • Line 2D
  • Histogramme
  • Camenbert
  • Chemin
  • Barre
  • Figure avec plusieurs graphiques

Pandas

  • Les Séries
  • Les DataFrames
  • Création de Série et de DataFrame
  • Sélection des données
  • Agrégation
  • Entrées et sorties via les fichiers .csv
  • Fusion de DataFrame
  • Manipulation de série temporelles
  • Utilisation d'une base de données

Parallélisme

  • Principes de base de la parallélisation
  • Python et la parallélisation
  • Mutlti-threading
  • Qu'est ce qu'un thread ?
  • Accès concurrentiel aux données
  • Les verrous
  • Les sémaphores
  • Deadlock
  • File d'attente
  • Limites du Multi-threading en Python
  • Multi-processing
  • Qu'est ce qu'un process ?
  • Mémoire partagée
  • Verrous et sémaphores
  • File d'attente
  • Communication
  • Barrière
  • Pool


Data Sciences avec python

Interressé par cette formation ? Contactez-nous pour recevoir plus d'informations