Pensez comme un Data Scientist FOAD

Plus d’un tiers des ventes du site Amazon.com est généré grâce à leur moteur de recommandation. Leurs algorithmes de Machine Learning leur a aussi révélé que les recommandations sont d’autant plus efficaces que lorsqu’elles sont faîtes lors d’une campagne mail plutôt qu’un affichage sur la page web.

Segmentation (clustering), prédiction, estimation, recommandation, ces méthodes d’analyse sont aujourd’hui utilisées dans l’objectif d’apporter de la valeur aux données détenues par l’entreprise.

Si l’implémentation de ces algorithmes reste de la responsabilité du mathématicien, leurs usages est maintenant rendu possible par l’apparition de librairies masquant une partie de leur complexité́. A l’issue de cette formation vous aurez appris les activités du Data Scientist : Choix et préparation des données, sélection des algorithmes, apprentissage, scoring, industrialisation.

+15
ans d'expérience pour tous nos formateurs
4.5
jours

Prochaines dates S'inscrire

À qui s’adresse cette formation "Pensez comme un Data Scientist FOAD" ?

Architectes

Chefs de projet

Développeurs

Inscrivez-vous

Description de la formation "Pensez comme un Data Scientist FOAD"

Méthodes pédagogiques
- Composée à 70% de pratique, cette formation utilise des exercices illustrés, présentés et accomplis avec le formateur, et des exercices à réaliser en autonomie.
- Une journée se décompose de la façon suivante :
- Matin : 2h de théorie en visioconférence, 10 à 15 minutes de présentation d'exercices en visio, 1h de TP en autonomie avec possibilité de solliciter le formateur (partage d'écran à distance pour une assistance efficace).
- Après-midi : 2h de théorie en visioconférence, 10 à 15 minutes de présentation d'exercices en visio, 1h de TP en autonomie avec possibilité de solliciter le formateur (partage d'écran à distance pour une assistance efficace).
- Une évaluation quotidienne de l'acquisition des connaissances de la veille est effectuée.
- Une synthèse est proposée en fin de formation.
- Une évaluation à chaud sera proposée au stagiaire à la fin du cours.
- Un support de cours (version électronique) sera remis à chaque participant comprenant les slides sur la théorie, les exercices. L'émargement par demi-journée de présence se fera de façon numérique.
- Enfin, une attestation de formation sera envoyée si le stagiaire a bien assisté à la totalité de la session.
- En ce qui concerne le matériel informatique du stagiaire, il est seulement préconisé un ordinateur et une connexion internet. Nous nous chargeons du reste.
- Chaque participant se verra attribuer une Machine Virtuelle qui sera exécutée dans le Cloud d'Amazon. Il disposera alors de la puissance et des outils nécessaires pour le bon déroulement de la formation. Aucune installation de la part du participant n'est requise avant la formation.
Présentation

Plus d’un tiers des ventes du site Amazon.com est généré grâce à leur moteur de recommandation. Leurs algorithmes de Machine Learning leur a aussi révélé que les recommandations sont d’autant plus efficaces que lorsqu’elles sont faîtes lors d’une campagne mail plutôt qu’un affichage sur la page web.
Segmentation (clustering), prédiction, estimation, recommandation, ces méthodes d’analyse sont aujourd’hui utilisées dans l’objectif d’apporter de la valeur aux données détenues par l’entreprise.
Si l’implémentation de ces algorithmes reste de la responsabilité du mathématicien, leurs usages est maintenant rendu possible par l’apparition de librairies masquant une partie de leur complexité́. A l’issue de cette formation vous aurez appris les activités du Data Scientist : Choix et préparation des données, sélection des algorithmes, apprentissage, scoring, industrialisation.
Objectifs
- Comprendre le Machine Learning et l’Intelligence Artificielle
- Catégoriser les différentes approches : clustering, classification, régression…
- Choisir, structurer et adapter les données pertinentes pour des résultats pertinents
- Apprendre le langage python et ses librairies scientifiques (scikit-learn, pandas)
- Mettre en œuvre des cas concrets (prédiction, clustering)
- Mesurer la pertinence des modèles mis en œuvre
- Traiter des gros volumes de données en parallélisant les traitements : Spark et Dask
- Déployer un modèle en production
- Introduction au Deep Learning
Audience
- Architectes
- Chefs de projet
- Développeurs
Formateur

Le formateur est un expert du domaine qui intervient sur le sujet depuis plusieurs années en formation mais aussi en conseil.
Doté d’une grande qualité d’écoute, sa pédagogie et sa compétence technique vous permettront d’acquérir les compétences sur ce sujet.
Il saura alterner entre théorie, pratique, et retours d’expérience.
Prérequis
- La connaissance d'un langage de programmation structuré est nécessaire
Programme
JOUR 1
Les bases du machine learning
- Quelques exemples en guise d’introduction
- Généraliser : un principe fondateur du Machine Learning pour permettre la prédiction et la segmentation
- Algorithmes supervisés et non supervisés
- Appropriation du vocabulaire du Data Scientist
Premiers pas
- Collecter et stocker les données
- Analyser, comprendre, nettoyer et structurer les données : Le Feature Engineering
- Apprentissage et création d’un modèle
- Evaluation du modèle
- Amélioration du modèle
- JOUR 2
Le langage python
- La syntaxe du langage
- Les outils de développement : Jupyter notebook
- Les librairies du data scientist : Pandas, Scikit-learn
- Analyser et comprendre les données
- Matplotlib et Seaborn : Des librairies de data visualisation pour Python
Choisir les algorithmes de machine learning
- Comprendre les enjeux
- Tour d’horizon des principaux algorithmes
- Classification : k-Nearest Neighbors (k-NN),
- Arbre de décision, Random Forest, XGBoost
- Régression : Régression logistique
- Clustering : K-Means, DBScan
- Les différentes méthodes de scoring
- JOUR 3
Concepts avancés
- Validation croisée
- Ensemble Machine Learning : cumulez les algorithmes pour une meilleure précision
- Automatiser les manipulations de données avec un pipeline
Traiter les données en parallèle
- Pourquoi paralléliser ?
- Adapter les algorithmes
- Une complexité complémentaire
- Les frameworks de distribution à disposition : Spark et Dask
- JOUR 4
Déployer en production
- Intégrer un pipeline à une chaine de déploiement automatisée (continuous delivery)
- Packager un modèle : Predicive Model Markup Language
- Créer un endpoint REST avec python Flask
- Déployer dans le cloud
Le Deep Learning
- Présentation générale : les réseaux de neurones
- Les réseaux convolutionnels : Analyse d’images
- Les réseaux récurrents
- Comprendre par l’exemple : Pytorch & Keras
Tarif

Nous consulter

prêt à vous former ? Télécharger la fiche

Les prochaines dates pour cette formation

Aucune formation planifiée...

Pensez comme un Data Scientist FOAD

À qui s’adresse cette formation "Pensez comme un Data Scientist FOAD" ?

Description de la formation "Pensez comme un Data Scientist FOAD"

Méthodes pédagogiques

Présentation

Objectifs

Audience

Formateur

Prérequis

Programme

JOUR 1

Les bases du machine learning

Premiers pas

Le langage python

Choisir les algorithmes de machine learning

Concepts avancés

Traiter les données en parallèle

Déployer en production

Le Deep Learning

Tarif

Les prochaines dates pour cette formation

Nos autres formations en hautes technologies

DevOps

Data

Web client

Architecture

Agilité

Mobilité

IA

Cybersécurité

Langages

Soft skills

UX Design

Divers

Prêt(e) à vous former ? Demandez l'excellence