La datascience en pratique
Le Machine Learning et en particulier le Deep Learning sont à l’origine de nombreux progrès dans différents domaines (vision par ordinateur, traitement naturel du langage, etc…) applicables à tous les secteurs d’activités.
Segmentation (clustering), prédiction, estimation, recommandation, ces méthodes d’analyse sont aujourd’hui utilisées dans l’objectif d’apporter de la valeur aux données détenues par l’entreprise.
Si l’implémentation de ces algorithmes reste de la responsabilité du mathématicien, leurs usages est maintenant rendu possible par l’apparition de librairies masquant une partie de leur complexité́.
A l’issue de cette formation vous aurez appris les activités du Data Scientist : Choix et préparation des données, sélection des algorithmes, apprentissage, scoring, industrialisation.
Vous connaîtrez également les principes fondamentaux du Deep Learning et vous maîtriserez les différentes architectures de réseaux de neurones, vous permettant de créer les modèles répondant à vos problématiques.
- +15ans d'expérience pour tous nos formateurs
- 6jours
À qui s’adresse cette formation "La datascience en pratique" ?
Description de la formation "La datascience en pratique"
-
Méthodes pédagogiques
- Composée à 70% de pratique, cette formation utilise des exercices illustrés et didactiques.
- Une évaluation quotidienne de l'acquisition des connaissances de la veille est effectuée.
- Une synthèse est proposée en fin de formation.
- Une évaluation à chaud sera proposée au stagiaire à la fin du cours. Un support de cours sera remis à chaque participant comprenant les slides sur la théorie, les exercices. Une feuille d'émargement par demi-journée de présence est fournie en fin de formation ainsi qu'une attestation de fin de formation si le stagiaire a bien assisté à la totalité de la session.
-
Présentation
Le Machine Learning et en particulier le Deep Learning sont à l’origine de nombreux progrès dans différents domaines (vision par ordinateur, traitement naturel du langage, etc…) applicables à tous les secteurs d’activités.
Segmentation (clustering), prédiction, estimation, recommandation, ces méthodes d’analyse sont aujourd’hui utilisées dans l’objectif d’apporter de la valeur aux données détenues par l’entreprise.
Si l’implémentation de ces algorithmes reste de la responsabilité du mathématicien, leurs usages est maintenant rendu possible par l’apparition de librairies masquant une partie de leur complexité́.
A l’issue de cette formation vous aurez appris les activités du Data Scientist : Choix et préparation des données, sélection des algorithmes, apprentissage, scoring, industrialisation.
Vous connaîtrez également les principes fondamentaux du Deep Learning et vous maîtriserez les différentes architectures de réseaux de neurones, vous permettant de créer les modèles répondant à vos problématiques.
-
Objectifs
- Comprendre le Machine Learning et l’Intelligence Artificielle
- Catégoriser les différentes approches : clustering, classification, régression…
- Choisir, structurer et adapter les données pertinentes pour des résultats pertinents
- Apprendre le langage python et ses librairies scientifiques (scikit-learn, pandas)
- Mettre en œuvre des cas concrets (prédiction, clustering)
- Mesurer la pertinence des modèles mis en œuvre
- Traiter des gros volumes de données en parallélisant les traitements : Spark et Dask
- Déployer un modèle en production
- Comprendre le Deep Learning
- Utilizer les framework de Deep Learning : TensorFlow, PyTorch et JAX
- Maîtriser les différentes architectures de réseaux de neurones : denses, convolutionnels, récurrents, génératifs
- Mettre en œuvre des cas concrets pour chaque type de réseaux
- Exécuter des calculs sur des CPUs, GPUs et TPUs
- Mesurer la pertinence des modèles mis en œuvre & visualiser l’apprentissage
- Déployer un modèle en production
-
Audience
- Architectes
- Chefs de projet
- Data Analysts
- Data Engineers
- Data Scientists
- Développeurs
-
Formateur
Le formateur est un expert du domaine qui intervient sur le sujet depuis plusieurs années en formation mais aussi en conseil.
Doté d’une grande qualité d’écoute, sa pédagogie et sa compétence technique vous permettront de comprendre le métier du Datascientist.
Il saura alterner entre théorie, pratique, et retours d’expérience.
-
Prérequis
- La connaissance d'un langage de programmation structuré est nécessaire.
- Afin de valider les compétences et les prérequis de chaque participant, en amont de la formation, le formateur organise un entretien téléphonique. Il confirme alors que le participant a le niveau nécessaire et que le contenu répond bien à ses attentes.
-
Programme
Les bases du machine learning
- Quelques exemples en guise d’introduction
- Généraliser : un principe fondateur du Machine Learning pour permettre la prédiction et la segmentation
- Algorithmes supervisés et non supervisés
- Appropriation du vocabulaire du Data Scientist
Premiers pas
- Collecter et stocker les données
- Analyser, comprendre, nettoyer et structurer les données : Le Feature Engineering
- Apprentissage et création d’un modèle
- Evaluation du modèle
- Amélioration du modèle
Le langage python
- La syntaxe du langage
- Les outils de développement : Jupyter notebook
- Les librairies du data scientist : Pandas, Scikit-learn
- Analyser et comprendre les données
- Matplotlib et Seaborn : Des librairies de data visualisation pour Python
Choisir les algorithmes de machine learning
- Comprendre les enjeux
- Tour d’horizon des principaux algorithmes
- Classification : k-Nearest Neighbors (k-NN),
- Arbre de décision, Random Forest, XGBoost
- Régression : Régression logistique
- Clustering : K-Means, DBScan
- Les différentes méthodes de scoring
Concepts avancés
- Validation croisée
- Ensemble Machine Learning : cumulez les algorithmes pour une meilleure précision
- Automatiser les manipulations de données avec un pipeline
Traiter les données en parallèle
- Pourquoi paralléliser ?
- Adapter les algorithmes
- Une complexité complémentaire
- Les frameworks de distribution à disposition : Spark et Dask
Déployer en production
- Intégrer un pipeline à une chaine de déploiement automatisée (continuous delivery)
- Packager un modèle : Predicive Model Markup Language
- Créer un endpoint REST avec python Flask
- Déployer dans le cloud
Premiers pas dans les neurones
- Le neurone formel
- Le perceptron
- Les fonctions d’activation
- La descente de gradient
- Démo : Playground réseau de neurones
Les Frameworks de Deep Learning
- TensorFlow
- PyTorch
- JAX
- Keras
- TP : Reconnaissance de chiffres (MNIST)
Les réseaux de neurones convolutionnels
- CNN vs le cortex visuel humain
- Couche de convolution & pooling
- Architecture d’un CNN
- Comment le réseau appred-il ?
- Quelques architectures de référence
- Démo : Reconnaissance de chiffres avec CNN (MNIST)
- TP : Reconnaissance d’image
Les réseaux de neurones récurrents
- Définition RNN
- LSTM
- GRU
- Traitement automatique du langage naturel : Embeddings & Word2vec
- TP : Prévision de séries temporelles
- TP : Analyse de sentiments
Les transformers et les LLM
- Attention is All You Need
- Mécanisme d’attention
- Panorama des LLM existants
- Closed model APIs vs OpenModel weights vs Fully open model
- RAG & AgenticAI
-
Tarif
Nous consulter