Formation Business Analytics, Data Science et DataViz

Méthodes, algorithmes, organisation et outils

Présentation

Comment la révolution des données peut-elle contribuer à la performance de l’entreprise ?

Les grands acteurs du Web ont vulgarisé l’usage des Big Data et de la Data Science afin d’exploiter leurs données. La culture de la donnée se diffuse dans les entreprises et révolutionne les business models : Uber, Amazon, Airbnb, Google nous le démontrent tous les jours.

Il devient de plus en plus nécessaire aux décideurs, dans les fonctions métiers et IT, de comprendre les résultats que l’on peut obtenir, les limitations, les méthodes et les démarches du Big Data, de la Data Science et de la Data Visualization. Cette formation leur permettra, grâce à l’acquisition de bases solides sur le sujet, de s’engager dans la transformation de leur activité en toute connaissance de cause.

Afficher plus

Le mot de l'animateur

« Le Big Data et la Data Science sont des éléments essentiels de la nouvelle vague digitale mise en mouvement par l’utilisation avancée de la donnée. Cette formation vous donne des bases larges et solides pour appréhender ces nouveaux types de sujets. Vous comprendrez la méthodologie pour traiter vos données, les algorithmes de Machine Learning ainsi que les techniques de visualisation. »

Objectifs

  • Comprendre les nouvelles tendances, écosystèmes et enjeux Big Data
  • Illustrer comment les données peuvent améliorer la performance de l’entreprise
  • Comprendre les démarches Data Science et Data Visualization
  • Acquérir une compréhension globale pour engager la transformation de votre activité

Programme

1 – Le déluge des données et comment en tirer parti

L’émergence de nouvelles sources de données

  • Économie digitale et réseaux sociaux.
  • La révolution mobile.
  • Objets connectés.
  • Données non structurées.

Des nouvelles technologies pour maîtriser ce volume

  • Plafonnement sur les temps de traitement et d’accès séquentiels.
  • Réduction exponentielle des coûts de stockage.
  • Puissance de calcul et architectures parallélisées.
  • Logiciels d’analyse et de parallélisation.

Le modèle des grands du Web

  • Un modèle qui a prouvé son efficacité en contexte contraint.
  • Culture de la mesure.
  • Souplesse technologique.
  • Contribution Open Source.
  • L’Intelligence Artificielle comme cœur de métier des nouveaux acteurs.

2 – Définitions et use cases métier

Définitions

  • Business Intelligence.
  • Business Analytics.
  • Big Data.
  • Data Visualisation.
  • Data Science & Intelligence Artificielle.
  • Algorithmic business.

La Donnée comme avantage concurrentiel

  • Clé d’amélioration des processus.
  • Au cœur de nouveaux produits.
  • Commercialisation de la Donnée.

Cas d’usages

  • Relations clients.
  • Anti-fraude.
  • Maintenance prédictive.
  • Analyse de fiches métiers.
  • Analyse de texte.
  • Energie.
  • Santé.

3 – Méthodologie d’analyse de données

Le processus CRISP-DM

  • Comprendre la problématique métier.
  • Comprendre la Donnée.
  • Préparer la Donnée.
  • Modéliser.
  • Evaluer.
  • Déployer.

Une approche itérative expérimentale

  • Un processus non prévisible proche d’une démarche de recherche.
  • Une vraie démarche scientifique.

Des compétences clés

  • Bases de Données.
  • Architecture informatique.
  • Statistiques et probabilité.
  • Machine Learning.

4 – Préparation de la Donnée

Collecte de la Donnée

  • Des formats de Données divers et variés.
  • Le Web Scraping pour collecter davantage de Données.
  • Les APIs.

Une qualité de données souvent insuffisante

  • Risque de dégradation de qualité lié au Big Data.
  • Véracité, ou la qualité des données au minimum.
  • Historique limité aux besoins opérationnels.

Stockage de la donnée (Data Warehouse et Data Lake)

  • Tirer partie du Data Warehouse.
  • Nouvelles approches Big Data : le Data Lake.
  • Pourquoi tout conserver ?

Gouvernance et RGPD

  • Nécessité d’une bonne gouvernance de la donnée.
  • RGPD (objectifs, grands principes et conséquences)

5 – Infrastructures et outils informatiques

Boîte à outils data

  • La Workstation Data Science.
  • Open Source : R, Python.

Une infrastructure orientée données et usages

  • Architecture générale.
  • Ingestion des données : Batchs, Microbatchs et Streaming.
  • Lambda Architecture.
  • Stockage des données : Hadoop et HDFS.
  • SQL et NoSQL.
  • L’émergence de Spark.

Les solutions Cloud

  • Les promesses du Cloud : avantages et inconvénients.
  • Offres cloud AWS (Amazon Web Services), GCP (Google Cloud Platform), Microsoft Azure.
  • Démonstration avec la console AWS

6 – Rappels de statistiques et probabilités

Notion de base

  • Série statistique.
  • Variables aléatoires discrètes et continues.
  • Principales caractéristiques : médiane, moyenne, écart-type.
  • Représentations graphiques.

Corrélation vs causalité

  • Définition et représentation graphique de la corrélation.
  • Corrélation élevée n’implique pas causalité.
  • Exploiter les corrélations pour mieux comprendre les processus métier.

7 – Modélisation, algorithmes, évaluation

Types de modélisation pour de l’analyse prédictive

Démarche Data Science dans un cadre supervisé

  • Classification et régression.
  • Evaluation de modèles et métriques d’évaluation.
  • Overfit et underfit.
  • Compromis biais-variance.

Algorithmes classiques dans un cadre supervisé

  • Régressions linéaire et logistique.
  • Support Vector Machine.
  • Arbre de décision.
  • Random Forest.

Apprentissage non supervisé

  • Définition.
  • Algorithmes classiques : K-Means et Clustering hiérarchique.
  • Couplage avec du supervisé.

8 – Data Visualization

Pourquoi visualiser ?

  • Le pouvoir de la Data Visualisation.
  • Depuis le XIXe siècle.
  • Interpréter les modèles.

Comment visualiser ?

  • À ne pas faire.
  • Deux métriques pour une visualisation efficace.
  • Mémoire et choix du message.
  • Encodage et décodage.
  • Différents types de visualisation.

Outils et technologies

  • Outils de visualisation.
  • Statique vs Interactif.
  • Solutions open source vs. commerciales.

9 – Démarche projet

Démarche globale

  • Une démarche globale.
  • Étude de faisabilité.

POC

  • Prototypage : le point de départ.
  • Quelle évaluation.

Industrialisation

  • Les grandes phases précédant l’industrialisation.
  • Motivations pour industrialiser.
  • Méthodologie pour industrialiser.
  • Automatiser la prise de décision.

Mettre en production un modèle

  • La problématique.
  • Model as Code.
  • Les promesses des APIs.

Facteurs clés / Facteurs de risque

  • Facteurs clés de succès d’un projet.
  • Facteurs de risque d’un projet.

10 – Réussir sa transformation par la donnée

Une organisation pour innover par la Donnée

  • Stratégie data pour définir une organisation.
  • Centralisation vs Décentralisation.
  • Interne vs externe.

DataLab

  • Le Data Lab, une cellule transverse.
  • Motiver et installer un Data Lab.
  • Rôles et responsabilités au sein d’un Data Lab.

Recrutement

  • Les profils types.
  • Quels cursus et compétences ?
  • Faire progresser ses équipes.
  • Motiver et fidéliser.

Facteurs de succès

  • Réussir la transformation par la Donnée.
  • S’insérer dans une démarche de transformation digitale.
  • Communiquer.
  • Obtenir des moyens.
  • Montrer des résultats rapidement et régulièrement.
  • Soutenir l’effort dans la durée.
  • Exemple d’un projet à succès.
Afficher plus

Public

Décideurs dans les fonctions métiers et IT, Data Scientist, Data Officer.

Prérequis

Curiosité et appétence pour tous les sujets liés à la data.

Méthodologie

METHODES PEDAGOGIQUES : Cette formation pragmatique s’appuie sur de nombreuses illustrations et exemples extraits de l’expérience de l’animateur. Certaines démonstrations seront effectuées et détaillées en séance.
METHODES D'EVALUATION : Le stagiaire reçoit en amont de la formation un questionnaire permettant de mesurer les compétences, profil et attentes du stagiaire. Tout au long de la formation, les stagiaires sont évalués au moyen de différentes méthodes (quizz, ateliers, exercices et/ou de travaux pratiques, etc.) permettant de vérifier l'atteinte des objectifs. Un questionnaire d'évaluation à chaud est soumis à chaque stagiaire en fin de formation pour s’assurer de l’adéquation des acquis de la formation avec les attentes du stagiaire. Une attestation de réalisation de la formation est remise au stagiaire.

Présentation de la formation en vidéo

95%

de participants satisfaits sur les 12 derniers mois
Data & Big Data

Business Analytics, Data Science et DataViz

Acquérir des bases solides sur les Big Data, Data Science, Business Analytics et Dataviz afin de pouvoir exploiter au mieux vos données.
  •  
  • 2095 € H.T

Autres formations sur le même thème