Architectures de données d'Entreprise :
l’état de l’art

Une compréhension concrète et approfondie des données de référence du Système d’Information pour relever tous les défis stratégiques autour de la Data.
Sommaire

LE MOT DE L’INTERVENANT

Avec ce séminaire, je pense vous permettre d’appréhender de...

Avec ce séminaire, je pense vous permettre d’appréhender de manière très opérationnelle comment concevoir, intégrer et déployer les référentiels de données (client, produit, contrat, fournisseur, etc.) et maîtriser parfaitement la Donnée et sa qualité par construction. Beaucoup d’idées reçues seront abordées et décryptées. Des problématiques très concrètes seront évoquées telles que la sémantique, les processus de qualification de données, les contraintes posées par les progiciels métiers, la migration de l’existant, le rôle de l’organisation ainsi que l’impact des Référentiels sur le décisionnel, le Big Data. Sera aussi abordée la contribution des Référentiels à la « Security By Design » et la conformité GDPR.

Habib GUERGACHI
Vingt-cinq ans d’expérience en Delivery d’Architectures logicielles complexes auprès de multinationales, de géants du Web et de startups. Douze ans d’expérience en conseil auprès des DG, DSI, DRH et Directions Métiers. Fondateur de Zengularity SA. Angel Investor dans Play framework, Libredemat et prismic.io. Administrateur de Foyer SA (LU) et conférencier exclusivement chez Capgemini Institut depuis 1998.
Lire la suite Cacher le texte

 

 

La maîtrise des référentiels de données est un prérequis sans lequel la transition digitale sera laborieuse, la valorisation des données coûteuse, la conformité approximative et la sécurité compromise.

Très pratique, illustré de nombreux exemples, ce séminaire puise dans mes expériences acquises dans de multiples projets sur les référentiels de données au sein de grandes d’entreprises internationales, d’administrations, de collectivités territoriales, d’hôpitaux et aussi au sein de plusieurs géants du Web. Toutes ces entreprises ambitionnent de faire des référentiels la mœlle épinière de l’intelligence de leur SI.

J’aborde dans ce séminaire les problématiques liées à la donnée de référence sous toutes dix dimensions. : définitions, enjeux, usages, architectures, technologies, outils, méthodes, sécurité, mise en œuvre et gouvernance.

Les connaissances acquises sont pratiques et immédiatement actionnables. Mon approche multidimensionnelle (processus, fonctionnel, technique, gestion du changement, etc.) vous permettra d’acquérir rapidement la maturité nécessaire pour dialoguer avec toutes les parties prenantes et maximiser ainsi les conditions de succès de vos projets autour des référentiels du SI.



Définitions

  • Définition d’un Référentiel.
  • Définition d’une Donnée de Référence.
  • Définition d’un Objet Métier de Référence.
  • Définition d’un Référentiel de Données.
  • Définition d’un Référentiels d’Objets métiers.

Types de Référentiels

  • Les principaux types de Référentiels.
  • Les points critiques des référentiels de nomenclature.
  • La problématique des référentiels de gestion et de production.
  • Que penser des référentiels décisionnels, de production, etc. ?

Concept d’Unicité

  • Définitions du concept d’unicité et du domaine d’unicité.
  • Les 3 stratégies pour maîtriser l’unicité d’une donnée de référence.
  • Les limites de maîtrise de l’unicité d’une donnée et d’un objet métier de référence.
  • Peut on encore gérer une base de données centrale unique comme référentiel d données.

Critères d’éligibilité

  • Les 4 critères pour qu’une donnée soit éligible à donnée de référence.
  • Comment appliquer les critères à un Objet Métier de référence ?
  • Comment gérer le croisement des critères et la granularité d’un Objet Métier ?
  • Exemples détaillés de l’application des critères d’éligibilité.

Métadonnées

  • Introduction aux notions de métadonnées.
  • Les principaux standards de description de métadonnées..
  • Métadonnées en Design Time vs méta données en Runtime.
  • La problématique de classification des métadonnées.

DDD (Domain Driven Design)

  • Qu’est-ce que "Ubiquitous Language" ?
  • Les "Bounded Context" et quels bénéfices attendre ?
  • Avantages et limites des concepts de "Value Object", "Agrégat", "Entité", "Domain Event", etc.
  • Comment l’approche DDD peut accélérer les projets de référentiels de SI ?

Architecture technique

  • Les 7 blocs de l’architecture technique d’un référentiel.
  • Analyse détaillée des chacun des blocs d’architecture de référentiel.
  • Assemblage et de synchronisation de plusieurs référentiels.
  • Exemple d'architectures de référentiels produits, article, client et offre.

Synchronisation

  • Comment synchroniser de multiples référentiels de données.
  • Les difficultés de la synchronisation fonctionnelle.
  • Comment gérer le cas des référentiels dans le progiciel et le Cloud.
  • Comment gérer le des référentiels dans le Cloud (salesforce, Dynamic CRM, etc. ?

Transformation

  • Différentes approches de transformation des données de référence.
  • Quelles différences entre règle de transformation et règle de gestion ?
  • Comment réduire rapidement les besoins en transformation des données.

Nettoyage

  • Les différentes stratégies de nettoyage de données de référence.
  • La problématique de gestion fonctionnelle des rejets.
  • Exemples de risques d’altérations par nettoyage.

Enrichissement

  • Les principales difficultés d’enrichissement de données existantes.
  • Les limites de l’enrichissement des données de nomenclature.
  • Comment différencier une règle d’enrichissement d’une règle de gestion ?

Dédoublonnage

  • Les différentes approches de détection des doublons.
  • Pourquoi le dédoublonnage ne fonctionne en cas de très grands volumes ?
  • Intérêts et limites de l’intervention humaine.

DQM (Data Quality Management)

  • Les fonctionnalités d’une plateforme de DQM.
  • Les limites d’automatisation des contrôles de qualités des objets métiers de références.
  • Le rôle des métadonnées dans l’amélioration de la qualité des données.

Master Data Management (MDM)

  • Architecture fonctionnelle d’une plateforme MDM de référence.
  • Les zones de confort d’une solution de type MDM.
  • Pourquoi le MDM n’est pas jamais efficace à moyen long terme ?

Big Data

  • Les types d’architectures Big Data, Fast Data et Smart Data.
  • Comment la qualité des référentiels impacte directement la performance des traitements Big Data ?
  • Exemple de plateforme Big Data entièrement centrée sur les référentiels.

Modélisation des métadonnées

  • La liste des 10 métadonnées à gérer par donnée.
  • Exemple de plateforme de gestion de métadonnées.
  • La problématique de versionning et traçabilité des métadonnées.
  • Peut-on parler de métadonnées de métadonnées ?

Topologie de Stockage

  • Les bons et mauvais arguments pour un modèle de stockage centralisé.
  • Avantages et inconvénients de stockage distribué.
  • Principaux pièges et idées reçues sur le modèle de stockage virtuel.

Modèles d’alimentation

  • Les 4 mode d’alimentation des données de référence.
  • Quels bénéfices à alimenter en temps réel ?
  • Quel outil pour quel mode d’alimentation (EAI, MOM, ESB, ES, etc.)

Administration des référentiels

  • Exemple d’une plateforme d’administration des données et des métadonnées.
  • Les processus prioritaires pour administrer les données de référence.
  • Les principaux processus d’audit, de contrôle qualité et de sécurité.

Méthodologie

  • Quels sont les principaux acteurs dans un projet référentiels.
  • Méthodes adaptées à une démarche référentiels long terme.
  • Méthodes adaptées pour la création d’un référentiel en «  urgence  ».
  • Comment aligner les projets référentiels avec les projet de delivery du SI ?

Livrables d’un référentiel

  • Principaux livrables d’un projet référentiel.
  • Rôle du méta-dictionnaire dans le suivi des livrables.
  • Gestion de la compatibilité ascendante et descendante des livrables.
  • Les points sensibles pour formaliser les processus d’alimentation.

Facteurs de succès

  • La maîtrise du champ et de la profondeur des données de référence.
  • Les précautions essentielles dans le choix des sponsors d’un Référentiel.
  • Les meilleures pratiques pour faire adhérer les nouveaux projets aux Référentiels existants.

Coûts du référentiel

  • Structures de coûts d’une donnée de référence.
  • Extrapolation aux coûts d’un objet métier de référence et aux référentiels de données.
  • Les principaux facteurs de risques de dérapage des coûts de conception et de mise en œuvre.

ROI (Return On Investment)

  • Exemple de ROI supérieur à 100% en 12 mois sur un projets alimentation de Data warehouse.
  • Exemple de ROI supérieur à 100% en 6 mois sur les projets d’exploitation d’un Data Lake.
  • Exemple de ROI supérieur à 100% en 12 mois sur la maintenance d’une application vue 360 client.

Sécurité

  • Les principes d’implémentation de la sécurité applicative fondés sur les Référentiels.
  • Comment les référentiels peuvent durcir la sécurité du SI ?
  • Comment les référentiels réduisent drastiquement les risques de vol de données ?
  • Comment gérer les droits et les autorisations d’accès aux données des Référentiels ?

Gouvernance des données

  • Les 3 niveaux de gouvernance des données.
  • Les principales instances de gouvernance des données.
  • Les niveaux de maturité de la gouvernance de données.
  • Les principaux KPI de bord de pilotage de la gouvernance.

Conformité GDPR

  • Rappel des 7 principes de conformité GDPR.
  • Pourquoi les référentiels garantissent une conformité GDPR By Design ?
  • Pourquoi L’anonymisation et l’oubli sont garanti nativement par les référentiels du SI ?

Marché des outils

Ce chapitre dresse un panorama critique des principales offres du marché dédiées aux référentiels. Outils de Gestion et de gouvernance des métadonnées : Cartographie, Collecte, Stockage, Modélisation, Sémantique, Analyse, publication collaborative de métadonnées, etc.

Outils de construction, d’alimentation et synchronisation de référentiels de données : MDM, DQM, ESB, EAI, ETL, MOM, noSQL, NLP/NLU, etc.