Référentiels de données d’Entreprise :
l’état de l’art

Architecture technique et fonctionnelle, outils et démarches de mise en œuvre.
Sommaire

LE MOT DE L’INTERVENANT

Avec ce séminaire, je pense vous permettre d’appréhender de...

Avec ce séminaire, je pense vous permettre d’appréhender de manière très opérationnelle comment concevoir, intégrer et déployer les référentiels de données (client, produit, contrat, fournisseur, etc.) et maîtriser parfaitement la Donnée et sa qualité par construction. Beaucoup d’idées reçues seront abordées et décryptées. Des problématiques très concrètes seront évoquées telles que la sémantique, les processus de qualification de données, les contraintes posées par les progiciels métiers, la migration de l’existant, le rôle de l’organisation ainsi que l’impact des Référentiels sur le décisionnel, le Big Data. Sera aussi abordée la contribution des Référentiels à la « Security By Design » et la conformité GDPR.

Habib Guergachi
Vingt-cinq ans d’expérience en Delivery d’Architectures logicielles complexes, à très hautes exigences de performance et de sécurité auprès de multinationales, de géants du Web et de startups : AXA, BNP Paribas, Airbus, LCL, ADEO, Wallmart, LinkedIn, Gilt, Deliveroo, Synthésio, etc. Douze ans d’expérience en conseil auprès des DG, DSI, DRH et Directions Métiers pour délivrer rapidement leurs stratégies de change dans le métier, la technologie et le management. Fondateur de Zengularity SA, vendu à Fabernovel Group. Angel Investor dans Play framework, vendu à LightBend (US). Angel Investor dans Libredemat, vendu à Bergerlevrault (FR). Angel Investor dans prismic.io (plateforme CMS API leader mondial). Aujourd’hui, CTO du Groupe Fabernovel, Administrateur de Foyer SA (LU), leader de l’assurance au Benelux, en charge de la Stratégie Digitale, et conférencier exclusivement chez Capgemini Institut depuis 1998, avec plus de 5000 stagiaires formés.
Lire la suite Cacher le texte

 

Très pratique, illustré de nombreux exemples, ce séminaire s’appuie sur une expérience et un savoir-faire acquis sur de multiples projets de conception et déploiement de Référentiels de données de gestion au sein d’entreprises de tailles et de secteurs d’activité variés. Le séminaire aborde toutes les problématiques liées à la Donnée lorsqu’il s’agit de construire un SI moderne centré sur la donnée, appelée aussi SI d’une « Data Driven Company ».

  • Définitions selon la pyramide DIKW : Donnée, méta-donnée, information, connaissance et sagesse.
  • Données prospect, client, salarié, produit, contrat, livraison, etc. : comment les recueillir, les gérer, les exploiter dans la durée ?
  • Les limites de la beauté conceptuelle du Référentiel unique de données.
  • Client, produit, contrat, fournisseur, identité, habilitations, etc. : les objectifs de la maîtrise des données de référence.
  • Les principaux types de référentiels de données
  • Comment maîtriser la qualité des données à tous les étages de l’entreprise.
  • Comment aborder la problématique des Référentiels en présence de progiciels.
  • Rôle des Référentiels de métadonnées dans l’entreprise.
  • Techniques de construction des services d’accès aux données de référence.
  • Place des Référentiels dans une démarche d’Urbanisation du SI.
  • RGPD (Règlement Général sur la Protection des Données) : comment assurer la conformité par les Référentiels.
  • Les preuves que les Référentiels constituent le fondement de toute entreprise « Data Driven » ?
  • Comment les Référentiels sont-ils nécessaires à la sécurité applicative et la sécurité en profondeur de tout SI digital ouvert vers le Cloud ?
  • Démarche méthodologique et organisationnelle pour mener à bien un projet de création d’un Référentiel.


Les concepts de base


Définitions et typologie des Référentiels

  • Définitions fonctionnelle, organisationnelle et technique d’un Référentiel.
  • Les principaux types de Référentiels (Nomenclature, Gestion, Production, Décisionnel, Métadonnées, etc.).
  • Le top 3 des Référentiels dans les principaux domaines métier.

Méthode d’éligibilité d’une donnée au rang de Référentiel

  • Qui décide de ce qui doit être mis dans les Référentiels ?
  • Quelle est la granularité optimale d’un Référentiel ?
  • Les indicateurs de granularité d’un Référentiel.

Le rôle des Référentiels dans la conformité GDPR

  • Les trois principes de la réglementation européenne sur les données privées.
  • Pourquoi la maîtrise des Référentiels est un prérequis à la conformité GDPR ?
  • Exemple de mise en œuvre conforme à la GDPR de la portabilité des données privées.

Le Référentiel vu par les Architectes techniques

  • Différentes approches et principales contre-indications pour maîtriser l’unicité de l’information.
  • Faut-il synchroniser les données des différents Référentiels ou créer une Base de Données unique ?
  • Comment maîtriser la qualité des données saisies ?
  • Faut-il asservir les Référentiels des progiciels ?
  • Comment gérer les droits et les autorisations d’accès aux données des Référentiels ?

Le rôle des Référentiels dans la Sécurité et Cybersécurité

  • Les principes d’implémentation de la sécurité applicative fondés sur les Référentiels.
  • Comment les Référentiels sont utilisés par les équipes sécurité et Cybersécurité ?
  • Comment les Référentiels peuvent être une garantie « presque totale » contre le vol de données ?

Cas pratiques de projets de Référentiels métier et techniques

L’objectif est d’illustrer le rôle des Référentiels à travers des expériences concrètes menées dans le cadre de projets d’Urbanisation du SI.

Référentiels dans les architectures Big Data

  • Les types d’architectures Big Data, Fast Data et Smart Data
  • Quel rapport entre données de référence et performances Big Data ?
  • Quel surcoûts financiers représente l’absence de données de qualité ?

Architecture fonctionnelle d’un Référentiel d’entreprise


Fonctions de description des métadonnées

  • Le concept des métadonnées.
  • Quel niveau de détail optimal dans la description des métadonnées ?
  • Intérêt de la synonymie pour fiabiliser la sémantique.
  • Les limites du recours aux hyperonymes, antonymes, etc.

Fonctions de transformation

  • Différentes approches de transformation des données de référence.
  • Quelles différences entre règle de transformation et règle de gestion ?
  • Comment réduire rapidement les besoins en transformation des données.

Fonctions de nettoyage

  • Les points sensibles des fonctions de nettoyage de données.
  • La problématique de gestion des rejets.
  • Les bons et mauvais arguments pour améliorer la qualité des données à la source.

Fonctions d’enrichissement

  • Les principales difficultés d’enrichissement de données existantes.
  • Les limites de l’enrichissement par les Référentiels de type nomenclature.
  • Quelles différences entre règle d’enrichissement et règle de gestion ?

Fonctions de dédoublonnage

  • Les différentes approches de détection des doublons.
  • Les prérequis pour réduire les doublons.
  • Intérêts et limites de l’intervention humaine.

Data Quality Management (DQM)

  • Les limites fonctionnelles liées à l’unicité.
  • Les limites d’automatisation des contrôles de conformité aux structures.
  • L’analyse d’affinité par rapport aux métadonnées.

Master Data Management (MDM)

  • Les principes du MDM.
  • Les limites de la gouvernance des données ?
  • Quel rapport entre Référentiels de gestion et MDM ?

Architectures techniques d’un Référentiel d’entreprise


Modélisation et administration des métadonnées

  • Les principales métadonnées à gérer dans un Référentiel.
  • Techniques de structuration de la donnée et de ses métadonnées.
  • La problématique de traçabilité des métadonnées.

Localisation des bases de données des Référentiels

  • Faut-il adopter le modèle de stockage centralisé des données du Référentiel ?
  • Introduction aux principaux modèles de création de bases Référentielles.
  • Principaux pièges et idées reçues sur le modèle RV.

Alimentation des Référentiels

  • Avantages et inconvénients des approches temps réel et Batch.
  • Les outils pour une approche temps réel : EAI, MOM, ESB, etc.
  • Intérêts et limites des organisations dédiées.

Modules d’administration

  • La problématique d’administration des dictionnaires de métadonnées.
  • Comment contrôler et valider des demandes de mise à jour ?
  • Problématiques d’audit, de contrôle qualité et de sécurité.

Référentiel d’entreprise : démarches pratiques


Méthode de construction d’un Référentiel

  • Approche adaptée dans le cadre d’une démarche d’Urbanisation de SI.
  • Approche adaptée dans le cadre de création en « urgence  » d’un Référentiel.
  • Introduction à l’approche TOP N. Intérêts et limites.

Livrables d’un Référentiel

  • Principaux livrables d’un projet Référentiel.
  • Spécificités de la description sémantique et syntaxique.
  • Précautions essentielles pour formaliser les processus d’alimentation.

Facteurs clés de succès d’un projet Référentiel

  • Surmonter la difficulté de définition du champ et de la profondeur d’un Référentiel.
  • Les précautions essentielles dans le choix des sponsors d’un Référentiel.
  • Les meilleures pratiques pour faire adhérer les nouveaux projets aux Référentiels existants.

Coûts et ROI

  • Structures de coûts d’un projet de Référentiels d’entreprise.
  • Impacts sur les coûts et les délais des projets informatiques ?
  • Les principaux facteurs de risques de dérapage des coûts de conception et de mise en œuvre.
  • Exemple de ratios de réduction des coûts dans la construction d’un Data warehouse ?
  • Impact de la qualité des données sur la sécurité applicative.
  • Les gains en coûts d’exploitation d’un Datalake.
  • Les gains en temps et en énergie dans les calculs d’Intelligence Artificielle.
  • Gain en productivité suite à la refonte d’une application CRM orientée référentiels.

Panorama du marché des outils de Référentiels de données


Ce chapitre dresse un panorama critique des principales offres du marché dédiées aux référentiels. Outils de Gestion et de gouvernance des métadonnées : Cartographie, Collecte, Stockage, Modélisation, Sémantique, Analyse, publication collaborative de métadonnées, etc.

Outils de construction, d’alimentation et synchronisation de référentiels de données : MDM, DQM, ESB, EAI, ETL, MOM, noSQL, NLP/NLU, etc.