Créer un ticket Mes tickets
Bienvenue
Connexion  S'inscrire

Le métamodèle DataGalaxy

L'objectif de cet article est de vous permettre de vous familiariser avec la notion de métamodèle utilisée pour construire DataGalaxy :

Pourquoi cette notion est fondamentale ? Comment est-elle utilisée dans DataGalaxy ? 

Qu'est-ce que le métamodèle DataGalaxy ? 

Une des ambitions de DataGalaxy est de fournir une vision cohérente des données dans leur environnement. Cela signifie donc être capable de relier différents points de vue / utilisations de la donnée.

En effet, pour de nombreuses raisons tant historiques qu'organisationnelles, la gestion des données est un domaine très fragmenté. Plusieurs acteurs interviennent légitimement dessus :

  • Des personnes, plutôt coté services informatiques, vont gérer le stockage des données c’est-à-dire comment celles-ci sont implantées et modélisées dans des bases de données.
  • D'autres vont administrer les flux: c’est-à-dire comment  les données transitent entre les bases : modification de format, consolidation, mise en relation…
  • Bien souvent les services opérationnels auront la compréhension fonctionnelle de ces données : c’est-à-dire leurs significations, cas d'usage, validité…
  • Enfin des services data (BI, Analytics…) gèrent la mise à disposition de données, agrégées ou non, et d'indicateurs dans des reportings de données.

Or cette multiplication du nombre d'acteurs, l'augmentation du volume et de la diversité des données, diminuent la capacité de compréhension des parties prenantes. Il est très complexe de construire une vision exhaustive et compréhensible des données.

Le métamodèle va donc permettre des passerelles entre ces différentes utilisations de la donnée et ainsi créer une vue cohérente des données dans leur environnement .  

Pourquoi relier les informations entre elles ?

Il est pertinent de savoir où sont stockées les données ou de disposer d'une cartographie des reportings disponibles. Mais une valeur ajoutée bien plus grande réside dans la capacité à relier ces différents points de vue et à les combiner à d'autres comme la signification métier ou les transformations subies.

Ainsi savoir que la Table T_Prosp de la base Tiers détient l'information ID_NAME est intéressant, mais savoir relier l'information à d'autres apporte une plus forte valeur ajoutée. Par exemple :

  • Relié au module glossaire, nous pourrions savoir qu'il s'agit du Nom du prospect, c’est-à-dire une personne dont les identifiants ont été récupérés lors d'un passage sur notre site web.
  • Relié au module des traitements, nous pourrions savoir qu'elle est consolidée avec la base de nos clients afin de vérifier la présence de doublon.
  • Relié au module des usages, nous saurions que cette information est utilisée dans le cadre d'une extraction mise à disposition de nos partenaires.

L'objectif est donc de pouvoir relier les informations au travers des différents modules dont dispose DataGalaxy afin de :

  • Disposer d'une vision à 360° de la donnée: signification, stockage, traitement, exploitations…
  • Lier les différentes notions entre elles,
  • Identifier les impacts de gestion.

Comment gérer ces passerelles ?  

La solution permet de gérer une granularité très fine pour les rattachements. Cette granularité est à adapter selon :

  • Votre niveau de maturité sur la gestion des données : Si il s'agit de votre première cartographie, se lancer dans un mapping champ à champ risque d'être chronophage pour une valeur ajoutée proportionnellement plus faible que mapper par "grosse patate". De plus vous risquez d'être vite découragé !
  • Votre capacité à faire vivre ces rattachements : Les données sont en perpétuelle évolution. Faire évoluer des mappings champ a champ peut vite devenir une charge importante. La capacité à maintenir est donc un critère majeur à prendre en compte.

De la même manière cette granularité doit être adaptée selon :

  • Le besoin tel qu'exprimé dans les uses cases d'exploitation de la solution : inutile de mapper très finement tous les champs à des flux si le but est surtout de savoir quelle est la signification de métier de telle donnée.
  • La valeur ajoutée espérée : inutile de relier finement des bases de données peu stratégique par exemple.

DataGalaxy va vous permettre de relier :

  • L'emplacement physique des données avec leur signification, flux et usages : c’est-à-dire les objets du module dictionnaire avec ceux des 3 autres modules.
  • Les définitions des données avec leur exploitation : c’est-à-dire les objets du module usages avec ceux du module glossaire.

Les relations entre objets sont explicités dans cet article et la façon de le faire dans celui-ci.

Cette réponse a-t-elle été utile ? Oui Non

Envoyer vos commentaires
Désolés de n'avoir pu vous être utile. Aidez-nous à améliorer cet article en nous faisant part de vos commentaires.