Les attributs pour définir les différentes facettes du contexte sont les éléments de base d'une stratégie de gouvernance des données.
Cet article a pour objectif d'expliquer la notion d'attribut et de décrire son fonctionnement dans la plateforme DataGalaxy.
Pour savoir comment créer et supprimer des attributs, vous pouvez consulter l'article La gestion des attributs.
Pour consulter également consulter la liste des attributs éditeurs.
Qu'est-ce qu'un attribut ?
Une des missions de DataGalaxy est de faire collaborer les différents profils data (analystes, dev, architectes, métiers, producteurs, consommateurs, ...) autour d'une vision partagée des différentes facettes de la donnée. Cela implique de gérer différents types d'informations hétérogènes. La gestion des attributs permet d’adresser ce besoin. Ils correspondent à des champs qui, une fois regroupés dans des catégories, permettent d'établir une carte d'identité des objets, ou la fiche objet.
L'objectif des attributs est de pouvoir contextualiser autant que possible les différentes facettes d'un objet et donc d'enrichir sa connaissance.
Afin de supporter la démarche de gouvernance des données (vision d'entreprise), les attributs sont créés au niveau du clientspace. Cela signifie qu'ils sont commun à l'ensemble des workspaces dépendant de cet espace client.
Il est important de se poser quelques questions avant de se lancer dans la création de dizaines d'attributs :
- Quelle est la proportion des utilisateurs concernés par l'information portée par l'attribut ?
- Quels sont les attributs critiques pour votre use case, dont la curation est indispensable ?
- Est-ce que la signification de l'attribut est explicite ? Par exemple que signifie l'attribut "fréquence" ? Est-ce la fréquence d'actualisation ? De suppression des données ?
- Est-ce que cet attribut n'existe pas déjà ou ne recouvre pas en grande partie un autre attribut ? Il convient de faire converger au maximum les termes afin de ne pas se retrouver avec plusieurs champs interchangeables, ce qui serait source de confusion.
- Complétude des valeurs proposées dans la liste de l'attribut ? Certains types d'attributs contiennent des listes de valeurs : celles-ci doivent être suffisamment riches pour que chacun s'y retrouve mais pas trop pour éviter de se perdre.
- Quelle langue doit-on utiliser ? La plateforme est disponible en français et en anglais, mais les valeurs positionnées sur les attributs peuvent être dans n'importe quelle langue. Laquelle doit prévaloir ? Doit-on créer l'attribut dans les deux langues ?
- Est-ce que des attributs sont spécifiques à un domaine, pôle ou projet ? Est-ce que la gestion doit en être déléguée ?
- .....
Tips
Il n'y a pas de limite quant au nombre d'attributs qu'il est possible de créer. Cependant, il faut garder en tête que 20% des attributs portent 80% de la connaissance attendue par les utilisateurs des données.
La multiplication des attributs peut être contre productive et décourager les utilisateurs (faible ergonomie, incompréhension des différences, complexité de la maintenance...).
Pour conserver un niveau d'ergonomie optimal, nous recommandons d'évaluer le ROI de la création et de l'affichage de chaque attribut.
Comment ça fonctionne ?
Le schéma ci-dessous résume la structuration des attributs dans DataGalaxy :

Les attributs sont structurés en deux grandes familles :
- Les attributs système
Afin d'assurer un démarrage rapide, DataGalaxy propose et assure la maintenance d'un certain nombre d'attributs.On parle alors d'attributs système.
Ce sont des attributs disponibles "par défaut", non modifiables par les utilisateurs. On peut les reconnaître grâce à l'icône nuage accolé à leur nom.
Certains attributs systèmes permettent de visualiser des données issues d'outils sources, par exemple le nombre d'enregistrements d'une table ou la requête source d'un data set. Les informations remontées dépendent des outils sources, vous en trouverez le détail dans les articles des technologies concernées.
- Les attributs personnalisés
Ce sont les attributs créés et gérés par les administrateurs du clientspace, ils sont utilisables/disponibles pour l'ensemble des workspaces du clientspace.
En conséquence toute modification ou suppression d'un attribut personnalisé impactera l'ensemble des workspaces qui utilisent cet attribut.
Deux types d'attributs peuvent être proposés dans chaque famille :
- Les attributs communs
Ils correspondent aux attributs qui sont utilisables/disponibles pour l'ensemble des objets de la plateforme quelque soit le module d'appartenance de l'objet .
Exemple : La description de l'objet, la classification DCP, le responsable, ...

- Les attributs par module
Ils correspondent aux attributs spécifiques qui sont exclusivement utilisables/disponibles pour un sous ensemble d'objets de la plateforme :
- Attributs spécifiques pour les objets du Glossaire,
- Attributs spécifiques pour les Data Sources (BDD, File Store, ...),
- Attributs spécifiques pour les Structures (Table, File, ...),
- Attributs spécifiques pour les Champs (Colonne, ...),
- Attributs spécifiques pour les Usages,
- Attributs spécifiques pour les objets des Traitements.

La structure d'un attribut
L'ensemble des attributs quelque soit le type ou le format, partagent un socle de définition commun :
- Libellé de l'attribut,
- Description de l'attribut,
- Format de l'attribut (texte, date, étiquette...),
- L'option Recommandé qui permet de calculer le taux de complétude de l'objet,
- La valeur par défaut (facultatif).
Les formats d'attributs supportés
Formats | Description | Commentaire |
|---|---|---|
| Booléen | L'attribut se présente sur le la forme d'un champs Oui/Non. | Exemple de champs de type booléen :
|
| Date | L'attribut date se présente sous le format jj/mm/aaaa. | L'ensemble des informations au format date. |
Texte formaté | Attribut de texte riche avec les outils de mise en forme. | Les texte formaté est à utiliser pour les attributs nécessitant une description longue ou une mise en forme avancée du contenu. |
| Hyperlien | Permet d'insérer un lien vers des références externes. | Par exemple, dans le cadre d'un projet RGPD, Le champs hyperlien peut permettre de renvoyer vers l'outil Privacy Impact Assessment de la CNIL. |
| Nombre | Champ au format Nombre. | Il peut s'agir de nombre entier ou décimal |
| Liste de valeurs | Liste de valeur à choix unique. | |
| Texte | Champ texte simple. | Les attributs de ce type sont limités à 512 caractères |
| Etiquette | Attribut de classification (Tag). Chaque étiquette créée possède une couleur qui permet ainsi de repérer facilement le groupe auquel appartient l'objet tagué avec cette étiquette. | Exemple de classification: Marketing, Commercial, Finance, RH. |
| Liste multi valeurs | Champ à choix multiple. | Le fonctionnement des liste multi valeurs est similaire à celui des étiquettes. |
| Utilisateurs | Champ à choix multiple avec en liste de valeur les utilisateurs de l'espace client. | |
| Personne | Champ à choix multiple avec en liste de valeur les utilisateurs de l'espace client. | L'usage type est la définition d'attribut pour identifier les parties prenantes et les acteurs externes. |
| Hiérarchie | Champs avec une liste de valeur hiérarchique à choix multiple. | |
| Série temporelle | Champ permettant de suivre l'évolution d'une valeur dans le temps | Exemple : un indicateur de qualité |