Créer un ticket Mes tickets
Bienvenue
Connexion  S'inscrire

Connecteur Azure Data Lake Services Gen1 (ADLS Gen1)

⚠️ Le connecteur DataGalaxy ADLS Gen1 sera retiré de la liste des connecteurs supportés fin juin 2026. Il ne sera plus disponible dans votre plateforme.
Si vous utilisez le plugin ADLS Gen1 du connecteur Desktop, vous pouvez continuer à l'utiliser sous votre entière responsabilité. Cependant il ne sera plus mis à jour (y compris concernant les vulnérabilités) et l'équipe support ne pourra vous aider si vous rencontrez des difficultés.

Cet article explique comment utiliser le connecteur Azure Data Lake Services Gen1 pour DataGalaxy

Ce connecteur est disponible dans les modes suivants :

Mode DesktopMode SaaS Online ❌

Présentation du connecteur

Les objets récupérés et leurs correspondances dans DataGalaxy sont détaillés dans le tableau suivant :

Objet ADLSGen1
Objet DataGalaxy
Commentaires
RépertoireRépertoire (Conteneur)
FichierFichier (Structure)
ChampChampLa définition des colonnes est importée si le fichier traité est un fichier CSV (séparateur ";")

Etape 1 : Installation

  • Télécharger le connecteur DataGalaxy depuis le portail (voir ici)
  • Extraire l'archive du connecteur dans le répertoire de votre choix
  • Télécharger le plug-in depuis le portail et le copier dans le répertoire /lib du connecteur

Etape 2 : Exécution du connecteur ADLS Gen1

  • Après avoir démarré le connecteur, accéder aux connecteurs du Dictionnaire : 
  • S'il a été correctement installé, le plug-in ALDS Gen1 apparaît dans la liste
  • Les informations suivantes sont demandées : 
ParamètreObligatoireDescription
Nom du clusterOuiNom du cluster
Id tenantOuiIdentifiant du tenant Azure
Id clientOuiIdentifiant du compte de service client Azure
Secret clientOuiSecret du client
CheminNonChemin racine à parcourir
Mode rapideNon
Option à privilégier pour un datalake volumineux. Dans ce mode, le connecteur ne calcule pas de résumé préalable avant import, et les colonnes des fichiers CSV présents dans le datalake ne sont pas remontées dans DataGalaxy
Inclure uniquement les répertoire (filtre)NonLe connecteur ne recense pas les fichiers contenus dans les répertoires
Profondeur (filtre)
NonLimite la profondeur des répertoires à parcourir à N niveaux de sous dossiers. Tous les sous répertoires sont parcourus lorsque ce paramètre est égal à 0.
MasqueNonLes masques permettent de définir des stratégies de regroupement et de filtrage des dossiers et des fichiers en fonction de modèle de nommage.
Exemple : /datasource/{YYYYMMDD}/file_{YYYYMM}_{zz}.csv

Les masques doivent être des chemins absolus à partir de la racine et chaque caractère est important, il peut donc être nécessaire de définir plusieurs masques pour couvrir tous vos cas.

Plus d'informations sur ce paramétrage sont disponibles lors de l'exécution du connecteur.

Une fois ces informations renseignées, vous devez tester la connexion pour pouvoir lancer la procédure d'import.

Plus d'informations sur le mode opératoire du connecteur disponibles ici

Informations techniques

Le compte de service utilisé doit être configuré pour disposer des droits suivants :

  • API autorisées (à définir lors l'inscription de l'application) : Azure Data Lake 
  • Attribution de rôle (à définir au niveau du compte de stockage) : Lecteur

Vous pouvez éventuellement définir des restrictions supplémentaires à l'aide des ACL pour limiter les ressources auxquelles le compte de service aura accès.

Le connecteur ADLS Gen1 exploite les API REST Azure Data Lake Store Gen1 (https://docs.microsoft.com/fr-fr/rest/api/datalakestore/)

Releases

DatePlugin
Version
DataGalaxy
release
Desktop Connector
version (minimum)
Description
23/08/20244.0.1v3.69.05.2.3Updated the logger to show more information when using verbose mode  
06/08/20244.0.0v3.65.0
5.0.5Migrated from java 11 to java 17 + CVE fixes

Cette réponse a-t-elle été utile ? Oui Non

Envoyer vos commentaires
Désolés de n'avoir pu vous être utile. Aidez-nous à améliorer cet article en nous faisant part de vos commentaires.