Propriétés du tAzureAdlsGen2Input Standard - 7.3

Azure Data Lake Storage Gen2

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Data Lake Storage Gen2
Gouvernance de données > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Data Lake Storage Gen2
Qualité et préparation de données > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Data Lake Storage Gen2
Last publication date
2024-02-22

Ces propriétés sont utilisées pour configurer le tAzureAdlsGen2Input s'exécutant dans le framework de Jobs Standard.

Le composant tAzureAdlsGen2Input Standard appartient à la famille Cloud.

Le composant de ce framework est disponible dans tous les produits Talend.

Basic settings

Property Type

Sélectionnez la manière de configurer les informations de connexion.

  • Built-In : les paramètres de connexion seront définis localement pour ce composant. Vous devez spécifier manuellement les valeurs pour toutes les propriétés de connexion.

  • Repository : les paramètres de connexion stockés centralement dans le Repository > Metadata seront réutilisés par ce composant. Vous devez cliquer sur le bouton [...] et, dans la boîte de dialogue Repository Content, sélectionnez les détails de connexion à réutiliser. Toutes les propriétés de connexion seront automatiquement renseignées.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Créez le schéma en cliquant sur le bouton Edit Schema.
Remarque : Si vous effectuez des modifications, le schéma passe automatiquement en type built-in.
  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Guess schema

Cliquez sur ce bouton pour récupérer le schéma de l'objet de données spécifié.

Authentication method

Sélectionnez l'une des méthodes d'authentification suivantes dans la liste déroulante.

  • Shared key, qui nécessite une clé d'accès au compte. Consultez Manage a storage account pour plus d'informations.
  • Shared Access Signature, qui nécessite une signature d'accès partagé. Pour plus d'informations, consultez Constructing the Account SAS URI (en anglais).
  • Azure Active Directory, cochez cette option pour utiliser l'authentification Azure Active Directory lors de l'établissement de la connexion. Consultez Azure AD Authentication pour des informations associées.
Remarque : L'option Azure Active Directory est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-06 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.

Nom du compte

Saisissez le nom du compte Data Lake Store auquel accéder. Assurez-vous que l'administrateur du système a donné les droits d'accès appropriés à ce compte de stockage.

Endpoint suffix

Saisissez l'endpoint du service Azure Storage.

La combinaison du nom de compte et de l'endpoint de service Azure Storage forme l'endpoint du compte de stockage.

Shared key

Saisissez la clé associée au compte de stockage auquel vous devez accéder. Deux clés sont disponibles pour chaque compte. Par défaut, n'importe laquelle peut être utilisée pour accéder au compte. Pour plus d'informations concernant l'obtention de votre clé, consultez Manage a storage account (en anglais).

Ce champ est disponible si vous sélectionnez Shared key dans la liste déroulante Authentication method.

SAS Token

Saisissez le jeton SAS de votre compte. Vous pouvez obtenir le jeton de la signature d'accès partagé pour chaque service autorisé sur le portail de Microsoft Azure, après génération de la signature. Le format du jeton SAS est le suivant : https://<$storagename><$service>.core.windows.net/<$sastoken>, où <$storagename> est le nom du compte de stockage, <$service> le nom du service autorisé (blob, file, queue ou table) et <$sastoken> la valeur du jeton de signature d'accès partagé. Pour plus d'informations, consultez Constructing the Account SAS URI (en anglais).

Ce champ est disponible si vous sélectionnez Shared access signature dans la liste déroulante Authentication method.

Check connection

Cliquez sur ce bouton pour valider les paramètres de connexion fournis.

Filesystem

Saisissez le nom du conteneur d'objets Blob cible.

Vous pouvez également cliquer sur le bouton ... à droite de ce champ et sélectionner le conteneur de blobs voulu dans la liste de dans la boîte de dialogue.

Blobs Path

Saisissez le chemin d'accès aux blobs cibles.

Format

Configurez le format des données entrantes. Les formats suivants sont supportés : CSV, AVRO, JSON et Parquet.

Field Delimiter

Configurez le séparateur de champs. Vous pouvez sélectionner Semicolon, Comma, Tabulation et Space dans la liste déroulante. Vous pouvez également sélectionner Other et saisir votre séparateur personnalisé dans le champ Custom field delimiter.

Record Separator

Configurez le séparateur d'enregistrments. Vous pouvez sélectionner LF, CR et CRLF dans la liste déroulante. Vous pouvez également sélectionnée Other et saisir votre séparateur personnalisé dans le champ Custom Record Separator.

Text Enclosure Character

Saisissez le caractère utilisé pour entourer le texte.

Escape character

Saisissez le caractère d'échappement de la ligne.

Header

Cochez cette case pour insérer une ligne d'en-tête aux données.

Remarque :
  • Sélectionnez cette option si les données à récupérer contiennent une ligne d'en-tête. Dans ce cas, vous devrez également vous assurer que les noms des colonnes dans le schéma sont cohérents avec les noms des colonnes d'en-têtes des données.
  • Décochez cette option si les données à récupérer ne contiennent pas de ligne d'en-tête. Dans ce cas, vous devrez nommer les colonnes du schéma field0, field1, field2, etc.

File Encoding

Sélectionnez l'encodage du fichier dans la liste déroulante.

Paramètres avancés

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global Variables

ERROR_MESSAGE

Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères.

NB_LINE

Nombre de lignes correctement traitées. Cette variable est une variable After et retourne un entier.

Utilisation

Règle d'utilisation

Ce composant est généralement utilisé comme composant de début dans un Job ou un sous-Job et nécessite un lien de sortie.