Propriétés du tAzureStorageOutputTable Standard

Azure Storage Table

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Open Studio for ESB
Talend Data Fabric
Talend Big Data
Talend Open Studio for MDM
Talend ESB
Talend Big Data Platform
Talend Open Studio for Data Integration
Talend Real-Time Big Data Platform
Talend Data Integration
Talend MDM Platform
Talend Open Studio for Big Data
Talend Data Services Platform
Talend Data Management Platform
task
Création et développement > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Storage Table
Qualité et préparation de données > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Storage Table
Gouvernance de données > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Storage Table
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tAzureStorageOutputTable s'exécutant dans le framework de Jobs Standard.

Le composant tAzureStorageOutputTable Standard appartient à la famille Cloud.

Le composant de ce framework est disponible lorsque vous utilisez l'une des solutions Big Data de Talend.

Basic settings

Property Type

Sélectionnez la manière de configurer les informations de connexion.

  • Built-In : les informations de connexion seront stockés localement pour ce composant. Vous devez spécifier manuellement les valeurs de toutes les propriétés de connexion.

  • Repository : les informations de connexion stockées centralement dans le Repository > Metadata seront réutilisées par ce composant. Vous devez cliquer sur le bouton [...] et, dans la boîte de dialogue Repository Content, sélectionnez les détails de connexion à réutiliser. Toutes les propriétés de connexion seront automatiquement renseignées.

Cette propriété n'est pas disponible lorsqu'un autre composant de connexion est sélectionné dans la liste Connection Component.

Connection Component

Sélectionnez dans la liste déroulante le composant dont les informations de connexion seront utilisées pour configurer la connexion à Azure Storage.

Account Name

Saisissez le nom du compte de stockage auquel vous devez accéder. Vous pouvez trouver un nom de compte de stockage dans le dashboard Storage accounts du système Microsoft Azure Storage à utiliser. Assurez-vous que l'administrateur du système a donné les droits d'accès appropriés à ce compte de stockage.

Account Key

Saisissez la clé associée au compte de stockage auquel vous devez accéder. Deux clés sont disponibles pour chaque compte. Par défaut, n'importe laquelle peut être utilisée pour accéder au compte.

Protocol

Sélectionnez le protocole de la connexion à créer.

Use Azure Shared Access Signature

Cochez cette case pour utiliser une signature d'accès partagé pour accéder aux ressources du stockage sans utiliser de clé de compte.

Dans le champ Azure Shared Access Signature qui s'affiche, saisissez votre signature d'accès partagé entre guillemets doubles. Vous pouvez obtenir l'URL de la signature d'accès partagé pour chaque service autorisé sur le portail de Microsoft Azure, après génération de la signature. Le format de l'URL est le suivant : https://<$storagename>.<$service>.core.windows.net/<$sastoken>, où <$storagename> est le nom du compte de stockage, <$service> le nom du service autorisé (blob, file, queue ou table) et <$sastoken> est la valeur du jeton de signature d'accès partagé. Pour plus d'informations, consultez Constructing the Account SAS URI (en anglais).

Notez que SAS a une période de validité, vous pouvez configurer l'heure de début de validité de SAS et son heure d'expiration, après laquelle SAS n'est plus valide lors de la génération. Vous devez vous assurer que votre SAS est toujours valide lorsque vous exécutez votre Job.

Table name

Spécifiez le nom de la table dans laquelle les entités seront écrites.

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-In : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

  • Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Partition Key

Sélectionnez dans la liste déroulante la colonne du schéma contenant la valeur de la clé de partition.

Row Key

Sélectionnez dans la liste la colonne du schéma contenant la valeur de la clé de ligne.

Action on data

Sélectionnez une action à effectuer sur les données de la table définie.

  • Insert : insère une nouvelle entité à la table.
  • Insert or replace : remplace une entité existante ou insère une nouvelle entité si elle n'existe pas. Lorsqu'une entité est remplacée, les propriétés de l'entité précédente sont supprimées si la nouvelle entité ne les définit pas.
  • Insert or merge : fusionne une entité existante ou insère une nouvelle entité si elle n'existe pas. Lors de la fusion d'une entité, les propriétés de l'entité précédente seront conservées si la nouvelle entité ne les définit pas ou ne les inclut pas.
  • Merge : met à jour une entité existante sans supprimer la valeur de l'entité précédente si la nouvelle entité ne définit pas sa valeur.
  • Replace : met à jour une entité existante et supprime la valeur de la propriété de l'entité précédente si la nouvelle entité ne définit pas sa valeur.
  • Delete : supprime une entité existante.

Pour des raisons de performance, les données entrantes sont traitées en parallèle et en ordre aléatoire. Il n'est donc pas recommandé d'effectuer des opérations sensibles à l'ordre (par exemple une insertion ou un replacement), s'il y a des lignes en doublon dans vos données.

Action on table

Sélectionnez une opération à effectuer sur la table définie, vous pouvez effectuer l'une des opérations suivantes :

  • Default : aucune opération n'est effectuée.

  • Drop and create table : la table est supprimée et créée à nouveau.

  • Create table : la table n'existe pas et est créée.

  • Create table if does not exist : la table est créée si elle n'existe pas.

  • Drop table if exist and create : la table est supprimée si elle existe déjà et créée à nouveau.

Process in batch

Cochez cette case pour traiter par lots les entités d'entrée.

Notez que les entités à traiter par lots doivent appartenir au même groupe de partition, ce qui signifie qu'elles doivent avoir la même valeur de clé de partition.

Die on error

Cochez cette case pour arrêter l'exécution du Job lorsqu'une erreur survient.

Advanced settings

Name mappings

Renseignez cette table pour mapper le nom de la colonne du schéma du composant au nom de la propriété de l'entité de la table Azure s'ils sont différents.

  • Schema column name : saisissez le nom de la colonne du schéma du composant, entre guillemets doubles.
  • Entity property name : saisissez le nom de la propriété de l'entité de la table Azure, entre guillemets doubles.

Par exemple, si trois colonnes de schéma CompanyID, EmployeeID et EmployeeName sont utilisées pour alimenter la valeur des propriétés des entités PartitionKey, RowKey et Name, respectivement, vous devez ajouter les lignes suivantes pour le mapping lors de l'écriture des données dans la table Azure.

  • dans la cellule Schema column name, renseignez la valeur "CompanyID" et, dans la cellule Entity property name, renseignez la valeur "PartitionKey".
  • dans la cellule Schema column name, renseignez la valeur "EmployeeID" et, dans la cellule Entity property name, renseignez la valeur "RowKey".
  • dans la cellule Schema column name, renseignez la valeur "EmployeeName" et, dans la cellule Entity property name, renseignez la valeur "Name".
tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global variables

NB_LINE

Nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

NB_SUCCESS

Nombre de lignes correctement traitées. Cette variable est une variable After et retourne un entier.

NB_REJECT

Nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE

Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères.

Utilisation

Règle d'utilisation

Ce composant est généralement utilisé comme composant de fin dans un Job ou un sous-job et nécessite un lien d'entrée.