Propriétés du tAzureStorageOutputTable Standard - 7.1

Azure Storage Table

Version
7.1
Language
Français (France)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Storage Table
Gouvernance de données > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Storage Table
Qualité et préparation de données > Systèmes tiers > Stockages Cloud > Composants Azure > Composants Azure Storage Table

Ces propriétés sont utilisées pour configurer le tAzureStorageOutputTable s'exécutant dans le framework de Jobs Standard.

Le composant tAzureStorageOutputTable Standard appartient à la famille Cloud.

Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.

Basic settings

Property Type

Sélectionnez la manière de configurer les informations de connexion.

  • Built-In : les paramètres de connexion seront définis localement pour ce composant. Vous devez spécifier manuellement les valeurs pour toutes les propriétés de connexion.

  • Repository : les paramètres de connexion stockés centralement dans le Repository > Metadata seront réutilisés par ce composant. Vous devez cliquer sur le bouton [...] et, dans la boîte de dialogue Repository Content, sélectionnez les détails de connexion à réutiliser. Toutes les propriétés de connexion seront automatiquement renseignées.

Cette propriété n'est pas disponible lorsqu'un autre composant de connexion est sélectionné dans la liste Connection Component.

Connection Component

Sélectionnez dans la liste déroulante le composant dont les informations de connexion seront utilisées pour configurer la connexion à Azure Storage.

Account Name

Saisissez le nom du compte de stockage auquel vous devez accéder. Vous pouvez trouver un nom de compte de stockage dans le dashboard Storage accounts du système Microsoft Azure Storage à utiliser. Assurez-vous que l'administrateur du système a donné les droits d'accès appropriés à ce compte de stockage.

Account key

Saisissez la clé associée au compte de stockage auquel vous devez accéder. Deux clés sont disponibles pour chaque compte. Par défaut, n'importe laquelle peut être utilisée pour accéder au compte.

Protocol

Sélectionnez le protocole de la connexion à créer.

Use Azure Shared Access Signature

Cochez cette case pour utiliser une signature d'accès partagé (SAP) pour accéder aux ressources du stockage sans utiliser de clé de compte. Pour plus d'informations, consultez Utilisation des signatures d'accès partagé (SAP).

Dans le champ Azure Shared Access Signature qui s'affiche, saisissez votre signature d'accès partagé entre guillemets doubles. Vous pouvez obtenir l'URL de la signature d'accès partagé pour chaque service autorisé sur le portail de Microsoft Azure, après génération de la signature. Le format de l'URL est le suivant : https://<$storagename>.<$service>.core.windows.net/<$sastoken>, où <$storagename> est le nom du compte de stockage, <$service> le nom du service autorisé (blob, file, queue ou table) et <$sastoken> est la valeur du jeton de signature d'accès partagé. Pour plus d'informations, consultez Constructing the Account SAS URI (en anglais).

Notez que la SAP a une période de validité, vous pouvez configurer l'heure de début de validité de la SAP et son heure d'expiration, après laquelle la SAP n'est plus valide lors de la génération. Vous devez vous assurer que votre SAP est toujours valide lorsque vous exécutez votre Job.

Table name

Spécifiez le nom de la table dans laquelle les entités seront écrites.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Modifiez le schéma en cliquant sur Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Partition Key

Sélectionnez dans la liste déroulante la colonne du schéma contenant la valeur de la clé de partition.

Row Key

Sélectionnez dans la liste la colonne du schéma contenant la valeur de la clé de ligne.

Action on data

Sélectionnez une action à effectuer sur les données de la table définie.

  • Insert : insère une nouvelle entité à la table.
  • Insert or replace : remplace une entité existante ou insère une nouvelle entité si elle n'existe pas. Lorsqu'une entité est remplacée, les propriétés de l'entité précédente sont supprimées si la nouvelle entité ne les définit pas.
  • Insert or merge : fusionne une entité existante ou insère une nouvelle entité si elle n'existe pas. Lors de la fusion d'une entité, les propriétés de l'entité précédente seront conservées si la nouvelle entité ne les définit pas ou ne les inclut pas.
  • Merge : met à jour une entité existante sans supprimer la valeur de la propriété de l'entité précédente si la nouvelle entité ne définit pas sa valeur.
  • Replace : met à jour une entité existante et supprime la valeur de la propriété de l'entité précédente si la nouvelle entité ne définit pas sa valeur.
  • Delete : supprime une entité existante.

Pour des raisons de performance, les données entrantes sont traitées en parallèle et en ordre aléatoire. Il n'est donc pas recommandé d'effectuer des opérations sensibles à l'ordre (par exemple une insertion ou un replacement), s'il y a des lignes en doublon dans vos données.

Action on table

Sélectionnez une opération à effectuer sur la table définie, vous pouvez effectuer l'une des opérations suivantes :

  • Default : n'effectuer aucune opération de table.

  • Drop and create table : la table est supprimée et de nouveau créée.

  • Create table : la table n'existe pas et est créée.

  • Create table if does not exist : créer la table si elle n'existe pas encore.

  • Drop table if exists and create : supprimer la table si elle existe déjà, puis en créer une nouvelle.

Process in batch

Cochez cette case pour traiter par lots les entités d'entrée.

Notez que les entités à traiter par lots doivent appartenir au même groupe de partition, ce qui signifie qu'elles doivent avoir la même valeur de clé de partition.

Die on error

Cochez cette case pour arrêter l'exécution du Job lorsqu'une erreur survient.

Advanced settings

Name mappings

Renseignez cette table pour mapper le nom de la colonne du schéma du composant au nom de la propriété de l'entité de la table Azure s'ils sont différents.

  • Schema column name : saisissez le nom de la colonne du schéma du composant, entre guillemets doubles.
  • Entity property name : saisissez le nom de la propriété de l'entité de la table Azure, entre guillemets doubles.

Par exemple, si trois colonnes de schéma CompanyID, EmployeeID et EmployeeName sont utilisées pour alimenter la valeur des propriétés des entités PartitionKey, RowKey et Name, respectivement, vous devez ajouter les lignes suivantes pour le mapping lors de l'écriture des données dans la table Azure.

  • dans la cellule Schema column name, renseignez la valeur "CompanyID" et, dans la cellule Entity property name, renseignez la valeur "PartitionKey".
  • dans la cellule Schema column name, renseignez la valeur "EmployeeID" et, dans la cellule Entity property name, renseignez la valeur "RowKey".
  • dans la cellule Schema column name, renseignez la valeur "EmployeeName" et, dans la cellule Entity property name, renseignez la valeur "Name".
tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Variables globales

NB_LINE

Nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

NB_SUCCESS

Nombre de lignes correctement traitées. Cette variable est une variable After et retourne un entier.

NB_REJECT

Nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE

Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères.

Utilisation

Règle d'utilisation

Ce composant est généralement utilisé comme composant de fin dans un Job ou un sous-Job et nécessite un lien d'entrée.