Propriétés du tCassandraOutputBulkExec Standard - Cloud - 8.0

Cassandra

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants NoSQL > Composants Cassandra
Gouvernance de données > Systèmes tiers > Composants NoSQL > Composants Cassandra
Qualité et préparation de données > Systèmes tiers > Composants NoSQL > Composants Cassandra

Ces propriétés sont utilisées pour configurer le tCassandraOutputBulkExec s'exécutant dans le framework de Jobs Standard.

Le composant tCassandraOutputBulkExec Standard appartient aux familles Big Data et Bases de données NoSQL.

Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.

Basic settings

Property type

Peut être Built-In ou Repository.

Built-In : aucune propriété n'est stockée de manière centrale.

Repository : Sélectionnez le fichier dans lequel sont stockées les propriétés du composant.

Schema et Edit Schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Modifiez le schéma en cliquant sur Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs.

    Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

 

Built-in : le schéma est créé et conservé localement pour ce composant seulement.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Job Designs et projets.

Lorsque le schéma à réutiliser contient des valeurs par défaut de type Integer ou Function, assurez-vous que ces valeurs par défaut ne sont pas entourées de guillemets. Si elles le sont, supprimez manuellement les guillemets.

Pour plus d'informations, consultez la description relative à la récupération des schémas de tables dans le Guide utilisateur du Studio Talend.

DB Version

Sélectionnez la version de Cassandra que vous utilisez.

Host

Saisissez le nom de l'hôte ou l'adresse IP du serveur Cassandra.

Port

Saisissez le numéro du port d'écoute du serveur Cassandra.

Required authentication

Cochez cette case afin de fournir les informations d'authentification pour Cassandra.

Username

Saisissez dans ce champ le nom d'utilisateur ou d'utilisatrice pour l'authentification à Cassandra.

Ce champ est disponible uniquement lorsque la case Required authentication est cochée.

Password

Saisissez dans ce champ le mot de passe pour l'authentification à Cassandra.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Ce champ est disponible uniquement lorsque la case Required authentication est cochée.

Espace de clés

Saisissez le nom du Keyspace dans lequel écrire la table SSTable.

Famille de colonne

Saisissez le nom de la famille de colonnes dans laquelle écrire la table SSTable.

Mapping type

Sélectionnez le type de mapping dans la liste déroulante. Si vous sélectionnez manual, vous devez saisir le mapping dans le champ Mapping, par exemple "0=id, 1=name, 2=birthday".

Ce champ est disponible uniquement lorsque la version sélectionnée de votre base de données est Cassandra 4.x/4.0x.

Nom de fichier

Saisissez le nom du fichier dans lequel vous souhaitez écrire la table SSTable.

Ce champ est disponible uniquement lorsque la version sélectionnée de votre base de données est Cassandra 4.x/4.0x.

Partitioner

Sélectionnez le partitionneur déterminant comment les données sont partitionnées à travers le cluster Cassandra.

  • Random

  • Murmur3

  • Order preserving : non recommandé, car il suppose que les clés sont des chaînes de caractères en UTF8.

Pour plus d'informations concernant le partitionneur, consultez https://cwiki.apache.org/confluence/display/CASSANDRA2/Partitioners (en anglais).

Ce champ est disponible uniquement lorsque la version sélectionnée de votre base de données est Cassandra 3.3.x/3.2.x/3.1.x/3.0.x.

Instruction de schéma

Saisissez l'instruction pour définir le schéma de la famille de colonnes à utiliser ou à créer à la volée.

  • Cette instruction est une instruction préparée Cassandra, stockant localement les résultats de requête dans le répertoire SSTable directory défini via ce composant, avant de les envoyer au serveur. Pour plus d'informations concernant les instructions préparées, consultez Prepared statements (en anglais).

  • Une famille de colonnes Cassandra est un conteneur d'une collection de lignes d'enregistrements partageant un même type. Son schéma doit contenir la même colonne que le schéma du composant défini, c'est-à-dire que les noms de colonnes doivent être identiques dans les deux schémas.

Un exemple d'instruction pour ce schéma est fourni dans le champ Schema statement :
create table ks.tb (id int, name text, birthday timestamp, primary key(id, birthday)) with clustering order by (birthday desc)
Cette instruction va appeler une famille de colonnes nommée tb et contenant les colonnes id, name et birthday sous le Keyspace ks.

Pour plus d'informations concernant une famille de colonnes, consultez Standard column family (en anglais).

Ce champ est disponible uniquement lorsque la version sélectionnée de votre base de données est Cassandra 3.3.x/3.2.x/3.1.x/3.0.x.

SSTable directory

Spécifiez le répertoire local pour la table SSTable. Notez que le chemin d'accès complet à la table SSTable comprend le répertoire local à la suite du Keyspace spécifié et du nom de la famille de colonnes.

Par exemple, si vous configurez le répertoire local à /home/talend/sstable et que vous spécifiez testk comme nom du Keyspace et testc comme nom de la famille de colonnes, le chemin d'accès complet à la table SSTable est /home/talend/sstable/testk/testc/.

Ce champ est disponible uniquement lorsque la version sélectionnée de votre base de données est Cassandra 3.3.x/3.2.x/3.1.x/3.0.x.

Taille de buffer

Spécifiez la taille à partir de laquelle écrire la table SSTable dans Cassandra.

Ce champ est disponible uniquement lorsque la version sélectionnée de votre base de données est Cassandra 3.3.x/3.2.x/3.1.x/3.0.x.

Paramètres avancés

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job au niveau du Job ainsi qu'au niveau de chaque composant.

Variables globales

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend .

Utilisation

Usage rule

Ce composant est principalement utilisé lorsqu'aucune transformation particulière n'est requise sur les données à charger dans la base de données.

Limitation

L'exécution de ce composant provoque la fin du Job.