Propriétés du tCassandraOutputBulk Standard - 6.4

Cassandra

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants Cassandra
Gouvernance de données > Systèmes tiers > Composants Database > Composants Cassandra
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants Cassandra
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tCassandraOutputBulk s'exécutant dans le framework de Jobs Standard.

Le composant tCassandraOutputBulk Standard appartient aux familles Big Data et Databases.

Le composant de ce framework est disponible dans tous les produits Big Data de Talend.

Basic settings

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

Built-In : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

Lorsque le schéma à réutiliser contient des valeurs par défaut, qui sont des entiers (integer) ou des fonctions (function), assurez-vous que les valeurs par défaut ne sont pas entourées de guillemets. Si c'est le cas, vous devez supprimer manuellement les guillemets.

Pour plus d'informations, consultez Vérification des valeurs par défaut dans un schéma récupéré.

Table type

Sélectionnez le type du modèle de données à utiliser pour la table à créer. Le type peut être CQL (plus précisément CQL3) ou non-CQL (L'API basée Thrift héritée de Cassandra avant CQL3).

Cette liste déroulante est disponible uniquement lorsque la version sélectionnée dans la liste DB version est Cassandra 2.0.0. Pour les versions de Cassandra supérieures à 2.0.0, CQL devient le seul modèle utilisé par ce composant et la liste n'est plus disponible.

DB Version

Sélectionnez la version de Cassandra que vous utilisez.

Host

Saisissez le nom de l'hôte ou l'adresse IP du serveur Cassandra.

Port

Saisissez le numéro du port d'écoute du serveur Cassandra.

Required authentication

Cochez cette case pour fournit les informations d'authentification à Cassandra.

Avertissement :

Cette case ne s'affiche pas si vous sélectionnez Cassandra 1.1.2 dans la liste DB Version.

Username

Renseignez ce champ en saisissant l'identifiant d'authentification à Cassandra.

Password

Renseignez ce champ en saisissant le mot de passe d'authentification à Cassandra.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Use configuration file

Cochez cette case et, dans le champ qui s'affiche, saisissez le chemin d'accès ou parcourez votre système jusqu'au fichier principal de configuration pour Cassandra, cassandra.yaml.

Ainsi, ce composant peut importer et utiliser directement la configuration du fichier cassandra.yaml, qui peut contenir des propriétés avancées de Cassandra, comme les propriétés relatives au chiffrement SSL.

Lorsque vous devez exécuter votre Job dans différents environnements Cassandra, cette fonctionnalité permet à votre Job de passer facilement d'une configuration à une autre.

Pour plus d'informations concernant ce fichier cassandra.yaml, consultez Cassandra configuration (en anglais).

Keyspace

Saisissez le nom du Keyspace dans lequel écrire la table SSTable.

Column family

Saisissez le nom de la famille de colonnes dans laquelle écrire la table SSTable.

Partitioner

Sélectionnez le partitionneur déterminant comment les données sont partitionnées à travers le cluster Cassandra.

  • Random : partitionneur par défaut dans Cassandra 1.1 et versions antérieures.

  • Murmur3 : partitionneur par défaut dans Cassandra 1.2.

  • Order preserving : non recommandé car il suppose que les clés sont des chaînes de caractères en UTF8.

Pour plus d'informations concernant le partitionneur, consultez http://wiki.apache.org/cassandra/Partitioners (en anglais).

Schema statement

Saisissez l'instruction pour définir le schéma de la famille de colonnes à utiliser ou à créer à la volée.

  • Cette instruction est une instruction préparée Cassandra, stockant localement les résultats de requête dans le répertoire SSTable directory défini via ce composant, avant de les envoyer au serveur. Pour plus d'informations concernant les instructions préparées, consultez Prepared statements (en anglais).

  • Une famille de colonnes Cassandra est un conteneur d'une collection de lignes d'enregistrements partageant un même type. Son schéma doit contenir la même colonne que le schéma du composant défini, c'est-à-dire que les noms de colonnes doivent être identiques dans les deux schémas.

Un exemple d'instruction pour ce schéma est fourni dans le champ Schema statement :
create table ks.tb (id int, name text, birthday timestamp, primary key(id, birthday)) with clustering order by (birthday desc)
Cette instruction va appeler une famille de colonnes nommée tb et contenant les colonnes id, name et birthday sous le Keyspace ks.

Pour plus d'informations concernant une famille de colonnes, consultez Standard column family (en anglais).

Ce champ est disponible uniquement lorsque la version sélectionnée de votre base de données Cassandra est supérieure à 2.0.0. Lorsque votre version est 2.0.0, ce champ est disponible lorsque vous avez sélectionné CQL dans la liste Table type.

Insert statement

Saisissez l'instruction pour écrire les données du flux d'entrée dans les colonnes de la famille à utiliser.

Cette instruction est une instruction préparée Cassandra, stockant localement les résultats de requête dans le répertoire SSTable directory défini via ce composant, avant de les envoyer au serveur. Pour plus d'informations concernant les instructions préparées, consultez Prepared statements (en anglais).

Un exemple de cette instruction d'insertion est fourni dans le champ Insert statement :
insert into ks.tb (id, name, birthday) values (?, ?, ?)
Cette instruction va écrire des données dans les colonnes id, name et birthday, respectivement d'une famille de colonnes nommée tb dans le Keyspace ks. Les points d'interrogation dans l'instruction sont les marqueurs des variables liées pour les trois colonnes. Pour plus d'informations concernant les variables liées et leur utilisation, consultez Bound parameters (en anglais).

Ce champ est disponible uniquement lorsque la version sélectionnée de votre base de données Cassandra est supérieure à 2.0.0. Lorsque votre version est 2.0.0, ce champ est disponible lorsque vous avez sélectionné CQL dans la liste Table type.

Column name comparator

Sélectionnez le type de données pour le nom des colonnes, utilisé pour trier les colonnes. Cette liste n'est pas disponible lorsque le modèle de données à utiliser est CQL3.

Pour plus d'informations concernant les comparateurs, consultez http://www.datastax.com/docs/1.1/ddl/column_family#about-data-types-comparators-and-validators (en anglais).

SSTable directory

Spécifiez le répertoire local pour la table SSTable. Notez que le chemin d'accès complet à la table SSTable comprend le répertoire local à la suite du Keyspace spécifié et du nom de la famille de colonnes.

Par exemple, si vous configurez le répertoire local à /home/talend/sstable et que vous spécifiez testk comme nom du Keyspace et testc comme nom de la famille de colonnes, le chemin d'accès complet à la table SSTable est /home/talend/sstable/testk/testc/.

Buffer size

Spécifiez la taille à partir de laquelle écrire la table SSTable dans Cassandra.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Règle d'utilisation

Ce composant nécessite un lien d'entrée.