Composants Talend Snowflake - 7.3

Snowflake

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Stockages Cloud > Composants Snowflake
Gouvernance de données > Systèmes tiers > Stockages Cloud > Composants Snowflake
Qualité et préparation de données > Systèmes tiers > Stockages Cloud > Composants Snowflake
Last publication date
2024-02-22
Deux méthodes sont disponibles pour vous connecter à et interagir avec Snowflake à partir d'un Job Talend : les composants Snowflake et les composants JDBC.

La méthode à favoriser est d'utiliser les nouveaux composants Snowflake, qui offrent une connectivité native et une manipulation directe des données au sein d'un service Snowflake.

Vous pouvez également utiliser les composants JDBC génériques, qui offrent une plus grande diversité de fonctionnalités lorsque la définition de données est requise. Ensemble, ces fonctionnalités d'intégration de Snowflake fournissent aux développeurs et développeuses Talend des options de traitement des données Snowflake au sein des Jobs Talend.

tSnowflakeConnection et tJDBCConnection

Examinez la manière dont Snowflake fonctionne dans les Jobs Talend.

Dans le premier exemple, le composant tSnowflakeConnection établit la connexion. Utilisez-le en spécifiant la définition de la connexion et les paramètres requis (référez-vous aux détails décrits dans Connectivité de Talend Snowflake), ou modifiez le paramètre de connexion Property Type de Built-In à Repository et sélectionnez l'une des connexions définies précédemment créées.

Le second exemple présente l'utilisation du composant tJDBCConnection. Renseignez les champs requis ou modifiez la propriété Property Type de Built-In à Repository et sélectionnez l'une des connexions définies précédemment créées.

Dans un cas comme dans l'autre, gardez à l'esprit les bonnes pratiques et vérifiez que votre connexion est valide dans le Job. Terminez l'exécution si une connexion n'est pas établie lors de l'exécution.

tWarn et tDie

La bonne pratique est d'incorporer les composants tWarn et tDie. De plus, une fois qu'un Job comprend une connexion à Snowflake, elle peut être utilisée par d'autres composants requis pour la manipulation de données.

tSnowflakeClose et tJDBCClose

La bonne pratique lors de l'utilisation d'une connexion à Snowflake est de vous assurer que vous fermez la connexion avant de quitter le Job Talend. Utilisez le tSnowflakeClose ou le tJDBCClose à cet effet.
Ils sont généralement déclenchés par le composant tPostJob.

tSnowflakeInput et tSnowflakeOutput

Les étapes finales utilisent les composants tSnowflakeInput et tSnowflakeOutput afin de manipuler les données dans une connexion Snowflake. Ces deux composants permettent de sélectionner dans la liste Property Type le paramètre de connexion Built-In ou Repository. Vous pouvez également choisir parmi les objets de connexion créés dans le Job Talend, comme présenté précédemment. Ces deux composants fonctionnent comme la plupart des autres composants de bases de données de la Palette du Studio, comme les composants Oracle, MS SQL Server ou MySQL. Si vous avez l'habitude de les utiliser, sachez que ces nouveaux composants Snowflake fonctionnent d'une manière similaire.

Cet exemple présente le tSnowflakeInput utilisant une connexion déclarée dans le Job. Le type de Schema sélectionné détermine le nom de la table. La Condition permet d'utiliser un filtre (semblable à une clause WHERE clause) à ajouter à la récupération de données. Le composant tSnowflakeInput est également utilisé, pour effectuer un lookup sur un composant tMap, ce qui base la jointure SQL sur le schéma.
Remarque : Le composant tSnowflakeInput supporte une fonctionnalité SELECT implicite basée sur le schéma spécifié de la table sélectionnée.
L'exemple suivant présente le composant tSnowflakeOutput, pour lequel la connexion est sélectionnée depuis Project Repository et est utilisée lors de l'exécution. Une fois l'opération du composant terminée (le jeu de données passé a été inséré), la connexion se ferme. Cette technique fournit au concepteur du Job le choix de la gestion de connexion.
Remarque : Le composant tSnowflakeOutput supporte les fonctionnalités INSERT, UPDATE, UPSERT et DELETE.
Les composants JDBC correspondants, le tJDBCInput et le tJDBCOutput peuvent être également utilisés, même si ces opérations vont effectuer leur traitement via le pilote JDBC et contourner la connectivité native fournie par les composants Snowflake.

tJDBCRow

Le dernier composant, le tJDBCRow peut être utilisé pour traiter des instructions SQL spécifiques par rapport à une connexion Snowflake JDBC. Un composant natif correspondant, le tSnowflakeRow, n'est pas disponible dans cette version. Il pourrait cependant exister dans une future version du Studio Talend.