Paramètres spécifiques aux composants

Guide de référence des scripts de Jobs Talend

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Real-Time Big Data Platform
Talend Data Integration
Talend Data Fabric
Talend Big Data
Talend Big Data Platform
Talend ESB
Talend Data Services Platform
Talend Data Management Platform
Talend MDM Platform
task
Création et développement > Création de Jobs
EnrichPlatform
Talend CommandLine
Studio Talend

Le tableau suivant présente les fonctions et paramètres des scripts de Jobs que vous pouvez définir dans la fonction setSettings {} du composant.

Fonction/paramètre Description Obligatoire ?

SQL_CONTEXT

Spécifiez le langage de requête à utiliser dans le tSqlRow. Les valeurs acceptées sont :

  • SQLContext : spécifiez le langage de requête natif Spark.
  • : spécifiez le langage de requête Hive supporté par Spark.

Non

SQL_QUERY

Saisissez votre requête en faisant particulièrement attention à l'ordre des champs afin de correspondre à la définition du schéma.

Le composant tSqlRow utilise le libellé de son lien d'entrée pour nommer la table enregistrée stockant les jeux de données depuis le même lien d'entrée. Par exemple, si un lien d'entrée est nommé row1, ce row1 est le nom de la table sur laquelle effectuer les requêtes.

Oui

REGISTER_JARS {}

Dans cette fonction, utilisez le paramètre JAR_NAME pour ajouter les Jar Spark SQL ou Hive SQL UDF (user-defined function, fonction personnalisée) que vous souhaitez que le tSqlRow utilise.

Si vous ne souhaitez pas appeler votre fonction personnalisée à l'aide de son nom de classe complètement qualifié, vous devez définir un alias de fonction pour cette fonction personnalisée, dans les fonctions TEMP_SQL_UDF_FUNCTIONS {}et utiliser cet alias. Il est recommandé d'utiliser l'approche de l'alias, car un alias est souvent pratique pour appeler une fonction personnalisée à partir d'une requête.

Non

TEMP_SQL_UDF_FUNCTIONS {}

Ajoutez dans cette fonction les paramètres TEMPORARY_FUNCTION_ALIAS et UDF_FQCN pour donner à chaque fonction personnalisée importée un nom de fonction temporaire à utiliser dans la requête, dans le tSqlRow. Si vous avez spécifié le contexte Spark SQL en configurant le paramètre SQL_CONTEXT à SQLContext, vous devez inclure dans cette fonction le paramètre DATA_TYPE, afin de spécifier le type de données de sortie de la fonction personnalisée Spark SQL à utiliser.

Non

LABEL

Utilisez ce paramètre pour spécifier un libellé textuel pour le composant.

Non