Propriétés du tFileOutputParquet pour Apache Spark Batch - 7.0

Parquet

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants File (Intégration) > Composants Parquet
Gouvernance de données > Systèmes tiers > Composants File (Intégration) > Composants Parquet
Qualité et préparation de données > Systèmes tiers > Composants File (Intégration) > Composants Parquet
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tFileOutputParquet s'exécutant dans le framework de Jobs Spark Batch.

Le composant tFileOutputParquet Spark Batch appartient à la famille File.

Basic settings

Define a storage configuration component

Property type

 

 

Les champs suivants sont prérenseignés avec les données récupérées.

Schema et Edit Schema

 

 

Folder/File

Action

Sélectionnez une opération pour l'écriture des données :

Create : crée un fichier et écrit des données dans ce fichier.

Overwrite : écrase le fichier existant dans le répertoire spécifié dans le champ Folder.

Compression

Par défaut, l'option Uncompressed est active mais vous pouvez sélectionner Gzip ou Snappy pour compresser les données de sortie.

Advanced settings

Utilisation

Règle d'utilisation

Spark Connection