Propriétés HDFS
Propriétés à configurer pour une connexion à un système de fichiers distribué Hadoop (HDFS) donné.
Connexion HDFS
Propriété |
Configuration |
|
---|---|---|
Selection (Sélection) | Sélectionnez ou saisissez HDFS. | |
Configuration | ||
Moteur | Sélectionnez votre moteur dans la liste. | |
Connexion | User name (Identifiant) | Saisissez l'identifiant utilisé pour l'authentification à HDFS. |
Description | Saisissez un nom d'affichage (obligatoire) et une description (facultative) pour la connexion. |
Jeu de données HDFS
Propriété | Configuration | |
---|---|---|
Dataset name | Saisissez un nom pour le jeu de données. Ce nom sera utilisé comme identifiant unique du jeu de données dans toutes les applications Talend Cloud. | |
Connexion | Sélectionnez votre connexion dans la liste. Si vous créez un jeu de données basé sur une connexion existante, ce champ est en lecture seule. | |
HDFS data | Path (Chemin d'accès) | Saisissez le chemin d'accès aux données à récupérer dans le système de fichiers. |
Format config (Formatage de la configuration) | Auto detect (Détection auto) | Cliquez sur ce bouton pour détecter automatiquement le format des données à récupérer. |
Format | Vous pouvez également sélectionner dans la liste le format du fichier à récupérer et saisir ou sélectionner les informations relatives au format du fichier :
|
Des paramètres supplémentaires peuvent être affichés selon si le connecteur est utilisé comme jeu de données source ou de destination.
- Pour les jeux de données HDFS sources :
- Force parallelism—ignore escape char and text enclosure parameters (Forcer le parallélisme - ignorer les paramètres de caractères d'échappement et d'entourage du texte) : Activez cette option si vous souhaitez ignorer les caractères d'échappement et les caractères utilisés pour entourer le texte dans votre fichier.
- Jeux de données de destination cibles :
- Overwrite (Écraser) : Activez cette option si le fichier existe déjà et que vous souhaitez écraser son contenu.
- Merge output (Fusionner la sortie) : Activez cette option si le fichier existe déjà et que vous souhaitez fusionner le contenu existant et le contenu mis à jour du fichier.
- Map input column names to output (Mapper le nom des colonnes d'entrée à la sortie) : Cette option s'applique uniquement aux fichiers ayant un format CSV, JSON ou Excel. Elle permet de s'assurer que les noms des champs d'entrée et de sortie sont identiques.
Cette page vous a-t-elle aidé ?
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !