Ces propriétés sont utilisées pour configurer le tHMapInput s'exécutant dans le framework de Jobs Spark Batch.
Le composant tHMapInput Spark Batch appartient à la famille Traitement.
Ce composant est disponible dans les produits Talend Platform avec Big Data et dans Talend Data Fabric.
Paramètres simples
Storage |
Pour vous connecter à une installation HDFS, cochez la case Define a storage configuration component et sélectionnez le nom du composant à utiliser, parmi ceux disponibles dans la liste déroulante. Cette option nécessite d'avoir précédemment configuré la connexion à l'installation HDFS à utiliser, comme décrit dans la documentation du composant tHDFSConfiguration. Si vous laissez la case Define a storage configuration component décochée, vous pouvez convertir les fichiers seulement en local. |
Configure Component |
Avant de configurer ce composant, vous devez déjà avoir ajouté un composant en aval et l'avoir lié au tHMapInput, ainsi que d'avoir récupéré le schéma du composant en aval. Pour configurer le composant, cliquez sur le bouton [...] et, dans la fenêtre Component Configuration, effectuez les actions suivantes.
|
Input |
Cliquez sur le bouton [...] pour définir le chemin d'accès à l'emplacement où est stocké le fichier d'entrée. |
Open Map Editor |
Cliquez sur le bouton [...] pour ouvrir le mapping et le modifier dans l'éditeur Map Editor de Talend Data Mapper . Pour plus d'informations, consultez le Guide d'utilisation du Talend Data Mapper. |
Synchronize map with schema connections |
Cochez cette case si vous souhaitez générer à nouveau automatiquement vos structures d'entrée et de sortie de map après modification de l'une d'entre elles :
Si cette case est cochée, la map est automatiquement synchronisée lorsqu'elle est ouverte à partir du composant, après une modification. Sinon, une boîte de dialogue s'ouvre et vous propose de synchroniser.
Remarque : Pour les structures avec plusieurs connexions, la map peut uniquement être synchronisée si les structures ont été créées de la même manière que celles générées par l'assistant de configuration du composant. Par exemple, les maps d'aplatissement avec plusieurs sorties ne peuvent être synchronisées.
|
Die on error |
Cette case est cochée par défaut. Décochez la case pour ignorer les lignes en erreur et terminer le traitement des lignes sans erreur. Si vous décochez cette case, vous pouvez exécuter les options suivantes :
Remarque : Les erreurs qui surviennent durant les tentatives de stockage des rejets sont enregistrées et le traitement continue.
|
Utilisation
Usage rule |
Ce composant est utilisé avec le tHDFSConfiguration, définissant la connexion au stockage HDFS. Ce composant est un composant d'entrée et nécessite un flux de sortie. |
Utilisation avec Talend Runtime | Si vous souhaitez déployer un Job ou une Route contenant un composant de mapping de données avec Talend Runtime, vous devez d'abord installer la fonctionnalité Talend Data Mapper. Pour plus d'informations, consultez Utiliser Talend Data Mapper avec Talend Runtime. |