Hortonworks_Sandbox_Samples (Map/Reduce Jobs) - 6.1

Talend Data Fabric Guide de prise en main

EnrichVersion
6.1
EnrichProdName
Talend Data Fabric
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le dossier Hortonworks_Sandbox_Samples sous le sous-nœud Map/Reduce Jobs regroupe les alternatives Map/Reduce aux Jobs contenus dans le dossier Hortonworks_Sandbox_Samples sous le sous-nœud Standard Jobs. Pour plus d'informations sur les Jobs Map/Reduce, consultez le Guide utilisateur du Studio Talend.

Dossier

Sous-dossier

Description

Advanced_Examples

ApacheWebLog

En tant qu'alternative aux Jobs standards du dossier ApacheWebLog du sous-nœud Standard Jobs, ce dossier regroupe des exemples montrant comment utiliser des Jobs Map/Reduce afin d'obtenir les mêmes résultats que ceux obtenus dans les Jobs Pig standards précédents. Ces exemples calculent le nombre d'adresses IP et de codes Web. Les résultats sont les mêmes que ceux dans les Jobs Pig précédents.

Afin que ces deux Jobs Map/Reduce fonctionnent, vous devez au préalable exécuter les Jobs des étapes 1 et 2 du dossier Advance_Examples > ApacheWebLog sous le sous-nœud Standard Jobs.

 

Gov_Spending_Analysis

En tant qu'alternative de l'étape 2 de Gov_Spending_Analysis, qui exécute des agrégations Hive du total des dépenses par agence du gouvernement, ce Job Map/Reduce montre comment obtenir les mêmes résultats d'agrégation avec un Job Map/Reduce.

Afin que ce Job Map/Reduce fonctionne, vous devez au préalable exécuter le Job de l'étape 1 dans Advance_Examples > Gov_Spending_Analysis sous le sous-nœud Standard Jobs.