Lire le fichier de registre à analyser dans la chaîne Pig - 7.1

Exemples de Jobs Big Data

EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Création de Jobs
Création et développement > Création de Jobs > Distributions Hadoop
Création et développement > Création de Jobs > Frameworks de Jobs > Standard

Procédure

  1. Double-cliquez sur le tPigLoad afin d'ouvrir sa vue Basic settings.
  2. Afin d'utiliser une connexion à HDFS centralisée, ouvrez la liste Property Type et sélectionnez Repository. Cliquez ensuite [...] afin d'ouvrir la boîte de dialogue [Repository Content].
  3. Sélectionnez la connexion à HDFS définie pour la connexion à la base de données HDFS puis cliquez sur OK.

    Tous les détails de connexion sont automatiquement saisis dans les champs appropriés.

  4. Sélectionnez le schéma générique de access_log depuis le Repository et déposez-le sur le composant afin d'appliquer le schéma.
  5. Dans la liste Load function, sélectionnez PigStorage et saisissez, dans le champ Input file URI le chemin défini dans le Job précédent, /user/hdp/weblog/access_log/out.log dans cet exemple.