Accéder au contenu principal Passer au contenu complémentaire

Accéder aux données sélectionnées

Procédure

  1. Double-cliquez sur le tCacheOut pour ouvrir sa vue Component.
    Ce composant stocke les données sélectionnées dans le cache.
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur du schéma afin de vérifier que le schéma est identique à celui d'entrée. Si ce n'est pas le cas, cliquez sur le bouton Sync columns.
  3. Du côté de la sortie de l'éditeur du schéma, cliquez sur le bouton pour exporter le schéma dans le système de fichiers local et cliquez sur OK pour fermer l'éditeur.
  4. Dans la liste Storage level, sélectionnez Memory only.

    Pour plus d'informations concernant chaque niveau de stockage, consultez https://spark.apache.org/docs/latest/programming-guide.html#rdd-persistence (en anglais).

  5. Double-cliquez sur le tCacheIn pour ouvrir sa vue Component.
  6. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur du schéma et cliquez sur le bouton pour importer le schéma exporté dans l'étape précédente. Cliquez sur OK afin de fermer l'éditeur.
  7. Dans la liste Output cache, sélectionnez le composant tCacheOut duquel lire les données en cache. Lors de l'exécution, ces données seront chargées dans le flux lookup du sous-Job utilisé pour traiter le log contenant l'enregistrement des clics.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !