Procédure
-
Double-cliquez sur le tCacheOut pour ouvrir sa vue Component.
Ce composant stocke les données sélectionnées dans le cache.
- Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur du schéma afin de vérifier que le schéma est identique à celui d'entrée. Si ce n'est pas le cas, cliquez sur le bouton Sync columns.
-
Du côté de la sortie de l'éditeur du schéma, cliquez sur le bouton
pour exporter le schéma dans le système de fichiers local et cliquez sur OK pour fermer l'éditeur.
-
Dans la liste Storage level, sélectionnez Memory only.
Pour plus d'informations concernant chaque niveau de stockage, consultez https://spark.apache.org/docs/latest/programming-guide.html#rdd-persistence (en anglais).
-
Double-cliquez sur le tCacheIn pour ouvrir sa vue Component.
-
Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur du schéma et cliquez sur le bouton
pour importer le schéma exporté dans l'étape précédente. Cliquez sur OK afin de fermer l'éditeur.
- Dans la liste Output cache, sélectionnez le composant tCacheOut duquel lire les données en cache. Lors de l'exécution, ces données seront chargées dans le flux lookup du sous-Job utilisé pour traiter le log contenant l'enregistrement des clics.