转换作业 - 7.2

Talend Big Data Platform 入门指南

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data Platform
task
数据治理
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
将现有的 Spark Batch 作业转换为 Spark Streaming 作业。

开始之前

过程

  1. Repository (存储库) 树视图中,展开 Job Designs (作业设计) 节点、Big Data Batch (大数据批处理) 节点,然后展开 getting_started 文件夹和 spark 文件夹。
  2. 右键单击 aggregate_movie_director_spark 作业,然后从上下文菜单中选择 Duplicate (复制)

    复制 (Duplicate) 窗口即会打开。

  3. Input new name (输入新名称) 字段中,将此副本命名为 aggregate_movie_director_spark_streaming
  4. Job Type (作业类型) 下拉列表中,选中 Big Data Streaming (大数据流式处理)
  5. Framework (框架) 列表中,选中 Spark Streaming 并单击 OK (确定) 确认更改。

    aggregate_movie_director_spark_streaming 作业将显示在 Repository (存储库)Big Data Streaming (大数据流式处理) 节点下方。

  6. 右键单击该节点并从上下文菜单中选择 Create folder (创建文件夹)
  7. New Folder (新建文件夹) 向导中,将新文件夹命名为 streaming_movies 并单击 Finish (完成) 创建文件夹。
  8. aggregate_movie_director_spark_streaming 作业拖放到此 streaming_movies 文件夹。

结果

这个新的 Spark Streaming 作业现在即可进行进一步编辑。