转换作业 - 7.2

Talend Big Data Platform 入门指南

EnrichVersion
7.2
EnrichProdName
Talend Big Data Platform
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
task
数据治理
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发
将现有的 Spark Batch 作业转换为 Spark Streaming 作业。

开始之前

过程

  1. Repository (存储库) 树视图中,展开 Job Designs (作业设计) 节点、Big Data Batch (大数据批处理) 节点,然后展开 getting_started 文件夹和 spark 文件夹。
  2. 右键单击 aggregate_movie_director_spark 作业,然后从上下文菜单中选择 Duplicate (复制)

    复制 (Duplicate) 窗口即会打开。

  3. Input new name (输入新名称) 字段中,将此副本命名为 aggregate_movie_director_spark_streaming
  4. Job Type (作业类型) 下拉列表中,选中 Big Data Streaming (大数据流式处理)
  5. Framework (框架) 列表中,选中 Spark Streaming 并单击 OK (确定) 确认更改。

    aggregate_movie_director_spark_streaming 作业将显示在 Repository (存储库)Big Data Streaming (大数据流式处理) 节点下方。

  6. 右键单击该节点并从上下文菜单中选择 Create folder (创建文件夹)
  7. New Folder (新建文件夹) 向导中,将新文件夹命名为 streaming_movies 并单击 Finish (完成) 创建文件夹。
  8. aggregate_movie_director_spark_streaming 作业拖放到此 streaming_movies 文件夹。

结果

这个新的 Spark Streaming 作业现在即可进行进一步编辑。