转换作业 - 7.1

Talend Big Data 入门指南

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
task
数据治理
设计和开发
EnrichPlatform
Talend Administration Center
Talend Installer
Talend Runtime
Talend Studio
将现有的 MapReduce 作业转换为 Spark Batch 作业,可让您充分利用现有资产轻松创建 Spark 作业。

开始之前

过程

  1. Repository (存储库) 树视图中,展开 Job Designs (作业设计) 节点、Big Data Batch (大数据) 节点,然后展开 getting_started 文件夹和 mapreduce文件夹。
  2. 右键单击 aggregate_movie_director_mr 作业,然后从上下文菜单中选择 Duplicate (复制)

    复制 (Duplicate) 窗口即会打开。

  3. Input new name (输入新名称) 字段中,将此副本命名为 aggregate_movie_director_spark_batch
  4. Framework (框架) 列表中,选中 Spark 并单击 OK (确定) 确认更改。

    aggregate_movie_director_spark_batch 作业显示在 Repository (存储库) 中的 mapreduce 文件夹中。

  5. 右键单击 getting_started 文件夹并从上下文菜单中选择 Create folder (创建文件夹)
  6. New Folder (新建文件夹) 向导中,将新文件夹命名为 spark_batch 并单击 Finish (完成) 创建文件夹。
  7. aggregate_movie_director_spark_batch 作业拖放到此 spark_batch 文件夹。

结果

这个新的 Spark Batch 作业现在即可进行进一步编辑。