配置数据转换组件 - 7.2

Talend Open Studio for Big Data 入门指南

EnrichVersion
7.2
EnrichProdName
Talend Open Studio for Big Data
EnrichPlatform
Talend Studio
task
数据治理
设计和开发

tMap 组件配置为连接影片数据和导演数据。

将影片数据和导演数据加载到作业后,您需要配置 tMap 组件以联接它们来产生您所期望的输出。

过程

  1. 双击 tMap 打开其 Map Editor (Map 编辑器) 视图。
  2. movieID 列、title (标题) 列、releaseYear 列和 url 列从左侧拖放到每个输出流表上。

    Map Editor (Map 编辑器) 的输入侧 (左侧),每个表表示一个输入流,上表表示主流,下表表示查找流。

    如果您将 tMap 连接到 拖放和连接组件 中的 tFileOutputDelimited,输出侧 (右侧) 的两个表表示命名为 out1reject (拒绝) 的输出流。

  3. 在输入侧,将 directorID 列从主流表拖放到查找流表中 ID 行的 Expr.key 列。

    这样一来,就定义了主流和查找流之间的连接键。

  4. directorID 列从主流表拖放到输出侧的 reject (拒绝) 表,并将 Name (名称) 列从查找流表拖放到 out1 表。

    前两个步骤中的配置描述了输入数据的列如何映射到输出数据流的列。

    从编辑器下半部分的 Schema editor (Schema 编辑器) 视图中,您可以看到两侧的 schema 均已自动完成。

  5. out1 输出流表上,单击 按钮显示筛选表达式的编辑字段。
  6. 输入 row1.directorId != null

    这可让 tMap 仅输出 directorID 字段不为空的影片记录。筛选出一条具有空 directorID 字段的记录。

  7. reject (拒绝) 输出流表上,单击 按钮打开设置面板。
  8. Catch Output Reject (获取输出拒绝) 行中,选择 true,输出 reject (拒绝) 流中具有空 directorID 字段的记录。
  9. 单击 Apply (应用),然后单击 OK (确定) 确认这些更改并接受弹出对话框提示的传播。

结果

现在,转换即会配置为用导演名称填写影片数据,并将不包含任何导演数据的影片记录写入单独的数据流。