配置映射并执行作业 - 7.3

Talend Data Management Platform 入门指南

Version
7.3
Language
中文(简体)
Operating system
Data Management Platform
Product
Talend Data Management Platform
Module
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Content
安装和升级
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发
Last publication date
2023-08-02

以下过程说明如何配置映射和内连接以输出含有效导演 ID 的影片信息。

步骤

  1. 双击 tMap 组件打开 Map 编辑器。

    Map 编辑器显示三个表,在本示例中名为 row1row2Valid_movies,分别对应于影片文件 schema、导演文件 schema 和有效影片信息的输出 schema,且 row1 表中的列已映射到 Valid_movies 表中的列。

  2. 选择 row1 表中的 directorID 列,并将其放到 row2 表中的 directorID 列,根据导演 ID 创建两个输入数据集之间的连接。
  3. 单击 tMap settings (tMap 设置) 按钮,然后单击 Join Model (连接模型)Value (值) 字段,再单击出现的 [...] 按钮打开 Options (选项) 对话框。在对话框中,选择 Inner Join (内连接),然后单击 OK (确定) 将联接定义为内连接。

    使用此设置,只有导演 ID 与引用文件中的导演 ID 匹配的影片记录才会传到输出。

  4. 在 Map 编辑器底部的 Schema editor (Schema 编辑器) 中,选择输出 schema 的 directorID 列,在本示例中为 Valid_movies,然后单击 X 按钮将其移除。
  5. 单击输出表下方的 [+] 按钮添加新列,将其命名为 directedBy,将长度设为 20,然后上移使其位于 titlereleaseYear 列之间。
  6. 选择 row2 表中的 directorName 列,并将其拖放到与输出表中的 directedBy 列对应的 Expression (表达式) 字段。

    新建了查找表和输出表之间的映射。

  7. 单击 OK (确定) 确认映射并关闭 Map 编辑器,并在系统询问是否传播更改时单击 Yes (是)

    映射配置将保存,且输出 schema 会同步到输出组件 tLogRow

  8. 按下 F6 或单击 Run (运行) 视图中的 Run (运行) 按钮来执行作业。

结果

只有含有效导演信息的影片记录才会显示在 Run (运行) 控制台上。