配置映射并执行作业 - 7.1

Talend Data Integration 入门指南

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Integration
task
数据治理
设计和开发
EnrichPlatform
Talend Administration Center
Talend Installer
Talend Runtime
Talend Studio

以下过程说明如何配置映射和内部联接以输出含有效导演 ID 的影片信息。

过程

  1. 双击 tMap 组件打开 Map 编辑器。

    Map 编辑器显示三个表,在本示例中名为 row1row2Valid_movies,分别对应于影片文件 schema、导演文件 schema 和有效影片信息的输出 schema,且 row1 表中的列已映射到 Valid_movies 表中的列。

  2. 选择 row1 表中的 directorID 列,并将其放到 row2 表中的 directorID 列,根据导演 ID 创建两个输入数据集之间的联接。
  3. 单击 tMap settings (tMap 设置) 按钮,然后单击 Join Model (联接模型)Value (值) 字段,再单击出现的 [...] 按钮打开 Options (选项) 对话框。在对话框中,选择 Inner Join (内部联接),然后单击 OK (确定) 将联接定义为内部联接。

    使用此设置,只有导演 ID 与引用文件中的导演 ID 匹配的影片记录才会传到输出。

  4. 在 Map 编辑器底部的 Schema editor (Schema 编辑器) 中,选择输出 schema 的 directorID 列,在本示例中为 Valid_movies,然后单击 X 按钮将其移除。
  5. 单击输出表下方的 [+] 按钮添加新列,将其命名为 directedBy,将长度设为 20,然后上移使其位于 titlereleaseYear 列之间。
  6. 选择 row2 表中的 directorName 列,并将其拖放到与输出表中的 directedBy 列对应的 Expression (表达式) 字段。

    新建了查找表和输出表之间的映射。

  7. 单击 OK (确定) 确认映射并关闭 Map 编辑器,并在系统询问是否传播更改时单击 Yes (是)

    映射配置将保存,且输出 schema 会同步到输出组件 tLogRow

  8. 按下 F6 或单击 Run (运行) 视图中的 Run (运行) 按钮来执行作业。

结果

只有含有效导演信息的影片记录才会显示在 Run (运行) 控制台上。