以下过程说明如何配置映射和内连接以输出含有效导演 ID 的影片信息。
步骤
-
双击 tMap 组件打开 Map 编辑器。
Map 编辑器显示三个表,在本示例中名为 row1、row2 和 Valid_movies,分别对应于影片文件 schema、导演文件 schema 和有效影片信息的输出 schema,且 row1 表中的列已映射到 Valid_movies 表中的列。
-
选择 row1 表中的 directorID 列,并将其放到 row2 表中的 directorID 列,根据导演 ID 创建两个输入数据集之间的连接。
-
单击 tMap settings (tMap 设置) 按钮,然后单击 Join Model (连接模型) 的 Value (值) 字段,再单击出现的 [...] 按钮打开 Options (选项) 对话框。在对话框中,选择 Inner Join (内连接),然后单击 OK (确定) 将联接定义为内连接。
使用此设置,只有导演 ID 与引用文件中的导演 ID 匹配的影片记录才会传到输出。
- 在 Map 编辑器底部的 Schema editor (Schema 编辑器) 中,选择输出 schema 的 directorID 列,在本示例中为 Valid_movies,然后单击 X 按钮将其移除。
-
单击输出表下方的 [+] 按钮添加新列,将其命名为 directedBy,将长度设为 20,然后上移使其位于 title 和 releaseYear 列之间。
-
选择 row2 表中的 directorName 列,并将其拖放到与输出表中的 directedBy 列对应的 Expression (表达式) 字段。
新建了查找表和输出表之间的映射。
-
单击 OK (确定) 确认映射并关闭 Map 编辑器,并在系统询问是否传播更改时单击 Yes (是)。
映射配置将保存,且输出 schema 会同步到输出组件 tLogRow。
-
按下 F6 或单击 Run (运行) 视图中的 Run (运行) 按钮来执行作业。
结果
只有含有效导演信息的影片记录才会显示在 Run (运行) 控制台上。