要使用的 DBFS、Azure 和处理组件在作业工作区中编排,以构成数据转换的完整过程。
步骤
-
在作业中,输入要使用的组件的名称,然后从显示的列表中选择此组件。在本场景中为两个 tFileInputDelimited 组件、一个 tMap 组件、两个 tFileOutputDelimited 组件、一个 tDBFSConnection 组件、一个 tDBFSGet 组件和一个 tAzureStoragePut 组件。
-
双击 tFileInputDelimited 组件以使此标签可编辑,然后输入 movie (影片) 以更改此组件的标签。
-
执行相同的操作,将另一个 tFileInputDelimited组件 标记为 director (导演)。
-
右键单击 tDBFSConnection,然后从显示的上下文菜单中选择 。
-
单击 tDBFSGet 将 tDBFSConnection 连接到 tDBFSGet。
-
重复相同的操作,以始终使用 On Subjob Ok (子作业正常时) 连接,将 tDBFSGet 连接到标记为 movie (影片) 的 tFileInputDelimited 组件,然后将相同的 tFileInputDelimited 组件连接到 tAzureStoragePut。
-
右键单击标记为 movie (影片) 的 tFileInputDelimited 组件,然后从上下文菜单中选择 并单击 tMap 以连接这两个组件。这是将影片数据发送到 tMap 的数据流连接,它作为 tMap 的 Main Link(主连接)。
-
执行相同的操作,使用 连接将 director (导演) tFileInputDelimited 组件连接到 tMap。这是导演数据作为查找数据发送到 tMap 的 Lookup (查找) 连接。
-
执行相同的操作,使用 连接将 tMap 组件连接到 tFileOutputDelimited,然后在弹出向导中将此连接命名为 out1,并单击 OK (确定) 以确认更改。
-
重复这些操作,使用 连接将 tMap 组件连接到另一个 tFileOutputDelimited 组件,并将其命名为 reject (拒绝)。