写入输出 - 7.2

Talend Open Studio for Big Data 入门指南

EnrichVersion
7.2
EnrichProdName
Talend Open Studio for Big Data
EnrichPlatform
Talend Studio
task
数据治理
设计和开发
两个 tFileInputDelimited 组件被配置为将预期的影片数据和拒绝的影片数据写入本地文件系统中的不同目录;然后 tAzureStoragePut 将这些文件上传到现有的 Azure Blob 容器。

过程

  1. 双击接收 out1 连接的 tFileOutputDelimited

    Basic settings (基本设置) 视图在 Studio 的下半部分打开。

  2. File Name (文件名) 字段中,输入要在其中写入结果的目录。在本场景中,目录为 C:/tos_bd_gettingstarted_source_files/temps/out.csv,将用于接收包含影片导演姓名的记录。
  3. Field separator (字段分隔符) 字段中,输入以双引号括起的 ;
  4. 单击 Advanced settings (高级设置) 选项卡以打开其视图,然后清除 Throw an error if the file already exists (当文件存在时抛出错误) 复选框,以允许组件覆盖名称相同的现有文件。
  5. 重复相同的操作,以配置接收 reject (拒绝) 连接的 tFileOutputDelimited,区别在于需要在 File Name (文件名) 字段中将目录设置为 C:/tos_bd_gettingstarted_source_files/temps/reject.csv
  6. 双击 tAzureStoragePut 打开其 Component (组件) 视图。
  7. Account Name (帐户名称) 字段和 Account Key (帐户密钥) 字段中,输入要使用的 Azure Blob 存储帐户的用户名和密码。确保系统管理员为此存储帐户分配适当的访问权限。
  8. Container name (容器名称) 字段中,输入要使用的 Azure Blob 容器的名称。此容器必须已经存在。
  9. Local folder (本地文件夹) 字段中,输入 tFileOutputDelimited 组件要在其中写入输出文件的目录。在此示例中,目录为 C:/tos_bd_gettingstarted_source_files/temps
  10. Azure storage folder (Azure 存储文件夹) 字段中,输入用于存储要上传到 Azure 的数据的文件夹名称。如果文件夹不存在,则会在 Container name (容器名称) 字段中指定的上述容器中即时创建此文件夹。
  11. F6 运行作业。

结果

Run (运行) 视图将在 Studio 的下半部分自动打开,并显示此作业的执行进度。

完成后,即可检查输出是否已写入 Azure Blob 存储容器中。