将数据写入 HDFS - 7.2

Talend Data Fabric 入门指南

EnrichVersion
7.2
EnrichProdName
Talend Data Fabric
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
task
数据治理
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发

过程

  1. 双击 tAvroOutput 打开其 Component (组件) 视图。
  2. 确保选中 Define a storage configuration component (定义存储配置组件) 复选框。
  3. Folder (文件夹) 字段中输入路径,或浏览到写入数据的文件夹。
  4. Action (操作) 列表中选择需要对相关文件夹执行的操作。如文件夹已存在,选择 Overwrite (改写),否则选择 Create (创建)
  5. F6 运行此作业.

结果

工作区的统计区域显示所生成数据集的处理进度,分段并按批次计算。

完成后,可在正在使用的 HDFS 系统的 Web 控制台中查看结果。

您可以看到 basic_example- 文件夹是连续创建的,单击可打开其中之一,内含此作业写入的 avro 文件。

请注意,并非所有 basic_example- 文件夹都包含实际数据。