将数据写入 HDFS - 8.0

Talend Data Fabric 入门指南

Version
8.0
Language
中文(简体)
EnrichDitaval
Data Fabric
Product
Talend Data Fabric
Module
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Content
数据治理
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发

步骤

  1. 双击 tAvroOutput 打开其 Component (组件) 视图。
  2. 确保选中 Define a storage configuration component (定义存储配置组件) 复选框。
  3. Folder (文件夹) 字段中输入路径,或浏览到写入数据的文件夹。
  4. Action (操作) 列表中选择需要对相关文件夹执行的操作。如文件夹已存在,选择 Overwrite (改写),否则选择 Create (创建)
  5. F6 运行此作业.

结果

工作区的统计区域显示所生成数据集的处理进度,分段并按批次计算。

完成后,可在正在使用的 HDFS 系统的 Web 控制台中查看结果。

您可以看到 basic_example- 文件夹是连续创建的,单击可打开其中之一,内含此作业写入的 avro 文件。

请注意,并非所有 basic_example- 文件夹都包含实际数据。