准备导演文件元数据 - 7.1

Talend Open Studio for Data Integration 入门指南

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Open Studio for Data Integration
task
数据治理
设计和开发
EnrichPlatform
Talend Studio

此过程说明如何在 Repository (存储库) 中设置引用文件 directors.txt 的元数据。在本场景中,此元数据项将用于添加和设置查找输入。

开始之前

  • 目录 C:\getting_started\input_data\ 中的文件 directors.txt 已就绪。

过程

  1. Repository (存储库) 树视图中,展开 Metadata (元数据) 节点,右键单击 File delimited (分隔的文件),然后从上下文菜单中选择 Create file delimited (创建分隔的文件) 以打开 [New Delimited File (新建分隔文件)] 向导。
  2. 输入文件连接的名称 (在本例中为 directors [导演]) 以及其他有用信息,以更好地描述您的文件元数据,然后单击 Next (下一步) 继续下一步的操作并定义文件的常规属性。
  3. File (文件) 字段中,指定源文件的路径,或单击 Browse (浏览) 以浏览到该文件。

    文件已加载,File Viewer (文件查看器) 区域显示文件摘要,您可以检查文件一致性、有无标题以及文件的大体结构。

  4. Format (格式) 列表中选择 Windows,然后单击 Next (下一步) 以解析该文件。
  5. File Settings (文件设置) 区域的 Field Separator (字段分隔符) 列表中,选择 Comma (逗号)
  6. 单击 Next (下一步) 检索文件 schema。

    Description of the Schema (Schema 描述) 表显示生成的文件 schema。

  7. 将 schema 命名为 directors_schema,将列分别重命名为 directorIDdirectorName,并将 directorID 列的数据类型从 Integer (整数) 改为 String (字符串)。
  8. 单击 Finish (完成) 确认 schema 并关闭向导。

    创建的文件元数据显示在 Repository (存储库) 树视图中。

结果

现在,您在设置组件读取引用文件时可以使用导演文件元数据。