数据混合 - 7.3

Talend Data Preparation 入门指南

author
Talend Documentation Team
EnrichVersion
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
数据质量和准备 > 清理数据
EnrichPlatform
Talend Data Preparation

Lookup (查找) 功能允许您从现有数据集中选取数据并添加到准备中。

本示例假设:

  • 您已从本页面左侧面板的 Downloads (下载) 选项卡获取 states.csv 文件。
  • 您已将 states.csv 添加到 Talend Data Preparation 中的数据集列表中。有关如何导入数据集的更多信息,请参阅从本地文件打开数据集

本例中,要借助您拥有的引用文件添加更多关于客户的地理信息:States 数据集。本数据集包含美国州代码及其对应区域的列表。您将动态使用此数据集中的数据来补充您的准备。这将允许您根据州代码添加关于各客户订阅区域的信息。

要从另一个数据集混合数据到您的准备中,请按如下步骤继续:

过程

  1. 单击 State (州) 列标头选择其内容。
  2. 单击屏幕上部的 Lookup (查找) 图标。

    屏幕底部将打开 Add data from lookup (通过查找添加数据) 面板。

  3. 单击 + 图标以选择要添加的数据集。
    将打开之前导入的数据集列表。对您而言,仅 States 可用。
  4. 选择 States (州) 旁的复选框,然后单击 Add (添加)
    屏幕底部将打开 States 数据集。您可以看见该数据集仅包含两列,包括 State (州),该列也可在您的当前准备中看到。
  5. 在准备和数据集中选择 State (州) 列,它们将以蓝色显示。
    仅当有相同信息列时您的准备和数据集可以连接,此时为美国州代码。
  6. States 数据集中,选择 Region (区域) 列标头下的复选框 Add to Dataset (添加到数据集),将其添加到当前准备中。
  7. 将鼠标放在 Confirm (确认) 按钮上以预览更改。
  8. 单击 Confirm (确认) 按钮应用更改,并添加 Region (区域) 列到您的准备中。

结果

现在,您的数据包括从引用文件中提取的关于客户订阅区域的新信息。