重複行 - 2.5

Talend Data Preparation ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
2.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation

[Remove duplicate rows] (重複行を削除)ファンクションを使用すると、完全に重複しているすべての行を簡単に削除し、データセットに1行のみを保持することができます。

たとえば、コピーアンドペーストの失敗などのヒューマンエラー、さらには自動操作のためにスプレッドシートの情報が重複することがあります。この例では、受信したデータセットには、顧客情報がすべてシステムで複製された行が含まれています。

[Remove duplicate rows] (重複行を削除)を使用すると、データセットを簡単に消去できます。

手順

  1. データセットの任意のカラムのヘッダーをクリックします。
  2. ファンクションパネルの[Table] (テーブル)タブをクリックして、テーブル全体で適用できるファンクションの一覧を表示します。
  3. [Remove duplicate rows] (重複行を削除)ファンクションにカーソルを合わせて結果を表示し、クリックして適用します。

タスクの結果

重複した情報はすべて1回の簡単な操作で削除でき、データセットでは各行1行のみが表示されるようになります。