メールアドレスを重複除去 - Cloud - 7.3

Talendジョブスクリプトリファレンスガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend CommandLine
Talend Studio
Content
ジョブデザインと開発 > ジョブデザイン
Last publication date
2023-09-13

重複するメールアドレスを特定するtUniqRowコンポーネントを追加するには、以下のようにします:

手順

  1. tFileInputDelimitedコンポーネントの次に、新しいaddComponent {}関数とそのサブ関数setComponentDefinition {}を追加してtUniqRowコンポーネントを追加します。
    addComponent {
    	setComponentDefinition {
    		TYPE: "tUniqRow",
    		NAME: "tUniqRow_1",
    		POSITION: 416, 192
    	}
    
    }
  2. setComponentDefinition {}関数の次に、setSettings {}関数を入力して重複除去プロセスを定義し、コンポーネントのラベルを設定します。
    	setSettings {
    		UNIQUE_KEY {
    			SCHEMA_COLUMN : "email",
    			KEY_ATTRIBUTE : "true"
    		},
    		LABEL : "deduplicate"
    	}
  3. setSettings {}関数の次に、2つのaddSchema {}関数を入力して、ユニークなメールアドレス用の出力フローと、重複用の出力フローのスキーマを定義します。
    	addSchema {
    		NAME: "UNIQUE",
    		CONNECTOR: "UNIQUE"
    		addColumn {
    			NAME: "email",
    			TYPE: "id_String"
    		}
    	}
    	addSchema {
    		NAME: "DUPLICATE",
    		CONNECTOR: "DUPLICATE"
    		addColumn {
    			NAME: "email",
    			TYPE: "id_String"
    		}
    	}