データ出力の設定 - 7.2

Text standardization

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化 > テキスト標準化コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化 > テキスト標準化コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化 > テキスト標準化コンポーネント

手順

  1. tAggregateRowをダブルクリックして、[Basic settings] (基本設定)ビューを表示し、コンポーネントのプロパティを定義します。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして、ダイアログボックスを開きます。ここで出力フローを定義できます。
  3. ダイアログボックスの右側の出力フローで、[+]ボタンをクリックして、出力フローに必要な数のカラムを追加します。
    この例では、2つの出力カラム、[translation] (変換)カラムおよび[count] (カウント)という新しい出力カラムが必要です。
    完了したら、[OK]をクリックしてダイアログボックスを閉じ、次の手順に進みます。
  4. tAggregateRow基本設定ビューおよび[Group by] (グループ化)エリアで、[+]ボタンをクリックして、必要に応じて複数の行を追加します。ここでは、グループ化の値を定義できます。
    • [Output column] (出力カラム)の行をクリックし、集計データを保持する出力カラム、この例では[translation] (変換)カラムを選択します。

    • [Input column position] (入力カラムの位置)行をクリックし、集計する値を収集する入力カラム、この例では[translation] (変換)カラムを選択します。

  5. [Operations] (操作)エリアで、[+] ボタンをクリックして、集計データを保持するカラムの行を追加します。ここで、計算値を定義できます。
    • [Output column] (出力カラム)の行をクリックし、変換先カラム、この例では[translation] (変換)カラムをリストから選択します。

    • [Function] (関数)カラムの行をクリックし、リスト表示された操作のいずれかを選択します。

      この例では、出力カラムに1回だけ表示される個別の語幹の数をカウントします。

    • [Input column position] (入力カラムの位置)行をクリックし、集計する値を収集する入力カラム、この例では[id_key]カラムを選択します。

  6. tFileOutputExcelをダブルクリックして、[Basic settings] (基本設定)ビューを表示し、コンポーネントのプロパティを定義します。
  7. 目的のファイルパスを設定し、必要に応じてファイルの設定を定義します。