入力データのフィルタリングと集計 - 7.3

CombinedSQL

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > ELTコンポーネント > CombinedSQL
データガバナンス > サードパーティーシステム > ELTコンポーネント > CombinedSQL
データクオリティとプレパレーション > サードパーティーシステム > ELTコンポーネント > CombinedSQL

手順

  1. デザインワークスペースでtCombinedSQLFilterを選択して、[Component] (コンポーネント)タブをクリックして設定パネルにアクセスします。
  2. [Sync columns] (カラムの同期)ボタンをクリックして既存のコンポーネントからスキーマを取得するか、[Schema] (スキーマ)リストから[Built-in] (組み込み)を選択し、[Edit schema] (スキーマを編集)の横にある[...]をクリックして手動でスキーマを設定します。
    tCombinedSQLFilterのデータ構造を定義すると、[Conditions] (条件)テーブルの[Input column] (入力カラム)リストにカラム名が自動的に表示されます。
    このシナリオでは、tCombinedSQLFilterコンポーネントにより[id]、[state]、[date_of_birth]、および[salary]という4列のカラムがインスタンス化されます。
  3. [Conditions] (条件)テーブルでは、これらの基準を満たすレコードのみを抽出するために、入力パラメーター、演算子および予想される値をセットします。
    [Conditions] (条件)テーブルの[+]ボタンを2回クリックし、[Input column] (入力カラム)でドロップダウンリストから[state]および[date_of_birth]を選択します。
    このシナリオでは、tCombinedSQLFilterコンポーネントにより、ソーステーブルのカラムstatedate_of_birthカラムがフィルタリングされ、生年月日が1960年10月19日以降でUtahOhioIowaに住んでいる従業員が抽出されます。
  4. [state]のカラムの場合、ドロップダウンリストからINを演算子として選択し、値として'Utah'、 'Ohia'、 'Iowa'を入力します 。
  5. [date_of_birth]のカラムの場合、ドロップダウンリストから>を演算子として選択し、値として('1960-10-19')を入力します
  6. [Logical operator between conditions] (条件間の論理演算子)リストから[And] (および)を選択して、2つの条件を同時に適用します。[Use custom SQL] (カスタムSQLの使用)ボックスを選択し、コードボックスで条件を編集して条件をカスタマイズすることもできます。
  7. デザインワークスペースで、tCombinedSQLAggregateを選択し、[Component] (コンポーネント)タブをクリックして設定パネルにアクセスします。
  8. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、の設定を入力します:
    tCombinedSQLAggregateコンポーネントは、前のコンポーネントから来る[id]、[state]、[date_of_birth]、および[salary]の4列のカラムをインスタンス化します。
  9. [Group by] (グループ化)テーブルは、定義されたカラムに基づいて処理するデータセットを定義するのに役立ちます。この例では[State]になります。
    [Group by] (グループ化)テーブルで、[+]ボタンをクリックして1行追加します。
  10. [Output column] (出力カラム)ドロップダウンリストから[State]を選択します。このカラムは[State] (状態)でフィルタリングされたデータを保持するために使用されます。
  11. [Operations] (操作)テーブルは、実行する集計操作のタイプを定義するのに役立ちます。利用可能な[Output column] (出力カラム)リストは、(tCombinedSQLOutput コンポーネントを使用して)出力するスキーマによって異なります。このシナリオでは、従業員が住んでいる州に基づいてデータをグループ化します。次に、州ごとの従業員の数をカウントし、平均/最低/最高の給与だけでなく、各州の最高齢/最年少の従業員を計算します。
  12. [Operations] (操作)テーブルで、[+]ボタンをクリックしてカラムを追加し、[Output column] (出力カラム)リストをクリックして、計算されたデータを保持する出力カラムを選択します。
  13. [Function] (関数)フィールドで、実行する関連作業を選択します。