サンプルデータの設定 - Cloud - 8.0

Sampling

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > サンプリングコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > サンプリングコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > サンプリングコンポーネント
Last publication date
2024-02-28

手順

  1. tReservoirSamplingをダブルクリックして[Basic settings] (基本設定)ビューを表示し、コンポーネントプロパティを定義します。
  2. [Edit schema] (スキーマを編集)ボタンをクリックして入力および出力カラムを表示し、必要に応じて出力スキーマに変更を施します。
  3. 入力フローから抽出する行数を[Sample Size] (サンプルサイズ)フィールドに入力します(このサンプルでは24)。
  4. [Advanced settings] (詳細設定)タブをクリックし、[Seed for random generator] (ランダムジェネレーターをシード)フィールドにランダムな数値を入力します。
    このフィールドに数値を設定すると、ジョブの実行ごとに同じサンプルが抽出されます。別のサンプルを抽出する場合は、値を変更します。