増分データプロファイリングとサンプリングをスケジュール - 8.0

Talend Data Catalogユーザーガイド

Version
8.0
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Catalog
Content
データガバナンス
Last publication date
2023-11-13

プロセスを定期的に実行し、最大期間か最大データ量でプロセスを制限するようにスケジュールできます。

ブリッジは、プロファイリング結果をMIMBキャッシュに早急に保存します。複数のファイルをプロファイル化する場合は、準備ができしだい各ファイルのプロファイリング結果を保存します。

ブリッジが失敗した場合は、キャッシュ内の最終ポイントから再開します。ファイルが変更されていないことをブリッジが検出した場合は、そのファイルのプロファイリング時間をアップデートします。

保存が完了した場合、失敗した場合、最大期間または最大データ量に達した場合のいずれかにおいて、ブリッジはできる限り呼び出し側に値を返そうとします。

始める前に

[Data Management] (データの管理)機能を持つオブジェクトロールが割り当てられていること。

手順

  1. [Import Setup]タブのIncremental Importパラメーターで、True値を選択します。
  2. 次のオプションを指定します。
    • -tl 3600s 処理時間の制限(sは秒数、mは分数、hは時間数)
    • -fl 1000 処理ファイルのカウント制限

    [Help] (ヘルプ)パネルを展開してパラメーター情報を参照します。