日付形式の調整 - Cloud

Talend Cloud Data Preparation入門ガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2024-03-11

Talend Cloud Data Preparationでは多種多様な日付形式がサポートされているため、これらの形式を調整してデータを改善できます。

データが、dateとして設定されたセマンティックタイプに従っているにもかかわらず、[SubDate] (サブ日付)カラムには複数の日付形式があります。そのため、欧州と米国の標準である-/が混在しています。

カラムで欧州と米国の日付が混在している状態。

SubDate (サブ日付)カラムを調整して、全データに1つの日付形式だけを設定します。これを行うには、次の手順に従います。

手順

  1. SubDate (サブ日付)カラムのヘッダーをクリックしてその内容を選択します。
    SubDateカラムが選択されている状態。
  2. 右下の統計ボックスの[Pattern] (パターン)をクリックします。
    統計ボックスで[Pattern] (パターン)機能が選択されている状態。

    このタブには、現在使用されているさまざまな日付形式をよりわかりやすく表示されます。欧州の標準とアメリカの形式に従っている日付が混在しています。いずれにしても、dd-MMM-yyyy形式が最も多く使用されていることがわかります。

  3. 日付形式を標準化するには、ファンクションリストの[Change Date Format...] (日付形式を変更…)をクリックします。
    テーブルファンクションリストで、[Change Date Format...] (日付形式を変更…)が選択されている状態。

    メニューが開いたら、現在の日付形式と希望の日付形式を指定します。

  4. [Current format] (現在の形式)ドロップダウンリストで、[I don't know, best guess] (最も妥当と思われるもの)を選択したままにします。
  5. [New format] (新しい形式)ドロップダウンリストで[Other] (その他)を選択します。
  6. [Your format] (ユーザー形式)フィールドに「dd-MMM-yyyy」と入力します。
    設定中の[Change Date Format...] (日付形式を変更…)ファンクション。

    dd-MMM-yyyy形式は既に出現数が最も多いので、最も適しています。

タスクの結果

SubDate (サブ日付)カラムは1つの日付形式だけに従うので、日付が見やすくなります。また、レシピでは最後のアクションが強調表示されているので、このレシピで日付形式を直接変更し直すこともできます。
レシピが最後のアクションとその設定を展開している状態。