Talend Data Preparationでは多種多様な日付形式がサポートされているため、これらの形式を調整してデータを改善できます。
データが、date
として設定されたセマンティックタイプに従っているにもかかわらず、[SubDate] (サブ日付)カラムには複数の日付形式があります。そのため、欧州と米国の標準である-
と/
が混在しています。
SubDate (サブ日付)カラムを調整して、全データに1つの日付形式だけを設定します。これを行うには、次の手順に従います。
手順
-
SubDate (サブ日付)カラムのヘッダーをクリックしてその内容を選択します。
-
右下の統計ボックスの[Pattern] (パターン)をクリックします。
このタブには、現在使用されているさまざまな日付形式をよりわかりやすく表示されます。欧州の標準とアメリカの形式に従っている日付が混在しています。いずれにしても、dd-MMM-yyyy
形式が最も多く使用されていることがわかります。
-
日付形式を標準化するには、ファンクションリストの[Change date format...] (日付形式を変更…)をクリックします。
メニューが開いたら、現在の日付形式と希望の日付形式を指定します。
-
[Current format] (現在の形式)ドロップダウンリストで、[I don't know, best guess] (最も妥当と思われるもの)の選択したままにします。
-
[New format] (新しい形式)ドロップダウンリストで[Other] (その他)を選択します。
-
[Your format] (ユーザー形式)フィールドに「dd-MMM-yyyy」と入力します。
dd-MMM-yyyy
形式は既に出現数が最も多いので、最も適しています。
タスクの結果
SubDate (サブ日付)カラムは1つの日付形式だけに従うので、日付が見やすくなります。また、レシピでは最後の操作が強調表示されているので、このレシピで日付形式を直接変更し直すこともできます。