セマンティック認識を活用し、スマート入力を使って日付を曜日に変換 - Cloud

Talend Cloud Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
EnrichPlatform
Talend Data Preparation

スマート入力機能では入力する例に基づき、特定のセマンティックタイプに対応するデータ(国、電子メール、URL、米国の郵便番号と州、日付)を認識し、フォーマット化することもできます。

市内に数店舗を構える小規模の流通企業を例にとってみましょう。次のデータセットは、毎日の合計販売数が該当する日付と共に記録されるしくみを表したものです。日付の入力にはdd/MM/yyyyというフォーマットが使われますが、統計分析を行って最も収益が高い曜日を知るため、該当する曜日も表示したいとします。このシナリオでは、スマート入力関数を使ってこの情報を抽出する方法を説明します。

手順

  1. [state] (日付)カラムのヘッダーをクリックし、内容を選択します。
  2. 関数パネルでMagic fillと入力し、結果をクリックして関連する関数のオプションを表示します。
  3. [Input 1] (入力1)フィールドに、変換する[date] (日付)カラムの値の1つ(17/01/2018など)を入力します。
  4. [Output 1] (出力1)フィールドに、対応する曜日であるWednesdayを入力します。
    関数を動作させるには、適用する変換の少なくとも2つの完全な例を入力する必要があります。その後、あと3つまで例を追加できます。例はデータセットから取得できますが、他の有効な日付/日の組み合わせを使用することも可能です。入力する例が多いほど、関数によって識別される変換の精度が上がります。
  5. 残りのフィールドで、例の前後にデータを追加入力します:
    • [Input 2] (入力2)02/11/2018[Output 2] (出力2)Friday
    • [Input 3] (入力3)06/12/2018[Output 3] (出力3)Thursday
    • [Input 4] (入力4)22/09/2019[Output 4] (出力4)Sunday
    • [Input 5] (入力5)13/07/2019[Output 5] (出力5)Saturday

    関数はこれらの例に基づき、入力がすべてdd/MM/yyyyという日付であること、そして出力が該当する曜日であることを理解し、対応する変換を残りのカラムに適用します。

  6. [Submit] (送信)をクリックします。

タスクの結果

新しいカラムが作成され、最初のカラムの各日付に該当する曜日が表示されます。販売の大半が水曜日と土曜日に成立していることがわかりますが、この情報はこれまで得られらなかったものです。この後は特定の曜日にフィルターを適用したり、チャートパネルを介して集計を行い、各曜日の販売平均を算出したりすることもできます。