セマンティックタイプがディクショナリーまたは複合型に基づいているカラム内のセルを編集する時に、アプリケーションはこのディクショナリーに含まれている値を入力の途中で自動的に提案します。これは、カラム全体が同じ基準に従うようにするためです。
この例では、米国の州コードをはじめとする顧客データが含まれているデータセットで作業しています。Texasの出現に2文字のコードフォーマットで正しく入力されていないものがあるため、Stateカラムでデータの一部が無効と見なされ、クオリティバーに示されます。エラーが含まれている行を隔離し、オートコンプリートでセルの1つを編集し、同一のセルすべてに変更を適用することで、カラム全体を1つの操作で修正します。
始める前に
オートコンプリートメニューは、セマンティックタイプが
Talend Data Preparationにデフォルトで存在する値のディクショナリーや複合型に基づいている場合、または
Talend Dictionary Serviceで作成された場合のみ使用できます。カスタムセマンティックタイプを作成したり、既存のものを編集したりする方法の詳細は、
セマンティックタイプライブラリーをエンリッチ化を参照してください。
手順
-
Stateカラムで、クオリティバーのオレンジの部分をクリックし、[Select rows with invalid values for State] (州の値が無効な行を選択)をクリックしてフィルターを適用し、Texasを含む行を隔離します。
-
Stateカラムで、Texasの1つをダブルクリックします。
これでセルのコンテンツを編集できるようになります。以前の値を削除すると、ドロップダウンリストが開き、US State Code
ディクショナリーベースのセマンティックタイプの一部である値がアルファベット順にすべて提案されます。
-
Texasのコードは表示される最初の結果の一部ではないため、Tと入力して結果を見てみます。
入力を進めるにつれて、より正確な候補だけが表示されるようになります。ただし、予期される値が元のリストで既に見つかる場合は、この値を直接選択できます。
-
絞り込まれたこのリストから、Texasに対応する州コードであるTXを選択します。
-
値の入力または選択を終えたら、表示されるチェックボックス[Apply to all cells with this value] (この値を持つすべてのセルに適用する)をオンにします。
このセルで行った変更が、正しくない他の値にも適用されます。
-
[Submit] (送信)をクリックします。
タスクの結果
候補を予測表示するこのファンクションにより、適用する新しい値は正しい形式になります。正しくないその他すべての
[Texas] (テキサス)の出現が、1回の操作で正しい州コード
TXに置換されます。クオリティバーに、
Stateカラムのデータがすべて有効であると示されています。