tLoqateAddressRowの標準プロパティ - Cloud - 8.0

Loqate address standardization

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント > Loqateアドレス標準化コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント > Loqateアドレス標準化コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化 > 住所標準化コンポーネント > Loqateアドレス標準化コンポーネント

このプロパティはStandardジョブフレームワークで実行されているtLoqateAddressRowを設定するために使います。

[Standard] (標準) tLoqateAddressRow コンポーネントは、データクオリティファミリーに属しています。

このコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricで利用できます。

基本設定

[Schema] (スキーマ)

スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。

 

[Built-In] (組み込み): このコンポーネントに対してのみスキーマを作成し、ローカルに保管します。関連項目: Talend Studioユーザーガイドをご覧ください。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。関連項目: 『 Talend Studioユーザーガイド』を参照してください。

スキーマを編集

[...]ボタンをクリックして、アドレスデータの入力スキーマと出力スキーマを定義します。

tLoqateAddressRowから取得するフォーマット済みデータを出力するために必要なすべてのカラムを、出力スキーマで必ず定義してください。

[Input Address] (住所の入力)

[Address field] (住所フィールド): テーブルに行を追加し、入力住所を保持するフィールドを定義済みのコンポーネントリストから選択します。

tLoqateAddressRowは個々のフォールドの長いリストを表示します。一部の国の住所構造は他の国よりも複雑になるためです。入力フィールドの詳細は、tLoqateAddressRowの住所フィールドを参照してください。

[Input Column] (入力カラム): テーブルに行を追加し、入力住所を保持するカラムをリストから選択します。入力スキーマには、1つ以上のカラムを含めることができ、アドレスデータを表示しないカラムを含めることができます。

[Output Address] (出力住所)

[Address field] (住所フィールド): テーブルに行を追加し、出力住所を保持するフィールドを定義済みのコンポーネントリストから選択します。フィールドの値が、テーブルで設定した出力カラムにマッピングされます。

tLoqateAddressRowは個々のフィールドの長いリストを表示します。一部の国の住所構造は他の国よりも複雑になるためです。出力フィールドの詳細は、tLoqateAddressRowの住所フィールドを参照してください。

[Output Column] (出力カラム): テーブルに行を追加し、出力住所を保持するカラムをリストから選択します。

入力カラムの正確な名前を持つ[Output Address] (出力住所)テーブルに出力カラムを1つ含める場合、入力カラムの値は、tLoqateAddressRowからの値で上書きされます。

出力スキーマには、読み取り専用の出力標準カラムが2つあります。

-STATUS: 処理中の入力住所のステータスを返します。プロセステータスの詳細は、tLoqateAddressRowのプロセスステータスを参照してください。

-ACCURACYCODE: 処理された住所の検証コードが返されます。このコードを構成する値と各セグメントの意味の詳細は、tLoqateAddressRowのアドレス検証コードを参照してください。

[Loqate Data Path] (Loqateデータパス)

Loqateによって提供され、ローカルにインストールされたLoqate Global Knowledge Repositoryへのパスを設定します。

Loqate Local APIとGlobal Knowledge Repositoryをオーダーしてhttp:// www.loqate.com/からダウンロードする必要があります。tLoqateAddressRowはQ2.2 2016リリースを使います。

詳細設定

[Server options] (サーバーオプション)

サーバーオプションを次のように設定します。

-Address Line Separator (アドレス行区切り): 出力アドレスフィールド内で出力アドレスコンポーネントを区切る文字列を定義します。デフォルトの区切りは改行文字列(<BR>)です。

-Default Country (デフォルトの国名): データ解析時、特定可能な国名が入力レコード内にない場合にISO 3166-1 alpha-3コードを使用する国名を選択します。

-Forced Country (強制的に使用する国名): データ解析時、ISO 3166-1 alpha-3コードをすべての入力レコードに対して使用する国名を選択します。

-[Output Script] (出力スクリプト): このオプションを使って出力住所を音訳します。

[Latin] (ラテン語)を選択して、解析結果をラテン語または西洋の文字でエンコードします。

[Native] (ネイティブ)を選択し、国名スクリプトを使って解析結果をエンコードします。

以下は、tLoqateAddressRowが音訳できる文字セット(スクリプト)と言語のリストです。

Latn -ラテン(西洋文字)、

Cyrl - キリル文字(ロシア)

Grek - ギリシャ文字(ギリシャ)

Hebr - ヘブライ文字(イスラエル)

Hani - 漢字(日本)

Hans - 簡体字中国語(中国)

Arab - アラビア文字(アラブ首長国連邦)

Thai - タイ語(タイ)

Hang - ハングル文字(韓国)

Native -可能な限りネイティブスクリプトで出力します。

-[Minimum match score] (最小一致スコア): レコードが取り消されないように達する必要がある最小一致スコアを指定します。デフォルト値はゼロで、有効な値の範囲は0~100です。

このオプションは、特定のレベルの検証(最小一致スコア)に達していない場合、出力フィールドで入力データを取得する必要がある時にとても役立ちます。

[tStat Catcher Statistics] (tStatキャッチャー統計)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

グローバル変数

[Global Variables] (グローバル変数)

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、 Talend Studio ユーザーガイドをご覧ください。

使用方法

[Usage rule] (使用ルール)

このコンポーネントは中間ステップです。入力フロート出力フローが必要になります。