入力コンポーネントを設定 - 7.2

Natural Language Processing

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 自然言語処理
データガバナンス > サードパーティーシステム > 自然言語処理
データクオリティとプレパレーション > サードパーティーシステム > 自然言語処理
tFileInputXMLコンポーネントは、処理するテキストをロードするために使用します。

手順

  1. tFileInputXMLコンポーネントをダブルクリックして[Basic settings] (基本設定)ビューを開き、そのプロパティを定義します。
    1. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして、入力データの保存に必要なカラムを追加します。
    2. [File name] (ファイル名)フィールドで、処理するファイルのパスを指定します。
    3. [Element to extract] (抽出するエレメント)"row"と入力します。
    4. [Loop XPath query] (ループXPathクエリー)フィールドに、二重引用符で囲んだXPathクエリー式を入力して、ループの基になるノードを指定します。
    5. Mappingテーブルの[XPath query] (XPathクエリー)カラムで、クエリーするフィールドを二重引用符で囲んで指定します。
  2. データ処理中に問題が発生した場合は、コンポーネントの[Advanced settings] (詳細設定)ビューで[Custom encoding] (カスタムエンコーディング)チェックボックスをオンにします。
  3. [Encoding] (エンコーディング)リストで、使用するエンコーディングを選択します(この例ではUTF-8)。