文字列機能のリスト - Cloud

Talend Cloud Pipeline Designerプロセッサーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発 > パイプラインのデザイン
EnrichPlatform
Talend Pipeline Designer

次のテーブルは、[String] (文字列)プロセッサーを使ってデータに適用できる機能のリストです。

名前 説明
[Add extra characters] (余分な文字を追加) 予測されるサイズに一致するよう、元の値の左または右に余分な文字を追加(パディング)します。
[Calculate length] (長さを計算) 値(23562 -> 5)から桁数を抽出します。
[Change to lower case] (小文字に変換) このカラムのセルテキストをすべて小文字に変換します。
[Change to title case] (単語の先頭文字を大文字に変更) このカラムのテキストコンテンツをタイトル表記に変換します。(例: "this is an example" -> "This Is an Example")
[Change to upper case] (大文字に変換) このカラムのセルテキストをすべて大文字に変換します。
[Contains text] (テキストを含める) セルに指定の値が含まれているかどうか確認します。
[Convert character width] (文字幅を変換) 文字幅を半角または全角に変換したり、文字列を正規化したりします。
[Generate unique identifier (UUID)] (ユニークな識別子(UUID)を生成) カラムの各行にユニークな識別子を生成します。
[Match similar text] (類似のテキストに一致) 値が指定の値のレーベンシュタイン距離以下かどうかについて、trueまたはfalseの値を持つ新しいカラムを作成します。
[Remove all non alpha numeric characters] (数字以外の文字をすべて削除) 0~9、Aa~Zz、アクセント記号付き文字以外の文字をすべて削除することで、予期しない文字を含む値を消去します。空白文字は保持されます。

たとえば、 T=+Âl**€en#d$ 20%1,7TÂlend 2017になります。

[Remove all non numeric characters] (数字以外の文字をすべて削除) 0~9以外の文字をすべて削除することで数値を消去します。小数点記号と空白文字は保持されます。

たとえば、 T=+Âl**€en#d$ 20%1,7201,7になります。

[Remove consecutive characters] (連続する文字を削除) 連続して繰り返される文字を削除します。
[Remove trailing and leading characters] (後続文字および先行文字を削除) 末尾と先頭の空白、または特定の文字を削除(トリム)します。
[Simplify text (remove case, accent, etc.)] (テキストを簡素化(大文字/小文字の区別、アクセントなどを排除)) 小文字にし、アクセントを削除し、NFKDを利用して正規化し、組み合わせた文字は分割し、文字列全体を短くしてカラムの内容を簡略化します。

たとえば、Françoisfrancoisのようになります。