文字ベースのパターン - Cloud

Talend Cloud Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
EnrichPlatform
Talend Data Preparation
Talend Data Preparationでは、データ内の文字ベースのパターン配分を分析することができます。

Latin文字、アジア文字のほかに、ひらがな、カタカナ、漢字、ハングルの間の分割は、以下のパターンで表記されます。

文字 パターン
ラテン数字 すべてのASCII数字が9に置き換わります
Latin小文字 すべてのASCII Latin文字がaに置き換わります
Latin大文字 すべての大文字のLatin文字がAに置き換わります
ひらがな 全てのひらがな文字がHに置き換わります
片仮名 すべてのカタカナ文字がKに置き換わります
漢字 漢字がCに置き換わります
ハングル ハングル文字がGに置き換わります
片仮名 すべてのカタカナ文字がKに置き換わります