文字ベースのパターン - 2.8

Talend Data Preparation ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
2.8
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation
Talend Data Preparationでは、データ内の文字ベースのパターン配分を分析することができます。

Latin文字、アジア文字のほかに、ひらがな、カタカナ、漢字、ハングルの間の分割は、以下のパターンで表記されます。

文字 パターン
Latin数字 すべてのASCII数字が9に置き換わります
Latin小文字 すべてのASCII Latin文字がaに置き換わります
Latin大文字 すべての大文字のLatin文字がAに置き換わります
ひらがな すべてのひらがな文字がHに置き換わります
カタカナ すべてのカタカナ文字がKに置き換わります
漢字 漢字がCに置き換わります
ハングル ハングル文字がGに置き換わります
カタカナ すべてのカタカナ文字がKに置き換わります