文字ベースのパターン - 8.0

Talend Data Preparationユーザーガイド

Version
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2024-03-26
Talend Data Preparationでは、データ内の文字ベースのパターン配分を分析できます。

ラテン文字、アジア文字のほかに、ひらがな、カタカナ、漢字、ハングルの間の分割は、以下のパターンで表記されます。

文字 パターン
ラテン数字 すべてのASCII数字が9に置き換わります
Latin小文字 すべてのASCII Latin文字がaに置き換わります
Latin大文字 すべての大文字のLatin文字がAに置き換わります
ひらがな すべてのひらがな文字がHに置き換わります
片仮名 すべてのカタカナ文字がKに置き換わります
漢字 漢字がCに置き換わります
ハングル ハングル文字がGに置き換わります
片仮名 すべてのカタカナ文字がKに置き換わります