Unstructured text (非構造テキスト) - 7.0

カラム分析

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Fabric
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio

これはStudioで導入された新しいデータマイニングタイプです。このデータマイニングタイプは、非構造テキストデータを処理するために使用します。

たとえば、コメントテキストを含むCOMMENTというカラムの場合、その中のテキストは非構造的なため、データマイニングタイプを「Nominal (名義)」にはできません。それでも、そのようなカラムの重複値が見られるため、新しいデータマイニングタイプが必要となったのです。