パーサールールを設定および管理 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

パーサールールは、ANTLRの記号を使って分析される想定のデータ文字列の構成を説明、および定義します。

このようにパーサールールを使用すると、想定に応じて分析済みデータを正規化および標準化できます。パーサールールは、標準化ルールとも呼ばれています。

たとえば、<INT><WORD+><StreetType>というパーサールールは、12 main streetのような標準的な住所のデータ形式を定義します。

パーサールールのセットは、Talend Studio Profiling パースペクティブの[DQ Repository] (DQリポジトリー)ツリービュー、あるいはtStandardizeRowコンポーネントの[Basic settings] (基本設定)ビューから作成できます。ただし、特定のルールのセットの共有、再利用、適合などの目的でパーサールールのセットをテスト、保存、および管理しなければならない場合は、[DQ Repository] (DQリポジトリー)ツリービューを使用する必要があります。

パーサールールを作成および使用してtStandardizeRowでデータを分析、正規化、および標準化する方法についての詳細は、Talendコンポーネントリファレンスガイドをご覧ください。

ANTLRパーサーの詳細は、このANTLRのドキュメンテーションをご覧ください。