Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
パーサールールは、ANTLRの記号を使って分析される想定のデータ文字列の構成を説明、および定義します。
このようにパーサールールを使用すると、想定に応じて分析済みデータを正規化および標準化できます。パーサールールは、標準化ルールとも呼ばれています。
たとえば、<INT><WORD+><StreetType>
というパーサールールは、12 main streetのような標準的な住所のデータ形式を定義します。
パーサールールのセットは、Talend Studioの Profiling パースペクティブの[DQ Repository] (DQリポジトリー)ツリービュー、あるいはtStandardizeRowコンポーネントの[Basic settings] (基本設定)ビューから作成できます。ただし、特定のルールのセットの共有、再利用、適合などの目的でパーサールールのセットをテスト、保存、および管理しなければならない場合は、[DQ Repository] (DQリポジトリー)ツリービューを使用する必要があります。
パーサールールを作成および使用してtStandardizeRowでデータを分析、正規化、および標準化する方法についての詳細は、Talendコンポーネントリファレンスガイドをご覧ください。
ANTLRパーサーについての詳細は、http://www.antlr.org/をご覧ください。