Data Quality: 新しい機能 - 7.1

Talend Data Fabricリリースノート

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
task
インストールとアップグレード

フィーチャー

説明

Talend Studioにおける単語ベースのパターンプロファイリング よりジェネリックなこのプロファイリングパターンでは、分析の精度は単語であり、文字ではありません。

単語ベースのパターンでは、新しいデータパターンは、探索分析や検索の目的だけでなく、データのプレパレーション時にも、より目立つようになります。

Talend Studioにおける日本語データのプロファイリング 日本語文字はProfilingパースペクティブでサポートされており、日本語文字に対するサポートのレベルはLatin文字と同等になっているほか、日本語でのデータキュレーションとデータクオリティが可能になっています。
Talend Studioにおける日本語データの処理 Apache Sparkフレームワークで機能する新しいコンポーネントがTalend Studioに導入されました。
  • tJapaneseNumberNormalizeは日本語の数字(漢数字)をアラビア数字に正規化します。
  • tJapaneseTokenizeは日本語のテキストをトークンに分割します。
  • tJapaneseTransliterateは日本語のテキストをかなとLatinスクリプトに変換します。
Talend Studioにおけるアジア系データのデータマスキング tDataMaskingコンポーネントの以下の関数は、アジア系の文字をサポートしています。
  • パターンから生成
  • [Replace characters between two positions] (2つの位置の間の文字を置換)
  • すべて置換
  • すべての文字を置換
  • [Replace n first characters] (N番目の文字を置換)
  • [Replace n last characters] (最後のN個の文字を置換)
Talend Studioにおける一貫したデータマスキング tDataMaskingコンポーネントに[Generate unique phone number] (ユニークな電話番号の生成)ファンクションが追加されました: このファンクションは、ユニークで有効な電話番号をランダムに生成することで、さまざまな異なる国(中国、フランス、ドイツ、インド、日本、英国、米国)の電話番号をマスクします。
tGoogleAddressRowコンポーネントを使用して国際電話番号を取得 tGoogleAddressRowコンポーネントが更新され、国際電話番号を取得できるようになりました。
Talend Dictionary Serviceにおけるユーザーアクションの監査 ログイン/ログアウトおよび設定の更新やデプロイを含め、Talend Dictionary Serviceのすべてのユーザーアクションを監査します。セキュリティルールと規制へのコンプライアンスを徹底するのに役立ちます。
Talend Dictionary Serviceにおけるセマンティックタイプに対するマスアクション 複数のセマンティックタイプを一度にインポート、エクスポート、削除、パブリッシュできるようになり、そのため、プロジェクト全体を1つの環境から別の環境へと一度にプロモートできるようになりました。
国際化 Talend StudioProfilingパースペクティブインタフェースが中国語に翻訳され、国際化の幅が広がりました。
追加のデータベースに対するサポート Talendでは、データクオリティデータマート、Talend DQ Portal、およびデータクオリティコンポーネントに追加のデータベースを使用できるようになりました。
  • Microsoft SQL Server 2017
  • MySQL 8.0
  • PostgreSQL 10
追加のデータベースに対するサポート Talendでは、Profilingパースペクティブに追加のデータベースを使用できるようになりました。
  • Denodo
  • Microsoft SQL Server 2017
  • MySQL 8.0
  • PostgreSQL 10
Spark 2.3のサポート Talendでは、以下のコンポーネントを使用してTalend Studioでジョブを実行するときに、Spark 2.3 (ローカルモード)をサポートします。
  • tALSModel
  • tDataMasking
  • tDataShuffling
  • tJapaneseNumberNormalize
  • tJapaneseTokenize
  • tJapaneseTransliterate
  • tMatchIndex
  • tMatchIndexPredict
  • tMatchModel
  • tMatchPairing
  • tNaiveBayesModel
  • tPatternMasking
  • tPredict
  • tRecommend
  • tReservoirSampling
  • tRuleSurvivorship
  • tStandardizePhoneNumber
  • tSynonymSearch
  • tTransliterate
  • tVerifyEmail