Data Quality : nouvelles fonctionnalités - 7.1

Notes de version de Talend Data Fabric

EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
task
Installation et mise à niveau

Fonctionnalité

Description

Profiling des modèles basés sur mot dans le Studio Talend Dans ce modèle de profiling plus générique, la granularité de l'analyse est au niveau des mots et non des caractères.

Les modèles basés sur les mots rendent les nouveaux modèles de données plus visibles lors de la préparation des données ainsi qu'à des fins de découverte ou d'analyse d'exploration.

Profiling des données en japonais dans Studio Talend Les caractères japonais sont désormais supportés dans la perspective Profiling au même niveau que les caractères latins, ce qui facilite la conservation des données et favorise la qualité des données en japonais.
Traitement des données en japonais dans Studio Talend De nouveaux composants, fonctionnant avec le framework Apache Spark, ont été introduits dans le Studio Talend :
  • le tJapaneseNumberNormalize normalise les nombres japonais (kansūji) en nombres arabes standard.
  • le tJapaneseTokenize segmente le texte japonais en segments.
  • le tJapaneseTransliterate convertit le texte japonais en scripts kana et latin.
Masquage de données pour les données asiatiques dans Studio Talend Les fonctions suivantes dans le composant tDataMasking supportent les caractères asiatiques :
  • Generate from Pattern
  • Replace characters between two positions
  • Replace all
  • Replace all letters
  • Replace n first characters
  • Replace n last characters
Masquage de données cohérent dans Studio Talend La fonction Generate unique phone number a été ajoutée au composant tDataMasking : cette fonction masque les numéros de téléphone pour différents pays (Chine, France, Allemagne, Inde, Japon, Royaume-Uni et États-Unis) en générant des numéros de téléphone aléatoires uniques.
Obtention de numéros de téléphone internationaux à l'aide du composant tGoogleAddressRow Le composant tGoogleAddressRow a été mis à jour pour pouvoir extraire les numéros de téléphone internationaux.
Audit des actions utilisateurs dans Talend Dictionary Service Auditez toutes les actions utilisateur dans Talend Dictionary Service, notamment les connexions/déconnexions, le déploiement et les mises à jour de configuration. Vous pouvez ainsi assurer une meilleure conformité aux réglementations et règles de sécurité.
Actions en masse sur les types sémantiques dans Talend Dictionary Service Vous pouvez désormais importer, exporter, supprimer et publier plusieurs types sémantiques à la fois, ce qui vous permet de promouvoir un projet complet d'un environnement vers un autre.
Internationalisation L'interface de la perspective Profiling dans le Studio Talend a été traduite en chinois, pour une portée internationale étendue.
Support de bases de données supplémentaires Talend prend désormais en charge des bases de données supplémentaires pour le datamart DQ, Talend DQ Portal et les composants Data Quality :
  • Microsoft SQL Server 2017
  • MySQL 8.0
  • PostgreSQL 10
Support de bases de données supplémentaires Talend prend désormais en charge des bases de données supplémentaires pour la perspective Profiling :
  • Denodo
  • Microsoft SQL Server 2017
  • MySQL 8.0
  • PostgreSQL 10
Support de Spark 2.3 Talend supporte Spark 2.3 (mode local) lors de l'exécution de Jobs dans le Studio Talend avec les composants suivants :
  • tALSModel
  • tDataMasking
  • tDataShuffling
  • tJapaneseNumberNormalize
  • tJapaneseTokenize
  • tJapaneseTransliterate
  • tMatchIndex
  • tMatchIndexPredict
  • Le tMatchModel
  • Le tMatchPairing
  • tNaiveBayesModel
  • tPatternMasking
  • tPredict
  • tRecommend
  • tReservoirSampling
  • tRuleSurvivorship
  • tStandardizePhoneNumber
  • tSynonymSearch
  • tTransliterate
  • tVerifyEmail