Procédure - 7.0

Deduplication

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
EnrichPlatform
Studio Talend

Procédure

  1. Dans le Repository de la perspective Integration du Studio Talend , cliquez-droit sur le Job que vous avez créé dans le scénario précédent afin d'ouvrir son menu contextuel. Sélectionnez ensuite Edit properties.
    L'assistant [Edit properties] s'ouvre alors. Le Job doit être fermé avant que vous ne puissiez effectuer des changements dans cet assistant.
    Notez que vous pouvez changer le nom du Job ainsi que les autres informations de description du Job à partir de cet assistant.
  2. Dans la liste Job Type, sélectionnez Big Data Batch.
  3. Dans la liste Framework, sélectionnez Spark. Un Job Spark portant le même nom apparaît sous le sous-nœud Big Data Batch du nœud Job Design.

Résultats

Si vous devez partir d'un Job Spark vierge, cliquez-droit sur le nœud Job Design ou sur le sous-nœud Big Data Batch et sélectionnez Create Big Data Batch Job dans le menu contextuel. Un Job vierge s'ouvre dans l'espace de modélisation graphique.