Accéder au contenu principal Passer au contenu complémentaire

Mise en correspondance de clés primaires et étrangères

Vous pouvez créer une analyse faisant correspondre les clés étrangères dans une table aux clés primaires d'une autre table, et vice versa. Cette analyse de redondance supporte uniquement les tables de bases de données.

Avant de commencer

Une connexion à une base de données doit avoir été créée dans la perspective Profiling .

Dans cette vue, vous pouvez également accéder aux données actualisées via la perspective Data Explorer.

Pour accéder aux lignes de données analysées, cliquez-droit sur l'une des lignes de la table et sélectionnez une option :
  • View match rows : pour accéder à une liste de toutes les lignes pouvant correspondre aux deux ensembles de colonnes identiques.
  • View not match rows : pour accéder à une liste de toutes les lignes ne pouvant pas correspondre aux deux ensembles de colonnes identiques.
  • View rows : pour accéder à une liste de toutes les lignes dans les deux ensembles de colonnes identiques.
Note InformationsAvertissement : L'explorateur de données ne supporte pas les connexions dont le nom d'utilisateur·trice est vide, par exemple la connexion en session unique (SSO, Single Sign-On) de MS SQL Server. Si vous analysez des données à l'aide d'une de ces connexions et que vous essayez de visualiser les lignes et les valeurs des données dans la perspective Data Explorer , un message d'avertissement apparaît et vous demande de configurer vos informations de connexion au serveur SQL.

View rows

Exemple d'une liste de lignes analysées dans deux colonnes.

Dans l'éditeur SQL, vous pouvez sauvegarder la requête exécutée et l'afficher sous les nœuds Libraries > Source Files dans la vue DQ Repository si vous cliquez sur l'icône de sauvegarde dans la barre d'outils de l'éditeur. Pour plus d'informations, consultez Sauvegarder les requêtes exécutées sur les indicateurs.

Définir l'analyse pour faire correspondre les clés primaires et étrangères dans des tables

Procedure

  1. Dans la vue DQ Repository, développez le dossier Data Profiling.
  2. Cliquez-droit sur le dossier Analyses et sélectionnez New Analysis.
    Menu contextuel du nœud Analyses.
    L'assistant Create New Analysis s'ouvre.
  3. Dans le champ de filtre, commencez à saisir redundancy analysis, sélectionnez Redundancy Analysis et cliquez sur le bouton Next. Si votre Studio est en français, saisissez analyse de redondance.
  4. Dans le champ Name, saisissez un nom pour l'analyse.
    Note InformationsImportant:

    N'utilisez pas les caractères spéciaux suivants dans le nom des éléments : ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " « » < >

    Ces caractères seront remplacés par un "_" dans le système de fichiers et vous risquez de créer des doublons.

  5. Définissez les métadonnées de l'analyse (Purpose (Objectif), Description et Author (Auteur)) dans les champs correspondants puis cliquez sur Finish.
    Fenêtre d'une nouvelle analyse, avec les champs Name, Purpose et Description renseignés.
    Un fichier pour l'analyse nouvellement créée s'affiche sous le nœud Analysis de la vue DQ Repository. L'éditeur d'analyse s'ouvre avec les métadonnées définies de l'analyse.
    Vue d'ensemble de la section Analysis Metadata (Analyse de métadonnées) dans l'onglet Analysis Settings (Paramètres d'analyse).

Sélectionner les clés primaires et étrangères

Procedure

  1. Cliquez sur Analyzed Column Sets pour afficher la vue où définir l'analyse.
    Dans cet exemple, l'objectif est de faire correspondre les clés étrangères de la colonne customer_id de la table sales_fact_1998 aux clés primaires de la colonne customer_id de la table customer, et vice versa. Ce processus identifiera les relations entre les deux tables, pour montrer, par exemple, si chaque client a passé une commande en 1998.
    Vue d'ensemble de la section Analyzed Column Sets (Ensembles de colonnes analysés) dans l'onglet Analysis Settings (Paramètres d'analyse).
  2. Dans la liste Connection, sélectionnez la connexion à la base de données à laquelle vous souhaitez vous connecter.
    Dans cette liste, vous disposez de toutes les connexions créées et centralisées dans le référentiel du Studio Talend.
  3. Cliquez sur A Column Set pour ouvrir la boîte de dialogue [Column Selection].
    Si vous souhaitez vérifier la validité des clés étrangères, sélectionnez la colonne les contenant, pour l'ensemble A, et la colonne contenant les clés primaires, pour l'ensemble B.
  4. Parcourez les catalogues/schémas de votre connexion à la base de données pour atteindre la table contenant la colonne que vous souhaitez faire correspondre.
    Dans cet exemple, la colonne à analyser est customer_id, qui contient les clés étrangères.
    Sélection des tables à analyser.
    Vous pouvez filtrer la liste des tables ou des colonnes en saisissant le texte souhaité dans les champs Table filter ou Column filter respectivement. La liste affiche uniquement les tables/colonnes correspondant au texte saisi.
  5. Cliquez sur le nom de la table pour afficher toutes ses colonnes dans le panneau de droite de la boîte de dialogue [Column Selection].
  6. Dans la liste à droite, cochez la case de la colonne contenant les clés étrangères puis cliquez sur OK pour passer à l'étape suivante.
    Vous pouvez glisser les colonnes à analyser directement de la vue DQ Repository dans l'éditeur.
    Si vous cliquez-droit sur une colonne listée dans la vue Analyzed Columns et que vous sélectionnez Show in DQ Repository view, la colonne sélectionnée sera automatiquement située sous la connexion correspondante dans l'arborescence.
  7. Cliquez sur B Column Set et suivez les mêmes étapes afin de sélectionner la colonne contenant les clés primaires, ou glissez-la de la vue DQ Repository dans le panneau de droite.
    Si vous cochez la case Compute only number of rows not in B, vous chercherez toutes les clés primaires manquantes dans les colonnes de l'ensemble B.
  8. Si nécessaire, cliquez sur Data Filter dans l'éditeur d'analyse pour afficher la vue dans laquelle vous pouvez définir un filtre sur chaque colonne analysée.
  9. Appuyez sur F6 pour exécuter cette analyse de correspondance de clés.
    Un message de confirmation s'affiche.
  10. Cliquez sur OK dans le message si vous souhaitez continuer l'opération.
    L'exécution de ce type d'analyse peut prendre un certain temps. La vue Analysis Results s'ouvre pour afficher les résultats de l'analyse.

Results

Tableau et graphique de la section Analysis Results (Résultats de l'analyse).

Dans cet exemple, chaque clé étrangère dans la table sales_fact_1998 est associée à une clé primaire dans la table customer. Cependant, 98,22% des clés primaires dans la table customer n'ont pas pu être associées à des clés étrangères dans la table sales_fact_1998. Ces clés primaires concernent des clients qui n’ont rien commandé en 1998.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.