Einfügen gefilterter Daten in eine Azure Cosmos DB-Tabelle - Cloud

Handbuch für Talend Cloud-Anwendungskonnektoren

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Inventory
Talend Data Preparation
Talend Pipeline Designer
Content
Administration und Überwachung > Verwaltung von Verbindungen
Design und Entwicklung > Konzeption von Pipelines
Last publication date
2024-03-26

Dieses Szenario soll Sie bei der Einrichtung und Verwendung von Konnektoren in einer Pipeline unterstützen. Es wird empfohlen, dass Sie das Szenario an Ihre Umgebung und Ihren Anwendungsfall anpassen.

Vorbereitungen

Prozedur

  1. Klicken Sie auf Connections (Verbindungen) > Add connection (Verbindung hinzufügen).
  2. Wählen Sie den Typ der zu erstellenden Verbindung im daraufhin geöffneten Fenster aus.

    Example

    Cosmos DB
  3. Wählen Sie in der Liste Engine Ihre Engine aus.
    Anmerkung:
    • Es wird empfohlen, die Remote Engine Gen2 und nicht die Cloud Engine for Design für eine erweiterte Datenverarbeitung einzusetzen.
    • Wenn keine Remote Engine Gen2 in Talend Management Console erstellt wurde bzw. diese vorhanden, aber als nicht verfügbar markiert ist, d. h. sie ist nicht aktiv und wird nicht ausgeführt, dann können Sie weder einen Connection type (Verbindungstyp) in der Liste auswählen noch die neue Verbindung speichern.
    • Die Liste der verfügbaren Verbindungstypen richtet sich nach der ausgewählten Engine.
  4. Wählen Sie den Typ der zu erstellenden Verbindung aus.
    Wählen Sie für dieses Beispiel CosmosDB aus.
  5. Geben Sie die Verbindungseigenschaften für den Zugriff auf die Azure Cosmos DB-Datenbank gemäß der Beschreibung in Eigenschaften von Azure Cosmos DB ein, prüfen Sie die Verbindung und klicken Sie dann auf Add dataset (Datensatz hinzufügen).
  6. Geben Sie im Fensterbereich Add a new dataset (Neuen Datensatz hinzufügen) einen Namen für Ihren Datensatz ein. In diesem Beispiel soll die Cosmos DB-Sammlung verarbeitete Daten zu Leads aufnehmen.

    Example

    leads
  7. Geben Sie die erforderlichen Eigenschaften entsprechend der in Ihrem Azure-Konto enthaltenen Cosmos DB-Sammlung ein.
  8. Klicken Sie auf Validate (Validieren), um den Datensatz zu speichern.
  9. Gehen Sie genauso vor, um die Testverbindung und den Datensatz hinzuzufügen, der als Quelle in Ihrer Pipeline für das CRM verwendet werden soll.
    In diesem Beispiel wird der Datensatz bank marketing data (Bankspezifische Marketingdaten) mit folgendem CSV-Schema verwendet:
    CSV Schema:
    age;job;marital;education;default;balance;housing;loan;contact;day;month;duration;campaign;pdays;previous;poutcome;y
  10. Klicken Sie auf der Seite Pipelines auf Add pipeline (Pipeline hinzufügen). Ihre neue Pipeline wird geöffnet.
  11. Legen Sie einen sinnvollen Namen für die Pipeline fest.

    Example

    Inserting bank marketing data into a CosmosDB table (Bankspez. Marketingdaten in eine CosmosDB-Tabelle einfügen)
  12. Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN) und wählen Sie im daraufhin geöffneten Fenster Ihren Quelldatensatz aus, bank marketing data (Bankspezifische Marketingdaten).
  13. Klicken Sie auf , um Prozessoren zu Ihrer Pipeline hinzuzufügen, beispielweise einen Prozessor des Typs Type converter (Typkonverter), um Saldodaten vom Typ Zeichenfolge (String) in den Typ Doppelwert (Double) zu konvertieren.
  14. Klicken Sie auf , um einen Filter-Prozessor hinzuzufügen, der alle Leads ab 30 Jahren ausfiltern soll, die Führungskräfte sind und ein Saldo über 2000 Dollar aufweisen.
  15. Klicken Sie auf das Element ADD DESTINATION (ZIEL HINZUFÜGEN) der Pipeline, um ein Fenster zu öffnen, in dem Sie den Cosmos DB-Datensatz auswählen können, in den Ihre Ausgabedaten eingefügt werden sollen.
  16. Klicken Sie auf der Registerkarte Configuration (Konfiguration) des Ziels auf Main (Haupt) und:
    1. Aktivieren Sie die Optionen Create collection if not exists (Sammlung erstellen, wenn nicht vorhanden) und Auto ID generation (Autom. ID-Generierung), damit bei der Ausführung der Pipeline, in die die Daten eingefügt werden sollen, eine Datenbanksammlung und -ID erstellt werden.
    2. Klicken Sie auf Main (Haupt) und wählen Sie Insert (Einfügen) in der Liste Data action (Datenaktion) aus, um die Daten bei der Ausführung der Pipeline in den vorhandenen Datensatz einzufügen.
  17. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.
  18. Klicken Sie in der oberen Symbolleiste von Talend Cloud Pipeline Designer auf die Schaltfläche Run (Ausführen), um das Fenster zur Auswahl des Ausführungsprofils zu öffnen.
  19. Wählen Sie Ihr Ausführungsprofil in der Liste aus (weitere Informationen finden Sie unter „Ausführungsprofile“) und klicken Sie dann auf Run (Ausführen), um die Pipeline auszuführen.

Ergebnisse

Ihre Pipeline wird ausgeführt, die Daten wurden verarbeitet und gefiltert und der Ausgabe-Flow wird in den von Ihnen definierten Microsoft CRM-Datensatz eingefügt.

Sie können das Log Ihrer Pipeline prüfen, um Detailangaben zum Umfang der an Azure Cosmos DB gesendeten Daten zu erhalten.