Eigenschaften von Google BigQuery - Cloud

Handbuch für Talend Cloud-Anwendungskonnektoren

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Inventory
Talend Data Preparation
Talend Pipeline Designer
Content
Administration und Überwachung > Verwaltung von Verbindungen
Design und Entwicklung > Konzeption von Pipelines
Last publication date
2024-03-26
Zu konfigurierende Eigenschaften, um eine Verbindung zu Google BigQuery herstellen zu können.

Verbindung zu Google BigQuery

Eigenschaft

Konfiguration

Selection (Auswahl) Wählen Sie Google BigQuery aus bzw. geben Sie diese Auswahl ein.
Configuration (Konfiguration)
Engine Wählen Sie eine Engine in der Liste aus.
Verbindung Project name (Projektname) Geben Sie die eindeutige Kennung Ihres Projekts in Google Cloud Platform ein. Diese Information ist auf der Dashboard-Seite Ihrer Google Cloud-Konsole verfügbar. Mehr Informationen zu Google Cloud-Projekten finden Sie in der Dokumentation von Google Cloud.
Google credentials (Google-Anmeldedaten) Fügen Sie den Inhalt der JSON-Datei ein, die Ihren Dienstkonto-Schlüssel enthält. Mehr Informationen zum Authentifizierungsprozess von Google Cloud finden Sie in der Dokumentation von Google Cloud.
Beschreibung Geben Sie einen Anzeigenamen (obligatorisch) und eine Beschreibung (optional) für die Verbindung ein.

Datensatz von Google BigQuery

Eigenschaft Konfiguration
Dataset name (Datensatzname) Geben Sie einen Anzeigenamen für den Datensatz ein. Dieser Name wird in allen Talend Cloud-Anwendungen als eindeutige Kennung für den Datensatz verwendet.
Verbindung Wählen Sie Ihre Verbindung in der Liste aus. Wenn Sie einen Datensatz basierend auf einer vorhandenen Verbindung erstellen, ist dieses Feld schreibgeschützt.
Type (Typ) Wählen Sie den Typ des zu erstellenden Datensatzes aus:
  • Table (Tabelle): Für den Zugriff auf den Datensatz und die Datensatztabelle in Ihrem BigQuery-Bucket über die entsprechenden eindeutigen Namen.
  • Query (Abfrage): Für die Abfrage der Daten in Ihren vorhandenen Tabellen.
Table (Tabelle) Dataset (Datensatz) Wählen Sie den eindeutigen Namen des BigQuery-Datensatzes mit Ihrer Tabelle aus bzw. geben Sie ihn ein. Weitere Informationen können Sie der Dokumentation von Google BigQuery über Datensätze entnehmen.
Table name (Tabellenname) Wählen Sie den eindeutigen Namen Ihrer BigQuery-Tabelle aus bzw. geben Sie ihn ein.
Storage bucket (Storage-Bucket) Geben Sie den Namen des Buckets ein, d. h. des Google-BigQuery-Containers, der die Daten enthält.
Query (Abfrage) Query (Abfrage) Geben Sie die Abfrage für den Zugriff auf die gewünschten Daten in Ihrer BigQuery-Tabelle ein.
Use legacy SQL (Legacy-SQL verwenden) Wenn es sich bei der zu verwendenden Abfrage um die Legacy-SQL von BigQuery handelt, aktivieren Sie diese Option. Für weitere Informationen zu dieser Legacy-SQL siehe die Legacy-SQL-Abfragereferenz in der Dokumentation von Google BigQuery.

Konfiguraiton des Google BigQuery-Ziels

Wenn Google BigQuery als Zieldatensatz in Ihrer Pipeline verwendet wird, können Sie den Typ der Operation auswählen, die Sie beim Einfügen von Daten in die BigQuery-Tabelle durchführen möchten:

Eigenschaft Konfiguration
Table operation (Tabellenoperation) Legen Sie fest, wie die verarbeiteten Daten in die BigQuery-Tabelle eingefügt werden sollen:
  • Append (Anhängen): Wählen Sie diese Option aus, wenn die verarbeiteten Daten bei der Ausführung an die vorhandene BigQuery-Tabelle angehängt werden sollen.
  • Create if not exists (Erstellen, wenn nicht vorhanden): Wählen Sie diese Option aus, um eine BigQuery-Tabelle zu erstellen und die verarbeiteten Daten bei der Ausführung in dieser Tabelle einzufügen.
  • Truncate (Trunkieren): Wählen Sie diese Option aus, um bei der Ausführung alle bestehenden Zeilen zu entfernen und dadurch den Inhalt Ihrer BigQuery-Tabelle zu überschreiben.
Max batch size (Max. Batchgröße) Legen Sie die maximal zulässige Anzahl an Zeilen in jedem Batch fest. Eine Änderung des Standardwerts kann sich auf die Leistung der Pipeline auswirken.

Je nachdem, ob der Konnektor als Quell- oder Zieldatensatz verwendet wird, können zusätzliche JDBC-Parameter angezeigt werden. In diesem Abschnitt finden Sie weitere Informationen zu diesen Parametern.