Eigenschaften von Azure Data Lake Storage Gen2 - Cloud

Handbuch für Talend Cloud-Anwendungskonnektoren

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Inventory
Talend Data Preparation
Talend Pipeline Designer
Content
Administration und Überwachung > Verwaltung von Verbindungen
Design und Entwicklung > Konzeption von Pipelines
Last publication date
2024-03-26
Zu konfigurierende Eigenschaften, damit eine Verbindung zu einem bestimmten Azure Data Lake Storage Gen2-Dateisystem hergestellt werden kann.

Verbindung zu Azure Data Lake Storage Gen2

Eigenschaft

Konfiguration

Selection (Auswahl) Wählen Sie Azure Data Lake Storage Gen2 aus bzw. geben Sie diese Auswahl ein.
Configuration (Konfiguration)
Engine Wählen Sie eine Engine in der Liste aus.
Main (Haupt) Authentication method (Authentifizierungsmethode) Wählen Sie die gewünschte Art der Authentifizierung beim Storage-Konto aus:
  • Shared Key (Freigegebener Schlüssel): Geben Sie den Schlüssel ein, der dem Storage-Konto zugewiesen wurde, auf das zugegriffen werden soll. Für jedes Konto sind standardmäßig zwei Schlüssel verfügbar, von denen jeder für diesen Zugriff verwendet werden kann. Anweisungen dazu, wie Sie Ihren Schlüssel erhalten, finden Sie unter Verwalten eines Storage-Kontos.
  • Shared Access Signature (SAS (Shared Access Signature) verwenden): Geben Sie das SAS-Token Ihres Kontos ein. Sie finden das SAS-Token für jeden genehmigten Dienst im Microsoft Azure-Portal nach der SAS-Generierung. Das SAS-Token weist folgendes Format auf: https://<$storagename><$service>.core.windows.net/<$sastoken>, wobei <$storagename> dem Storage-Kontonamen, <$service> dem Namen des genehmigten Dienstes (Blob, Datei, Warteschlange oder Tabelle) und <$sastoken> dem Wert des SAS-Tokens entspricht. Weitere Informationen finden Sie unter Bilden einer kontospezifischen SAS-URI.
  • Azure Active Directory: Geben Sie Mandant-ID, Client-ID und Client-Secret für Ihr Konto ein, um eine identitätsbasierte Autorisierung von Requests an Blob- und Queue-Dienste zu ermöglichen. Weitere Informationen finden Sie unter Autorisieren mit Azure Active Directory.
Account Name (Kontoname) Geben Sie den Namen des Data Lake Storage-Kontos ein, auf das zugegriffen werden soll. Stellen Sie sicher, dass der Administrator des Systems Ihnen die erforderlichen Zugriffsberechtigungen für das betroffene Konto zugewiesen hat.
Endpoint suffix (Endpunkt-Suffix) Geben Sie das Endpunkt-Suffix ein, das der Region Ihres Azure Cloud-Kontos entspricht.

Beispiel: core.windows.net (Standard für Azure Public)

Beispiel 2: core.chinacloudapi.cn (Azure Cloud China)

Advanced (Erweitert) Timeout Legen Sie die maximale Anzahl an Sekunden fest, die ein Benutzer auf eine verfügbare Verbindung warten soll. Wenn dieser Zeitraum abgelaufen und die Verbindung nach wie vor nicht verfügbar ist, wird eine Ausnahme ausgegeben.
Beschreibung Geben Sie einen Anzeigenamen (obligatorisch) und eine Beschreibung (optional) für die Verbindung ein.

Datensätze in Azure Data Lake Storage Gen2

Eigenschaft Konfiguration
Dataset name (Datensatzname) Geben Sie einen Anzeigenamen für den Datensatz ein. Dieser Name wird in allen Talend Cloud-Anwendungen als eindeutige Kennung für den Datensatz verwendet.
Verbindung Wählen Sie Ihre Verbindung in der Liste aus. Wenn Sie einen Datensatz basierend auf einer vorhandenen Verbindung erstellen, ist dieses Feld schreibgeschützt.
Filesystem (Dateisystem) Wählen Sie den Namen Ihres Azure Data Lake Storage-Dateisystems aus bzw. geben Sie ihn ein.
Blob path (Blob-Pfad) Geben Sie den Pfad des Verzeichnisses ein, das die abzurufende Datei enthält.
Format Wählen Sie in der Liste das Format der abzurufenden Datei aus und geben Sie die Informationen zum Dateiformat ein bzw. wählen Sie sie aus:
  • CSV:
    • Field delimiter (Feldbegrenzer): Wählen Sie den Typ des Feldbegrenzers aus, der in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld custom record delimiter (Benutzerdefinierter Feldbegrenzer) einen benutzerspezifischen Feldbegrenzer eingeben.
    • Record separator (Datensatzbegrenzer): Wählen Sie den Typ des Datensatzbegrenzers aus, der in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld custom record delimiter (Benutzerdefinierter Datensatzbegrenzer) einen benutzerspezifischen Datensatzbegrenzer eingeben.
    • Text enclosure character (Textbegrenzungszeichen): Geben Sie das Zeichen ein, das zur Begrenzung von Text verwendet wird.
    • Escape character (Maskierungszeichen): Geben Sie das Zeichen ein, das in den abzurufenden Datensätzen geschützt werden soll.
    • Header: Aktivieren Sie diese Option, wenn die abzurufende Datei Kopfzeilen (Header) enthält, und geben Sie die Anzahl der im Schema zu überspringenden Zeilen ein bzw. wählen Sie sie aus.
    • CSV schema (CSV-Schema): Geben Sie das Ihrer CSV-Datei entsprechende Schema ein.
    • File encoding (Dateicodierung): Wählen Sie den Typ der Codierung aus, die in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld Custom encoding (Benutzerdefinierte Codierung) einen benutzerspezifischen Codierungstyp eingeben.
  • Avro: Keine spezifischen Parameter erforderlich für dieses Format.
  • JSON: Keine spezifischen Parameter erforderlich für dieses Format.
  • Parquet: Keine spezifischen Parameter erforderlich für dieses Format.
  • Delta: Keine spezifischen Parameter erforderlich für dieses Format.
    Wichtig: Partitionierte Delta-Tabellen werden nicht unterstützt. Jede partitionierte Spalte wird zurückgegeben.