Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Eigenschaften von HDFS

Zu konfigurierende Eigenschaften, um eine Verbindung zu einem bestimmten Hadoop Distributed File System (HDFS) herstellen zu können.

Verbindung zu HDFS

Eigenschaft

Konfiguration

Selection (Auswahl) Wählen Sie HDFS aus bzw. geben Sie diese Auswahl ein.
Configuration (Konfiguration)
Engine Wählen Sie eine Engine in der Liste aus.
Verbindung User name (Benutzername) Geben Sie den Benutzernamen für die Authentifizierung bei HDFS ein.
Beschreibung Geben Sie einen Anzeigenamen (obligatorisch) und eine Beschreibung (optional) für die Verbindung ein.

Datensätze in HDFS

Eigenschaft Konfiguration
Dataset name (Datensatzname) Geben Sie einen Anzeigenamen für den Datensatz ein. Dieser Name wird in allen Talend Cloud-Anwendungen als eindeutige Kennung für den Datensatz verwendet.
Verbindung Wählen Sie Ihre Verbindung in der Liste aus. Wenn Sie einen Datensatz basierend auf einer vorhandenen Verbindung erstellen, ist dieses Feld schreibgeschützt.
HDFS data (HDFS-Daten) Path (Pfad) Geben Sie den Pfad der abzurufenden Daten im Dateisystem ein.
Format config (Formatkonfig.) Auto detect (Autom. erkennen) Klicken Sie auf diese Schaltfläche, damit das Format der abzurufenden Datei automatisch erkannt wird.
Format Sie können auch in der Liste das Format der abzurufenden Datei auswählen und die Informationen zum Dateiformat eingeben bzw. auswählen:
  • CSV:
    • Record delimiter (Datensatzbegrenzer): Wählen Sie den Typ des Datensatzbegrenzers aus, der in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld Custom record delimiter (Benutzerdefinierter Datensatzbegrenzer) einen benutzerspezifischen Datensatzbegrenzer eingeben.
    • Field delimiter (Feldbegrenzer): Wählen Sie den Typ des Feldbegrenzers aus, der in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld Custom field delimiter (Benutzerdefinierter Feldbegrenzer) einen benutzerspezifischen Feldbegrenzer eingeben.
    • Text enclosure character (Textbegrenzungszeichen): Geben Sie das Zeichen ein, das zur Begrenzung von Text verwendet wird.
    • Escape character (Maskierungszeichen): Geben Sie das Zeichen ein, das in den abzurufenden Datensätzen geschützt werden soll.
    • Encoding (Codierung): Wählen Sie den Typ der Codierung aus, die in der abzurufenden Datei verwendet wird. Wenn Sie Other (Andere) auswählen, können Sie in das Feld Custom encoding (Benutzerdefinierte Codierung) einen benutzerspezifischen Codierungstyp eingeben.
    • Set header (Header festlegen): Aktivieren Sie diese Option, wenn die abzurufende Datei Kopfzeilen (Header) enthält, und geben Sie die Anzahl der im Schema zu überspringenden Zeilen ein bzw. wählen Sie sie aus.
  • Excel:
    • Excel format (Excel-Format): Wählen Sie das Format bzw. die Version der abzurufenden Datei aus.
    • Sheet (Arbeitsblatt): Geben Sie den Namen des spezifischen Excel-Arbeitsblatts ein, das Sie abrufen möchten.
    • Set header/footer (Header/Fußzeile festlegen): Aktivieren Sie diese Optionen, wenn die abzurufende Datei Kopf- (Header) und/oder Fußzeilen enthält, und geben Sie die Anzahl der im Schema zu überspringenden Zeilen ein bzw. wählen Sie sie aus.
  • Avro: Keine spezifischen Parameter erforderlich für dieses Format.
  • Parquet: Keine spezifischen Parameter erforderlich für dieses Format.
  • JSON: Keine spezifischen Parameter erforderlich für dieses Format.
Je nachdem, ob der Konnektor als Quell- oder Zieldatensatz verwendet wird, können zusätzliche Parameter angezeigt werden:
  • Für HDFS-Quelldatensätze:
    • Force parallelism—ignore escape char and text enclosure parameters (Parallelismus forcieren - Maskierungszeichen und Textbegrenzungsparameter ignorieren): Aktivieren Sie diese Option, wenn Maskierungszeichen sowie die Zeichen, die in Ihrer Datei zur Begrenzung von Text verwendet werden, ignoriert werden sollen.
  • Für HDFS-Zieldatensätze:
    • Overwrite (Überschreiben): Aktivieren Sie diese Option, wenn die Datei bereits vorhanden ist und Sie deren Inhalt überschreiben möchten.
    • Merge output (Ausgabe zusammenführen): Aktivieren Sie diese Option, wenn die Datei bereits vorhanden ist und Sie den vorhandenen und aktualisierten Dateiinhalt zusammenführen möchten.
    • Map input column names to output (Mapping von Eingabe- auf Ausgabespaltennamen): Diese Option bezieht sich nur auf Dateien im Format CSV, JSON und Excel. Mit dieser Option wird sichergestellt, dass die Namen der Eingabe- und Ausgabefelder übereinstimmen.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!