Zu Hauptinhalt springen

Liste der Funktionen

In diesen Tabellen werden alle in Talend Cloud Data Preparation verfügbaren Funktionen sowie deren Wirkung aufgeführt.

Bei der Anwendung einer der nachstehend aufgelisteten Funktionen - mit Ausnahme der Funktionen vom Typ Math (Mathematik) - wird der Eingabewert zurückgegeben, wenn die Daten als ungültig eingestuft werden oder der Datentyp nicht mit der ausgewählten Funktion kompatibel ist, ungeachtet dessen, ob das Kontrollkästchen Create new column (Neue Spalte erstellen) aktiviert oder deaktiviert ist.

Bei Funktionen vom Typ Math (Mathematik) werden leere Werte ignoriert, während ungültige Werte bei Anwendung der Funktion ein leeres Resultat ergeben.

InformationshinweisAnmerkung:

Die folgenden Funktionen, die auf Matching-Algorithmen zurückgreifen, bieten keine Unterstützung für asiatische Zeichen:

  • Standardize value (fuzzy matching) (Standardisieren von Werten (Fuzzy Matching))
  • Find and group similar text (Ähnlichen Text finden und gruppieren)
Auf Zeilen anwendbare Funktionen
Name Kategorie Beschreibung
Delete row (Zeile löschen) Datenbereinigung Löscht diese Zeile.
Make as header (Als Header verwenden) Datenbereinigung Die Zellen dieser Zeile werden Spaltennamen, die Zeile wird gelöscht.
Auf Spalten anwendbare Funktionen
Name Kategorie Beschreibung
Negate value (Wert negieren) Boolescher Wert Der boolesche Wert in den Zellen dieser Spalte wird umgekehrt.
Change data type (Datentyp ändern) Spaltenspez. Metadaten Der Typ dieser Spalte wird geändert (Zahl, Text, Datum usw.).
Change semantic domain (Semantische Domäne ändern) Spaltenspez. Metadaten Die semantische Domäne dieser Spalte wird geändert (Ort, PLZ, Nachname usw.).
Create new column (Neue Spalte erstellen) Spaltenspez. Metadaten Die Spalte wird kopiert oder es wird eine völlig neue Spalte erstellt.
InformationshinweisAnmerkung: Bei einer Verwendung im Sequence mode (Sequenzmodus) ist diese Funktion nicht mit Spark-Jobs und HDFS- oder S3-Exporten kompatibel.
Delete column (Spalte löschen) Spaltenspez. Metadaten Die ausgewählten Spalten werden gelöscht.
Duplicate column (Spalte duplizieren) Spaltenspez. Metadaten Es wird eine genaue Kopie dieser Spalte angefertigt.
Rename column (Spalte umbenennen) Spaltenspez. Metadaten Die Spalte wird dupliziert.
Concatenate columns (Spalten konkatenieren) Spalten Der Inhalt von zwei oder mehreren Spalten wird in einer Spalte zusammengeführt.
Concatenate with (Konkatenieren mit) Spalten Der Inhalt der Spalte wird mit einer anderen Spalte zusammengeführt und in einer neuen Spalte angezeigt.
Reorder columns (Spalten neu anordnen) Spalten Die Spaltenreihenfolge wird geändert.
Swap columns (Spalten vertauschen) Spalten Die Werte werden mit denjenigen einer anderen Spalte vertauscht.
Convert country names and codes (Ländernamen und -codes konvertieren) Konvertierungen Ein Ländername wird in einen ISO-3166-Ländercode (Alpha-2, Alpha-3 oder numerisch) konvertiert bzw. umgekehrt. Diese Funktion unterstützt englische, französische und japanische Namen und Codes.
Convert distance (Distanz konvertieren) Konvertierungen Eine Entfernung wird von einer in eine andere Einheit konvertiert.
Convert duration (Dauer konvertieren) Konvertierungen Eine Dauer wird von einer in eine andere Einheit konvertiert.
Convert temperature (Temperatur konvertieren) Konvertierungen Die Einheiten von Temperaturmesswerten werden konvertiert.
Clear on matching value (Bei übereinstimmendem Wert löschen) Datenbereinigung Die Zellen, die dem vorgegebenen Wert entsprechen, werden gelöscht.
Clear the cells with invalid values (Zellen mit ungültigen Werten löschen) Datenbereinigung Bereinigt Zellen, die einen als ungültig erkannten Wert enthalten.
Coalesce columns (Zusammenfügen von Spalten) Datenbereinigung Der erste Wert ungleich Null wird für jede Zeile aus den ausgewählten Spalten abgerufen.
Delete empty rows (Leere Zeilen löschen) Datenbereinigung Entfernt die Zeilen, in denen die Zelle in jeder Spalte leer ist.
Delete the rows that match (Übereinstimmende Zeilen löschen) Datenbereinigung Die Zeilen, die eine Zelle in dieser Spalte mit einem vorgegebenen Wert enthalten, werden gelöscht.
Delete the rows with empty cell (Zeilen mit leeren Zellen löschen) Datenbereinigung Löscht Zeilen, die leere Zellen enthalten.
Delete the rows with invalid cell (Zeilen mit ungültiger Zelle löschen) Datenbereinigung Zeilen, die eine ungültige Zelle enthalten, werden gelöscht.
Delete the rows with negative values (Zeilen mit negativen Werten löschen) Datenbereinigung Die Zeilen mit einem negativen Wert in dieser Spalte werden gelöscht.
Fill cells with value (Zellen mit Werten füllen) Datenbereinigung Füllt die Zellen in der Spalte mit einem vorgegebenen Wert.
Fill empty cells from above (Leere Zellen von oben füllen) Datenbereinigung Kopiert den Wert der nächsten nicht-leeren Zelle oberhalb. Wenn mehrere nicht leere Zellen vorhanden sind, werden alle mit demselben Wert gefüllt, der ursprünglich von oben übernommen wurde.
InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs und HDFS- oder S3-Exporten kompatibel.
Fill empty cells with text (Leere Zellen mit Text füllen) Datenbereinigung Füllt leere Zellen in der Spalte mit einem vorgegebenen Wert.
Fill empty cells with value (Leere Zellen mit Wert füllen) Datenbereinigung Füllt die Zellen in der Spalte mit einem vorgegebenen Wert.
Standardize value (fuzzy matching) (Wert standardisieren (Fuzzy Matching)) Datenbereinigung Ersetzt die ungültigen Werte durch den ähnlichsten gültigen Wert aus dem Wörterbuch.
InformationshinweisAnmerkung: Diese Funktion unterstützt keine asiatischen Zeichen.
Hash data (Daten hashen) Datenmaskierung Hasht den Inhalt einer Spalte unter Verwendung des SHA-256-Algorithmus.
Mask data obfuscation ((Daten maskieren) (Obfuskation)) Datenmaskierung Maskiert Daten gemäß den Domäneninformationen der Spalte (Anonymisierung).
Lookup Datenmischung Übernimmt Spalten aus einem anderen Datensatz in diesen.
Calculate time since (Zeit berechnen seit) Datumsangaben Berechnet die verstrichene Zeit seit einem bestimmten Datum in der angegebenen Einheit (Jahr, Monat, Tag, Stunde, Minute, Sekunde).
Calculate timestamp to date (Zeitstempel zur Datierung berechnen) Datumsangaben Ausgehend von einem Zeitstempel (verstrichene Zeit in Sekunden seit Unix-Zeit, d. h. 01.01.1970) wird eine neue Spalte mit dem Datum erstellt.
Change date format (Datumsformat ändern) Datumsangaben Ändert das in einer Datumsspalte zu verwendende Datumsformat.
Compare dates (Datumsangaben vergleichen) Datumsangaben Vergleicht die Spalte mit einer anderen Spalte oder Konstanten.
Convert dates (Datum konvertieren) Datumsangaben Konvertiert Daten von einem Kalender in einen anderen.
Extract date parts (Datumsteile extrahieren) Datumsangaben Erstellt Spalten mit Jahr, Monat, Quartal, Tag, Stunde, Minute, Sekunde usw.
Modify dates (Datum ändern) Datumsangaben Addiert oder subtrahiert eine bestimmte Menge in der Zeiteinheit.
Deduplicate rows with identical values (Zeilen mit identischen Werten deduplizieren) Deduplizierung Löscht Zeilen, die partielle oder vollständige Duplikate sind. Die erste Spalte wird beibehalten.
InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs und HDFS- oder S3-Exporten kompatibel.
Delete these filtered rows (Diese gefilterten Zeilen löschen) Gefiltert Es werden nur die Zeilen gelöscht, die den aktuellen Filtern entsprechen.
Keep these filtered rows (Diese gefilterten Zeilen beibehalten) Gefiltert Es werden nur die Zeilen beibehalten, die den aktuellen Filtern entsprechen.
Add, multiply, substract or divide (Addieren, multiplizieren, subtrahieren oder dividieren) Mathematik Führt eine Operation/Berechnung für diese Spalte mit einer anderen Spalte oder einem festen Wert durch: Addieren/summieren (+), multiplizieren (x), subtrahieren (-) oder dividieren (/)
Base 10 Logarithm (Logarithmus zur Basis 10) Mathematik Berechnet den Zehnerlogarithmus aus einer Spalte.
Calculate absolute value (Absolutwert berechnen) Mathematik Berechnet den Absolutwert für alle numerischen Werte in der Spalte.
Cosine (Kosinus) Mathematik Errechnet den trigonometrischen Kosinus aus einer Spalte.
Exponential Mathematik Exponential einer Spaltenzahl.
Max (Max.) Mathematik Maximum mit anderer Spalte oder Konstante
Max of columns (Höchstwert der Spalten) Mathematik Zeigt den Höchstwert der Datenelemente von zwei oder mehr Spalten an.
Mean of columns (Mittelwert der Spalten) Mathematik Berechnet den Mittelwert der Datenelemente von zwei oder mehr Spalten.
Median of columns (Medianwert der Spalten) Mathematik Berechnet den Medianwert der Datenelemente von zwei oder mehr Spalten.
Min (Min.) Mathematik Mindestwert mit anderer Spalte oder Konstante
Min of columns (Mindestwert der Spalten) Mathematik Zeigt den Mindestwert der Datenelemente von zwei oder mehr Spalten an.
Modulo Mathematik Berechnet den Restwert einer Division.
Multiply columns (Spalten multiplizieren) Mathematik Multipliziert die Werte von zwei oder mehr Spalten und zeigt das Ergebnis in einer neuen Spalte an.
Natural logarithm (Natürlicher Logarithmus) Mathematik Berechnet den natürlichen Logarithmus aus einer Spalte.
Negate (Negieren) Mathematik Negiert eine Spaltenzahl.
Power (Potenz) Mathematik Erstellt die Potenz mit einer anderen Spalte oder Konstanten.
Sine (Sinus) Mathematik Errechnet den trigonometrischen Sinus aus einer Spalte.
Square root (Quadratwurzel) Mathematik Errechnet die Quadratwurzel einer Spaltenzahl.
Sum columns (Spalten summieren) Mathematik Berechnet die Summe der Datenelemente von zwei oder mehr Spalten und zeigt das Ergebnis in einer neuen Spalte an.
Tangent (Tangente) Mathematik Errechnet die trigonometrische Tangente aus einer Spalte.
Compare numbers (Zahlen vergleichen) Zahlen Vergleicht die Spalte mit einer anderen Spalte oder Konstanten.
Format numbers (Zahlen formatieren) Zahlen Ermöglicht die Formatierung von Zahlen (Dezimalwerte, Ganzzahlen und wissenschaftliches Format) in einem spezifischen Format oder Muster.
Generate sequence (Sequenz generieren) Zahlen Erstellt eine Folge positiver oder negativer Ganzzahlen (Integer) in einer Spalte mit dem Schritt Ihrer Wahl.
InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs und HDFS- oder S3-Exporten kompatibel.
Remove fractional part (Bruchteil entfernen) Zahlen Rundet die Werte in Richtung null (3,74 -> 3) und (-3,74 -> -3).
Remove negative values (Negative Werte entfernen) Zahlen Ersetzt negative Ganzzahlen bzw. Dezimalwerte durch leere Werte.
Round value using ceil mode (Wert runden im Ceil-Modus) Zahlen Rundet Werte gemäß der von Ihnen festgelegten Genauigkeit auf die nächste Zahl auf (3,14 -> 4, wenn Precision (Genauigkeit) auf 0, bzw. 3,14 -> 3,2, wenn Precision (Genauigkeit) auf 1 eingestellt ist).
Round value using down mode (Wert runden im Down-Modus) Zahlen Rundet Werte in Richtung null (3,74 -> 3 bzw. -3,74 -> -3, wenn Precision (Genauigkeit) auf 0 eingestellt ist).
Round value using floor mode (Wert runden im Floor-Modus) Zahlen Rundet Werte gemäß der von Ihnen festgelegten Genauigkeit auf die nächste Zahl ab (3,74 -> 3, wenn Precision (Genauigkeit) auf 0, bzw. 3,74 -> 3,7, wenn Precision (Genauigkeit) auf 1 eingestellt ist).
Round value using halfUp mode (Wert runden im Halfup-Modus) Zahlen Rundet Werte auf die nächste Zahl gemäß der von Ihnen festgelegten Genauigkeit (3,14 -> 3 und 3,74 -> 4 für eine Precision (Genauigkeit) von 0).
Extract phone number information (Informationen zu Telefonnummern extrahieren) Telefonnummern Extrahiert zusätzliche Informationen zu Telefonnummern, z. B. Telefontyp, Land und Betreibername. Jedes Feld wird in einer neuen Spalte extrahiert.
Format phone number (Telefonnummer formatieren) Telefonnummern Formatiert Telefonnummern gemäß den Standardformaten.
Extract email parts (E-Mail-Teile extrahieren) Untergliedern Extrahiert lokale und domänenspezifische Teile aus einer E-Mailadresse.
Extract full name parts (Teile eines vollständigen Namens extrahieren) Untergliedern Extrahiert Informationen aus einem vollständigen Namen, u. a. Anrede, Vorname, Kurzname, zweiter/dritter Vorname, Nachname und Suffix.
Extract number (Zahl extrahieren) Untergliedern Extrahiert die Zahl aus der Eingabe.
Extract values by regex (Werte über Regex extrahieren) Untergliedern Extrahiert Zeichenfolgen-Token basierend auf Regex-Gruppen.
Extract values by semantic type (Werte nach semantischem Typ extrahieren) Untergliedern Extrahiert verschiedene Informationen in separate Spalten gemäß den vor- oder benutzerdefinierten semantischen Typen.
Extract URL parts (URL-Teile extrahieren) Untergliedern Extrahiert Protokoll, Host, Port, Abfrage usw. aus einer URL in separate Spalten.
Split the text in parts (Text in Teile untergliedern) Untergliedern Unterteilt die Spalte über Begrenzer.
Calculate length (Länge berechnen) Zeichenfolgen Extrahiert die Anzahl an Zahlen aus einem Wert (23562 -> 5).
Change to lower case (In Kleinbuchstaben ändern) Zeichenfolgen Der gesamte Zellentext in dieser Spalte wird in Kleinbuchstaben umgewandelt.
Change to title case (In 'Erster Buchstabe groß' ändern) Zeichenfolgen Jedes Wort in der Spalte beginnt mit einem Großbuchstaben (Beispiel: „Das ist ein Beispiel“ -> „Das Ist Ein Beispiel“).
Change to upper case (In Großbuchstaben ändern) Zeichenfolgen Der gesamte Zellentext in dieser Spalte wird in Großbuchstaben umgewandelt (GROSS).
Contains text (Enthält Text) Zeichenfolgen Prüft, ob die Zelle den vorgegebenen Wert enthält.
Extract a value by index (Wert nach Index extrahieren) Zeichenfolgen Extrahiert einen Textteil (Teilzeichenfolge) in eine neue Spalte.
Magic Fill Zeichenfolgen Ermöglicht Ihnen die Definition eines Musters anhand von Beispielen und die Anwendung der Transformation auf die gesamte Spalte.
InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs und HDFS- oder S3-Exporten kompatibel.
Match similar text (Ähnlichen Text suchen) Zeichenfolgen Erstellt eine neue Spalte mit true oder false, je nachdem, ob der Wert kleiner ist als die Levenshtein-Distanz eines vorgegebenen Werts oder dieser entspricht.
Match pattern (Mit Muster abgleichen) Zeichenfolgen Erstellt eine neue Spalte mit true oder false, je nachdem, ob der Wert einem bestimmten Muster entspricht.
Remove consecutive characters (Aufeinanderfolgende Zeichen entfernen) Zeichenfolgen Entfernt aufeinanderfolgende Zeichen.
Remove part of the text (Textteile entfernen) Zeichenfolgen Entfernt den angegebenen Text aus den Zellen in der Spalte.
Remove trailing and leading characters (Angehängte und führende Zeichen entfernen) Zeichenfolgen Entfernt angehängte oder führende Zeichen (d. h. trimmen).
Search and replace (Suchen und ersetzen) Zeichenfolgen Ersetzt Zellen oder Zellenteile, die einen bestimmten Wert enthalten.
Add extra characters (Zusätzliche Zeichen hinzufügen) Zeichenfolgen erweitert Fügt links oder rechts vom ursprünglichen Wert zusätzliche Zeichen hinzu (Padding), um eine erwartete Größe zu erreichen.
Convert character width (Zeichenbreite konvertieren) Zeichenfolgen erweitert Konvertiert die Zeichenbreite in Halfwidth oder Fullwidth oder normalisiert die Zeichenfolgen.
Find and group similar text (Ähnlichen Text finden und gruppieren) Zeichenfolgen erweitert Ersetzt alle vergleichbaren Werte durch den richtigen Wert (d. h. Cluster bei Fuzzy Matching).
InformationshinweisAnmerkung: Diese Funktion unterstützt keine asiatischen Zeichen.
Generate unique identifier (UUID) (Eindeutige Kennung (UUID) generieren) Zeichenfolgen erweitert Generiert eine eindeutige Kennung für jede Zeile der Spalte.
Remove all non alpha numeric characters (Nicht-alphanumerische Zeichen entfernen) Zeichenfolgen erweitert Löscht Werte, die unerwartete Zeichen enthalten, indem alle Zeichen ungleich 0-9, Aa-Zz und akzentuierte Buchstaben entfernt werden. Leerzeichen werden beibehalten.

Beispiel: T=+Âl**€en#d$ 20%1,7 wird zu TÂlend 2017.

Remove all non numeric characters (Nicht-numerische Zeichen entfernen) Zeichenfolgen erweitert Löscht numerische Werte, indem alle Zeichen ungleich 0-9 entfernt werden. Dezimaltrennzeichen und Leerzeichen werden beibehalten.

Beispiel: T=+Âl**€en#d$ 20%1,7 wird zu 201,7.

Simplify text (remove case, accent, etc.) (Text vereinfachen (Groß-/Kleinschreibung, Akzente entfernen usw.)) Zeichenfolgen erweitert Vereinfacht den Inhalt der Spalte durch Setzen des Inhalts in Kleinbuchstaben, Entfernen der Akzente, Normalisieren mithilfe von NFKD, Teilen kombinierter Zeichen und Trimmen der gesamten Zeichenfolge.

Beispiel: François wird zu francois.

Auf ganze Tabellen anwendbare Funktionen
Name Kategorie Beschreibung
Delete empty columns (Leere Spalten löschen) Datenbereinigung Alle Spalten, die nur leere Werte enthalten, werden gelöscht.
Delete empty rows (Leere Zeilen löschen) Datenbereinigung Entfernt die Zeilen, in denen die Zelle in jeder Spalte leer ist.
Change date format (Datumsformat ändern) Datumsangaben Ändert das in einer Datumsspalte zu verwendende Datumsformat.
Remove duplicate rows (Zeilenduplikate entfernen) Deduplizierung Löscht alle Zeilen, die genaue Duplikate sind, und behält nur jeweils eine Instanz.
InformationshinweisAnmerkung: Diese Funktion ist nicht mit Spark-Jobs und HDFS- oder S3-Exporten kompatibel.
Format numbers (Zahlen formatieren) Zahlen Ermöglicht die Formatierung von Zahlen (Dezimalwerte, Ganzzahlen und wissenschaftliches Format) in einem spezifischen Format oder Muster.
Format phone number (Telefonnummer formatieren) Telefonnummern Formatiert Telefonnummern gemäß den Standardformaten.
Remove trailing and leading characters (Angehängte und führende Zeichen entfernen) Zeichenfolgen Entfernt angehängte oder führende Zeichen (d. h. trimmen).
Search and replace (Suchen und ersetzen) Zeichenfolgen Ersetzt Zellen oder Zellenteile, die einen bestimmten Wert enthalten.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!