Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Folgen einer Datenmaskierung

Je nach dem semantischen Typ der Spalte, auf die Sie die Funktion Mask data (obfuscation) (Daten maskieren (Obfuskation)) anwenden, stehen andere Parameter mit unterschiedlicher Wirkung zur Verfügung.

Text und semantische Typen

Bei Textdaten schlägt Talend Data Preparation automatisch einen der vordefinierten semantischen Typen, einen Ihrer benutzerdefinierten semantischen Typen oder den Typ Text vor. Im Fall der vordefinierten und benutzerdefinierten semantischen Typen kann es sich um einen regulären Ausdruck oder ein Wertewörterbuch handeln.

Die folgende Tabelle zeigt die verfügbaren Maskierungsroutinen für eine Spalte des Typs Text oder einen der vordefinierten bzw. benutzerdefinierten semantischen Typen und deren Wirkung beispielsweise auf den Wert Talend in 2018 is awesome (Talend im Jahr 2018 ist einzigartig).

Maskierungsroutine Beschreibung Parameter Ausgabe
Semantic masking (Semantische Maskierung)
  • Für auf einem regulären Ausdruck basierende semantische Typen generiert die Funktion Datensätze nach dem Zufallsprinzip, die dem Muster des regulären Ausdrucks entsprechen.
    InformationshinweisAnmerkung: Semantische Typen, die mit regulären Ausdrücken erstellt wurden, die nicht mit der Bibliothek dk.brics.automaton kompatibel sind, unterstützen die semantische Maskierung nicht. Jedes Zeichen des Datensatzes wird willkürlich ersetzt.
  • Für wörterbuchbasierte semantische Typen ersetzt die Funktion die Datensätze nach dem Zufallsprinzip durch Werte, die aus dem Wörterbuch extrahiert wurden, das zuvor zur Erstellung des semantischen Typs verwendet wurde.
Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar) Äåòçôî ëð 1889 òn äipïåvu
Keep characters between two positions (Zeichen zwischen zwei Positionen beibehalten) Alle im ausgewählten Intervall enthaltenen Zeichen bleiben unverändert, die Zeichen außerhalb des Intervalls werden gelöscht.
  • Beginning index (Anfangsindex): 11
  • End index (Endindex): 25
2018 is awesome
Generate from Char Pattern (Aus Zeichenmuster generieren) Ausgehend vom Muster Ihrer Wahl wird ein Datensatz mit willkürlichen Zeichen erstellt.
  • Character pattern (Zeichenmuster): aaaaaa 9999 aaaaaaa
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
õaßayè 8908 æluäco
Remove characters between two positions (Zeichen zwischen zwei Positionen entfernen) Alle im ausgewählten Intervall enthaltenen Zeichen werden entfernt, die Zeichen außerhalb des Intervalls bleiben unverändert.
  • Beginning index (Anfangsindex): 7
  • End index (Endindex): 14
Talend is awesome
Replace all (Alle ersetzen) Alle Zeichen werden durch das Ersatzzeichen Ihrer Wahl ersetzt.
  • Replacement (Ersatz): x
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
xxxxxxxxxxxxxxxxxxxxxxxxx
Replace all digits (Alle Zahlen ersetzen) Alle Zahlen werden durch das Ersatzzeichen Ihrer Wahl ersetzt. Die Buchstaben werden unverändert beibehalten.
  • Replacement (Ersatz): 9
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
Talend in 9999 is awesome
Replace all letters (Alle Buchstaben ersetzen) Alle Buchstaben werden durch das Ersatzzeichen Ihrer Wahl ersetzt. Zahlen werden unverändert beibehalten.
  • Replacement (Ersatz): y
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
yyyyyy yy 2018 yy yyyyyyy
Replace characters between two positions (Zeichen zwischen zwei Positionen ersetzen) Alle im ausgewählten Intervall enthaltenen Zeichen werden ersetzt, die Zeichen außerhalb des Intervalls bleiben unverändert.
  • Beginning index (Anfangsindex): 1
  • End index (Endindex): 6
  • Replacement (Ersatz): a
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
aaaaaa in 2018 is awesome
Replace first n characters (Erste n Zeichen ersetzen) Die ersten n Zeichen werden durch das Ersatzzeichen Ihrer Wahl ersetzt, die folgenden Zeichen bleiben unverändert.
  • Number of characters (Anzahl Zeichen): 17
  • Replacement (Ersatz): @
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
@@@@@@@@@@@@@@@@@ awesome
Replace last n characters (Letzte n Zeichen ersetzen) Die letzten n Zeichen werden durch das Ersatzzeichen Ihrer Wahl ersetzt, die vorhergehenden Zeichen bleiben unverändert.
  • Number of characters (Anzahl Zeichen): 10
  • Replacement (Ersatz): !
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
Talend in 2018 !!!!!!!!!!
Keep first n digits and replace following ones (Erste n Zahlen beibehalten und alle folgenden ersetzen) Die ersten n Ziffern werden unverändert beibehalten, die folgenden Ziffern werden nach dem Zufallsprinzip ersetzt. Andere Zeichen als Zahlen bleiben unverändert.
  • Number of digits (Anzahl Zahlen): 1
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
Talend in 2436 is awesome
Keep last n digits and replace previous ones (Letzte n Zahlen beibehalten und alle vorhergehenden ersetzen) Die letzten n Ziffern werden unverändert beibehalten, die vorhergehenden Ziffern werden nach dem Zufallsprinzip ersetzt. Andere Zeichen als Zahlen bleiben unverändert.
  • Number of digits (Anzahl Zahlen): 2
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
Talend in 1618 is awesome

Numerische Werte

Die folgende Tabelle enthält die verfügbaren Maskierungsroutinen für eine Spalte mit numerischen Werten vom Typ Integer (Ganzzahl) oder Decimal (Dezimalwert) und deren Wirkung auf den Wert 21803 beispielsweise.

Maskierungsroutine Parameter Ausgabe
Replace with random value (Durch willkürlichen Wert ersetzen)
  • Maximum variation (%) (Max. Abweichung (%)): 10
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
21499
Generate value between two values (Wert zwischen zwei Werten generieren)
  • Minimum value (Mindestwert): 20000
  • Maximum value (Höchstwert): 22000
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
21876

Datumsangaben

Die folgende Tabelle enthält die verfügbaren Maskierungsroutinen für eine Spalte vom semantischen Typ Date (Datum) und deren Wirkung auf den Wert 05/04/2018 beispielsweise.

Maskierungsroutine Parameter Ausgabe
Replace with random date (Durch willkürliches Datum ersetzen)
  • Maximum variation (in days) (Max. Abweichung (in Tagen)): 365
  • Masking mode (Maskierungsmodus): Random (Willkürlich) oder Repeatable (Wiederholbar)
23/11/2017
Keep year and set day and month to 01/01 (Jahr beibehalten und Tag und Monat auf 01/01 einstellen) N/A 01/01/2018

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!