Accéder au contenu principal

tReservoirSampling

Ce composant extrait un échantillon de données aléatoires d'un ensemble de Big Data.

Le tReservoirSampling extrait un échantillon du jeu de données d'entrée afin que les résultats du profiling de cet échantillon de données soient uniformes et homogènes par rapport à ceux du profiling de l'intégralité du jeu de données.

En mode local, les versions 2.0, 2.3, 2.4 et 3.0 d'Apache Spark sont supportées.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Selon le produit Talend que vous utilisez, ce composant peut être utilisé dans un framework de Jobs, dans plusieurs, ou dans tous les frameworks :

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !