データのクレンジング
プレパレーションが保存されたので、他のデータセットの場合と同様に顧客データの作業を開始して、通常のすべてのファンクションの中から選択を行うことができます。
最初にインポートしたデータセットには2万行が含まれていますが、最初の1万行のサンプルだけがデフォルトにより表示されます。しかし心配はいりません。追加するすべてのプレパレーションステップをデータセット全体に適用できます。
データセット内のすべてのデータが有効でエラーのない状態にするために、いくつかの基本的なクレンジング操作を実行します。
たとえば、First_NameカラムとLast_Nameカラムの一部のエントリーに不要な空白があります。
各カラムの下のクオリティバーも、データに空のセルまたは無効なセルが含まれていることを示しています。Email (メール)カラムなどには両方があります。
1回の操作でプレパレーションからすべての空の行と無効な行を削除し、顧客名が含まれているカラムのフォーマットエラーを削除します。
手順
タスクの結果
2つの簡単な操作で、データセット内のエラーをすべて削除し、データの質が改善されました。
各カラムのクオリティバーはすべてグリーンになり、プレパレーションに無効なデータが残っていないことを示しています。
このページは役に立ちましたか?
このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。