このカラムセット分析を実行する前に、インジケーターの設定、データフィルター、分析パラメーターを定義する作業が残っています。
始める前に
手順
-
[Analysis Parameters] (分析パラメーター)ビューで、次を実行します。
- [Number of connections per analysis] (分析ごとの接続数)フィールドで、分析ごとに、選択したデータベースへの接続に対して許可する同時接続数を設定します。
この数値はデータベースの利用可能リソース、つまりデータベースがサポートできる同時接続数に基づいて設定します。
- [Execution engine] (実行エンジン)リストから、分析の実行に使用するJavaまたはSQLのいずれかのエンジンを選択します。
- Javaエンジンを選択した場合、[Store data] (データの保存)チェックボックスはデフォルトでオンになっており、オフにすることはできません。分析が実行されると、いつでもプロファイリング結果をローカルで使用できるため、[Analysis Results] (分析結果) > [Data] (データ)ビューを通じて結果をドリルダウンできます。
Javaエンジンを使用して分析を実行すると、すべてのデータが取得され、ローカルに保存された時にディスク容量が使用されます。空き容量を作成する場合は、Talend-Studio/workspace/project_name/Work_MapDBのメインのTalend Studioディレクトリー内に保存されているデータを削除できます。
- SQLエンジンを選択した場合は、[Store data] (データの保存)チェックボックスを使い、分析されたデータをローカルに保存して[Analysis Results] (分析結果) > [Data] (データ)ビューでアクセスするかどうか決定できます。注: 分析しているデータが非常に大きい場合は、分析計算の最後に結果を保管しないように、[Store data] (データの保管)チェックボックスをオフにしておくことをお勧めします。
- Javaエンジンを選択した場合、[Store data] (データの保存)チェックボックスはデフォルトでオンになっており、オフにすることはできません。分析が実行されると、いつでもプロファイリング結果をローカルで使用できるため、[Analysis Results] (分析結果) > [Data] (データ)ビューを通じて結果をドリルダウンできます。
- [Number of connections per analysis] (分析ごとの接続数)フィールドで、分析ごとに、選択したデータベースへの接続に対して許可する同時接続数を設定します。
-
分析を保存し、[F6]を押して実行します。
分析エディターが[Analysis Results] (分析結果)ビューに切り替わり、分析結果がテーブルとグラフィックで表示されます。グラフ結果では、各カラム個別の値ではなく、分析対象カラムの完全レコードに関するシンプル統計が得られます。
分析するカラムのセットのコンテンツに一致させるためにパターンを使う場合は、使用するパターンの総計を基に一致結果と非一致結果を表すグラフが表示されます。
-
[Simple Statistics] (シンプル統計)テーブルで、インジケーター結果を右クリックして[View Rows] (行の表示)または[View Values] (値の表示)を選択します。
- Javaエンジンを使用して分析を実行する場合、分析対象データのリストがProfilingパースペクティブで開きます。
- SQLエンジンを使用して分析を実行する場合、分析対象データのリストが Data Explorer パースペクティブで開きます。
-
[All Match] (すべて一致)テーブルで、結果行を右クリックして[Generate an ETL job to handle rows] (行を処理するETLジョブを生成)を選択します。
既製ジョブが生成され、 Integration パースペクティブで開きます。このジョブによって有効な行および無効な行がグルーピングされ、それぞれ別々のファイルに書き込まれます。注: [All Match] (すべて一致)テーブルは、Javaエンジンを使用して分析を実行する場合のみ使用できます。
-
[Data] (データ)ビューで[Filter Data] (データのフィルタリング)をクリックし、使用されるパターンに基づいて有効な値および無効な値をフィルタリングします。
Javaエンジンを使用して分析を実行する場合のみデータをフィルター処理できます。詳細は、パターンを基にデータをフィルタリングするをご覧ください。