メイン コンテンツをスキップする 補完的コンテンツへスキップ

Tableau Server Extract (Hyper) Data Store - インポート

Availability-note AWS

ブリッジの要件

このブリッジ:
  • ドライバーを<TDC_HOME>/data/download/MIMB/にダウンロードするためには、https://repo.maven.apache.org/maven2/ やその他のツールサイトへのインターネットアクセスが必要です。

ブリッジの仕様

ベンダー Tableau
ツール名 Tableauサーバーとクラウド
ツールバージョン 8.x〜2023.x
ツールのWebサイト https://help.tableau.com/current/pro/desktop/en-us/extracting_data.htm (英語のみ)
サポートされている方法論 [リレーショナルデータベース] マルチモデル、データストア(物理データモデル)、(式解析)、BIレポート(リレーショナルソース) Java API経由の on HYPER (prev. TDE)ファイル
データプロファイリング
増分収集
マルチモデル収集
モデル選択のためのリモートリポジトリーの参照

仕様
ツール: HYPER (以前のTDE)ファイルでのJava API経由のTableau / Tableauサーバーおよびクラウドバージョン8.x〜2023.x TDE)ファイル
https://help.tableau.com/current/pro/desktop/en-us/extracting_data.htmをご覧ください
メタデータ: [リレーショナルデータベース] マルチモデル、データストア(物理データモデル)、(式解析)、BIレポート(リレーショナルソース)
コンポーネント: TableauExtractバージョン11.2.0

免責事項
このインポートブリッジでは、インターネットに接続して次のサードパーティライブラリーをダウンロードする必要があります:
- オープンソースのサードパーティライブラリーをダウンロードする場合はhttps://repo.maven.apache.org/maven2/など
- その他のサードパーティソフトウェア(データベース特定のJDBCドライバーなど)は該当するサイトへ

ダウンロードされたサードパーティライブラリーは、$HOME/data/download/MIMB/に格納されています。
HTTPSが失敗した場合、インポートブリッジはHTTPを試します。
- インターネットへのアクセスにプロキシを使用している場合は、JREでそのプロキシを設定する必要があります(Miscellaneousパラメーターで -j オプションをご覧ください)。
- インポートブリッジではインターネットにフルにアクセスできない場合は、インターネットアクセスがある別のサーバーから$HOME/data/download/MIMB/ディレクトリーをコピーします。$HOME/bin/MIMB.sh (または.bat) -dというコマンドを使えば、すべてのブリッジで使用される全サードパーティライブラリーを一度にダウンロードできます。

このインポートブリッジを実行すると、ライセンス規約の責任、およびダウンロードしたサードパーティソフトウェアライブラリーによって生じる潜在的なセキュリティの脆弱性を受け入れることになります。

概要
このインポートブリッジは、Tableauサーバーのデータ抽出(.hyper)ファイルをデータストアとしてインポートします。

要件
このインポートブリッジにはTableauサーバーへのネットワーク接続が必要です。このサーバーではネットワークSSLまたはプロキシ設定が求められることがあります(詳細はサーバーパラメーターをご覧ください)。そのため、インポートブリッジが動作しているマシンのWebブラウザーで、同じ設定でTableauサーバーにアクセスできることが必要です。

ユーザーには適切な権限が必要です(詳細はユーザーパラメーターをご覧ください)。

インポートファイルは、TableauサーバーおよびTableau Hyper APIに対するHTTP(S)の接続に依存します。
Tableau Hyper APIインストールおよび設定に関する詳細は、https://help.tableau.com/current/api/hyper_api/en-us/index.htmlをご覧ください。

Tableauサーバー Extract (Hyper) Data Storeインポートブリッジを使い、独立したモデルとしてTableauサーバーからデータストアを抽出する場合、
"データソースを抽出"パラメーターを”外部インポート"に設定してTableauサーバー (リポジトリー)インポートブリッジを使用する必要があります。
これは、Tableau ExtractからTableau Workbookでの利用までの、データフローの接続解決(スティッチング)を可能にするためです。

よくある質問
該当なし

制限事項
現在判明している一般的な制限事項は、MIMB Known Limitationsか、バンドルされているDocumentation/ReadMe/MIMBKnownLimitations.htmlをご覧ください。

このインポートブリッジはSAMLを使ったログインをサポートしていません。

サポート
トラブルシューティングパッケージを次の項目と共に提供してください:
- デバッグログ(UIまたはconf/conf.propertiesでMIR_LOG_LEVEL=6を使って設定可能)
- 利用できる場合はメタデータバックアップ(技術的理由によりこの共通オプションが実装されていないブリッジがあるものの、Miscellaneousパラメーターで-backupオプションを使って設定可能)

Miscellaneousパラメーターの-backupオプションを使用して、トラブルシューティングを目的にTableauバックアップが自動生成されるように設定できます。
また、Tableauサーバーのバックアップ(.tsbak)を次のように手動で生成する方法もあります。
1- 管理者としてコマンドプロンプトを開きます。
2- Tableauサーバーがインストールされているディレクトリーに移動します:
C:\Program Files\Tableau\Tableauサーバー\7.0\bin (32ビット)
C:\Program Files (x86)\Tableau\Tableauサーバー\7.0\bin (64ビット)
3- 次のコマンドを入力します:
tabadmin backup tabserv --stop-server -d -t C:\temp\tableau
- tabservはバックアップファイル名です。
- C:\temp\tableauはバックアップ先ディレクトリーへのパスです。
パラメーター[--stop-server]を[--unsafe]に置き換えると、バックアップ操作中もTableauサーバーをオンラインに保つことができます。


ブリッジパラメーター

パラメーター名 説明 タイプ デフォルト 範囲
[Server] (サーバー) Tableauサーバー URL (デフォルトではhttp://localhost:80)
またはIPアドレス(192.168.0.2など)
SSLを使用している場合、URLはhttpsで始まる必要があります(SSLのデフォルトポート443が使われていない場合はカスタムポートで終わることもあります)。
STRING   http://localhost:80 必須
[Site] (サイト) Tableauサイトは、インストールされている複数のサイトでオンラインTableauサーバーに接続する時にのみ必要です。
値では大文字と小文字が区別されます。スペースはTableauに接続するためにURLに使用されているため、スペースを含めることはできません。
STRING      
[User Name] (ユーザー名) このブリッジで使用されているTableauのユーザー名。
そのユーザーにはすべてのメタデータを読み取るための適切なアクセス権が必要です。最初に管理者として試し(すべてのブリッジは読み取り専用であることが保証されており、メタデータのみを抽出してみます)、可能であればその次にメタデータのサブセットを試すことをお勧めします。成功すれば、必要なアクセス権だけを持つユーザーを使用できます。

ユーザーアカウントはTableauサーバーで[Interactor] (最新バージョンでは[Explorer]に名前が変更)としてライセンスされている必要があり、そのユーザーがインポートしようとしているすべてのブック、データソース、プロジェクトに対して[表示]権限と[ダウンロード]権限が必要です。ただし、[サイト管理者]セキュリティロールを持つアカウントの使用をお勧めします。

また、PATタイプの認証が必要な場合は、ユーザー名の代わりにpersonalAccessTokenNameを使用できます。
STRING     必須
パスワード Tableauユーザーのパスワード。

また、PATタイプの認証が必要な場合は、通常のパスワードの代わりにpersonalAccessTokenSecretを使用できます。
パスワード     必須
リポジトリーオブジェクト インポートするリポジトリーオブジェクト(ワークブック、データソース)のサブセット。
選択されたどのワークブックについても、依存するデータソースもインポートに含まれます。
ブリッジは、手動で入力されたオブジェクトをパスで検索できます。オブジェクト名にフォワードスラッシュ( / )が含まれている場合は、パスの区切りとしてフォワードスラッシュ( / )が、エスケープ文字としてバックスラッシュ( \ )がそれぞれ使われます。
REPOSITORY_SUBSET      
Tableau Hyper APIのライブラリーパス Tableau Data Extracts (.hyper)ファイルからメタデータの読み取りにTableau Hyper APIのライブラリーが必要です。

オペレーティングシステムとプロセッサーの各アーキテクチャーに対し、TableauではさまざまなバージョンのTableau Hyper APIを利用できます。作業する環境に対して正しいSDKディストリビューションを使用していることをご確認ください。
ダウンロード、要件、その他の情報は、https://help.tableau.com/current/api/hyper_api/en-us/index.htmlをご覧ください。
DIRECTORY     必須
複数のスレッド メタデータを非同期で収集するためのワーカースレッドの数。

- インポートブリッジに値を計算させる場合はパラメーターを空欄のままにしておきます。JVMアーキテクチャーと利用可能なCPUコアの数に応じて、1から6の間の数値を入れます。

- 実際のスレッド数を指定する場合は、1以上の数値を入力します。
指定した値が無効な場合は警告が表示され、1が使用されます。
メタデータを非同期で収集する時にメモリ不足になった場合は、数値を小さくして試してください。
マシンで利用できるメモリが多い(たとえば10GB以上)場合は、多くのドキュメントを一度に収集する時により大きな数値で試してみることができます。
ただし、設定した数値が大きすぎると、リソースの競合によりパフォーマンスの低下を招く場合があります。
数値      
Miscellaneous はじめに
ダッシュで始まるMiscellaneousオプションを指定し、必要であればその後にパラメーターを追加できます。例:
- connection.cast MyDatabase1="MICROSOFT SQL SERVER"
該当する場合は複数回使用できるオプションもあります。例:
- connection.rename NewConnection1=OldConnection1 -connection.rename NewConnection2=OldConnection2;
オプションのリストは長い文字列になるため、${MODEL_BRIDGE_HOME}\data\MIMB\parametersにあり拡張子が.txtであるファイルからロードすることもできます。その場合、オプションはすべて、このパラメーターの唯一の値としてそのファイル内で定義されることが必要です。例:
ETL/Miscellaneous.txt

JAVA環境のオプション
-java.memory <Javaメモリの最大サイズ> (以前の-m)

64ビットJREではデフォルトで1G、またはconf/conf.properties内の設定に従います。例:
-java.memory 8G
-java.memory 8000M

-java.parameters <Javaランタイム環境コマンドラインオプション> (以前の-j)


-java.parameters -Dname=value -Xms1G
のように、-java.parametersの後ろのテキストはすべてそのままJREに渡されるため、このオプションはMiscellaneousパラメーター内の最後に来る必要があります。インターネットへのアクセスにプロキシを使用している場合は、必要なサードパーティのソフトウェアライブラリーをダウンロードできるよう、次のオプションを設定する必要があります(このオプションはhttps://repo.maven.apache.org/maven2/にアクセスするため、そして例外的にいくつかの他のツールサイトにアクセスするために不可欠です)。
注: プロキシは、(会社の)外部トラフィックをHTTPSで暗号化しながら、HTTPでプロキシにアクセスできる内部トラフィックを信頼しているものがほとんどです。この場合、HTTPSリクエストはHTTPでプロキシに到達し、プロキシはそれをHTTPSで暗号化します。
-java.parameters -java.parameters -Dhttp.proxyHost=127.0.0.1 -Dhttp.proxyPort=3128 -Dhttp.proxyUser=user -Dhttp.proxyPassword=pass

モデルインポートのオプション
-model.name <モデル名>

モデル名をオーバーライドをオーバーライドします。例:
-model.name "My Model Name"

-prescript <スクリプト名>

このオプションによって、ブリッジの実行前にスクリプトを実行できるようになります。
スクリプトはbinディレクトリー(またはconf/conf.propertiesのM_SCRIPT_PATHで指定)にあり、拡張子が.batか.shであることが必要です。
スクリプトのパスに親ディレクトリーの記号( .. )を含めることはできません。
スクリプトは、成功した場合は終了コードである0を、失敗した場合は別の値を返します。
例:
-prescript "script.bat arg1 arg2"

-postscript <スクリプト名>

このオプションによって、ブリッジが正しく実行された後にスクリプトを実行できるようになります。
スクリプトはbinディレクトリー(またはconf/conf.propertiesのM_SCRIPT_PATHで指定)にあり、拡張子が.batか.shであることが必要です。
スクリプトのパスに親ディレクトリーの記号( .. )を含めることはできません。
スクリプトは、成功した場合は終了コードである0を、失敗した場合は別の値を返します。
例:
-postscript "script.bat arg1 arg2"

-cache.clear

インポート前にキャッシュをクリアするため、増分収集せずにフルインポートを実行します。

モデルが変更されず、-cache.clearパラメーターが使われていない場合(増分収集)、新しいバージョンは作成されません。
モデルが変更されず、-cache.clearパラメーターが設定されている場合(増分ではなくフルソースインポート)、新しいバージョンが作成されます。

-backup <directory>

このオプションによってブリッジ入力メタデータを保存すれば、将来のトラブルシューティングで活用できます。指定された<directory>は空であることが必要です。

このオプションの主な用途は、データストアインポートブリッジ(特にJDBCベースのデータベースインポートブリッジ)です。

なお、このオプションは次のようなブリッジでは動作しません。
- ファイルベースのインポートブリッジ(入力ファイルで代用可能なため)
- DI/BIリポジトリーインポートブリッジ(ツールのリポジトリーネイティブバックアップで代用可能なため)
- APIベース(COMベースなど)による一部のインポートブリッジ(技術的な理由のため)

データ接続オプション
使用するソースとターゲットのデータストアを参照するよう、通常はETL/DIツールとBIツールのインポートブリッジによってデータ接続が生成されます。これらのデータ接続はメタデータ管理ツールによって実際のデータストア(データベースやファイルシステムなど)への接続(メタデータスティッチング)に使われ、完全なエンドツーエンドのデータフローの来歴とインパクト分析が行われます。各データ接続の名前はインポートモデルごとに一意です。DI/BIデザインツールで使われているデータ接続名を可能な限り使用します。そうでない場合は、データベース/スキーマ名、ファイルシステムのパス、Uniform Resource Identifier (URI)など、短くても意味のある接続名が生成されます。次のオプションを使えば、接続を操作できます。これらのオプションによって、レガシーオプションである-c、-cd、-csが置き換えられます。

-connection.cast ConnectionName=ConnectionType

SQL解析のためにジェネリックデータベース接続(ODBCやJDBCなど)を正確なデータベースタイプ(ORACLEなど)にキャストします。例:
-connection.cast "My Database"="MICROSOFT SQL SERVER"
サポートされているデータストア接続タイプのリストは次のとおりです。
ACCESS
APACHE CASSANDRA
DB2/UDB
DENODO
GOOGLE BIGQUERY
HIVE
MYSQL
NETEZZA
ORACLE
POSTGRESQL
PRESTO
REDSHIFT
SALESFORCE
SAP HANA
SNOWFLAKE
MICROSOFT SQL AZURE
MICROSOFT SQL SERVER
SYBASE SQL SERVER
SYBASE AS ENTERPRISE
TERADATA
VECTORWISE
HP VERTICA

-connection.rename OldConnection=NewConnection

既存の接続を新しい名前に変更します。例:
-connection.rename OldConnectionName=NewConnectionName
既存の複数のデータベース接続の名前を変更し、新しい1つのデータベース接続に統合できます。例:
-connection.rename MySchema1=MyDatabase -connection.rename MySchema2=MyDatabase

-connection.split oldConnection.Schema1=newConnection

データベース接続を1つまたは複数のデータベース接続に分割します。
1つのデータベース接続をスキーマごとの1つの接続に分割できます。例:
-connection.split MyDatabase
すべてのデータベース接続をスキーマごとの1つの接続に分割できます。例:
-connection.split *
データベースにスキーマ名を追加することで、データベース接続を明示的に分割し、新しいデータベース接続を作成できます。例:
-connection.split MyDatabase.schema1=MySchema1

-connection.map SourcePath=DestinationPath

ソースパスをデスティネーションパスにマッピングします。これは、異なるパスが同じオブジェクト(ディレクトリーまたはファイル)をポイントしている場合にファイルシステム接続にとって便利です。
Hadoopでは、あるプロセスがHDFSの完全パスで指定されたCSVファイルに書き込む一方、別のプロセスが、デフォルトのファイル名と拡張子を持つ相対パスで指定されている同じファイルによって実装されたHiveテーブル(外部)から読み取ります。例:
-connection.map /user1/folder=hdfs://host:8020/users/user1/folder/file.csv
Linuxでは、/users/johnや/users/paulといった複数のシンボリックリンクによって、/dataのような特定のディレクトリー(またはファイル)が参照されます。例:
-connection.map /data=/users/John -connection.map /data=/users/paul
Windowsでは、M:やN:といった複数のネットワークドライブによって、C:\dataのような特定のディレクトリーが参照されます。例:
-connection.map C:\data=M:\ -connection.map C:\data=N:\

-connection.casesensitive ConnectionName

検出されたデータストアのタイプがこの設定(Microsoft SQL ServerやMySqlなど)をサポートしている場合は、指定された接続内のオブジェクト識別子に対し、大文字と小文字を区別しないデフォルトのマッチングルールがオーバーライドされます。例:
-connection.casesensitive "My Database"

-connection.level AggregationLevel

外部接続の集計レベルを指定します。例: -connection.level catalog
サポートされている値のリスト:
server
catalog
schema (デフォルト)
STRING      

 

ブリッジのマッピング

マッピング情報は利用できません

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。