SSAS

GCS(Google Cloud Storage)のファイルをSQLServerに取り込んでデータ分析を行った(1)

GCS(Google Cloud Storage)に配置したファイルを、SQL Server搭載済の仮想マシンに転送し、SQL Serverにデータロードし、データロードしたデータを利用してデータ分析用のデータ(ディメンション・キューブ)であるSSASプロジェクトを、SQL Server Analysis Serverに配置するところまで、一括で実施できるJavaプログラムを作成したため、その内容について共有する。今回は、作成したプログラムの内容について述べる。

GCS(Google Cloud Storage)上のファイル

GCS上には、以下のようにtsvファイルが配置されているものとする。
GCSファイル1

それぞれのファイルの中身は、下記の通り。
GCSファイル2

GCSファイル3 GCSファイル4

Javaプログラムの実行結果

Java 1.8で本プログラムを作成したが、その際の実行結果は以下の通り。
Java実行

実行前後の結果

GCS上のファイルを取得した、SQLServer上のファイル格納場所は以下の通りで、実行後にGCS上のtsvファイルが格納されていることが確認できる。
<実行前>
Java実行前1
<実行後>
Java実行後1

SQL Server上のテーブルのデータは以下の通りで、実行後にtsvファイルのデータがdbo.salesテーブルに格納されていることが確認できる。
<実行前>
Java実行前2
<実行後>
Java実行後2

SQL Server Analysis Serverに配置されたSSAS(SQL Server Analysis Services)プロジェクトは以下の通りで、SQL Server Analysis ServerにSSASプロジェクトが格納されていることが確認できる。
<実行前>
Java実行前3
<実行後>
Java実行後3

さらに、実行後に、SQL Server Analysis Serverに配置されたSSASプロジェクトを利用したSSRS(SQL Server Reporting Services)プロジェクトにより出力されたレポートは、以下の通り。
Java実行後4

なお、作成したプログラムの内容や環境構築の内容については、このブログにて、同名の記事(2)~(5)にて記載している。