Tableauでデータ分析・データ可視化をするためには、まず分析対象となるデータが必要です。
今回は、Tableau Desktopで、かんたんなExcelデータの取り込み方を説明します。
Tableau Desktopを起動する
それでは、まずインストールしたTableau Desktopを起動してください。
下のような画面が開かれました。この画面「スタートページ」と呼びます。
左側の青いサイドバーは「接続ペイン」と呼ばれます。特に名称を覚える必要はありません。
ただ、「ペイン(pane)」とは、あまり聞きなれないかもしれませんが、英語で「区画」という意味で、Tableauではよく使われる用語です。複数の異なる意味でつかわれますので、おいおい説明いたします。
Tableau Desktopで接続できるデータの種類
接続ペインの「その他」をクリックすると、次の画面が出てきます。
これが、Tableauが接続できるデータの種類のほとんどすべてです。たくさんありますね。
それでは、Tableauで利用できるデータの種類を整理してみましょう。Tableauでデータ接続するためには、ファイルを取り込むか、データベースに接続する必要があります。
ファイル
- Excel
- テキスト(CSV, .txtなど)
- JSON
- 統計ファイル(RやSPSS Statistics, SASなどで作成されたもの)
- 空間ファイル(Geojson, Esriシェープファイルなど)
- Microsoft Access
- Tableau抽出ファイル(.hyper)
これらのデータ形式は、データ接続ペインの「ファイルへ」のところに縦に並んでいます。
しかし、少し余談ですが「Tableau抽出ファイル」だけは、「その他」から開く必要があります。
Tableau抽出ファイル(.hyper)は、Tableau Desktop用に開発された非常に高速なファイルで、2018年に「かつてない分析パフォーマンスを実現する新データエンジン技術」と、鳴り物入りで発表されました。実際、このファイルが発表されてから、Tableau Desktopの速度は数倍は速くなりましたし、ファイルサイズも格段に小さくなりました。
もちろん現在でも、Tableauユーザーにとっては最も重要なファイル形式です。しかし、Tableauの接続パネルでは、未だに「その他」扱いされているのは、ちょっとかわいそうだなと思います。
サーバー
接続できるサーバーの種類は、「サーバーへ」の「その他」をクリックすると、一覧で出てきます。
あまりにも多いので、代表的なサーバーを列挙します。
- Microsoft SQL Server
- MySQL
- Oracle
- Amazon Redshift
- Google Bigquery
- MariaDB
- ODBC
- JDBC
- Google Analytics(4を含む)
- 各種ストレージサービス(Dropbox, Google Drive, BOX,など)
接続可能なデータベースの種類は、Tableauのバージョンによって異なります。新しいバージョンで接続可能なサーバーが増えることもあれば、廃止されることもあります。
接続可能なデータベースの最新情報については、公式ヘルプをご確認ください。
Excelに接続する
それでは、Excelに接続してみましょう。
Tableauには、有名な「サンプルスーパーストア」というサンプルデータがあります。これを使います。
接続ペインの「Excel」をクリックし、ドキュメントの直下にある「マイ Tableau リポジトリ」から、「サンプル – スーパーストア.xls」を開いてください。
このエクセルファイルは、以下のフォルダにあります。
C:\Users\<ユーザー名>\Documents\マイ Tableau リポジトリ\データ ソース\<Tableau Desktopのバージョン名>\ja_JP-Japan
これで、「データソース」ページが開かれました。
データソースページの画面説明
「左側のペイン」に、Excelファイル(サンプルスーパーストア)のシート一覧が表示されています。
今回は、ここから「注文」を画面中央にドラッグしましょう。
これで、Excelの「注文」データがTableau Desktopに取り込まれました。
画面の説明をしておきます(特に名称を覚える必要はありません)。
- 左側のペイン 接続されたデータ ソースの一覧と、データに関する他の詳細を表示します。Excelの場合は、ここにシートの一覧が表示されます。
- キャンバス この画面で、複数のデータソースの「関係」を設定します。Tableau Desktopでは、複数のデータを互いに接続することができるのですが、その接続についての細かな設定がここから行えます。
- メタデータグリッド データに含まれるフィールド名(Excelなら表頭の項目名)が一覧で表示されます。
- データグリッド データの内容が表示されます。
非常にシンプルな画面ですが、「データソース」ページではデータに関する細かな設定が可能です。
今回は入門編なので、いまは追加設定は行わず、画面左下のオレンジ色の「シート1」をクリックしてください。Tableau Desktopではオレンジ色には特別な意味があって、「次にここを操作してね」という「ガイド」の機能を果たしています。Tableauに慣れていない方でも迷わずに操作できますので、オレンジ色に注意してみてください。
Tableauワークスペースから「データソース」ページを開く方法
「シート1」をクリックすると、Tableauの画面が切り替わり、グラフや表・マップを作成する「ワークシート」(あるいは「ワークスペース」とも呼ばれます)が表示されます。
この画面から、グラフや表・地図を作成していくことになりますが、その操作はまた別の記事でご案内します。
ところで、分析している途中に、データソースの設定を変更したい(たとえば他のデータと接続したい)という場合があります。どうすればデータソースページに戻れるでしょうか?
二つの方法があります。
- 左上に、現在接続しているデータソースの一覧が表示されています。ここでは「注文(サンプルースーパーストア)」が表示されていますね。これをダブルクリック、あるいは右クリックから「データソースの編集」をクリックします。
2. メニューの「データ」ー「注文(サンプルースーパーストア)」ー「データソースの編集」をクリックする。
データソースページでできること
最後に、「データソース」ページの機能をまとめて紹介します。
- 接続方法の選択 抽出接続かライブ接続か
- 他のデータソースとの関係 他のデータとどのように互いに関係を設定するか
- データソースフィルタ データの一部だけを取り込む
- ユニオン 同じ形式の複数のデータを一つに統合する
- データ形式の変更 フィールドのデータ形式を変更する(たとえば文字列から整数に)
- データインタープリター ExcelやCSVデータなどを、分析しやすい形式に自動変換する。
- ピボット 列を行に変換する
これらの機能のすべてを理解しないと、Tableau Desktopが使えないわけではありません。
ですが、これらはとても便利で強力な機能なので、少しずつ一緒に学習していきましょう。
コメント