エンジニア、データサイエンティストの皆さん、こんにちは。
事業におけるデータの重要性が増した昨今、皆さんはビジネスサイドからの「こんなデータを出して欲しい!」といった要望に忙殺されていませんか? 往々にして、データ抽出作業は専門家による聖域になりがちであり、聖域化が進むとあらゆるデータ抽出の依頼が専門家の前に積み上がることになります。
この問題を解決する方法は大きく二つ、データ抽出作業の自動化と、データ抽出作業の民主化*1です。
今回は後者のデータ抽出の民主化について、Redashを用いて進めていく方法をお話しします。
データ抽出作業が専門家の聖域になりがちな理由
データ抽出作業は、環境構築と専門家のプライドという2つのハードルが理由で聖域になりがちです。
ビジネスサイドの人がデータが欲しいと思っても、すぐにSQLを実行できる環境がなく、 専門家が自分の仕事を手放さない場合、「じゃあ任せるか...」となってしまいます。
特に専門家は自分の仕事にプライドを持って行うあまり、ビジネスサイドの人の能力を軽視してしまう場合があります。*2
ITに関しては、プランナーをよく言えば「弱者」、悪く言えば「バカ扱い」する風潮があるように感じています。 「これはIT専門知識が必要で難しいからプランナーに直接扱わせるのは無理だからこちらでやろう、せめて××のインターフェースを被せよう」という方向になりがちです。
10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く からの引用
10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く (Informatics &IDEA)
- 作者: 青木峰郎
- 出版社/メーカー: SBクリエイティブ
- 発売日: 2015/06/30
- メディア: 単行本
- この商品を含むブログ (6件) を見る
この問題を解決するためには、お互いが歩み寄り、SQLの実行環境を準備した上で、知識を伝えながら信頼して抽出作業を任せていくことが必要になります。
Redashを用いたデータの民主化
Redashを導入し、誰でもRedash上でSQLを書くことができる状態を作り、データを民主化を進めるすることができます。
RedashとはいわゆるBIツールの一種で、Web上でSQL実行環境とクエリの共有を提供するシンプルなツールです。
Redashを導入することで、環境構築の手間がなくなり、専門家の秘匿だったSQLを共有化して知識の伝達を促すことができます。
Redashを社内に広げるための工夫
Redashを用いてデータの民主化を行っていく際の工夫をご紹介します。 以下のような工夫をすることで、ビジネスサイドの人もが戸惑わずにデータ抽出を行うことができるようになります。
- きちんとドメインを設定する
- Google SignInを導入する
- SQLのテンプレートを用意する
きちんとドメインを設定する
Redashはあくまでも社内ツールですが、分かりやすいドメインを設定することで利用者の利便性が高まります。
IPアドレスやAWSのデフォルトドメインなどで利用してもらうのはやめましょう。
Google SignInを導入する
RedashにGoogle SignInを導入することで、利用者は「管理者にアカウント発行を依頼する」という作業が必要なくなり、使いたいときにRedashを使い始めることができます。
Setting up a Redash Instance | Redash
SQLのテンプレートを用意する
RedashのQuery Parameters機能やQuery Snippets機能を利用して、良く使われるクエリーのテンプレートを用意しておきましょう。
新規利用者の学習コストが下がります。
Query Parameters | Redash Query Snippets | Redash
以上のような細かい工夫をしながら、データの民主化を進めていきましょう。
データ抽出作業を「専門家の独占業務」から、「必要な人が自分で行う業務」に変えることができればデータの民主化は完了です。
まとめ
Redashを用いることでデータ抽出を専門家の独占業務から、必要な人が自分で行う業務に変えることができる。
きちんとドメインを設定し、Google SignInを導入し、SQLのテンプレートを用意することで、ビジネスサイドの人も戸惑わずにデータ抽出を行うことができるようになります。