shobylogy

叩けシンプルの杖

Redashを用いたデータの民主化を進めやすくするための工夫

エンジニア、データサイエンティストの皆さん、こんにちは。 事業におけるデータの重要性が増した昨今、皆さんはビジネスサイドからの「こんなデータを出して欲しい!」といった要望に忙殺されていませんか? 往々にして、データ抽出作業は専門家による聖域…

Redashでユーザーのpasswordをリセットする

Redash 4.0.0以降の場合、admin権限があれば管理画面から任意のユーザーのpasswordを再発行することができる。 Redash 4.0.0未満、もしくはadminユーザーのpasswordが分からなくなった場合、サーバーに入ることができれば、cliからpasswordをリセットするこ…

Amazon AthenaでCSVに含まれていない情報をS3のフォルダ名から取得する

Amazon AthenaでCSVに含まれていない情報をS3のフォルダ名から取得する場合に苦労したため、解決方法を紹介しておきます。 結論から言うと、partition分割を使い、フォルダ毎にpartitionとして読み込むことで、AthenaのSQLからフォルダ名を参照することでき…

S3に貯めてあるログデータを短い準備期間で分析可能な状態にする

S3に貯めているログデータを短い準備期間で分析可能な状態にする必要に迫られたため、AWSのサービスで実現する方法を検討しました。 基本的には、Amazon Athena、もしくはAmazon Redshift Spectrumを使い、S3上のファイルに対して直接クエリを打てる状態にす…

スタートアップでの分析用ツール選定基準

今回は、スタートアップで分析用のツール導入を求められた場合の選定基準について、考えてみました。 スタートアップで分析業務にツールを使用する場合は、そのツールで問題解決が可能かどうか、費用対効果に見合うのかを考えた上で、そのツールが分析の専門…

分析業務でSQLを書くのに使っているツール

皆さんは分析業務でSQLを書く際には、どのようなツールを使っているでしょうか。 主に以下の2つのツールを使っています。 Sequel Pro DataGrip 主にSequel Proはビューアとして、DataGripはエディタとして利用しています。 Sequel Pro Sequel Proはオープン…

BinanceのAPIとサードパーティのPython Library

アルトコインの取引所として有名なBinanceは、WebSocketとRESTのAPIを提供しており、板情報はWebSocket、注文はREST、というように使い分けることができる。 また、サードパーティのPyhon Libraryが存在するため、簡単にbotの開発を行うことができる。 Binan…