bitcoin って、みんな名前は知ってると思うけど、実体は知らない人が多そうな気がする。そういう自分もよく分かってなかったので、少し触ってみる事にした。 bitcoinとは何か?使い方は? これは色んなサイトで解説され…
最近だとAWS等のクラウドを使う機会が増えていて、逆に物理サーバーを使うことが少なくなってきており、以前みたいにサイジングを細かくやることが少なくなってきた。 また、随分前から多くのLinuxディストリビューションでは、…
Webサイト作ってると、JSONを扱うことが多い。なので、Play! frameworkで、ScalaのオブジェクトからJSON文字列に、あるいはその逆をやりたいよね、と(特に前者)。 そんな今回はObject ->…
前回からかなり間が空いてしまったけど、今回で完結予定。 前回はHiveの話を中心に、S3に置いたファイルをHiveでどう扱うかなどについて書いた。また、第1回では全体の流れを書いたので、どんなことをやるかは詳しくはそちら…
bashではドル記号($)で色々な場面で使う(Bourne shellでも使うけど)。自分が知ってる範囲でまとめてみた。 変数の参照 基本中の基本なんで敢えて書く必要はないかも。 foo=1234 # 変数の定義 ech…
開発環境(Ubuntu on VirtualBox)のディスク容量が少なくなってきたので、/var/lib/mysql を 別のディレクトリ ( /data の下)に移動して、シンボリックリンクを張ったんだけど、MySQ…
バッチからPlay.startを実行するとエラー こちらを参考に、play frameworkで作ったwebサイトのバックグラウンド用タスクを作成し実行した。それに関しては別途エントリーを書くとして、以下のようにPlay…
Googleカレンダーで予定を登録したりするけど、そういうようなものをDBで扱いたい。 いくつかの方法があった よく分からない方法(詳細は省略) ググったらSOのこんなページが出てきたんだけど、ちょっと無駄に複雑な気がし…
ちょっと前回から間が空いてしまったけど、DynamoDB上のデータやその他のデータをS3に集めて、EMR上のHiveを使ってコホート分析をするという話の第2回。今回はHiveの話を中心に書いていく。 ※Hiveを使うのは…
コホート分析とは 定義に関してはWikipediaを見れば大体わかるかと。日本語のエントリーがないので、大雑把に説明すると、ユーザーをグループ(コホートと呼ばれる)に分割し、各コホート毎に指標(例えば、ユーザーごとの滞在…