Mahout 0.8でレコメンデーションエンジンを作る

最近2つのプロジェクトで「オススメの◯◯」とかそれに類する機能を作ったので、ちょっとまとめてみる。 基本的なことはMahout in Actionに書いてあるので、そっちを読んで欲しい。一応、本エントリーでも基本的なこと…

EC2で、非LVMパーティションを拡張する

最近だとAWS等のクラウドを使う機会が増えていて、逆に物理サーバーを使うことが少なくなってきており、以前みたいにサイジングを細かくやることが少なくなってきた。 また、随分前から多くのLinuxディストリビューションでは、…

DynamoDB + S3 + EMRでコホート分析(cohort analysis)をする(3)

前回からかなり間が空いてしまったけど、今回で完結予定。 前回はHiveの話を中心に、S3に置いたファイルをHiveでどう扱うかなどについて書いた。また、第1回では全体の流れを書いたので、どんなことをやるかは詳しくはそちら…