Skip to content
将棋

自然言語処理系機械学習サービスの日本語対応状況

自然言語処理系機械学習サービスの日本語対応状況 published on 自然言語処理系機械学習サービスの日本語対応状況 へのコメントはまだありません

やりたいこと

やりたいことがあまり具体的になってないけど、機械学習を使った自然言語処理をやりたい。大雑把には、日本語のテキストを入力して、それを分類したり、書き手の感情や性格とかを判別したり、そんなの。

最終的には全部自分で実装したいけど、当面は、既存のもので使えそうなのがあればそれを使おうと思う。

調べたもの

以下のものを調べた。

注意事項

ただ、すべてのものを調べた訳ではない。

  • 自然言語処理関連のもののみ
  • 個人的に興味がないものは調べていない
  • 終了予定のサービスなども調べていない

あと、API として最初からすぐに使えるようになっているものと、トレーニングしなければいけないものなどが混じっている。

誤り等があった場合は、ご指摘等頂ければ、訂正等を行う予定。

Continue reading 自然言語処理系機械学習サービスの日本語対応状況

Java (Scala) で言語判定

Java (Scala) で言語判定 published on Java (Scala) で言語判定 へのコメントはまだありません

やりたい事

  • Java (Scala) で、ある文字列が何語(日本語、英語、など)なのかを判別する
  • 入力文字列は以下の2通り
    • ユーザーから入力された検索文字列(1単語、数文字〜数単語、数十文字)
    • 検索対象となる文章(数十単語〜数十ページ程度)
  • 対応する言語
    • 当初は日本語と英語
    • 今後は5言語程度

なぜこれをやりたいかは、以下のエントリーを参照。

Elasticsearch多言語化その2 – K blog

Continue reading Java (Scala) で言語判定