やりたいこと やりたいことがあまり具体的になってないけど、機械学習を使った自然言語処理をやりたい。大雑把には、日本語のテキストを入力して、それを分類したり、書き手の感情や性格とかを判別したり、そんなの。 最終的には全部自…
久々の書評。 プログラマー向けに簡単に説明すると、ビジネスモデル版デザインパターン。 それだけだとあんまりなので、もう少し詳しく書く。知ってる人にとっては当たり前なんだけど、イノベーションが全く新規のアイディアであるって…
やりたい事 Java (Scala) で、ある文字列が何語(日本語、英語、など)なのかを判別する 入力文字列は以下の2通り ユーザーから入力された検索文字列(1単語、数文字〜数単語、数十文字) 検索対象となる文章(数十単…
本投稿は、一つ前の「Elasticsearch多言語化その2」の補足。 ゴール やりたい事は、以下のようなフィールドに対する検索結果のハイライトをすること。 nested 型で、中身は複数の “attachm…
本投稿は、Elastic stack (Elasticsearch) Advent Calendar 2016 の2日目の記事かつ、以前書いた以下の投稿の続編。 Elasticsearch の analyzer 関連の設…
最近リモートワークが大分普及してきて、メリット・デメリットも色々言われていると思う。他のところで言われてるのと同じような事を書いても仕方ないので、最近気づいた点を1つ書こうと思う。(短文、のはず) スペック的なもの 40…
英語でもそこそこの検索結果が出て欲しい 以前、Elasticsearch の analyzer 関連の投稿を書いた。 Elasticsearch の analyzer 関連の設定で知ってることを全て書く Elastics…
テキストを多言語化する方法は大まかに2パターン サイト・webサービスなどのテキストを多言語する方法はいくつかあって、詳細はググってもらうとして、(分類の仕方も色々あるけど)大雑把に以下の2つに分けられると思う。 get…
詳しい人から見れば大した内容じゃないと思うけど、調べたり試行錯誤した結果をまとめる。(間違いなどがあれば、ご指摘頂けるとありがたいです。) Elasticsearch を何に使っているか 他サービス → API/webh…