Skip to content

Elasticsearch の analyzer 関連の設定で知ってることを全て書く

Elasticsearch の analyzer 関連の設定で知ってることを全て書く published on Elasticsearch の analyzer 関連の設定で知ってることを全て書く へのコメントはまだありません

詳しい人から見れば大した内容じゃないと思うけど、調べたり試行錯誤した結果をまとめる。(間違いなどがあれば、ご指摘頂けるとありがたいです。)

Elasticsearch を何に使っているか

他サービス → API/webhook → 自サーバーの Elasticsearch

以前触れたと思うけど、開発プロジェクトのデータを全部1箇所にまとめて検索出来るようにしていて、そこで Elasticsearch を使っている。

自分の仕事内容としては、時間の4割位を受託開発にあてている。受託開発では、お客様や発注元の開発ベンダーに合わせて色んなツールを使わざるを得なくて、具体的には ChatWork, Backlog, Google Drive とかを使うことが結構多い。それに対して、自分達の開発チーム内部では自分達用のSlackチームがあるし、それ以外にも別のツールを使ってたりしているので、色んなところに情報が分散しがち。

なので、各ツールのAPI(あるいはwebhook)経由で自分達のサーバーにデータを送って、それを Elasticsearch に流し込んでいる。

検索対象

元データの種類は以下の通り。

  • テキスト
    • GitHub/Bitbucket/Backlog の issue (チケット), PR での議論
    • Slack, ChatWork の会話
    • wiki ページ
  • ファイル
    • Backlog のファイル置き場にあるファイル
    • Google Drive のファイル
    • Slack に貼られたファイル

言語は、日本語がメインだけど、海外の人とのやりとりや、英語のwebページ(StackOverflowとか)からのコピペもあるので、英語もある程度使われている。

Continue reading Elasticsearch の analyzer 関連の設定で知ってることを全て書く