Word2Vecの活用事例
fastText
- fastText(Facebookの人工知能研究所が公開した自然言語処理を高速化するライブラリ)
- Word2Vecと同じく単語の分散表現を構築することができる。
- fastTextの開発者はWord2Vecを作った Mikolov氏。
Facebookが公開した10億語を数分で学習するfastTextで一体何ができるのか
https://deepage.net/bigdata/machine_learning/2016/08/28/fast_text_facebook.html
- fastTextで取り組める3つのこと
- fastTextで出来る3つの全体像
- ベクトル表現の構築
- 分類
- 推薦
- Facebookはニュースフィードから釣り見出しを排除するためにfastTextをつくった?
- リクルートテクノロジーズでは、レコメンドに応用
- サイバーエージェントが実用化したAWAでのアーティストレコメンド
- Yahoo!はレシートメールの文章から製品をオススメする
- ◯2Vecを考えれば推薦に応用できる
Word2Vec
Word2Vec:発明した本人も驚く単語ベクトルの驚異的な力 https://deepage.net/bigdata/machine_learning/2016/09/02/word2vec_power_of_word_vector.html
Doc2Vec
Doc2Vecの仕組みとgensimを使った文書類似度算出チュートリアル
https://deepage.net/machine_learning/2017/01/08/doc2vec.html
リクルートの事例
リクルート式 自然言語処理技術の適応事例紹介
DeNAの事例
DeNAにおける自然言語処理活用
サイバーエージェントの事例
音楽聴き放題サービスAWAにおけるレコメンド手法の検討 (artist2vecの試み)
http://www.ai.soc.i.kyoto-u.ac.jp/docmas/proc/docmas-jsai-201511/wada_kazuya.pdf
Yahoo! JAPANの類似技術の事例
高次元ベクトルデータ検索技術「NGT」の性能と使い方の紹介
みずほ情報総研の事例
深層学習の最近の進展(みずほ情報総研技報 Vol.7 No.1)
https://www.mizuho-ir.co.jp/publication/giho/pdf/007_07.pdf
- 弊社では,深層学習の最新の成果の科学技術論文 や特許情報の処理へ適用を試みている.その第一歩 として,word2vec と doc2vec を用いた特許の類似文 献検索のシステムを開発している. 凡そ 1,000 億単語を含むGoogleニュースのデータ セットを用いて 300 万の単語とフレーズのベクトル 表現を学習したデータ)を用い,米国特許庁の特許 文献に対する類義語まで含めた検索を可能にした.