Word2Vecの活用事例

fastText

  • fastText(Facebookの人工知能研究所が公開した自然言語処理を高速化するライブラリ)
    • Word2Vecと同じく単語の分散表現を構築することができる。
    • fastTextの開発者はWord2Vecを作った Mikolov氏。

Facebookが公開した10億語を数分で学習するfastTextで一体何ができるのか

https://deepage.net/bigdata/machine_learning/2016/08/28/fast_text_facebook.html

  • fastTextで取り組める3つのこと
    • fastTextで出来る3つの全体像
      • ベクトル表現の構築
      • 分類
      • 推薦
    • Facebookはニュースフィードから釣り見出しを排除するためにfastTextをつくった?
    • リクルートテクノロジーズでは、レコメンドに応用
    • サイバーエージェントが実用化したAWAでのアーティストレコメンド
    • Yahoo!はレシートメールの文章から製品をオススメする
    • ◯2Vecを考えれば推薦に応用できる

Word2Vec

Word2Vec:発明した本人も驚く単語ベクトルの驚異的な力 https://deepage.net/bigdata/machine_learning/2016/09/02/word2vec_power_of_word_vector.html

Doc2Vec

Doc2Vecの仕組みとgensimを使った文書類似度算出チュートリアル

https://deepage.net/machine_learning/2017/01/08/doc2vec.html

リクルートの事例

リクルート式 自然言語処理技術の適応事例紹介

https://www.slideshare.net/recruitcojp/ss-66242894

DeNAの事例

DeNAにおける自然言語処理活用

https://www.slideshare.net/KazukiFujikawa/dena-53192270

サイバーエージェントの事例

音楽聴き放題サービスAWAにおけるレコメンド手法の検討 (artist2vecの試み)

http://www.ai.soc.i.kyoto-u.ac.jp/docmas/proc/docmas-jsai-201511/wada_kazuya.pdf

Yahoo! JAPANの類似技術の事例

高次元ベクトルデータ検索技術「NGT」の性能と使い方の紹介

https://techblog.yahoo.co.jp/data_solution/ngt_acl_2016/

みずほ情報総研の事例

深層学習の最近の進展(みずほ情報総研技報 Vol.7 No.1)

https://www.mizuho-ir.co.jp/publication/giho/pdf/007_07.pdf

  • 弊社では,深層学習の最新の成果の科学技術論文 や特許情報の処理へ適用を試みている.その第一歩 として,word2vec と doc2vec を用いた特許の類似文 献検索のシステムを開発している. 凡そ 1,000 億単語を含むGoogleニュースのデータ セットを用いて 300 万の単語とフレーズのベクトル 表現を学習したデータ)を用い,米国特許庁の特許 文献に対する類義語まで含めた検索を可能にした.

results matching ""

    No results matching ""