A13: 本の文章から 形態素解析システムを使用し、不特定単語でのおすすめ本を紹介するプロジェクト


概要

本の内容を青空文庫の著作権がない本から抜き取り、文章を形態素解析システムにかけ文節に区切り、文節ごとの言葉にword2vecを用いてベクトル数値化させ感情などをベクトルの中心に置き、既存の小説の内容による分類に縛られることなく、直感的な言葉を使ってお勧めの本を提供できるサイトを制作。

プロジェクトの背景

・現代社会において電子化が進む中で人間が行っている行為が多いと考え、小説の内容の分類を今まででは感情でしか分類することができなかったが形態素解析システムをすることによってより細かく、また多様性のあるサイトを作る事が可能になると考えた。

・20~40歳の小説離れが増加している傾向があるため、少しでも文字に 触れてほしいと考え、その人たちが心の底から本当に読んでみたいと思える本を提供したいと思いプロジェクトを制作するに至った。

目標

・不特定多数の単語から、おすすめの本を検索し特定させる

・他の類似しているサイトとで差別化を図る

※不特定多数の単語を入力され、同尺度のものが多数出てきた事に際には、単語の出現回数などによる文字のベクトル化などによって、さらに同尺度のものが出てきた場合には、あいうえお順などで表記することを考えた

このサービスの優れている点

・既存の小説の内容による分類に縛られない直感な自由な言葉でおすすめの本を提供できる

・毎回読む人たちが読みたい本の内容を入力して、それにあった本を紹介するため、サービス提供側の提示した分類法に縛られずに済む。

システム構成図