進捗10:発表、高岸呉羽の場合
呉羽「……それでは、ITJLG大学、新名研究室の高岸が、
『特徴量抽出に基づく、未知レシピへのメタデータの自動付与方式の提案』というタイトルで
発表させていただきます。
近年、コッコパッドや、らくてくレシピのような、レシピ投稿型サイトが幅広く利用されているところから、
レシピの検索推薦の研究が盛んに行われていると言えます。
しかし、投稿されたレシピ、特に重複したレシピからは、そのレシピが他と何が違うのかがひと目では分かりません。
『あっさり肉じゃが』のようなそのレシピの特徴を表している語句がレシピについていたとしても、
他のレシピとどれだけあっさりしているかということが明示的ではありません。
そこで我々は、レシピの調理手順、材料、レシピのタイトルからそのレシピの特徴を数値化し、
メタデータとして自動付与する方法を提案いたします。
まず、コッコパッドのレシピを、肉じゃがに絞ってスクレイピング(自動収集)しました。
その中から、特徴隣そうな語句を抜き出してみたところ、
・あっさり
・こってり
・お弁当に最適
・簡単
・節約
・シンプル
・ダイエット
・時短
と言ったワードが抽出されました。
この中から、表記ゆれ、つまり、同意味の語句を一つにまとめます。
すると、
・あっさり
・こってり
・お弁当に最適
・簡単
・ダイエット
・節約
となります。
今回は、あっさりとこってり、節約に視点を絞ります。
これは、対義するものがなければ、比較からの値の付与が不可能だからです。
まず、あっさりと言う修飾語が付く肉じゃがのレシピの手順を形態素解析し、ベクトル化します。
次にこってりという修飾語が付く肉じゃがのレシピの手順も同様にベクトル化します。
そして、tf-idfを用いて重みを考えます。
………………………
以上の結果より、この提案は有効であると実証できました。
まとめは以上となります。
発表を終わります。」
司会者「ありがとうございます。では質問のある方……ではどうぞ」
質問者「●●会社の石井です。ベクトルの次元は統一していますか?」
呉羽「はい、あっさりとこってりのレシピ両方の名詞、動詞、形容詞を次元としております。」
質問者「ノイズは如何でしょう?」
呉羽「ある程度のストップワードリスト(ノイズ除去用リスト)は作成しております。」
質問者「なるほど。ではレシピ特有の語句は如何でしょうか?」
呉羽「……と、いいますと?」
質問者「例えば、『乾煎りにする』という語句は、『乾』『煎り』『する』と分かれてしまい、ノイズになると思われます。」
呉羽「……たしかにおっしゃるとおりです。そこは対策していませんでした」
質問者「MeCabは、形態素解析辞書のカスタマイズが簡単なので、ぜひそのリストも作ってみてください」
呉羽「貴重なご意見、ありがとうございます」
司会者「では他の方……」
………………
司会者「――――はい、ありがとうございます。少し時間がオーバーしてしまいましたので、これで終了とします。」
………………
呉羽「…………はふぅ……つかれた……」
華「おつかれ。………呉羽」
呉羽「……はい?」
華「お前、発表者ツールみてただろ?」
呉羽「っ!?!?!?」
華「バレバレだ」
呉羽「あぅ…………」
………………………
………………
………
新規登録で充実の読書を
- マイページ
- 読書の状況から作品を自動で分類して簡単に管理できる
- 小説の未読話数がひと目でわかり前回の続きから読める
- フォローしたユーザーの活動を追える
- 通知
- 小説の更新や作者の新作の情報を受け取れる
- 閲覧履歴
- 以前読んだ小説が一覧で見つけやすい
アカウントをお持ちの方はログイン
ビューワー設定
文字サイズ
背景色
フォント
組み方向
機能をオンにすると、画面の下部をタップする度に自動的にスクロールして読み進められます。
応援すると応援コメントも書けます