Python

美味しいお店の抽出 〜続編その4〜

今回も「食べログ」のレビュー文に対する分析を進めようと思う。「食べログ」の分析は今回で5記事目のためいよいよシリーズ化してきたかも(笑)
前置きは手短に分析を進める(笑)

1. これまでの分析

前回までは「食べログ」のレビュー文に対して様々な方法でネガポジ分析・重要語抽出・「食べログ」内の星評価スコアとGoogle Cloud Natural Language APIの感情分析によって出力されたスコアとの相関などを調査した。詳しくは、過去記事を見てね。
「美味しいお店の抽出」
「美味しいお店の抽出 〜続編その1〜」
「美味しいお店の抽出 〜続編その2〜」
「美味しいお店の抽出 〜続編その3〜」

2. 今回の分析

今回はGoogle Cloud Natural Language APIのエンティティ感情分析をしようと思う。エンティティ感情分析では、レビュー文の重要語それぞれに対する感情分析を行いネガポジスコアを出力することができる。これならば、レビュー内の何の事柄に対してどのような感情(ネガポジ)を持っているの判断でき可能性があるのでは?と思ったためである。例えば、「料理」に対する感情や、「お店の雰囲気」に対する感情、「店舗スタッフ」に関する感情など詳細な分類や、レビュー内にの文において、レビュー投稿者自身の感想なのかや、他の第三者の感想の伝聞なども見分けられる可能性がある。
Google Cloud Natural Language APIのエンティティ感情分析は初めて使うためどんな粒度でどんな情報が取れるのかワクワクしている(笑)

3. エンティティ感情分析の結果

下の表にエンティティ感情分析の結果を示す。

例えば、表の1行目に着目して、各重要語とその感情スコアに着目する。
表の1行目のレビューは以下の文章となっていた。


レビュー文
【2020年7月25日初訪問】茗荷谷駅「1」番出口から、「茗荷谷駅前」交差点を渡って「春日通り」を後楽園方面へ。「小日向四丁目」のバス停を越えたらある左へと入って行く道のすぐ左手にあるお店。スイーツ百名店の中にポツポツと入って来る和菓子のお店。過去に訪問したお店はいずれも美味も、洋菓子の様に枠に囚われない感じのメニューが多くないのが事実。その結果、どら焼きやたい焼きのお店が多く占める結果に…。そんな中で異彩を放っている様に思われるのがこちらのお店。ずっと気になっており、遂にこの日の訪問が叶いました。到着したのは連休中となる土曜日のちょうど正午。先客は店内に1名のみいました。色んな和菓子が並ぶ中、ショーケースの1番上の段にそれ等はありました!テンションが上がる中、以下3つの商品を購入して店を後にしました。店を出る際、虫の知らせか…なんとなくその場で手渡された包装状態の商品を撮影…ケーキ程持ち運びに気を付けない為にパンで何度か失敗している事で、本能的にそんな行動に出たのでしょうか…?気が付けば…この日はとにかく蒸しっとするだけでなく、暑かった日。持ち運び中に、少し液体化も進んだんでしょう。あと、上から少し圧力が掛かったか…?取り出すとパックの隙間から液が溢れ出し、商品もかなり変形…更には買ったばかりのお気に入りのバッグも大変な事になっていました…。時代に逆行する様な事を言えば、中にビニールで包むくらいのサービスは欲しかったかな…と。そんな訳で今回の写真は特に見苦しくなっております…。①薄暮花→獺祭を使用した香り高いゼリー。かなり甘めの作りもアルコールが飛ばない様配慮されている様で、本来の味もしっかりと。3層構造になっており、一番下は酒粕中心のこの商品の肝となる層。その上には白胡椒とピンクペッパーの入った層。そしてそれらに蓋をする一番上の層という作り。これにより、甘くもペッパーが効いていて、つるんと旨味が凄い仕上がりに。日本酒の味が原因で飲めない人にも大丈夫そう。②Red Eye→これも3層構造になっている模様。一番上がトマトの層。塩気が抑えられたトマトジュースで作られている感じです。そしてその下にはビールの層とそれに蓋をする層。ビールはよ〜く味わって食べて行かないと分からない程度の優しい苦味の仕上がりとなっています。圧倒的にトマトの味が強く、意識しないで食べると濃厚トマトゼリーという感じです。③水羊羹→濃厚なこしあんのしっかり味で甘さは控えめの仕上がり。瑞々しく滑らか食感でつるんと食べられます。お酒を使用したメニューである①と②の2つに比べて、甘さがかなり控えめであるところがポイントかな…?大きなアクシデントがあったモノの、その味だけであれば間違いなく、他の追随を許さない完成度の高い独特な商品達。お酒を上手に使用すると、和菓子も洋菓子も旨くなる…という良い見本ですね。また出直したいな。ご馳走様でした。

出典:「一幸庵」

まず始めに、カラム「important_word」の重要語「印象」は感情スコアが-0.5とネガティブな内容となっていた。何の「印象」かと思いレビュー文を探したが見当たらない…どういうことだ?次の「食感」のワードあった!ただこのワードに対する感情スコアは0とニュートラルで何とも言えない感じ…次に5つ目の重要語「滑らか」に着目すると感情スコアは0.3とポジティブとなってる。ただ、「印象」と「滑らか」は同じ文章内にある表現で感情スコアが0と0.3と差がある様子を見ると、どうやら文章や係り受けレベルではなくあくまでも単語レベルの感情スコアを計算しているのかな?といった印象。

4. おわりに

今回はGoogle Cloud Natural Language APIのエンティティ感情分析を行ったが、重要語としてレビュー文に存在しないワードが出てくる事象が発生し解釈が難しい…
この結果をレビュー文のネガポジ判定のための材料に使うのは難しそうなため、他の切り口を探すことにする!!

T.A
新卒1年目で働いてます。 まだわからないことも沢山ありますが頑張りたいと思います。