当前位置: 首页> 价格优势> 五月罗马海鲜自助餐厅真的很差?
  • 五月罗马海鲜自助餐厅真的很差?
  • 2020-07-28 19:12:26
  • 前言


    前几天去吃了环球港的一家海鲜自助,叫五月罗马,名字还不错,但这次吃的很不愉快。位子很挤,海鲜也不好吃。 五月罗马海鲜自助餐厅 那如何判断一家餐厅值不值得花钱花时间去品尝呢?

    目的


    根据大众点评的众多评论决定一家餐厅值不值得去,少量的评论还是ok的,但多了只能用工具来做了

    数据来源


    大众点评

    数据爬取


    已这家海鲜自助为例,python代码如下

    import pandas as pd import time import requests from bs4 import BeautifulSoup contentary = [] for i in range(1,500):   url = 'http://www.dianping.com/shop/15874958/review_more?pageno='+str(i)   print(url)   #大众点评有反爬虫机制,需设置header   headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0'}   #headers = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0'}   res = requests.get(url, headers = headers)   soup = BeautifulSoup(res.text,'html.parser')   for content in  soup.select('.content'):         text = content.select('.comment-txt .J_brief-cont')[0].text.strip()       time1 = content.select('.time')[0].text.strip()       comment = content.select('.comment-rst')[0].text.strip().replace('\n','').replace('|','')       contentary.append({'time':time1 , 'comment':comment ,'text' :text})       print(comment)       time.sleep(5) content_df = pd.DataFrame(contentary)   content_df.to_excel('E:\\建模文件\\大众点评\\content_df.xlsx')    


    中文词汇情感分析


    此处特别推荐snownlp包,因为他用于训练情感词汇的训练集也是中文评论数据,所以我可以直接使用snownlp的接口(输入内容,返回该内容是积极情感的概率sentiments,sentiments越接近0说明评论越差,越接近1表明评论越好

    不如看几条sentiments=0的评论

    • 不知道怎么说,服务质量太差,三文鱼有一股异味,那个盘子都是脏的 没有干净的 下次再也不会来了 还不如去五颗星呢 五月罗马海鲜自助餐厅

    • 这家和环球港店比比简直天壤之别,菜比那边少很多,环境也很差,整个店乱糟糟的,毫无秩序,服务员态度都很差,像欠他们的一样

    • 一塌糊涂,服务员像吃过药,欠她钱还是没付钱,问个问题只当没听见,这么差的服务和菜式,那些好评是怎么刷出来的

    • 太差了!差,差,差。什么事情多差,下次决不会再来

    • 一个字终结差,不会去第二次,此时此刻无限吐槽,能评无星我不会给一颗。自助无服务,盘子自己倒,就差洗碗,有的只是来讨钱的。

    • 今天跟两个朋友去吃饭。回来之后就拉肚子。黑店,都是垃圾食品

    再看几条sentiments=1的评论

    • 周末人超多的~和小伙伴们一起去的~棒棒!

    • 价格实惠,品种齐全,孩子和老公都很喜欢!

    • 口味很好,环境不错,服务也很好……总而言之,很好,非常喜欢

    • 东西新鲜 口感非常好。品种齐全 环境幽雅

    再看几条sentiments=0.5的评论

    • 热热,口味还好,服务一般,菜品丰富,天气冷了再去!

    • 菜比较新鲜,品种丰富,价格合理

    • 东西还可以,就是人太多了,要等几轮。

    • 人很多,烧烤区灯光有点暗,补菜基本都很快,但火锅的东西一盘太少,女儿爱吃的牛百叶只拿了2次,后面就不补了

    总体感觉,预测很准确

    算出每个评论内容的sentiments

    from snownlp import sentiment import pandas as pd #加载pandas text=pd.read_excel(u'C:\\Users\\Hanyee\\Desktop\\Datasets\\大众点评\\content_df.xlsx',header=0) #读取文本数据 text0=text['text'] #提取所有数据 sentiments = [] for i in text0:   sentiments.append(SnowNLP(i).sentiments) text['sentiments'] = sentiments


    分析


    把每天的评论进行标记,sentiments>0.5,标记为good ,反之标记为bad,然后算出每天坏评论的占比bad_ratio。

    • 发现,最近三个月,每天都有40%左右的差评,所以五月罗马海鲜自助餐厅真的不值得去。

    小结

    • 通过餐厅的近期评论来决定这个餐厅值不值得去

    • 五月罗马海鲜自助餐厅不值得去

    五月罗马海鲜自助餐厅