import re
import jieba
import codecs
from collections import defaultdict
...
print(setiment('我今天特别开心'))
print(setiment('我今天很开心、非常兴奋'))
print(setiment('我昨天开心,今天不开心'))
1
1
-1
import nltk.classify as cf
import nltk.classify.util as cu
import jieba
准确率为:0.8432956381260097
信息量较大的前10个特征为:
刚买
月
差评
退
失望
联系
不卡
结果
坑
不想
‘ 破烂平板 ’ 的情绪面标签为 NEGATIVE 概率为 68.37%
‘ 手感不错,推荐购买 ’ 的情绪面标签为 POSITIVE 概率为 97.11%
‘ 刚开始吧还不错,但是后面越来越卡,差评 ’ 的情绪面标签为 NEGATIVE 概率为 100.00%
‘ 哈哈哈哈,我很喜欢 ’ 的情绪面标签为 POSITIVE 概率为 97.98%
‘ 今天很开心 ’ 的情绪面标签为 NEGATIVE 概率为 92.67%
import jieba
import pandas as pd
from snownlp import SnowNLP
pos_topic0
0.065*"安装" + 0.043*"不错" + 0.033*"品牌" + 0.026*"京东" + 0.026*"师傅" + 0.022*"信赖" + 0.021*"热水器" + 0.020*"值得" + 0.019*"史密斯" + 0.018*"满意"
pos_topic1
0.127*"不错" + 0.044*"东西" + 0.027*"热水器" + 0.027*"安装" + 0.019*"服务" + 0.018*"史密斯" + 0.016*"挺" + 0.015*"买" + 0.013*"送货" + 0.010*"购买"
pos_topic2
0.034*"安装" + 0.029*"品牌" + 0.027*"很快" + 0.025*"质量" + 0.025*"买" + 0.020*"送货" + 0.015*"便宜" + 0.014*"不错" + 0.014*"加热" + 0.014*"值得"
neg_topic0
0.075*"安装" + 0.046*"师傅" + 0.013*"送货" + 0.013*"服务" + 0.010*"买" + 0.010*"热水器" + 0.010*"不错" + 0.010*"京东" + 0.009*"上门" + 0.008*"史密斯"
neg_topic1
0.024*"热水器" + 0.015*"史密斯" + 0.012*"安装" + 0.010*"买" + 0.010*"不错" + 0.010*"不" + 0.009*"说" + 0.009*"京东" + 0.008*"牌子" + 0.008*"元"
neg_topic2
0.061*"安装" + 0.023*"热水器" + 0.016*"师傅" + 0.016*"不" + 0.015*"史密斯" + 0.014*"说" + 0.013*"买" + 0.010*"送货" + 0.010*"不错" + 0.009*"东西"
【打赏下载数据原及源码】
如忘记保存,或后续再查看,可凭“订单号” 手动获取