国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python snownlp情感分析簡易demo(分享)

2020-02-16 01:37:18
字體:
來源:轉載
供稿:網友

SnowNLP是國人開發的python類庫,可以方便的處理中文文本內容,是受到了TextBlob的啟發而寫的,由于現在大部分的自然語言處理庫基本都是針對英文的,于是寫了一個方便處理中文的類庫,并且和TextBlob不同的是,這里沒有用NLTK,所有的算法都是自己實現的,并且自帶了一些訓練好的字典。注意本程序都是處理的unicode編碼,所以使用時請自行decode成unicode。MIT許可下發行。

其 github 主頁

我自己修改了上文鏈接中的python代碼并加入些許注釋,以方便你的理解:

from snownlp import SnowNLP# SnowNLP庫:# words:分詞# tags:關鍵詞# sentiments:情感度# pinyin:拼音# keywords(limit):關鍵詞# summary:關鍵句子# sentences:語序# tf:tf值# idf:idf值s = SnowNLP(u'這個東西真心很贊')# s.words     # [u'這個', u'東西', u'真心', u'很', u'贊']print(s.words)s.tags # [(u'這個', u'r'), (u'東西', u'n'), (u'真心', u'd')# , (u'很', u'd'), (u'贊', u'Vg')]print(s.sentiments)# s.sentiments  # 0.9769663402895832 positive的概率# s.pinyin    # [u'zhe', u'ge', u'dong', u'xi', # u'zhen', u'xin', u'hen',# u'zan']4s = SnowNLP(u'「繁體字」「繁體中文」的叫法在臺灣亦很常見。')# s.han      # u'「繁體字」「繁體中文」的叫法在臺灣亦很常見。'print(s.han)
from snownlp import SnowNLPtext = u'''自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯系,但又有重要的區別。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現自然語言通信的計算機系統,特別是其中的軟件系統。因而它是計算機科學的一部分。'''s = SnowNLP(text)print(s.keywords(6)) # [u'語言', u'自然', u'計算機'] 不能用tags輸出關鍵字.s.summary(3) # [u'因而它是計算機科學的一部分', u'自然語言處理是一門融語言學、計算機科學、# 數學于一體的科學', u'自然語言處理是計算機科學領域與人工智能領域中的一個重要方向']s.sentences# print(s.sentences)print(s.sentiments) # 1.0s = SnowNLP([[u'這篇', u'文章'],       [u'那篇', u'論文'],       [u'這個']])# print(s.tf)# print(s.idf)# print(s.sim([u'文章'])) # [0.3756070762985226, 0, 0]

在編譯運行之前,先得安裝snownlp包,后續還有pylab,pandas模塊:
在VS Code終端(查看->集成終端)里面輸入:
pip install snownlp

pip install pylab

pip install pandas

前提是你安裝了pip,若是pip沒有安裝可以查看我之前的 文章

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 马尔康县| 罗田县| 法库县| 苍南县| 寿阳县| 福鼎市| 潜江市| 石嘴山市| 肇州县| 吉隆县| 尉犁县| 北安市| 彭水| 英德市| 金沙县| 天水市| 环江| 商城县| 丘北县| 兴安县| 泸州市| 若羌县| 深圳市| 江都市| 陵川县| 漳浦县| 新密市| 精河县| 木兰县| 兴城市| 宁波市| 正定县| 新蔡县| 华安县| 林州市| 彰武县| 神池县| 遂宁市| 洪洞县| 沂南县| 侯马市|