国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python語言檢測模塊langid和langdetect的使用實例

2020-02-16 01:15:13
字體:
來源:轉載
供稿:網友

之前使用數據編碼風格檢測的模塊chardet比較多一點,今天提到的兩個模塊是檢測數據的語言類型,比如是:中文還是英文,模塊的使用方法也比較簡單,我這里只是簡單地使用了一下,因為項目中有這個需求,所以拿來用了一下,并沒有深入地去研究這兩個模塊,模塊的地址鏈接我都給出來了,需要的話可以去研究下:

def langidFunc():  '''  https://github.com/yishuihanhan/langid.py  '''  print langid.classify("We Are Family")  print langid.classify("Questa e una prova")  print langid.classify("我們都有一個家")  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)  print identifier.classify("We Are Family") def langdetectFunc():  '''  https://github.com/yishuihanhan/langdetect  '''  s1=u"本篇文章主要介紹兩款語言探測工具,用于區分文本到底是什么語言,"  s2=u'We are pleased to introduce today a new technology'  print detect(s1)  print detect(s2)  print detect_langs(s2)  # detect_langs()輸出探測出的所有語言類型及其所占的比例  print detect_langs("Otec matka syn.")

結果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對武林站長站的支持。如果你想了解更多相關內容請查看下面相關鏈接

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 平江县| 彝良县| 南平市| 上蔡县| 盖州市| 乐至县| 肇源县| 兴安县| 砚山县| 东乡族自治县| 万全县| 林西县| 冀州市| 五峰| 丹寨县| 翁源县| 湖州市| 宁都县| 香港 | 安阳县| 买车| 西和县| 邵阳市| 湖口县| 板桥市| 新蔡县| 眉山市| 澄城县| 乌拉特后旗| 镇安县| 威信县| 黎平县| 高雄县| 东光县| 邢台县| 青海省| 普陀区| 巴林右旗| 德化县| 鲁甸县| 大城县|