本文實例講述了Python自然語言處理 NLTK 庫用法。分享給大家供大家參考,具體如下:
在這篇文章中,我們將基于 Python 討論自然語言處理(NLP)。本教程將會使用 Python NLTK 庫。NLTK 是一個當下流行的,用于自然語言處理的 Python 庫。
那么 NLP 到底是什么?學習 NLP 能帶來什么好處?
簡單的說,自然語言處理( NLP )就是開發能夠理解人類語言的應用程序和服務。
我們生活中經常會接觸的自然語言處理的應用,包括語音識別,語音翻譯,理解句意,理解特定詞語的同義詞,以及寫出語法正確,句意通暢的句子和段落。
NLP的作用
正如大家所知,每天博客,社交網站和網頁會產生數億字節的海量數據。
有很多公司熱衷收集所有這些數據,以便更好地了解他們的用戶和用戶對產品的熱情,并對他們的產品或者服務進行合適的調整。
這些海量數據可以揭示很多現象,打個比方說,巴西人對產品 A 感到滿意,而美國人卻對產品 B 更感興趣。通過NLP,這類的信息可以即時獲得(即實時結果)。例如,搜索引擎正是一種 NLP,可以在正確的時間給合適的人提供適當的結果。
但是搜索引擎并不是自然語言處理(NLP)的唯一應用。還有更好更加精彩的應用。
NLP的應用
以下都是自然語言處理(NLP)的一些成功應用:
搜索引擎,比如谷歌,雅虎等等。谷歌等搜索引擎會通過NLP了解到你是一個科技發燒友,所以它會返回科技相關的結果。 社交網站信息流,比如 Facebook 的信息流。新聞饋送算法通過自然語言處理了解到你的興趣,并向你展示相關的廣告以及消息,而不是一些無關的信息。 語音助手,諸如蘋果 Siri。 垃圾郵件程序,比如 Google 的垃圾郵件過濾程序 ,這不僅僅是通常會用到的普通的垃圾郵件過濾,現在,垃圾郵件過濾器會對電子郵件的內容進行分析,看看該郵件是否是垃圾郵件。NLP庫
現在有許多開源的自然語言處理(NLP)庫。比如:
Natural language toolkit (NLTK) Apache OpenNLP Stanford NLP suite Gate NLP library自然語言工具包(NLTK)是最受歡迎的自然語言處理(NLP)庫。它是用 Python 語言編寫的,背后有強大的社區支持。
NLTK 也很容易入門,實際上,它將是你用到的最簡單的自然語言處理(NLP)庫。
在這個 NLP 教程中,我們將使用 Python NLTK 庫。在開始安裝 NLTK 之前,我假設你知道一些 Python入門知識。
安裝 NLTK
如果你使用的是 Windows , Linux 或 Mac,你可以 使用PIP 安裝NLTK: # pip install nltk
。
在本文撰寫之時,你可以在 Python 2.7 , 3.4 和 3.5 上都可以使用NLTK?;蛘呖梢酝ㄟ^獲取tar 進行源碼安裝。
|
新聞熱點
疑難解答