近來,越來越多的數(shù)據(jù)科學(xué)家開始使用Python,我不由得想到,盡管他們從pandas、scikit-learn和numpy這些庫中得到了不少好處,但是他們也許錯過了一些也許較老但同樣有幫助的Python庫。
在這篇博文里,我將給大家推薦一些鮮為人知的庫。即便你是Python高手,也應(yīng)該看一看,其中的一到兩個庫可能是你從沒見過的。
1)Delores
Dolorean是一個很酷的日期/時間庫。除了名字好聽之外,也是一個我曾用過的最舒心的日期/時間修改庫。它有點像javascript的moment庫,每次我導(dǎo)入它的時候都會想笑。文檔也很棒,除了有技術(shù)指導(dǎo)外,他們還引用了《回到未來》的無數(shù)內(nèi)容(來豐富文檔)。
from delorean import DeloreanEST = "US/Eastern"d = Delorean(timezone=EST)

2)prettytable
這個包被放到了GoogleCode上,所以你可能沒聽說過。GoogleCode現(xiàn)在就像西伯利亞一樣荒涼。
盡管它被流放到了一個冰天雪地、荒無人煙的地方,prettytable仍舊是最棒的結(jié)構(gòu)化輸出的庫,它能在終端或瀏覽器里構(gòu)建良好的輸出。因此,如果你正在用 IPython Notebook的新插件,建議你用prettytable來代替__repr__進行HTML輸出。
from prettytable import PrettyTabletable = PrettyTable(["animal", "ferocity"])table.add_row(["wolverine", 100])table.add_row(["grizzly", 87])table.add_row(["Rabbit of Caerbannog", 110])table.add_row(["cat", -1])table.add_row(["platypus", 23])table.add_row(["dolphin", 63])table.add_row(["albatross", 44])table.sort_key("ferocity")table.reversesort = True+----------------------+----------+| animal | ferocity |+----------------------+----------+| Rabbit of Caerbannog | 110 || wolverine | 100 || grizzly | 87 || dolphin | 63 || albatross | 44 || platypus | 23 || cat | -1 |+----------------------+----------+3)snowballstemmer
我當(dāng)初裝snowballstemmer,是因為我覺得這個名字很酷炫。但它的確是一個小巧好使的包。snowballstemmer通過porter stemmer算法來提取15種語言的單詞詞干。
from snowballstemmer import EnglishStemmer, SpanishStemmer
EnglishStemmer().stemWord("Gregory")
# Gregori
SpanishStemmer().stemWord("amarillo")
# amarill
4)wget
還記得你每次都為特定的目標(biāo)寫web爬蟲么?以后我們可以用其他辦法來完成了,那就是wget.想要以遞歸的方式下載所有頁面?想要抓取頁面上的每張圖?想要避免cookie追蹤?wget可以給你想要的一切。
馬克·扎格伯格的電影里它自己都說
從柯克蘭(寢室名)開始,這里的一切公共目錄都是公開的,還允許在Apache系統(tǒng)里插入目錄。所以用個wget就能下載柯克蘭全部的照片庫里的圖片了。易如反掌!
新聞熱點
疑難解答
圖片精選