在程序運(yùn)行的過(guò)程中,所有的變量都是在內(nèi)存中,比如,定義一個(gè)dict:
d = dict(name='Bob', age=20, score=88)
可以隨時(shí)修改變量,比如把name改成'Bill',但是一旦程序結(jié)束,變量所占用的內(nèi)存就被操作系統(tǒng)全部回收。如果沒(méi)有把修改后的'Bill'存儲(chǔ)到磁盤上,下次重新運(yùn)行程序,變量又被初始化為'Bob'。
我們把變量從內(nèi)存中變成可存儲(chǔ)或傳輸?shù)倪^(guò)程稱之為序列化,在Python中叫pickling,在其他語(yǔ)言中也被稱之為serialization,marshalling,flattening等等,都是一個(gè)意思。
序列化之后,就可以把序列化后的內(nèi)容寫入磁盤,或者通過(guò)網(wǎng)絡(luò)傳輸?shù)絼e的機(jī)器上。
反過(guò)來(lái),把變量?jī)?nèi)容從序列化的對(duì)象重新讀到內(nèi)存里稱之為反序列化,即unpickling。
Python提供兩個(gè)模塊來(lái)實(shí)現(xiàn)序列化:cPickle和pickle。這兩個(gè)模塊功能是一樣的,區(qū)別在于cPickle是C語(yǔ)言寫的,速度快,pickle是純Python寫的,速度慢,跟cStringIO和StringIO一個(gè)道理。用的時(shí)候,先嘗試導(dǎo)入cPickle,如果失敗,再導(dǎo)入pickle:
try: import cPickle as pickleexcept ImportError: import pickle
首先,我們嘗試把一個(gè)對(duì)象序列化并寫入文件:
>>> d = dict(name='Bob', age=20, score=88)>>> pickle.dumps(d)"(dp0/nS'age'/np1/nI20/nsS'score'/np2/nI88/nsS'name'/np3/nS'Bob'/np4/ns."
pickle.dumps()方法把任意對(duì)象序列化成一個(gè)str,然后,就可以把這個(gè)str寫入文件。或者用另一個(gè)方法pickle.dump()直接把對(duì)象序列化后寫入一個(gè)file-like Object:
>>> f = open('dump.txt', 'wb')>>> pickle.dump(d, f)>>> f.close()
看看寫入的dump.txt文件,一堆亂七八糟的內(nèi)容,這些都是Python保存的對(duì)象內(nèi)部信息。
當(dāng)我們要把對(duì)象從磁盤讀到內(nèi)存時(shí),可以先把內(nèi)容讀到一個(gè)str,然后用pickle.loads()方法反序列化出對(duì)象,也可以直接用pickle.load()方法從一個(gè)file-like Object中直接反序列化出對(duì)象。我們打開另一個(gè)Python命令行來(lái)反序列化剛才保存的對(duì)象:
>>> f = open('dump.txt', 'rb')>>> d = pickle.load(f)>>> f.close()>>> d{'age': 20, 'score': 88, 'name': 'Bob'}
變量的內(nèi)容又回來(lái)了!
當(dāng)然,這個(gè)變量和原來(lái)的變量是完全不相干的對(duì)象,它們只是內(nèi)容相同而已。
Pickle的問(wèn)題和所有其他編程語(yǔ)言特有的序列化問(wèn)題一樣,就是它只能用于Python,并且可能不同版本的Python彼此都不兼容,因此,只能用Pickle保存那些不重要的數(shù)據(jù),不能成功地反序列化也沒(méi)關(guān)系。
|
新聞熱點(diǎn)
疑難解答
圖片精選