需求:
在/root/backup下面有兩個文件夾dst和src。要求在周一的時候進行完全備份,其余日子進行增量備份。從src備份到dst。
思路及關鍵點:
建立一個文件,以字典方式記錄src的文件名以及文件對應的md5的值
完全備份的時候將文件名和md5值寫在一個文件里面。cPickle的知識點。
增量備份的時候比較文件名是否在key里面,沒有就要備份;有的話,這個文件的md5值是否改變,改變了就要備份
os.path.join()拼接路徑,os.listdir(),os.chdir()
time.strftime()判斷周幾
cPickle,可以無損記錄所有Python的變量類型。文件操作。
tarfile對文件打包的使用
hashlib用于計算文件md5的值。注意不要一次打開一個文件,4k地打開,防止打開一個超大文件爆內存。
with file()可以打開一個文件之后不f.close()
#!/usr/bin/env pythonimport timeimport osimport cPickle as pimport tarfileimport hashlibbaseDir = '/root/backup'srcDir = 'src'dstDir = 'dst'fullName = "full_%s_%s.tar.gz" % (srcDir, time.strftime('%Y%m%d'))incrName = "incr_%s_%s.tar.gz" % (srcDir, time.strftime('%Y%m%d'))md5file = 'md5.data'def md5sum(fname): m = hashlib.md5() with file(fname) as f: while True: data = f.read(4096) if len(data) == 0: break m.update(data) return m.hexdigest()def fullBackup(): md5Dict = {} fileList = os.listdir(os.path.join(baseDir,srcDir)) for eachFile in fileList: md5Dict[eachFile] = md5sum(os.path.join(baseDir,srcDir,eachFile)) with file(os.path.join(baseDir,dstDir,md5file),'w') as f: p.dump(md5Dict,f) tar = tarfile.open(os.path.join(baseDir,dstDir,fullName),'w:gz') os.chdir(baseDir) tar.add(srcDir) tar.close()def incrBackup(): newmd5 = {} fileList = os.listdir(os.path.join(baseDir,srcDir)) for eachFile in fileList: newmd5[eachFile] = md5sum(os.path.join(baseDir,srcDir,eachFile)) with file(os.path.join(baseDir,dstDir,md5file)) as f: storedmd5 = p.load(f) tar = tarfile.open(os.path.join(baseDir,dstDir,incrName),'w:gz') os.chdir(baseDir) for eachKey in newmd5: if (eachKey not in storedmd5) or (newmd5[eachKey] != storedmd5[eachKey]): tar.add(os.path.join(srcDir,eachKey)) tar.close() with file(os.path.join(baseDir,dstDir,md5file),'w') as f: p.dump(newmd5,f)def main(): if time.strftime('%a') == 'Mon': fullBackup() else: incrBackup()if __name__ == '__main__': main()~ 以上這篇用Python寫腳本,實現完全備份和增量備份的示例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答