進行數據解析的理由不計其數,相關的工具和技巧也同樣如此。但是,當您需要用這些數據做一些新的事情時,即使有“合適的”工具可能也是不夠的。這一擔心對于異類數據源的集成同樣存在。用來做這項工作的合適工具遲早應該是一種編程語言。
Oracle 提供了一些非常強大的實用程序來加載、處理和卸載數據。SQL*Loader、Data Pump、外部表、Oracle Text、正則表達式都能提供這些功能。然而人們常常會需要在數據庫外做一些事情(或者,說得瑣碎些,可能您還沒有獲得必要的數據庫權限)。
利用 Python 可以進行高水平的、有效的數據解析。而利用互聯網上免費提供的大量標準庫和眾多模塊可以處理數據邏輯,不必手動剖析字節。
剛發過一個在地址欄的小hacker可以解除網頁屏蔽,最近學習python,寫了一個相當簡單的玩意,也可以做此事
#-*- coding: utf-8 -*-"""author: hujinpu""""""http://docs.python.org/lib/module-urllib.html"""import urlliburls = {'被屏蔽功能的網頁地址':'downloadtomycomputer.htm'}for url in urls:filename = urls[url]urllib.urlretrieve(url,filename)f = open(filename,'r')content = f.read()f.close()newfilename = "new_" + filenamef = open(newfilename,'w')f.write( content + "<script>document.onselectstart = document.oncontextmenu = document.onmousedown = document.onkeydown = function(){return true;};</script>");f.close()其中urls是一個字典,可以寫很多你要征服的url
Python的交互
在很多時候,你會想要讓你的程序與用戶(可能是你自己)交互。你會從用戶那里得到輸入,然后打印一些結果。我們可以分別使用raw_input和input語句來完成這些功能。對于輸出,你也可以使用多種多樣的str(字符串)類。例如,你能夠使用rjust方法來得到一個按一定寬度右對齊的字符串。利用help(str)獲得更多詳情。
另一個常用的輸入/輸出類型是處理文件。創建、讀和寫文件的能力是許多程序所必需的
文件:
你可以通過創建一個file類的對象來打開一個文件,分別使用file類的read、readline或write方法來恰當地讀寫文件。對文件的讀寫能力依賴于你在打開文件時指定的模式。最后,當你完成對文件的操作的時候,你調用close方法來告訴Python我們完成了對文件的使用。
 #!/usr/bin/python  #Tue Jan 8 21:25:42 CST 2013  poem='''//  Programming is fun  When the work is done  If you wanna make your work also fun:  use Python!  '''  f=file('poem.txt','w')  f.write(poem)  f.close()  f=file('poem.txt')  while True:  line=f.readline()  if len(line) == 0:  break  print line,  f.close()打開文件的模式可為讀(‘r')、寫(‘w')或追加(‘a')。
新聞熱點
疑難解答