遇到一個問題,需要正則匹配遠端FTP目錄下的文件,如果使用ftp客戶端可以通過命令行很容易的做到這一點,但是暫時沒有一個工具支持這樣的需求,于是通過python對FTP的支持和對正則表達式的支持,寫了這么一個簡單的工具,用于使用正則表達式來匹配遠端目錄的文件。
代碼如下
# coding=utf-8########################################################################## File Name: reg_url.py# Author: WangWeilong# Company: Baidu#########################################################################import reimport sysimport osfrom ftplib import FTPdhccmd = "http://xxx/api/submit"class DHC_FTP(): def __init__(self, hostname, username="", passwd=""): self.hostname = hostname try: self.ftp = FTP(self.hostname) except: print "hostname error!" exit(-1) self.username = username self.passwd = passwd self.filelist = [] self.reg_pattern = "" def getftpfilelist(self, path): self.ftp.login(self.username, self.passwd) self.ftp.cwd(path) self.filelist = self.ftp.nlst() def matchnames(self, regpattern): pattern = re.compile(regpattern) matchedfiles = [] for file in self.filelist: match = pattern.search(file) if match: matchedfiles.append(match.string) return matchedfilesif __name__ == "__main__": if len(sys.argv) != 4: print 'usage:python reg_url.py $ftpurldir $regular' else: #解析ftpurl字符串 head = sys.argv[1].split("@")[1].split("/")[0] username = sys.argv[1].split("http://")[1].split(":")[0] passwd = sys.argv[1].split("http://")[1].split(":")[1].split("@")[0] pathdir = sys.argv[1].split(head)[1] dhc_ftp = DHC_FTP(head, username, passwd) dhc_ftp.getftpfilelist("./" + pathdir) #獲取正則表達式 regpattern = r'%s' % sys.argv[2] matchedfiles = dhc_ftp.matchnames(regpattern) for files in matchedfiles: ftpname = sys.argv[1] + "/" + files print ftpname通過輸入想要的檢索的遠端目錄地址和想要用來匹配的正則表達式,就能獲取到遠端的文件了,至于用這些文件來干嘛,那就是需求問題了。
以上所述就是本文的全部內(nèi)容了,希望大家能夠喜歡。
請您花一點時間將文章分享給您的朋友或者留下評論。我們將會由衷感謝您的支持!
新聞熱點
疑難解答
圖片精選