在Python中使用poplib模塊收取郵件的教程

2020-02-23 00:58:51

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

SMTP用于發(fā)送郵件，如果要收取郵件呢？

收取郵件就是編寫一個(gè)MUA作為客戶端，從MDA把郵件獲取到用戶的電腦或者手機(jī)上。收取郵件最常用的協(xié)議是POP協(xié)議，目前版本號(hào)是3，俗稱POP3。

Python內(nèi)置一個(gè)poplib模塊，實(shí)現(xiàn)了POP3協(xié)議，可以直接用來收郵件。

注意到POP3協(xié)議收取的不是一個(gè)已經(jīng)可以閱讀的郵件本身，而是郵件的原始文本，這和SMTP協(xié)議很像，SMTP發(fā)送的也是經(jīng)過編碼后的一大段文本。

要把POP3收取的文本變成可以閱讀的郵件，還需要用email模塊提供的各種類來解析原始文本，變成可閱讀的郵件對(duì)象。

所以，收取郵件分兩步：

第一步：用poplib把郵件的原始文本下載到本地；

第二部：用email解析原始文本，還原為郵件對(duì)象。
通過POP3下載郵件

POP3協(xié)議本身很簡(jiǎn)單，以下面的代碼為例，我們來獲取最新的一封郵件內(nèi)容：

import poplib# 輸入郵件地址, 口令和POP3服務(wù)器地址:email = raw_input('Email: ')password = raw_input('Password: ')pop3_server = raw_input('POP3 server: ')# 連接到POP3服務(wù)器:server = poplib.POP3(pop3_server)# 可以打開或關(guān)閉調(diào)試信息:# server.set_debuglevel(1)# 可選:打印POP3服務(wù)器的歡迎文字:print(server.getwelcome())# 身份認(rèn)證:server.user(email)server.pass_(password)# stat()返回郵件數(shù)量和占用空間:print('Messages: %s. Size: %s' % server.stat())# list()返回所有郵件的編號(hào):resp, mails, octets = server.list()# 可以查看返回的列表類似['1 82923', '2 2184', ...]print(mails)# 獲取最新一封郵件, 注意索引號(hào)從1開始:index = len(mails)resp, lines, octets = server.retr(index)# lines存儲(chǔ)了郵件的原始文本的每一行,# 可以獲得整個(gè)郵件的原始文本:msg_content = '/r/n'.join(lines)# 稍后解析出郵件:msg = Parser().parsestr(msg_content)# 可以根據(jù)郵件索引號(hào)直接從服務(wù)器刪除郵件:# server.dele(index)# 關(guān)閉連接:server.quit()

用POP3獲取郵件其實(shí)很簡(jiǎn)單，要獲取所有郵件，只需要循環(huán)使用retr()把每一封郵件內(nèi)容拿到即可。真正麻煩的是把郵件的原始內(nèi)容解析為可以閱讀的郵件對(duì)象。
解析郵件

解析郵件的過程和上一節(jié)構(gòu)造郵件正好相反，因此，先導(dǎo)入必要的模塊：

import emailfrom email.parser import Parserfrom email.header import decode_headerfrom email.utils import parseaddr

只需要一行代碼就可以把郵件內(nèi)容解析為Message對(duì)象：

msg = Parser().parsestr(msg_content)

但是這個(gè)Message對(duì)象本身可能是一個(gè)MIMEMultipart對(duì)象，即包含嵌套的其他MIMEBase對(duì)象，嵌套可能還不止一層。

所以我們要遞歸地打印出Message對(duì)象的層次結(jié)構(gòu)：

# indent用于縮進(jìn)顯示:def print_info(msg, indent=0):  if indent == 0:    # 郵件的From, To, Subject存在于根對(duì)象上:    for header in ['From', 'To', 'Subject']:      value = msg.get(header, '')      if value:        if header=='Subject':          # 需要解碼Subject字符串:          value = decode_str(value)        else:          # 需要解碼Email地址:          hdr, addr = parseaddr(value)          name = decode_str(hdr)          value = u'%s <%s>' % (name, addr)      print('%s%s: %s' % (' ' * indent, header, value))  if (msg.is_multipart()):    # 如果郵件對(duì)象是一個(gè)MIMEMultipart,    # get_payload()返回list，包含所有的子對(duì)象:    parts = msg.get_payload()    for n, part in enumerate(parts):      print('%spart %s' % (' ' * indent, n))      print('%s--------------------' % (' ' * indent))      # 遞歸打印每一個(gè)子對(duì)象:      print_info(part, indent + 1)  else:    # 郵件對(duì)象不是一個(gè)MIMEMultipart,    # 就根據(jù)content_type判斷:    content_type = msg.get_content_type()    if content_type=='text/plain' or content_type=='text/html':      # 純文本或HTML內(nèi)容:      content = msg.get_payload(decode=True)      # 要檢測(cè)文本編碼:      charset = guess_charset(msg)      if charset:        content = content.decode(charset)      print('%sText: %s' % (' ' * indent, content + '...'))    else:      # 不是文本,作為附件處理:      print('%sAttachment: %s' % (' ' * indent, content_type))

上一篇：在Python中使用PIL模塊處理圖像的教程

下一篇：python使用socket連接遠(yuǎn)程服務(wù)器的方法