本文共 3048 字,大约阅读时间需要 10 分钟。
POP3和IMAP是邮件相关的协议,IMAP是比POP3更高级一点的协议,实现了了客户端和服务端的交互;邮件协议在实际工作中的应用较为广泛。
POP3 它是因特网电子邮件的第一个离线协议标准,POP3允许用户从服务器上把邮件存储到本地主机(即自己的计算机)上,POP3协议允许电子邮件客户端下载服务器上的邮件,但是在客户端的操作(如移动邮件、标记已读等),不会反馈到服务器上 SMTPSMTP 的全称是“Simple Mail Transfer Protocol”,即简单邮件传输协议。它是一组用于从源地址到目的地址传输邮件的规范,通过它来控制邮件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。SMTP 服务器就是遵循 SMTP 协议的发送邮件服务器。 SMTP 认证,简单地说就是要求必须在提供了账户名和密码之后才可以登录 SMTP 服务器,这就使得那些垃圾邮件的散播者无可乘之机。 增加 SMTP 认证的目的是为了使用户避免受到垃圾邮件的侵扰。IMAPIMAP全称是Internet Mail Access Protocol,即交互式邮件存取协议,它是跟POP3类似邮件访问标准协议之一。不同的是,开启了IMAP后,您在电子邮件客户端收取的邮件仍然保留在服务器上,同时在客户端上的操作都会反馈到服务器上,如:删除邮件,标记已读等,服务器上的邮件也会做相应的动作。 在python中支持POP3协议,也支持IMAP协议,但是IMAP因为其交互性逐渐取代了POP3成为了邮件服务器与客户端的交互,下面主要使用IMAP协议来获取邮件正文、附件、移动或删除邮件。 import re import email from imapclient import IMAPClient import tracebackclass EmailRead(object):
"""实现读取邮件正文、读取附件功能、移动邮件、删除邮件"""def __init__(self, user, passwd, index_file, re_list, server_adderss, port, move_file=None):
""" :param user: 登陆用户名 :param passwd: 登陆密码 :param index_file: 需要查询的邮件文件夹 :param re_list: 需要查找的邮件主题满足的正则表达式 :param move_file: 将邮件移动到该文件夹 :param server_adderss: 邮件服务器地址 :param port: 邮件服务器IMAP协议端口 """ self.server_address = server_adderss self.user = user self.password = passwd self.index_file = index_file self.move_file = move_file self.re_list = re_list self.server = None self.port = port self.item = None self.file_type_list = ['image/jpeg', 'application/vnd.openxmlformats-officedocument.spreadsheetml.sheet']def reade_email(self):
""" 查找邮件并根据附件类型下载附件 :return: """ self.server = IMAPClient(self.server_address, port=993, ssl=True) self.server.login(self.user, self.password) self.server.select_folder(self.index_file, readonly=False) result = self.server.search(['all']) # 获取所有邮件if result:
self.messages = self.server.fetch(result, ['BODY.PEEK[]']) for message_id, message in self.messages.items(): e = email.message_from_string(message[b'BODY[]'].decode()) # 生成Message类型 e try: subject = str(email.header.make_header( email.header.decode_header(e['SUBJECT']))) # 解码subject except: subject = e['SUBJECT']"""正则匹配标题中的 MSO """
if self.subject_re(subject): """获取附件和正文""" for part in e.walk(): filename = part.get_filename() content_type = part.get_content_type() con = part.get_payload(decode=False) if not filename and content_type == 'text/html': if isinstance(con, bytes): con = part.get_payload(decode=True).decode() elif filename and content_type in self.file_type_list: con = part.get_payload(decode=True) with open(filename, 'wb') as f: f.write(con) f.close() else: # list返回附件对象作用类似于e passdef move_email(self, *id):
"""邮件移动和删除功能:传入的move_file是None则不移动只删除""" messages = self.server.fetch(list(id), ['BODY.PEEK[]']) if None!= self.move_file: self.server.copy(messages, self.move_file) # move self.server.delete_messages(messages) # delete self.server.expunge() # save deletedef subject_re(self, subject):
"""用于匹配主题正则表达式""" for i in self.re_list: mso_re = re.search(i, subject) if mso_re: return True else: pass return Falsedefclose(self):
self.server.logout()
该系统也可以用于解决部分邮件验证的,可以直接从邮件获取到验证码的正文,并进一步提取。转载地址:http://ehsxx.baihongyu.com/