垃圾邮件与反垃圾邮件技术浅析_反垃圾邮件技术浅析
垃圾邮件与反垃圾邮件技术浅析由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“反垃圾邮件技术浅析”。
垃圾邮件与反垃圾邮件技术浅析
学号:
姓名:
院系:
邮件:
电话:
垃圾邮件与反垃圾邮件技术浅析
摘要:最近几年,垃圾邮件肆虐横行,危害越来越大,严重影响了正常的网络运行。本文简单地介绍了垃圾邮件的定义及垃圾邮件泛滥的原因;重点论述了当前主要的反垃圾邮件技术,最后对未来反垃圾邮件技术提出了展望。
关键词:垃圾邮件;反垃圾邮件;邮件过滤
1引言
随着全球信息化的迅猛发展,互联网络已经成为人们工作、学习和生活中不可或缺的部分,而电子邮件又是人们进行信息交流的重要手段。可是,垃圾邮件又是困扰网络用户的难题。垃圾邮件不仅消耗网络频宽,而且浪费用户的存储空间,甚至有可能成为造成社会不稳定的因素,所以我们有必要采取技术措施控制垃圾邮件的肆意蔓延。2什么是垃圾邮件
某种程度上,对垃圾邮件的定义可以是:人们没有意愿去接收到的电子邮件都是垃圾邮件。比如:
(1)商业广告。很多公司为了宣传新的产品、新的活动等通过电子邮件的方式进行宣传。
(2)政治言论。目前会收到不少来自其他国家或者反动组织发送的这类电子邮件,这就跟垃圾的商业广告一样,销售和贩卖他们的所谓言论。
(3)蠕虫病毒邮件。越来越多的病毒通过电子邮件来迅速传播,这也的确是一条迅速而且有效的传播途径。
(4)恶意邮件。恐吓、欺骗性邮件。比如phishing,这是一种假冒网页的电子邮件,完全是一种诡计,来蒙骗用户的个人信息、账号甚至信用卡。
3垃圾邮件泛滥的原因
垃圾邮件的产生可以追溯到最开始的连锁信,随着邮件技术的发展,垃圾邮件技术也在逐步发展,要想找到彻底解决垃圾邮件问题的技术,必须从邮件传输的原理入手。目前邮件传递的主要协议是SMTP协议,该协议没有任何认证手段,因此缺省的SMTP邮件服务器是所谓的OpenRelay(开放转发器),无论邮件来自哪里或发到哪里,邮件服务器都会予以发送。
最常见的邮件发送过程是这样:邮件的客户端使用SMTP协议将邮件发送给一台SMTP发送服务器,然后SMTP发送服务器根据邮件的目的地址,使用SMTP协议将该邮件转发给目标SMTP服务器(接收服务器),接收服务器收到邮件后放入接收人的邮箱(Mailbox或Maildir,可能是单独的服务器,也可能是同一台机器上),最后另一个邮件客户端(接收方)使用POP3或IMAP协议从邮箱服务器上接收自己的邮件。整个过程中,发送方与发送服务器、发送服务器和接收服务器之间都不做认证,因此发送方可以使用互联网上任意一台SMTP服务器来发送邮件,这就是Open Relay。
近年来由于垃圾邮件的泛滥,大部分邮件服务器关闭了Open Relay,在发送方与发送服务器间需要认证,来保证发送服务器发送邮件的主机的合法性,这就是增强的ESMTP协议。但这并没有解决第二个环节:发送邮件器和接收邮件服务器间的合法性认证。因为不可能要求接收邮件服务器上保存所有发送邮件服务器的合法用户信息,因此发送邮件服务器无法向接收邮件服务器做认证。
目前的邮件服务器的处理方式是:如果目的地址是本邮件服务器的用户,则无需认证予以接收;如果目的地址不是本邮件服务器的用户,需要用本邮件服务器的合法用户的用户名和口令来认证(该用户可以不是该邮件的发件人)。这样,就给自动垃圾邮件发送程序提供了可能:它只要给邮件服务器发的邮件都是该邮件服务器的用户,即可发送进去。我们知道,可以随处得到一个数百万甚至上千万的Email列表,使用程序自动按照邮件服务器域名发送相应的用户是很容易的,这就导致了垃圾邮件的泛滥。
4垃圾邮件的危害
垃圾邮件可以说是互联网带给人类最具争议性的副产品,它的泛滥已经使整个互联网不堪重负,并造成以下一些危害:
——占用网络带宽,造成邮件服务器拥塞,进而降低整个网络的运行效率。
——侵犯收件人的隐私权,侵占收件人信箱空间,耗费收件人的时间、精力和金钱。有的垃圾邮件还盗用他人的电子邮件地址做发信地址,严重损害了他人的信誉。
——被黑客利用,成为助纣为虐的工具。如2003年2月份,黑客攻击雅虎等五大热门网站就是一个例子。黑客先是侵入并控制了一些高带宽的网站,集众多服务器的带宽能力,然后用数以亿万计的垃圾邮件猛烈袭击目标,造成被攻击网站网路堵塞,最终瘫痪。
——严重影响ISP的服务形象。在国际上,频繁转发垃圾邮件的主机会被上级国际互联网服务提供商列入国际垃圾邮件数据库,从而导致该主机不能访问国外许多网络,而且收到垃圾邮件的用户会因为ISP没有建立完善的垃圾邮件过滤机制,而转向其它ISP。
——妖言惑众,骗人钱财,传播色情等内容的垃圾邮件,已经对现实社会造成了危害。
5当前主要的反垃圾邮件技术
5.1贝叶斯算法
贝叶斯算法是一种比较智能的技术,用户通过培训让反垃圾邮件产品认识什么样的邮件是垃圾邮件,什么样的邮件是正常的邮件,然后形成一个贝叶斯库。根据分析以前发生的事情频率和概率来预测将发生事情的频率和概率,判断垃圾邮件的依据就是贝叶斯库。
贝叶斯算法的优点是,垃圾邮件的判断准确性大大提高;缺点是,需要用户进行干预,判别的速度较慢。
5.2指纹识别
所谓邮件的指纹,就是邮件内容中的一些字符串的组合,又称为快照。就是从类似、但不相同的信息中,识别已经被确认为垃圾邮件的信息。反垃圾邮件产品通过确认的指纹,完成对垃圾邮件的识别。
当然,指纹检查的准确性依赖于垃圾邮件的指纹库,反垃圾邮件产品先给邮件中出现的每一个字符赋予一个数值(这个数值的确是按照特定垃圾的用词规律特点进行分类),再利用统计方法给这封邮件计算出一个综合的数值。也可以根据是否与其他多次收到的邮件相似来判定。
指纹识别技术的缺点是,要经常维护指纹库。
5.3实时黑名单列表
为了有效地拒绝来自恶意的垃圾邮件来源站点和/或被利用的垃圾邮件来源站点所发来的垃圾邮件,最直接和有效的办法就是拒绝该来源的连接。通过将确认后的垃圾邮件来源站点(无论是否是恶意与否)放入一个黑名单,然后通过发布该名单来保护邮件服务器不受到黑名单中站点的侵扰确实是一个目前对抗日益严重的垃圾邮件的行之有效的方法。
目前在黑名单技术上最流行的是实时黑名单(RealtimeBlackhole List,简称RBL)技术。通常该技术是通过DNS方式(查询和区域传输)实现的。目前国外流行的几个主要的实时黑名单服务器都是通过DNS方式提供的,如Mail-Abuse的RBL、RBL+等。
实时黑名单技术的优点是,减少用户的工作量和设置难度,降低一定的误报率;缺点是,有的RBL提供方提供的黑名单过于强硬。
5.4防止字典攻击
在我们平时使用邮件系统给别人发信的时候遇到过这样的情况,一不小心将收件人的地址写错了,那么这样的邮件是不可能被正确地送到目的地的,将被退回来。一些垃圾邮件的发送者就利用了邮件系统这个特点,大量地向邮件系统发送信件,没有被退回来的信件就是邮件系统当前拥有的邮件地址,这样垃圾邮件的发送者就可以很轻松地得到发送垃圾邮件的对象了。采用防止字典攻击的技术就是让邮件系统在没有真实用户存在于系统当中时不退信,这样攻击者就不能够获得有效的用户列表。
5.5邮件域名过滤
IBM开发了代号为FairUCE的反垃圾邮件新技术。该技术使用网络领域的内置身份管理工具,通过分析电子邮件域名过滤并封锁垃圾邮件。FairUCE把收到的邮件同其源头的IP地址相连接,在电子邮件地址、电子邮件域和发送邮件的计算机之间建立起一种联系,以确定电子邮件的合法性。IP地址是固定不变的,因此FairUCE就能够识别信息是来自僵尸(Zombie)计算机、机器人Bot装置还是来自合法的电子邮件服务器。
6结束语
制止垃圾邮件的困扰除了采用必要的技术手段,还必须寻求法律的支持。从法律角度看,发送垃圾邮件属于言论自由的滥用,不但得不到法律的支持,相反,很多国家正积极制定相关法律来禁止垃圾邮件。另外,未来反垃圾邮件技术,在提高准确率的同时,必须同时满足以下条件:适应各种网络规模;支持用户发信认证功能;支持可游离于各种服务器之外的电子邮件过滤功能,可自动关闭中转访问功能,保证邮件服务器不被非法利用,保证正常邮件到达的稳定性和实时性。