2018, Vol.23 No.1, 079-083
Article ID 1007-1202(2018)01-0079-05
DOI https://doi.org/10.1007/s11859-018-1297-y
A New Anti-Spam Model Based on E-mail Address Concealment Technique
ZHANG Yuqiang1,2, HE Jingsha3, XU Jing4
-
- Beijing Institute of Aerospace Control Devices, Beijing 100039, China;
- College of Computer Science and Technology, Beijing
University of Technology, Beijing 100124, China;
-
- School of Software Engineering, Beijing University of Technology, Beijing 100124, China;
- Department of Automation, Tsinghua University, Beijing
100084, China
copy; Wuhan University and Springer-Verlag GmbH Germany 2018
Abstract: To deal with the junk e-mail problem caused by the e-mail address leakage for a majority of Internet users, this paper presents a new privacy protection model in which the e-mail ad- dress of the user is treated as a piece of privacy information con- cealed. Through an interaction pattern that involves three parties and uses an e-mail address code in the place of an e-mail address, the proposed model can prevent the e-mail address from being leaked, thus effectively resolving the junk e-mail problem. We compare the proposed anti-spam method with the filtering tech- nology based on machine learning. The result shows that 100% spams can be filtered out in our scheme, indicating the effective- ness of the proposed anti-spam method.
Key words: spam; e-mail address; protection model; e-mail ad- dress code
CLC number: TP 393
Received date: 2016-07-15
Foundation item: Supported by National Natural Science Foundation of China (U1736116, 61272500, 60373075), and the National High-Tech Ramp;D Program (863 Program) (2015AA017204)
Biography: ZHANG Yuqiang, male, Engineer, Ph.D., research direction: network security. E-mail: yuqzhang@emails.bjut.edu.cn
Introduction
E-mails have brought us more and more conven- ience. However, at the same time, we also receive nu- merous unwanted messages from outsiders. Most of these messages are useless to us, and these destructive e-mails even contain viruses or malicious codes [1].
When users visit a website for the first time, they are often asked to register by the website by providing some personal information in order to get more services conveniently. During the registration, userrsquo;s e-mail ad- dress is a very important piece of information [2]. Users may receive an e-mail subsequently to activate the new account. And when users want to perform a transaction with the website, the e-mail address will be used to re- ceive service information from the website. In such in- teractions between users and website, e-mail addresses become essential in the process of interactions. The cur- rent interactive pattern is that users provide their com- monly used e-mail addresses to the website and the web- sites send customized service information to the e-mail addresses that they have provided [3, 4].
E-mail addresses are used not only for visiting web- sites, but also for communicating with other users. However, there are some unsafe factors in the network that make the real e-mail addresses very easily obtained by malicious parties. Once a commonly used e-mail ad- dress is revealed, junk mail may flood the e-mail [5].
Users can hardly change this situation. Neither do they have any way to make their e-mail address informa- tion a piece of secret information. Possible ways of dealing with this problem include adopting anti-spam
technologies by the service providers on behalf of the users and switching to new e-mail addresses frequently by the users. But these two methods may cause some inconvenience or have some technical deficiency and, consequently, can hardly solve the problem from userrsquo;s point of view.
The first type of method that has been adopted by service providers is the mainstream method of anti-spam in which filtering is the major technique [6]. Filtering techniques can be distinguished based on the role, such as MAT filtering, MDA filtering and MIJA filtering, and based on the method, such as key character-based filter- ing technique, white-list filtering technique, black-list filtering technique, reverse DNS query technique, rule-based filtering technique, content-based filtering technique and other mail filtering techniques. In recent years, with a wide application of machine learning methods, many technologies based on it were applied in anti-spam, such as text mining, classifier and so on. For example, Basavaraju et al[7] proposed a spam detection method to classify the spam using the text clustering techniques based on vector space model. Roul et al[8] proposed an approach to identify the spam pages by combining content and link-based techniques.
To some extent, these techniques can effectively in- hibit spam [9], but spammers constantly update their anti-filtering skill to deceive filters. In addition, these techniques are used to control the spam at the destination and are thus unable to stop spam from the source. The user can adopt another method, that is, not to use the dis- closed e-mail address again. Instead, the user will apply for a new one. This method seems simple and feasible. But when the user re-visits the same website or starts a new network interaction, the same problem will happen again and the new e-mail address has the same chance of being stolen by malicious parties [10]. In addition, al- though the process of applying for a new e-mail address is easy, all of the userrsquo;s classmates, friends, commercial partners a
全文共19721字,剩余内容已隐藏,支付完成后下载完整资料
一种新的基于电子邮件地址隐藏技术的反垃圾邮件模型
摘要:为了解决大多数Internet用户因电子邮件地址泄露而导致的垃圾邮件问题,本文提出了一种新的隐私保护模型,其中用户的电子邮件地址被视为 一条隐私信息被隐瞒了。 通过涉及三方的交互模式并使用电子邮件地址代码代替电子邮件地址,所提出的模型可以防止电子邮件地址被泄露,从而有效地解决垃圾邮件问题。我们将提出的反垃圾邮件方法与基于机器学习的过滤技术进行比较。结果表明,在我们的方案中可以过滤出100%的垃圾邮件,这表明了所提出的反垃圾邮件方法的有效性。
关键词:垃圾邮件; 电子邮件地址; 保护模式; 电子邮件地址代码
0 介绍
电子邮件给我们带来了越来越多的便利。然而,与此同时,我们也会收到来自外人的大量不需要的消息。大多数这些消息对我们来说都是无用的,这些破坏性的电子邮件甚至包含病毒或恶意代码[1]。
当用户第一次访问网站时,他们经常被要求通过提供一些个人信息在网站上注册,以便方便地获得更多服务。在注册过程中,用户的电子邮件地址是非常重要的信息[2]。用户可以随后接收电子邮件以激活新帐户。当用户想要与网站进行交易时,电子邮件地址将用于从网站上获取服务信息。在用户和网站之间的这种交互中,电子邮件地址在交互过程中变得至关重要。当前的交互模式是用户向网站提供他们常用的电子邮件地址,网站将定制的服务信息发送到他们提供的电子邮件地址[3,4]。
电子邮件地址不仅用于访问网站,还用于与其他用户通信。但是,网络中存在一些不安全因素,使恶意方很容易获得真实的电子邮件地址。一旦发现常用的电子邮件地址,垃圾邮件可能会泛滥电子邮件[5]。
用户很难改变这种情况。 他们也没有办法让他们的电子邮件地址信息成为一个秘密信息。 处理此问题的可能方法包括服务提供商代表用户采用反垃圾邮件技术,并经常由用户切换到新的电子邮件地址。 但是这两种方法可能会带来一些不便或者有一些技术缺陷,因此从用户的角度来看很难解决问题。
服务提供商采用的第一种方法是反垃圾邮件的主流方法,其中过滤是主要技术[6]。 滤波技术可以根据角色进行区分,如MAT滤波,MDA滤波和MIJA滤波,以及基于关键字符的滤波技术,白名单过滤技术,黑名单过滤技术等方法。 反向DNS查询技术,基于规则的过滤技术,基于内容的过滤技术和其他邮件过滤技术。 近年来,随着机器学习方法的广泛应用,基于它的许多技术被应用于反垃圾邮件,如文本挖掘,分类器等。 例如,Basavaraju等[7]提出了一种垃圾邮件检测方法,使用基于向量空间模型的文本聚类技术对垃圾邮件进行分类。 Roul等[8]提出了一种通过结合内容和基于链接的技术来识别垃圾邮件页面的方法。
在某种程度上,这些技术可以有效地阻止垃圾邮件[9],但垃圾邮件发送者不断更新其反过滤技能以欺骗过滤器。此外,这些技术用于控制目的地的垃圾邮件,因此无法阻止来自源的垃圾邮件。用户可以采用另一种方法,即不再使用已发布的电子邮件地址。相反,用户将申请一个新的。这种方法看似简单可行。但是当用户重新访问同一网站或开始新的网络交互时,同样的问题将再次发生,新的电子邮件地址也有被恶意方窃取的机会[10]。此外,尽管申请新电子邮件地址的过程很简单,但用户通过旧邮件地址与之通信的所有用户的同学,朋友,商业伙伴和其他互动网站都无法再保留与用户联系。用户必须与这些朋友和合作伙伴更新新应用的电子邮件地址,以重新建立新的地址簿以进行正常的日常通信。这种努力既麻烦又耗时,并且可能导致失去与一些重要通信方的联系[11]。
为了从根本上解决垃圾邮件泛滥的问题,本文提出了一种新的隐私保护方法,其中用户的电子邮件地址被视为一条应受到保护的隐私信息。 在这种方法中,我们使用电子邮件地址代码来替换用户的真实电子邮件地址,并提出一些技术措施,以确保电子邮件可以通过此电子邮件地址代码透明地传输到用户。用户可以灵活地控制电子邮件地址代码并独立地阻止垃圾邮件。使用这种新模型,用户可以轻松找到垃圾邮件发送者,从而有效阻止垃圾邮件到达用户,并允许用户及时报告垃圾邮件发送者。
本文的其余部分安排如下。 在第1节中,我们详细描述了我们提出的隐私保护模型,包括架构。 在第2节中,我们使用一个例子来说明我们的隐私保护模型是如何工作的。 最后,我们在第3节中总结了本文。
1 拟议模型
在本节中,我们将简要介绍模型的工作模式,并描述新模型中的核心方法。 然后,我们介绍了新隐私保护模型的架构和工作流程。
1.1工作模式
与传统的与电子邮件地址通信的方式相比,我们的方法不直接为交互式网站提供常用的电子邮件地址。 相反,我们建议使用特殊且灵活的电子邮件地址代码来替换常用的电子邮件地址。 通过此电子邮件地址代码,与用户交互的网站仍然可以将服务信息发送到用户常用的电子邮箱。 这种方法不仅可以保护用户的电子邮件地址,还可以像往常一样完成交互式服务的整个过程。
电子邮件地址代码是一种以用户为中心的设计,具有临时性,管理灵活性等特点。 该代码由用户生成,然后用作电子邮件,即,用户现在替换用于在用户自由设置的有效时间段内发送和接收电子邮件的真实电子邮件地址。 电子邮件地址代码到期后,可以再次使用用户常用的电子邮件地址。 或者,用户可以设置另一个用于下一时间段的电子邮件地址代码。 该模型的工作模式如图1所示。
1.2互动实体
该模型涉及三个主要交互实体:主题A,对象B和电子邮件服务器C.
图1模型的工作模式
主题A:启动交互过程(用户)的隐私信息的所有者。
对象B:用户的交互伙伴,要求用户提供电子邮件地址以继续交互式服务。
电子邮件服务器C:为用户提供电子邮件服务的服务器,被视为电子邮件地址隐私信息的提供者。
用户将电子邮件地址作为与服务器的隐私信息共享。 但是,交互伙伴是电子邮件地址信息的无关第三方。 只要交互过程可以顺利完成,用户就不必为交互伙伴提供真实的电子邮件地址。
1.3主要架构
该模型的主要体系结构包含四个元素:生成,存储,管理和验证模块,如图2所示。生成模块获取用户提供的电子邮件地址信息以生成电子邮件地址代码。 存储模块将电子邮件地址代码和其他相关信息存储在系统中。用户可以通过管理模块管理电子邮件地址代码,如修改有效期,打开或关闭电子邮件地址代码,撤销电子邮件地址代码等。验证模块用于验证 来自交互方的信息,以便接收或拒绝该消息。
图2模型的主要架构
生成模块(生产者):用户使用该模块申请电子邮件地址代码。 它根据交互方的ID号,随机数R,当前系统时间T和到期日期等信息生成电子邮件地址代码。 到期日期取决于与交互方的交互情况。
存储模块(存储):该模块存储电子邮件地址代码和相关信息后的电子邮件地址代码的所有信息。 该模块将电子邮件地址代码与用户常用的电子邮件绑定,以使用新的电子邮件地址代码进行信息传输。
管理模块(管理员):用户可以使用该模块来管理电子邮件地址代码信息。 通过该模块,用户可以基于不同的交互情况修改电子邮件地址代码信息参数。 特别是,当用户收到一些垃圾邮件时,他/她可以调整参数和与电子邮件地址代码相关的交互模式。
验证模块(验证者):该模块用于验证通过电子邮件地址代码向用户发送电子邮件的电子邮件发件人的ID信息。 如果发送者的ID信息与在生成电子邮件地址代码期间存储在交互方的ID信息相同,则将接受该电子邮件。 否则,它将被拒绝。
1.4模型的工作流程
基于反垃圾邮件隐私保护方法,该模型的实现采取以下步骤。 该方法的整个框架包括用户常用的电子邮件,电子邮件服务器以及与用户交互的其他人或网站。 如果A是用户常用的电子邮件,B是另一个用户或与用户交互的网站,而C是邮件服务器,则该方法包括以下6个步骤。
1)当A浏览网站B获取某些服务时,A需要填写注册信息并提供常用的电子邮件地址,以便顺利完成交互。
在我们的新隐私保护模型中,主题A将执行以下操作以完成注册。
2)登录邮件服务器C并申请电子邮件地址代码。 根据B的电子邮件地址,随机数和系统的当前时间,可以使用算法SHA-1生成消息摘要。 可以使用算法RSA生成数字签名,C生成电子邮件地址代码。 此代码将A的常用电子邮件与邮件服务器C绑定。根据与B交互过程中的情况管理A的电子邮件地址代码,所有与电子邮件地址代码相关的信息 将存储在A的常用电子邮件中。
3)A获取C生成的电子邮件地址代码,并设置电子邮件地址代码的初始信息:电子邮件地址代码的截止日期,B的临时名称,交互服务的关键字 和其他安全参数。
4)A在为B提供注册信息时,使用电子邮件地址代码替换常用的电子邮件地址。该电子邮件地址代码仅用于A和B之间的交互。
5)B在与A的所有交互中使用电子邮件地址代码。在B,所有从A收到的消息现在显示电子邮件地址代码但不显示A的真实电子邮件地址。当然,电子邮件 在交互过程中,A的地址代码对B是透明的。
6)在每次交互的过程中,由于电子邮件地址码包含B的ID信息,C可以验证通过电子邮件地址码发送消息的消息发送者的ID信息。 如果ID信息与在生成电子邮件地址代码期间存储的交互方的ID信息相同,则将接收该消息。 否则,该邮件将被拒绝。
2 实验
基于提出的反垃圾邮件和隐私保护模型,我们开发了一个原型系统。 在该系统上进行了比较实验,以评估所提出的模型的有效性和性能。
在我们的实验中,用户A的电子邮件地址是AAA@126.com,网站B的电子邮件地址是BBB@126.com,垃圾邮件网站是C.三种方案的比较显示 在下面:方案1使用我们的反垃圾邮件隐私保护模型,方案2使用相关的检测技术来过滤垃圾邮件,方案3不使用任何反垃圾邮件方法。
1)方案1
用户A通过唯一的电子邮件地址代码B754fc@126.com与网站B通信。 网站B没有用户A的真实电子邮件地址(如图3所示)。 因此,即使网站C从网站B获得唯一的电子邮件地址代码(B754fc@126.com),我们的系统也可以轻松识别从C发送到A的垃圾邮件,并且不会转发给 用户A的真实电子邮件地址(AAA@126.com)。
图3反垃圾邮件隐私保护模型的程序界面
2)方案2
该方案采用最新的方法,在反垃圾邮件中使用监控和过滤技术。 在这个方案中,在通过AAA@126.com与网站B联系的电子邮件之后,网站C可以获得A的真实电子邮件地址。然后网站C将向A发送垃圾邮件。 将垃圾邮件发送到邮箱A的过程中,该方案使用内容和基于链接的技术相结合的方法来检测和过滤垃圾邮件[8]。 因此,阻止一部分垃圾邮件被发送到用户的邮箱A.
3)方案3
该方案不使用所提出的模型。通过电子邮件通过AAA@126.com与网站B联系后,网站C可能会获得A的真实电子邮件地址并向A发送垃圾邮件。
图4显示了1000次实验的结果。 在每次测试中,分别使用方案1,2,3将100封垃圾邮件发送到用户的邮箱A,并记录收到的垃圾邮件数量。
从图4中可以看出,在方案1中,可以过滤掉所有垃圾邮件,并且收到的垃圾邮件数量为0.在方案2中,使用基于机器学习的过滤技术。 [8],收到26封垃圾邮件,表明垃圾邮件过滤率约为74%。 方案3不采用反垃圾邮件方法,因此用户的邮箱A收到所有测试垃圾邮件。 结果证明了所提出的反垃圾邮件方法的有效性。
图4避免垃圾邮件的三种方案的比较
3结论
我们在本文中提出了一种防止电子邮件垃圾邮件的新模型。我们提出的模型的优点如下:
1)通常使用的电子邮件的真实地址信息不会透露给任何其他交互式部分。用户不需要经常更新他们的电子邮件来处理电子邮件地址泄漏的问题。对用户常用电子邮件地址的保护可以确保用户和好朋友之间的正常通信。
2)用户可以根据自己的喜好轻松确定哪些邮件是垃圾邮件,并可以根据具体的交互情况灵活设置电子邮件地址代码的参数。
3)用户可以清楚地知道垃圾邮件等电子邮件问题的来源,从而可以采取适当的措施。
4)电子邮件地址代码的管理是灵活的。用户可以减少或延长其到期日期或打开,关闭和取消其接收和发送邮件功能。这些操作实际上取决于用户的需要。
在我们未来的研究中,我们在本文中提出的隐私保护模型将进一步完善,并且还将更深入地分析该模型的应用的性能和功能。
参考文献
- Ku C H, Leroy G. A decision support system: Automated crime report analysis and classification for e-government [J]. Government Information Quarterly, 2014, 31(4): 534-544.
-
全文共7094字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[489]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。