第一篇:垃圾郵件與反垃圾郵件技術淺析[范文]
垃圾郵件與反垃圾郵件技術淺析
學號:
姓名:
院系:
郵件:
電話:
垃圾郵件與反垃圾郵件技術淺析
摘要:最近幾年,垃圾郵件肆虐橫行,危害越來越大,嚴重影響了正常的網(wǎng)絡運行。本文簡單地介紹了垃圾郵件的定義及垃圾郵件泛濫的原因;重點論述了當前主要的反垃圾郵件技術,最后對未來反垃圾郵件技術提出了展望。
關鍵詞:垃圾郵件;反垃圾郵件;郵件過濾
1引言
隨著全球信息化的迅猛發(fā)展,互聯(lián)網(wǎng)絡已經成為人們工作、學習和生活中不可或缺的部分,而電子郵件又是人們進行信息交流的重要手段。可是,垃圾郵件又是困擾網(wǎng)絡用戶的難題。垃圾郵件不僅消耗網(wǎng)絡頻寬,而且浪費用戶的存儲空間,甚至有可能成為造成社會不穩(wěn)定的因素,所以我們有必要采取技術措施控制垃圾郵件的肆意蔓延。2什么是垃圾郵件
某種程度上,對垃圾郵件的定義可以是:人們沒有意愿去接收到的電子郵件都是垃圾郵件。比如:
(1)商業(yè)廣告。很多公司為了宣傳新的產品、新的活動等通過電子郵件的方式進行宣傳。
(2)政治言論。目前會收到不少來自其他國家或者反動組織發(fā)送的這類電子郵件,這就跟垃圾的商業(yè)廣告一樣,銷售和販賣他們的所謂言論。
(3)蠕蟲病毒郵件。越來越多的病毒通過電子郵件來迅速傳播,這也的確是一條迅速而且有效的傳播途徑。
(4)惡意郵件??謬?、欺騙性郵件。比如phishing,這是一種假冒網(wǎng)頁的電子郵件,完全是一種詭計,來蒙騙用戶的個人信息、賬號甚至信用卡。
3垃圾郵件泛濫的原因
垃圾郵件的產生可以追溯到最開始的連鎖信,隨著郵件技術的發(fā)展,垃圾郵件技術也在逐步發(fā)展,要想找到徹底解決垃圾郵件問題的技術,必須從郵件傳輸?shù)脑砣胧?。目前郵件傳遞的主要協(xié)議是SMTP協(xié)議,該協(xié)議沒有任何認證手段,因此缺省的SMTP郵件服務器是所謂的OpenRelay(開放轉發(fā)器),無論郵件來自哪里或發(fā)到哪里,郵件服務器都會予以發(fā)送。
最常見的郵件發(fā)送過程是這樣:郵件的客戶端使用SMTP協(xié)議將郵件發(fā)送給一臺SMTP發(fā)送服務器,然后SMTP發(fā)送服務器根據(jù)郵件的目的地址,使用SMTP協(xié)議將該郵件轉發(fā)給目標SMTP服務器(接收服務器),接收服務器收到郵件后放入接收人的郵箱(Mailbox或Maildir,可能是單獨的服務器,也可能是同一臺機器上),最后另一個郵件客戶端(接收方)使用POP3或IMAP協(xié)議從郵箱服務器上接收自己的郵件。整個過程中,發(fā)送方與發(fā)送服務器、發(fā)送服務器和接收服務器之間都不做認證,因此發(fā)送方可以使用互聯(lián)網(wǎng)上任意一臺SMTP服務器來發(fā)送郵件,這就是Open Relay。
近年來由于垃圾郵件的泛濫,大部分郵件服務器關閉了Open Relay,在發(fā)送方與發(fā)送服務器間需要認證,來保證發(fā)送服務器發(fā)送郵件的主機的合法性,這就是增強的ESMTP協(xié)議。但這并沒有解決第二個環(huán)節(jié):發(fā)送郵件器和接收郵件服務器間的合法性認證。因為不可能要求接收郵件服務器上保存所有發(fā)送郵件服務器的合法用戶信息,因此發(fā)送郵件服務器無法向接收郵件服務器做認證。
目前的郵件服務器的處理方式是:如果目的地址是本郵件服務器的用戶,則無需認證予以接收;如果目的地址不是本郵件服務器的用戶,需要用本郵件服務器的合法用戶的用戶名和口令來認證(該用戶可以不是該郵件的發(fā)件人)。這樣,就給自動垃圾郵件發(fā)送程序提供了可能:它只要給郵件服務器發(fā)的郵件都是該郵件服務器的用戶,即可發(fā)送進去。我們知道,可以隨處得到一個數(shù)百萬甚至上千萬的Email列表,使用程序自動按照郵件服務器域名發(fā)送相應的用戶是很容易的,這就導致了垃圾郵件的泛濫。
4垃圾郵件的危害
垃圾郵件可以說是互聯(lián)網(wǎng)帶給人類最具爭議性的副產品,它的泛濫已經使整個互聯(lián)網(wǎng)不堪重負,并造成以下一些危害:
——占用網(wǎng)絡帶寬,造成郵件服務器擁塞,進而降低整個網(wǎng)絡的運行效率。
——侵犯收件人的隱私權,侵占收件人信箱空間,耗費收件人的時間、精力和金錢。有的垃圾郵件還盜用他人的電子郵件地址做發(fā)信地址,嚴重損害了他人的信譽。
——被黑客利用,成為助紂為虐的工具。如2003年2月份,黑客攻擊雅虎等五大熱門網(wǎng)站就是一個例子。黑客先是侵入并控制了一些高帶寬的網(wǎng)站,集眾多服務器的帶寬能力,然后用數(shù)以億萬計的垃圾郵件猛烈襲擊目標,造成被攻擊網(wǎng)站網(wǎng)路堵塞,最終癱瘓。
——嚴重影響ISP的服務形象。在國際上,頻繁轉發(fā)垃圾郵件的主機會被上級國際互聯(lián)網(wǎng)服務提供商列入國際垃圾郵件數(shù)據(jù)庫,從而導致該主機不能訪問國外許多網(wǎng)絡,而且收到垃圾郵件的用戶會因為ISP沒有建立完善的垃圾郵件過濾機制,而轉向其它ISP。
——妖言惑眾,騙人錢財,傳播色情等內容的垃圾郵件,已經對現(xiàn)實社會造成了危害。
5當前主要的反垃圾郵件技術
5.1貝葉斯算法
貝葉斯算法是一種比較智能的技術,用戶通過培訓讓反垃圾郵件產品認識什么樣的郵件是垃圾郵件,什么樣的郵件是正常的郵件,然后形成一個貝葉斯庫。根據(jù)分析以前發(fā)生的事情頻率和概率來預測將發(fā)生事情的頻率和概率,判斷垃圾郵件的依據(jù)就是貝葉斯庫。
貝葉斯算法的優(yōu)點是,垃圾郵件的判斷準確性大大提高;缺點是,需要用戶進行干預,判別的速度較慢。
5.2指紋識別
所謂郵件的指紋,就是郵件內容中的一些字符串的組合,又稱為快照。就是從類似、但不相同的信息中,識別已經被確認為垃圾郵件的信息。反垃圾郵件產品通過確認的指紋,完成對垃圾郵件的識別。
當然,指紋檢查的準確性依賴于垃圾郵件的指紋庫,反垃圾郵件產品先給郵件中出現(xiàn)的每一個字符賦予一個數(shù)值(這個數(shù)值的確是按照特定垃圾的用詞規(guī)律特點進行分類),再利用統(tǒng)計方法給這封郵件計算出一個綜合的數(shù)值。也可以根據(jù)是否與其他多次收到的郵件相似來判定。
指紋識別技術的缺點是,要經常維護指紋庫。
5.3實時黑名單列表
為了有效地拒絕來自惡意的垃圾郵件來源站點和/或被利用的垃圾郵件來源站點所發(fā)來的垃圾郵件,最直接和有效的辦法就是拒絕該來源的連接。通過將確認后的垃圾郵件來源站點(無論是否是惡意與否)放入一個黑名單,然后通過發(fā)布該名單來保護郵件服務器不受到黑名單中站點的侵擾確實是一個目前對抗日益嚴重的垃圾郵件的行之有效的方法。
目前在黑名單技術上最流行的是實時黑名單(RealtimeBlackhole List,簡稱RBL)技術。通常該技術是通過DNS方式(查詢和區(qū)域傳輸)實現(xiàn)的。目前國外流行的幾個主要的實時黑名單服務器都是通過DNS方式提供的,如Mail-Abuse的RBL、RBL+等。
實時黑名單技術的優(yōu)點是,減少用戶的工作量和設置難度,降低一定的誤報率;缺點是,有的RBL提供方提供的黑名單過于強硬。
5.4防止字典攻擊
在我們平時使用郵件系統(tǒng)給別人發(fā)信的時候遇到過這樣的情況,一不小心將收件人的地址寫錯了,那么這樣的郵件是不可能被正確地送到目的地的,將被退回來。一些垃圾郵件的發(fā)送者就利用了郵件系統(tǒng)這個特點,大量地向郵件系統(tǒng)發(fā)送信件,沒有被退回來的信件就是郵件系統(tǒng)當前擁有的郵件地址,這樣垃圾郵件的發(fā)送者就可以很輕松地得到發(fā)送垃圾郵件的對象了。采用防止字典攻擊的技術就是讓郵件系統(tǒng)在沒有真實用戶存在于系統(tǒng)當中時不退信,這樣攻擊者就不能夠獲得有效的用戶列表。
5.5郵件域名過濾
IBM開發(fā)了代號為FairUCE的反垃圾郵件新技術。該技術使用網(wǎng)絡領域的內置身份管理工具,通過分析電子郵件域名過濾并封鎖垃圾郵件。FairUCE把收到的郵件同其源頭的IP地址相連接,在電子郵件地址、電子郵件域和發(fā)送郵件的計算機之間建立起一種聯(lián)系,以確定電子郵件的合法性。IP地址是固定不變的,因此FairUCE就能夠識別信息是來自僵尸(Zombie)計算機、機器人Bot裝置還是來自合法的電子郵件服務器。
6結束語
制止垃圾郵件的困擾除了采用必要的技術手段,還必須尋求法律的支持。從法律角度看,發(fā)送垃圾郵件屬于言論自由的濫用,不但得不到法律的支持,相反,很多國家正積極制定相關法律來禁止垃圾郵件。另外,未來反垃圾郵件技術,在提高準確率的同時,必須同時滿足以下條件:適應各種網(wǎng)絡規(guī)模;支持用戶發(fā)信認證功能;支持可游離于各種服務器之外的電子郵件過濾功能,可自動關閉中轉訪問功能,保證郵件服務器不被非法利用,保證正常郵件到達的穩(wěn)定性和實時性。
第二篇:國際垃圾郵件及反垃圾最新技術
國際垃圾郵件及反垃圾最新技術
作者:Barracuda 2008-04-16 16:54:37
信息化時代,垃圾郵件那些想謀求暴利的投機者經常使用的一條新的非法傳播途徑,它被認為是最有效和最廉價的廣告形式,傳統(tǒng) 的控制方法已經無法有效過濾垃圾郵件。垃圾郵件制造者通過郵件報頭欺騙等方式,對郵件主題和內容進行處理,并且利用第三方服務器進行轉發(fā)。電子郵件安全服 務公司Postini估計,目前,超過80%的電子郵件屬于垃圾郵件。為了在與垃圾郵件的對抗中取得主動,大部分解決方案提供商在郵件服務器上安裝反垃圾 郵件引擎,檢查進出該郵件服務器的郵件。
從96年4月份開始,人們使用 UCE(Unsolicited Commercial Email)來稱呼垃圾郵件,并開始積極想辦法阻止垃圾郵件在Internet 上泛濫。隨后,有人提出了SpamBlock的方法,例如使用 REMOVE.TO.REPLY 的工具來過濾郵件地址。隨著過濾垃圾郵件技術的發(fā)展以及人們對發(fā)送垃圾郵件者的譴責,垃圾郵件的制造者不得不采取更為隱蔽的技術,目前被利用最多的垃圾郵 件發(fā)送技巧有:
1、盜取身份,來自“好人”的身份欺騙:垃圾郵件制造者使用的手段相當多樣化,他們收集全球范圍的發(fā)信者IP地址,使用新的垃圾郵件域名,垃圾郵件或藏匿在其 他“健康”url的后面以創(chuàng)建url好信譽,或利用如博客、免費網(wǎng)站等這些免費場所來達到身份欺騙。在發(fā)送過程中,它們用同樣的技巧來隱藏發(fā)信者IP地 址,將url重定向到已知垃圾郵件域名或IP地址,或者使用許多免費的資源。
2、圖片垃圾郵件及多層圖片垃圾郵件:在所有的垃圾郵件中,圖像垃圾郵件從年初所占的1%已經飆升至15%。垃圾郵件發(fā)送者越來越會隱蔽信息,他們以圖片的形 式發(fā)送,而不是用文本。這些圖像之所以能夠蒙蔽一些過濾器是因為不太容易發(fā)現(xiàn)一個圖像文件所含的內容是朋友生日聚會的照片、還是內嵌某公司股票信息的圖 片。圖像垃圾郵件還會加重電子郵件系統(tǒng)的負擔,因為每封圖像垃圾郵件所占空間大約是普通垃圾郵件的7.5倍。
3、躲避全球IP監(jiān)控及信譽評分:信譽評分技術是指根據(jù)信譽(reputation)篩檢郵件的方法,依照寄件行為接受評比。評比標準依據(jù)幾項變數(shù),例如收件 人的申訴率、發(fā)送郵件的數(shù)量,以及對收件人取消訂閱要求的回應。另外,ip地址黑名單也是垃圾郵件發(fā)送者要回避的,為此,他們必須不斷尋找新的僵尸服務器 代發(fā)垃圾郵件。
4、躲避內容過濾,夾帶URL或者電話號碼:越來越多的垃圾郵件發(fā)送者為躲避內容過濾引擎,將郵件偽裝得越來越像一封正常郵件,而郵件中夾帶的URL地址或者電話號碼才是垃圾郵件發(fā)送者正真的意圖所在。
這些非法新技術的隱蔽性和擴張性大大優(yōu)于他們的前身,造成當今垃圾郵件泛濫成災,使用電子郵件的網(wǎng)民及各界人士對垃圾郵件造成的問題日益關注,網(wǎng)絡服務商和郵件運營商們紛紛提出了自己的技術方案:
發(fā)件人特征識別技術 Predictive Sender Profiling
在身份欺騙技術被垃圾郵件制造者廣泛利用的新形式下,郵件安全廠商推出了針對性的發(fā)件人特征識別技術,代表產品為國際領先安全廠商博威特公司的 梭子魚垃圾郵件防火墻。在06年底,該公司宣布將針對“好人”身份欺騙的特征識別技術加入梭子魚垃圾郵件防火墻中,首先要驗證發(fā)信者身份并預測其行為,這 其中包括列舉垃圾郵件制造者的行為以及加強不依靠身份驗證進行辨認的措施。博威特網(wǎng)絡技術公司表示,對于發(fā)件人特征識別技術來說,郵件信譽的校驗只是最基 本的,它必須通過啟發(fā)式和人性化的檢查來勾勒出垃圾郵件的行為特性,必須具備多樣的有效對策。
信譽評分技術 IP Reputation
加州山景城的Habeas公司從事信譽過濾(reputation-filtering)服務,也就是協(xié)助企業(yè)改良電子郵件的名聲,客戶包括 WalMart.com、Staples、Vanguard、Geico和Tickets.com等公司。Habeas的對手公司ReturnPath從 事的也是設法把郵件投入收件信箱的服務,避免讓郵件被棄置于垃圾信件分類。
Habeas首席執(zhí)行官Des Cahill說:“電子郵件不是白吃的午餐。沒有什么好東西仍然免費。就像做搜索引擎最好做引擎優(yōu)化(search engine optimization)一般,電子郵件信譽與投遞也是快速增長的新興行業(yè)。”專家把電子郵件信譽比喻成駕駛紀錄或信用紀錄。如果駕駛紀錄不佳,你必須 付更高的保險費;信用紀錄不良,你就無法取得優(yōu)惠的貸款利息。同理,如果電子郵件信譽差,你寄的郵件就會被丟入垃圾桶。
多重圖片識別技術 OCR
打擊圖片垃圾郵件的主導技術有圖片垃圾郵件指紋識別技術、ocr識別技術以及之后的第三代圖像防御技術。這三種技術在梭子魚垃圾郵件防火墻上有 集中的體現(xiàn),在ocr識別技術的初期,圖片垃圾郵件的發(fā)送者們企圖使用動態(tài)的gif圖像使內容占用多幀。而且,他們采用橫線,符號和其他圖像模糊圖片內的 文字。為了對付這些技巧,博威特公司第二代ocr引擎既包含動態(tài)gif文件分析功能還包括模糊文本識別技術。
隨著第三代圖片垃圾郵件的出現(xiàn),博威特公司研發(fā)出新型復合ocr引擎。該引擎深入分析圖片,在進行ocr識別之前對表象圖片進行規(guī)范化處理。這個新技術主要針對圖片掩飾,不同顏色的對比,以及組合文字,背景等手段。綜合處理正確率在95%以上。
意圖分析技術 Intention Analysis
意圖分析包括鑒別歷史記錄里的錯誤郵件發(fā)送基點、它們目前的行為和意圖。許多防御策略用來鑒別垃圾郵件,而意圖是隨時間而改變的特殊類別。
大部分垃圾郵件背后的動機是使接受某物,例如登陸某個站點,撥打某個電話,或者買某只股票。這些動機被稱為郵件“意圖”,觀察郵件的這些特點叫做“意圖分析”。目前為止,大部分垃圾郵件的意圖都是讓用戶點擊一個網(wǎng)頁或鏈接。
即使郵件發(fā)送者試圖通過新IP地址掩蓋他們的不良記錄,他們最終還是需要驅使用戶去特定的網(wǎng)站。梭子魚中心維護著垃圾郵件發(fā)送者常用網(wǎng)站地址庫,能夠基于郵件中插入的站點地址阻斷郵件。
意圖分析是阻斷垃圾郵件非常有效的手段,它的有效性隨著黑名單有效性的相對減少而增加。梭子魚中心分析后發(fā)現(xiàn),在梭子魚垃圾郵件防火墻的過濾郵件中,意圖分析過濾占到了10~20%。
垃圾郵件巨大的利潤驅使下,不法份子將不斷使用更新的手段和技術來達到目的,污染郵件環(huán)境。而網(wǎng)絡服務商和郵件運營商們則也將一如既往地研制出新技術來應對不法分子的挑戰(zhàn)。與垃圾郵件的斗爭注定將是一場持久戰(zhàn),廠商們已經做好了準備!
第三篇:反垃圾郵件技術初探
反垃圾郵件技術初探
摘要:如今,電子郵件的應用已經非常廣泛,給人們的工作和生活帶來了很大的方便。但是垃圾郵件的泛濫也給用戶帶來了諸多不便,尤其是病毒類垃圾郵件已經嚴重威脅用戶信息的安全。在本文中,筆者通過對Internet存在的垃圾郵件問題進行探討,從垃圾郵件的起因和特點出發(fā),闡述了反垃圾郵件的技術。關鍵詞:垃圾郵件;技術;過濾
隨著計算機互聯(lián)網(wǎng)技術的發(fā)展,電子郵件成為人們生活、工作中不可缺少的一項互聯(lián)網(wǎng)服務,電子郵件費用低廉、使用方便、信息量大、信息傳遞速度快,極大的滿足了人們的需求。正是因為郵件的這些特點,使垃圾郵件泛濫,而且具有反復性、不健康性和強制性,嚴重干擾了人們的正常生活,因此,要對反垃圾郵件技術進行探討。
一、垃圾郵件簡介
(一)垃圾郵件的概念
垃圾郵件是指收件人沒有事先提出要求或者同意接受的電子刊物、廣告等具有宣傳性質的電子郵件;隱藏發(fā)件人身份、標題、地址等信息的電子郵件;收件人無法拒收的電子郵件;含有虛假信息源、路由、發(fā)件人的電子郵件??傊?,垃圾郵件是指和內容無關,發(fā)送給多個未明確要求該郵件的收件人的郵件,也指發(fā)送給與信件主體不相關的新聞組或列表服務器的同一信件的重復郵件。
(二)垃圾郵件發(fā)送手段
1.以圖片方式代替文字內容發(fā)送。把將要傳送的內容以圖片的形式附入郵件中,過濾器很難識別圖片文件包含的內容。
2.郵件內容、發(fā)件信息偽裝。通過隨機內容生成器等將收信人地址加到正文或標題中,吸引收件人查看。
3.利用受病毒感染的“僵尸網(wǎng)絡”發(fā)送。比如說利用蠕蟲病毒,將垃圾郵件發(fā)送給世界各地可被蠕蟲病毒感染的機器,使被感染的電腦在機主不知情的情況下發(fā)送垃圾郵件。
4.采用“視覺戰(zhàn)術”,采用HTML格式,把內容加噪,干擾反垃圾郵件系統(tǒng)對于郵件內容的判斷,但是垃圾郵件的接受者依然可以接受垃圾郵件的原始信息。
二、反垃圾郵件技術
(一)規(guī)則過濾技術
規(guī)則過濾技術是指通過設置一些基本規(guī)則,對要識別的郵件進行評估,只有符合這些規(guī)則的一條或幾條規(guī)定,就認為是垃圾郵件。這些規(guī)則主要有:
1.通過SMTP通信鏈接頻度、速率的設定,過濾垃圾郵件。垃圾郵件的發(fā)送者常常試圖通過在很短一段時間內發(fā)送大量郵件來阻塞郵件服務器,所以,可通過對每個IP地址可用的帶寬比例或并發(fā)SMTP連接數(shù)目進行限制,限制異常的網(wǎng)絡流量,達到限制垃圾郵件的目的,也減少服務器因為垃圾郵件耗費的能源。
2.利用郵件地址、反向域名、域名“黑白名單”、IP查詢進行郵件的過濾和限制。①實時黑名單技術就是通過檢查收到郵件的IP地址,與實時黑名單中的IP地址進行核對阻止垃圾郵件,同時,實時黑名單是通過DNS來查找IP地址的A記錄是否存在,并不需要手工維護IP地址的列表清單。②反向域名驗證方法是通過啟動郵件服務器的反省域名解析功能,對收到來源的IP地址采用反向的DNS驗證真實性,有效過濾掉來自動態(tài)IP的垃圾郵件,降低垃圾郵件的數(shù)量。
(二)圖片垃圾郵件的判別技術
1.杜絕圖片垃圾郵件的關鍵在于分層處理,分層處理的解決方案加上有效的過濾原則,可幫助用戶解決圖片垃圾郵件帶來的網(wǎng)絡資源和網(wǎng)絡帶寬的浪費。
2.通信協(xié)議掃描技術是針對垃圾郵件的發(fā)信行為,對發(fā)件人進行監(jiān)控和阻擋,減少垃圾郵件。通過對垃圾郵件行為解析,透過SMTP聯(lián)機實時通信協(xié)議,對寄件者真實身份進行分析判斷并適時回饋,判斷其通訊行為,到圖像式垃圾郵件實現(xiàn)高效的阻擋。
(三)基于統(tǒng)計的內容過濾技術
1.基于統(tǒng)計的內容過濾技術,是利用統(tǒng)計分類算法與文本分類對垃圾郵件進行檢測,典型技術是貝葉斯過濾器。
2.貝葉斯過濾器的基本流程是:①在已經確定的正常郵件集和垃圾郵件集中進行學習,根據(jù)每個單詞都兩個集合中分別出現(xiàn)的次數(shù),計算單詞為垃圾詞匯的概率。②當新郵件到達時,對信件內容進行系統(tǒng)性的分詞和選詞,得到一組組單詞,根據(jù)在集合中學到的信息,計算整個單詞流的概率,判斷信件是否是垃圾郵件。
3.在實際應用中,因為貝葉斯分類法是利用概率推斷郵件是否是垃圾郵件,為了方便管理,系統(tǒng)通過對郵件的打分確定郵件是否是垃圾郵件,為不同的概率設立不同的分數(shù),每封郵件是否是垃圾郵件就以分數(shù)表示,確定一個闕值,查看郵件的分數(shù),如果郵件的分數(shù)超過了闕值,郵件就是垃圾郵件,反之不是。結語:
垃圾郵件是全球性的問題,也是一種社會現(xiàn)象,對于這一問題,應該采用管理和技術相結合的方式,以先進的技術手段為基礎,同時以完善的法律法規(guī)和管理規(guī)范為依托,通過建立國家性的反郵件服務體系,促進郵件服務商和運營商的協(xié)調合作,推動反垃圾郵件技術的發(fā)展。
參考文獻:
[1]熊應, 朱斌, 朱海云.電子郵件智能分類系統(tǒng)的設計.電子學報, 2011, 29(12)
[2]楊清, 楊岳湘, 翟國平.智能文本分類系統(tǒng)的研究與設計,計算機應用研究,2009,10
[3] 劉建毅, 張鵬飛, 王 極.高性能電子郵件過濾系統(tǒng)的設計與實現(xiàn)[J].計算機應用研究, 2008(4): 224-225.[4] 李文斌, 劉椿年, 黃佳進.基于數(shù)據(jù)挖掘的垃圾E-mail 過濾方法[J].北京工業(yè)大學學報, 2009, 29(2): 237-240.
第四篇:淺析反垃圾郵件技術
淺析反垃圾郵件技術
杜暖男 馬瑩瑩
(平頂山工業(yè)職業(yè)技術學院,河南平頂山 467001)
摘要:現(xiàn)如今,垃圾郵件已經成為困擾人們網(wǎng)路交流的安全隱患之一,本文主要針對這個問題,簡要分析一些較為實用的反垃圾郵件技術。
關鍵字:資訊安全;反垃圾郵件;過濾技術;
中圖分類號:TP393.08
眾所周知,電子郵件已成為人們進行網(wǎng)路交流溝通的重要途徑,但是人們需要花費時間來處理日益增長的垃圾郵件。由於垃圾郵件數(shù)量多,具有反復性、強制性、欺騙性、不健康性和傳播速度快等特點,嚴重干擾了人們正常生活,浪費用戶的時間、精力甚至造成很多額外的經濟支出和資訊安全隱患。因此,對反垃圾郵件技術的研究已經成為影響互聯(lián)網(wǎng)發(fā)展的重要課題之一。本文主要對反垃圾郵件技術進行簡要的分析。
目前存在的垃圾郵件主要有帶附件的垃圾郵件、內容為圖片的垃圾郵件和文本型垃圾郵件三種類型。針對這三種類型的垃圾郵件的典型技術有通信協(xié)定掃描技術和貝葉斯過濾技術。1規(guī)則過濾技術
使用規(guī)則過濾技術進行判斷可以相對快速的判斷垃圾郵件,這種技術通過設置一些規(guī)則,然後對要識別的郵件評估了大量的模式大多數(shù)是正則運算式。只要符合這些規(guī)則的一條或幾條,就認為是垃圾郵件。使用這種技術最重要的是評定規(guī)則的更新。這些規(guī)則通常有:
(1)利用郵件位址、IP、功能變數(shù)名稱“黑白名單”或反向功能變數(shù)名稱查詢進行的郵件限制或過濾。為了有效地拒絕來自惡意的垃圾郵件來源站點和域被利用的垃圾郵件來源站點所發(fā)來的垃圾郵件,最直接和有效的辦法就是拒絕該來源的連接。
即時黑名單(Realtime Bolckhole List,簡稱RBL)技術通過檢查收到郵件的IP地址,與在RBL中的IP地址核對來阻止垃圾郵件。即時黑名單不需要手工維護IP位址列表清單,而是通過DNS方式來動態(tài)地查找一個IP位址的 A(Address)記錄是否存在。因此即時黑名單技術也被稱為RBLs。
反向功能變數(shù)名稱驗證的方法就是啟動郵件伺服器的反向功能變數(shù)名稱解析功能,對收到郵件的來源IP位址採用反向DNS查找驗證真實性。如果反向DNS查找提供的域與郵件上的來源IP地址相符號,該郵件被接受,如果不符合,該郵件被拒絕。例如其聲稱的名字為mail.changan.net,而其IP位址為202.96.172.185,與其DNS記錄相符,則予以接收。這種方法可以有效過濾掉來自動態(tài)IP的垃圾郵件,大大降低垃圾郵件的數(shù)量。但是,由於很多反向DNS目錄未被有效建立,或無法正常建立,在這種情況下,由這些域發(fā)送的郵件將被阻斷,造成不可接受的高誤報率。
(2)通過SMTP通信鏈結速率、頻度的設定,過濾不符合規(guī)定的郵件。垃圾郵件發(fā)送者經常試圖通過在很短一段時間內發(fā)送大量郵件阻塞郵件伺服器,這被稱為DOS(拒絕服務)攻擊。垃圾郵件的一個基本特徵是會在短時間內發(fā)送大量的郵件,這就表現(xiàn)為某個IP地址會在短時間內重複連接收件伺服器的SMTP埠,並佔用大量的帶寬。根據(jù)這個特點,一種方法是對每個IP位址可用的帶寬比例進行限制,另一種是對每個IP位址的併發(fā)SMTP連接數(shù)目進行限制。結合動態(tài)黑名單方式,更好地限制那些異常的網(wǎng)路流量,採用郵件重複技術進行限制,對那些郵件頭中關鍵資訊重複的郵件進行限制,如發(fā)送IP位址、發(fā)件人、郵件主題。這樣既可以達到限制垃圾郵件的目的,也可以減少伺服器由於處理垃圾郵件所消耗的資源。
規(guī)則過濾技術雖然可以過濾一類垃圾郵件,但是不能適應垃圾郵件的發(fā)展,只要垃圾郵件的郵件作了一些改變,就要手動更新規(guī)則才能滿足垃圾郵件的變化。
2基於統(tǒng)計的內容過濾技術
基於統(tǒng)計內容的郵件過濾技術,可以不考慮語義環(huán)境,利用文本分類與統(tǒng)計分類演算法進行垃圾郵件檢測。比較有代表性的是貝葉斯篩檢程式,貝葉斯分析採用過去事件的知識預測未來事件。
其基本流程是:首先在已經確定的垃圾郵件集和正常郵件集中進行學習,根據(jù)每個單詞分別在兩個集合中出現(xiàn)的次數(shù),計算單詞為垃圾辭彙的概率。當一封新郵件到達時,系統(tǒng)對信件內容進行分詞和選詞,得到一組單詞流,然後根據(jù)學習到的資訊,計算整個單詞流的概率,並最終判斷該信件是否為垃圾郵件。
因為貝葉斯分類法是利用概率來推斷給定的郵件是垃圾郵件的可能性,在實際應用中為了便於管理,系統(tǒng)採用了打分的方法來為垃圾郵件與正常郵件的區(qū)分設定界限。首先,為不同的可能性建立相應的分數(shù),每封郵件是垃圾郵件的可能性就轉化為分數(shù)來表示,增強了可讀性;然後,確定一個閾值,如果郵件的分數(shù)超過了閾值,那麼該郵件就判定為垃圾郵件,反之為正常郵件。
3圖片垃圾郵件的判別技術
隨著垃圾郵件的日益複雜,其表現(xiàn)形式也千變萬化。垃圾郵件正由以往頗具迷惑性的URL位址鏈結和文字形式逐漸演變成圖片格式。杜絕圖片垃圾郵件的關鍵在於分層處理。當分層處理的解決方案加上有效的過濾規(guī)則,用戶就會解決圖片垃圾郵件所帶來的網(wǎng)路資源和網(wǎng)路帶寬的大量浪費。而採用典型的基於內容過濾的貝葉斯演算法無法過濾此類垃圾郵件。通信協(xié)定掃描技術是防垃圾郵件技術領域的一種新型技術。此技術對於識別和阻攔圖片式的垃圾郵件起到很大的作用。
通信協(xié)定掃描技術主要針對垃圾郵件的發(fā)信行為,對發(fā)件人進行監(jiān)控、阻擋,以達到減少垃圾郵件。通信協(xié)定掃描技術藉由匿名、偽造、濫發(fā)、非法的郵件行為判別,在不比對郵件內容/黑名單下,進行垃圾郵件行為解析,透過SMTP聯(lián)機即時通信協(xié)定,分析判斷並即時回溯追蹤寄件者真實身份,以判斷其通訊行為,對於圖像式垃圾郵件可以高效地實現(xiàn)阻擋。目前,垃圾郵件作為互聯(lián)網(wǎng)中的一個突出安全問題日益成為我們關注的重點和研究的熱點。單靠一種技術是無法徹底解決垃圾郵件,只有將各種反垃圾郵件技術結合起來運用,研製出更好的反垃圾郵件產品,並採用法律管理手段才能有效地控制和治理垃圾郵件。
第五篇:反垃圾郵件技術——郵件過濾
在對抗垃圾郵件的技術中還有一種極為重要的技術是郵件過濾技術(Mail Filter)。通過實時黑名單技術并不能完全解決垃圾郵件的問題,使用郵件過濾技術與之配合才能更有效的消除垃圾郵件帶來的影響。
郵件過濾按照郵件系統(tǒng)的角色結構可以分為三類:
MTA(郵件傳輸代理)過濾
MDA(郵件遞交代理)過濾
MUA(郵件用戶代理)過濾
MTA過濾是指MTA在會話過程中對會話的數(shù)據(jù)進行檢查,對于符合過濾條件的郵件進行過濾處理。郵件會話過程中有兩個階段可以進行過濾:
第一個階段,郵件發(fā)送郵件數(shù)據(jù)前,即在發(fā)送DATA指令前的過濾。在發(fā)送DATA指令前,郵件對話可以在SMTP連接開始、HELO/EHLO指令、MAIL FROM指令和RCPT TO指令中對會話數(shù)據(jù)進行檢查。
如果在檢查中該會話符合過濾的條件,就可以按照規(guī)則采取相應的動作,如直接在會話階段斷開連接、發(fā)出警告代碼等。郵件發(fā)送郵件數(shù)據(jù)前的檢查也叫做信封檢查。
第二個階段,郵件發(fā)送郵件數(shù)據(jù)后,即在發(fā)送DATA指令后的過濾。在通過一個點的單行結束DATA指令后,可以對DATA指令接收到的數(shù)據(jù)進行檢查,這包括信頭檢查和信體檢查。在DATA指令所傳送的數(shù)據(jù)中,信頭和信體是通過一個空行分隔開的。
信頭一般都比較小,通常在1KB-10KB之間,檢查信頭也比較快。而信體檢查就要檢查大量的數(shù)據(jù),會給郵件服務器帶來很大的負載。所以通常不做信體檢查。
郵件發(fā)送郵件數(shù)據(jù)后的檢查實際上是在郵件數(shù)據(jù)傳輸基本完畢后進行的,因此并不能節(jié)省下被垃圾郵件占用的帶寬和處理能力,只是可以讓用戶不再收到這些已被過濾的垃圾郵件。MDA過濾是指MDA在從MTA中接收到信件,在本地或遠程進行遞交時進行檢查,對于符合過濾條件的郵件進行過濾處理。
很多的MDA都支持在這個過程進行過濾,如Procmail、Maildrop和Cyrus-IMAP等,甚至它們本身就是作為過濾器使用的。這些過濾器使用過濾語言(如Sieve,它是一個標準化的郵件過濾語言,現(xiàn)在已成為IETF標準)。來制訂過濾規(guī)則,因此配置比較靈活、功能強大。但是由于是在郵件遞交階段進行過濾,同MTA的郵件發(fā)送郵件數(shù)據(jù)后的檢查一樣,并不能節(jié)省下被垃圾郵件占用的帶寬和處理能力,只是可以讓用戶不再收到這些已被過濾的垃圾郵件。
MTA和MDA過濾都是郵件服務器端的過濾,而MUA過濾是郵件用戶的客戶端的過濾。多數(shù)流行的郵件客戶端,如Outlook、Outlook Express、Netscape Mail、Foxmail等都支持MUA過濾。
郵件過濾技術作為一個有效的對抗垃圾郵件的手段,就如同殺毒軟件對病毒的查殺一樣,也是需要不斷根據(jù)情況更新郵件過濾規(guī)則的。通常都是管理員自行根據(jù)垃圾郵件監(jiān)測情況來更新過濾規(guī)則。不過本站即將推出一個推薦的信頭過濾規(guī)則和信體過濾規(guī)則,并不斷根據(jù)情況進行更新。用戶可以訂閱這些規(guī)則并參考應用到自己的郵件系統(tǒng)中。
郵件過濾是一項應用的相當早的技術,因而也發(fā)展的比較完善。已經有很多主流的郵件系統(tǒng)支持郵件過濾,一些不直接支持該功能的郵件系統(tǒng)也可以通過補丁或外置的郵件過濾器來實現(xiàn)郵件過濾。
不過由于多數(shù)的黑名單服務提供者是國外的組織和公司,所以其提供的黑名單并不能有效地反映出國內的垃圾郵件情況,因此國內使用實時黑名單服務的郵件商很少,這也是我們之所以要提供自己的實時黑名單服務的原因。我們希望提供一個主要針對國內的垃圾郵件狀況和動態(tài)地址分布的黑名單來為有效地遏制垃圾郵件做些有益的貢獻