비정상 문자 조합으로 구성된 스팸 메일의 탐지 방법

Vol. 18, No. 6, pp. 129-138, 10월. 2008
10.13089/JKIISC.2008.18.6.129, Full Text:
Keywords: Spam Mail Filtering, N-GRAM, Support Vector Machine, Bayesian Decision Theory
Abstract

인터넷의 활용도가 높아짐에 따라, 스팸메일이 전체 메일에서 차지하는 비중이 점점 커지게 되었다. 전체 인터넷 자원에서 필요에 의해 사용되는 메일의 기능보다, 주로 광고나 악성코드 등의 전파를 위한 목적으로 사용되는 메일의 비중이 점점 커지고 있으며, 이를 방지하기 위한 컴퓨터 및 네트워크, 인적자원의 소모가 매우 심각해지고 있다. 이를 해결하기 위해 스팸 메일 필터링에 대한 연구가 활발히 진행되어 왔으며, 현재는 문맥상의 의미는 없지만 가독상에서 의미를 해석할 수 있는 문장에 대한 연구가 활발히 이루어지고 있다. 이러한 방식의 메일은 기존의 어휘를 분석하거나 문서 분류 기법 등을 이용한 스팸 메일을 필터링 방법을 통해 분류하기 어렵다. 본 연구는 이와 같은 어려움을 해결하기 위해 메일의 제목에 대한 N-GRAM 색인화를 통해 베이지안 및 SVM 을 이용하여 스팸 메일을 필터링 하는 방법을 제안한다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
H. Lee, J. Cho, M. Jung and J. Moon, "An Approach to Detect Spam E-mail with Abnormal Character Composition," Journal of The Korea Institute of Information Security and Cryptology, vol. 18, no. 6, pp. 129-138, 2008. DOI: 10.13089/JKIISC.2008.18.6.129.

[ACM Style]
Ho-Sub Lee, Jae-Ik Cho, Man-Hyun Jung, and Jong-Sub Moon. 2008. An Approach to Detect Spam E-mail with Abnormal Character Composition. Journal of The Korea Institute of Information Security and Cryptology, 18, 6, (2008), 129-138. DOI: 10.13089/JKIISC.2008.18.6.129.