특징 분리를 통한 자연 배경을 지닌 글자 기반 CAPTCHA 공격

Vol. 25, No. 5, pp. 1011-1020, 10월. 2015
10.13089/JKIISC.2015.25.5.1011, Full Text:
Keywords: CAPTCHA, Breaking CAPTCHA, SVM, CNN, HSV color space
Abstract

컴퓨터 사용자가 사람인지 아닌지를 판별하는 CAPTCHA는 많은 포털 사이트에서 자동 프로그램에 의한 비정상적인 회원가입 또는 다중 로그인 방지 등을 위해 사용되고 있다. 많은 웹 사이트들은 숫자 혹은 영어로 구성된 문자열 기반 캡챠를 대부분 사용하는데, 최근에는 OCR 기술의 발달로 단순한 텍스트 기반 캡챠는 쉽게 무력화 된다. 이에 대한 대안으로 많은 웹 사이트들은 글자 판독을 어렵게 하기 위해 잡음을 첨가하거나 글자를 왜곡시키는 등 다양한 시도를 하고 있다. 본 논문에서 대상으로 하는 국내 한 포털 사이트 역시 공격자들에 의해 많은 공격을 당하였고, 끊임없이 캡챠를 발전시키고 있다. 본 논문에서는 해당 사이트에서 현재 사용되고 있는 다양한 자연 배경을 지닌 캡챠에 대해 분석하고, SVM을 이용한 특징 분리 후 CNN을 이용한 글자 인식을 통해 해당 캡챠의 취약성을 검증하였다. 실험 결과, 총 1000개의 캡챠 이미지 중 368개에 대해 정확히 맞추었고, 이를 통해 해당 포털 사이트에서 현재 사용하고 있는 새로운 버전의 캡챠 역시 안전하지 않음을 입증하였다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
J. Kim, S. Kim and H. J. Kim, "Breaking character and natural image based CAPTCHA using feature classification," Journal of The Korea Institute of Information Security and Cryptology, vol. 25, no. 5, pp. 1011-1020, 2015. DOI: 10.13089/JKIISC.2015.25.5.1011.

[ACM Style]
Jaehwan Kim, Suah Kim, and Hyoung Joong Kim. 2015. Breaking character and natural image based CAPTCHA using feature classification. Journal of The Korea Institute of Information Security and Cryptology, 25, 5, (2015), 1011-1020. DOI: 10.13089/JKIISC.2015.25.5.1011.