정적 분석 기반 기계학습 기법을 활용한 악성코드 식별 시스템 연구

Vol. 29, No. 4, pp. 775-784, 8월. 2019
10.13089/JKIISC.2019.29.5.775, Full Text:
Keywords: Malware, Machine Learning, Feature statistics, Packer, Similarity hashing
Abstract

신규 및 변종 악성코드의 발생으로 모바일, IoT, windows, mac 등 여러 환경에서 악성코드 침해 공격이 지속적으로 증가하고 있으며, 시그니처 기반 탐지의 대응만으로는 악성코드 탐지에 한계가 존재한다. 또한, 난독화, 패킹,Anti-VM 기법의 적용으로 분석 성능이 저하되고 있는 실정이다. 이에 유사성 해시 기반의 패턴 탐지 기술과 패킹에따른 파일 분류 후의 정적 분석 적용으로 기계학습 기반 악성코드 식별이 가능한 시스템을 제안한다. 이는 기존에 알려진 악성코드의 식별에 강한 패턴 기반 탐지와 신규 및 변종 악성코드 탐지에 유리한 기계학습 기반 식별 기술을 모두 활용하여 보다 효율적인 탐지가 가능하다. 본 연구 결과물은 정보보호 R&D 데이터 챌린지 2018 대회의 AI기반악성코드 탐지 트랙에서 제공하는 정상파일과 악성코드를 대상으로 95.79% 이상의 탐지정확도를 도출하여 분석 성능을 확인하였다. 향후 지속적인 연구를 통해 패킹된 파일의 특성에 맞는 feature vector와 탐지기법을 추가 적용하여 탐지 성능을 높이는 시스템 구축이 가능할 것으로 기대한다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
김수정, 하지희, 오수현 and 이태진, "A Study on Malware Identification System Using Static Analysis Based Machine Learning Technique," Journal of The Korea Institute of Information Security and Cryptology, vol. 29, no. 4, pp. 775-784, 2019. DOI: 10.13089/JKIISC.2019.29.5.775.

[ACM Style]
김수정, 하지희, 오수현, and 이태진. 2019. A Study on Malware Identification System Using Static Analysis Based Machine Learning Technique. Journal of The Korea Institute of Information Security and Cryptology, 29, 4, (2019), 775-784. DOI: 10.13089/JKIISC.2019.29.5.775.