금융데이터의 성능 비교를 통한 연합학습 기법의 효용성 분석

Vol. 32, No. 2, pp. 405-416, 4월. 2022
10.13089/JKIISC.2022.32.2.405, Full Text:
Keywords: Federated learning, credit data, K-anonmity, Differential-privacy, synthesis data
Abstract

AI기술은 데이터 기반의 기계학습을 이용하여 삶의 질을 높여주고 있다. 기계학습을 이용시, 분산된 데이터를 전송해 한곳에 모으는 작업은 프라이버시 침해가 발생할 위험성이 있어 비식별화 과정을 거친다. 비식별화 데이터는 정보의 손상, 누락이 있어 기계학습과정의 성능을 저하시키며 전처리과정을 복잡하게한다. 이에 구글이 2017년에 데이터의 비식별화와 데이터를 한 서버로 모으는 과정없이 학습하는 방법인 연합학습을 발표했다. 본 논문은 실제 금융데이터를 이용하여, K익명성, 차분프라이버시 재현데이터의 비식별과정을 거친 데이터의 학습 성능과 연합학습의 성능간의 차이를 비교하여 효용성을 분석하였으며, 이를 통해 연합학습의 우수성을 보여주고자 한다. 실험결과 원본데이터 학습의 정확도는 91% K-익명성을 거친 데이터학습은 k=2일 때 정확도 79%, k=5일 때 76%, k=7일 때 62%, 차분프라이버시를 사용한 데이터학습은 =2일 때 정확도 52%, =1일 때 50%, =0.1일 때 36% 재현데이터는 정확도 82%가 나왔으며 연합학습의 정확도는 86%로 두번째로 높은 성능을 보여 주었다.

Statistics
Show / Hide Statistics

Statistics (Cumulative Counts from December 1st, 2017)
Multiple requests among the same browser session are counted as one view.
If you mouse over a chart, the values of data points will be shown.


Cite this article
[IEEE Style]
장진혁, 최대선 and 안윤수, "금융데이터의 성능 비교를 통한 연합학습 기법의 효용성 분석," Journal of The Korea Institute of Information Security and Cryptology, vol. 32, no. 2, pp. 405-416, 2022. DOI: 10.13089/JKIISC.2022.32.2.405.

[ACM Style]
장진혁, 최대선, and 안윤수. 2022. 금융데이터의 성능 비교를 통한 연합학습 기법의 효용성 분석. Journal of The Korea Institute of Information Security and Cryptology, 32, 2, (2022), 405-416. DOI: 10.13089/JKIISC.2022.32.2.405.