Contents
•
SHAP 알고리즘 가속화 필요성
•
XAI 가속화 알고리즘 방법론
•
XAI 가속화 알고리즘 평가지표 선정
•
XAI 가속화 알고리즘 개발
•
실험 결과
SHAP 알고리즘 가속화 필요성
카카오뱅크 금융기술연구소에서는 인공지능 알고리즘을 실제 비즈니스 문제에 활용하기 위해 다양한 R&D 활동을 수행하고 있습니다. 이러한 활동 중 하나로 설명가능 인공지능(eXplainable AI, 이하 XAI)에 대해 여러 차례 소개해드렸습니다. 이번 글에서는 산학협력으로 완성한 XAI 알고리즘 가속화 결과에 대해서 이야기 나누고자 합니다.
XAI 알고리즘 관련 소개글
•
•
AI 규제 동향과 카카오뱅크 AI 거버넌스 2024.05.31
•
카카오뱅크의 AI를 설명하는 방법 2024.07.26
•
AI를 설명하면서 속도도 빠르게 할 순 없을까? SHAP 가속화 이야기 (현재)
다양한 XAI 알고리즘 중에서, 이전에 소개해드린 SHAP (Shapley Additive exPlanations)은 새플리값(Shapley Value)이라는 수리경제학적 이론에 기초한 방법론입니다. SHAP은 아래 수식과 같이 입력과 출력의 형태를 갖는 모든 함수에 대해 적용하여 설명 결과를 산출할 수 있다는 장점을 갖지만, 알고리즘 특성상 많은 계산량을 요구하기 때문에 SHAP 가속화 연구를 진행하게 되었습니다.
가속화가 필요한 이유는 크게 2가지 입니다. 먼저, “실시간성”을 보장해야 하는 업무가 있습니다. 카카오뱅크에서는 고객의 소중한 자산을 지키기 위해 이상거래탐지 업무에 AI를 활용하고 있습니다. 가령, 개발한 이상거래탐지 인공지능 알고리즘이 보이스피싱으로 의심되는 거래를 실시간으로 탐지했는데, 탐지된 이유를 살펴보기 위한 XAI 결과를 3초 이상 기다려야 한다고 생각해보겠습니다. 이 때, 탐지된 대상이 실제 보이스피싱 피해자가 범죄자 계좌로 송금하는 거래였다면, 3초 뒤가 아니라 실시간으로 빠르게 해당 고객의 금융거래를 제한하여 추가적인 피해를 막아야 합니다.
다음은 "배치효율성"으로, XAI 결과를 통해 AI를 설명할 수 있다고 하더라도 컴퓨팅 자원에 대한 비용을 고려해야 합니다. 카카오뱅크는 다양한 분야에 인공지능 알고리즘 개발해서 적용하고 있으며, 2,400만 명이 넘는 고객들을 대상으로 하는 인공지능 알고리즘에 XAI 결과를 무리없이 산출하기 위해서는 효율적인 방법론이 요구됩니다.
XAI 가속화 알고리즘 방법론
금융기술연구소는 XAI 알고리즘의 실용화를 위해 기존 XAI 알고리즘의 정확도를 최대한 유지하면서 속도를 향상시키는 방법론을 개발했습니다. 이를 위해 기존 대표 알고리즘들을 평가할 지표를 선정해 개발 방향을 정했습니다. 우선, XAI 알고리즘 가속화 연구는 크게 엔지니어링 기반, 알고리즘 기반, 하드웨어 기반 세 가지로 나눌 수 있습니다.
XAI 가속화 알고리즘 평가지표 선정
평가지표는 XAI 알고리즘 실용화라는 목표를 중심으로 선별했습니다. 가속화된 XAI를 실제 서비스에 반영가능하도록 하기 위해서는 속도는 최대한 빠르며, 기존 XAI 알고리즘의 설명력을 최대한 잃어버리지 않아야 합니다. 따라서 가속화된 알고리즘이 기존 XAI 알고리즘의 설명 결과를 얼마나 유지하는지를 평가하기 위한 정확도 지표와, 얼마나 가속화가 되었는지를 평가하기 위한 속도 지표를 기반으로 평가 지표를 선정했습니다.
1.
정확도 : Cosine Similarity, Top3 SRA
여기서 정확도란 가속화 대상 XAI 알고리즘인 KernelSHAP의 설명결과를 얼마나 보존하는지(결과가 KernelSHAP과 얼마나 유사한지)를 평가하고자 하였습니다.
1-1) Cosine Similarity
두 벡터 간 각도의 코사인값을 이용해 측정된 벡터간 유사도 값으로, -1과 1사이의 값을 가집니다. Cosine Similarity 값은 1에 가까울수록 유사함을 의미합니다.
1-2) Top 3 Signed Rank Agreement (Top3 SRA)
상위 3개 주요 특성(Feature)에 대해 순위와, 부호의 일치를 평가하는 값입니다. 기존 가속화 대상 XAI 알고리즘인 KernelSHAP(a)와 가속화가 적용된 모델(b)에 대한 설명결과로 추출된 상위 3개 특성을 비교하여, 순위와 부호가 모두 동일한 특성들의 비율을 계산합니다. 해당 값은 상위 3개 특성 결과가 일치해야하기 때문에 매우 보수적으로 정확도를 계산할 수 있습니다.
2.
속도 : 1초 이내
속도는 가속화 대상 XAI 알고리즘인 KernelSHAP의 설명시간을 얼마나 단축하는지를 평가하고자 했습니다. 또한, 실제 라이브 서비스에 반영 가능하기 위한 조건으로 1초 이내로 설명 결과를 도출할 수 있는지를 함께 확인했습니다.
XAI 가속화 알고리즘 개발
평가지표는 XAI 알고리즘 실용화라는 목표를 중심으로 선별했습니다. 가속화된 XAI를 실제 서비스에 반영가능하도록 하기 위해서는 속도는 최대한 빠르며, 기존 XAI 알고리즘의 설명력을 최대한 잃어버리지 않아야 합니다. 따라서 가속화된 알고리즘이 기존 XAI 알고리즘의 설명 결과를 얼마나 유지하는지를 평가하기 위한 정확도 지표와, 얼마나 가속화가 되었는지를 평가하기 위한 정확도 지표와, 얼마나 가속화가 되었는지를 평가하기 위한 속도 지표를 기반으로 평가 지표를 선정했습니다.
1.
엔지니어링 기반 가속화 : 가속화된 KernelSHAP
기존 KernelSHAP 알고리즘에서 Feature group을 샘플링(Sampling)하는 과정과 새플리값을 추론하는 과정에서 개선 가능한 부분을 발견하여 속도적 측면에서 개선된 “가속화된 KernelSHAP”을 개발했습니다. 해당 가속화 알고리즘은 기존 설명 결과를 100% 보존하며, 속도는 더욱 단축시킬 수 있습니다. 하지만 이 역시 KernelSHAP의 알고리즘을 그대로 가져가기 때문에 많은 샘플수를 필요로 하다는 점과 이로인한 속도적인 측면에서의 한계점은 여전히 존재할 수 있습니다.
2.
알고리즘 기반 가속화 : SAMSHAP
XAI 가속화 알고리즘의 가장 대표적인 방법론으로 FastSHAP이 있습니다. FastSHAP은 속도는 매우 빠르게 가속화할 수 있다는 장점이 있지만, 기존 설명결과를 보존하기 어렵다는 단점이 있습니다. 위에서 언급했던 가속화된 KernelSHAP이 가지는 속도적인 단점과 FastSHAP이 가지는 정확도 측면에서의 단점을 함께 보완한 SAMSHAP을 개발했습니다.
SAMSHAP은 KernelSHAP 알고리즘의 계산 시간을 더 가속화하기 위해, 배경데이터에 대한 연산을 1번만 계산하도록 미리 대리 모델을 학습시키는 방법론입니다. 이때, 배경 데이터에 대한 계산 이외에 “선형 회귀 모델”의 계수를 새플리값으로 이용해 설명 결과를 도출한다는 점에서 기존 KernelSHAP의 설명력을 더욱 유지시킬 수 있습니다.
실험 결과
개발된 두 가속화 XAI 알고리즘을 가지고 실제 서비스에 활용중인 카카오뱅크 AI 모델에 대한 결과를 비교 및 평가했습니다. 기존 XAI 알고리즘인 KernelSHAP과 비교했을 때, 엔지니어링 기반의 가속화된 KernelSHAP은 42% 속도 개선을 보였으며, 설명 결과의 정확도를 100%로 유지한 것을 확인할 수 있습니다. SAMSHAP의 경우에는 KernelSHAP대비 최대 10배 속도 향상을 보였으며, 정확도 측면에서는 KernelSHAP의 설명결과를 Cosine Similarity 기준으로는 92%, Top-3 SRA 기준으로 69% 보존한 것을 확인할 수 있습니다. 이는 계산속도가 빠른 FastSHAP 대비 우수한 설명력을 입증할 수 있습니다.
카카오뱅크는 지난 2023년부터 <카이스트 설명가능 인공지능 연구센터>와 함께 ‘금융 분야 설명가능 인공지능’에 대해 공동 연구를 진행했습니다. 이번 XAI 알고리즘 가속화 연구를 통해 카카오뱅크는 더욱 빠르고 신뢰가능한 AI 서비스를 고객들에게 제공하기 위한 기반을 다졌습니다. 지금처럼 AI의 실용성이 높아지고 있는 상황에서 AI 모델의 결과를 신뢰하고 이해하는 것은 금융 AI 서비스의 핵심 과제입니다. 앞으로도 카카오뱅크는 금융 서비스의 품질을 높이고, 고객의 신뢰를 강화할 수 있도록 지속적인 연구와 협력을 이어나갈 예정입니다.
카카오뱅크 금융기술연구소
Financial Tech Lab