안정성과 혁신 모두를 위해 도약하는 우리의 이야기를 담았습니다
•
본 글의 일부는 <카카오 Tech Ethics> “더 안전한 금융거래를 지원하는 ‘AI 스미싱 문자 확인’ 서비스”에도 같이 발행되었습니다. 인용된 이미지의 저작권과 출처는 <카카오 Tech Ethics>입니다.
Contents
스미싱(Smishing)은 휴대폰 문자메시지(SMS)나 SNS로 가족이나 지인, 정부 기관을 사칭해 개인정보를 탈취해 2차 피해를 입히는 범죄입니다. 규제 당국의 자료에 따르면 스팸 메시지 건수는 상반기 대비 2배 가량 증가했습니다. 경찰청은 최근 2년간 스미싱 피해액이 600억 원 억원에 달할 것으로 전망했습니다. 특히 스미싱은 단순한 개인 정보 유출이나 소액 사기와 달리 불법 대출을 비롯한 금융 사기와도 연관이 많아 카카오뱅크에서는 AI로 이를 예방할 수 있는 방안을 고민해 왔습니다.
스미싱 판별 이유도 설명하는 AI 기반 ‘스미싱 탐지 서비스’
카카오뱅크가 이번 서비스를 개발하면서 가장 중점을 둔 부분은 특정 메시지를 스미싱으로 판단하게 된 이유를 한번 더 자세히 알려주는 기능입니다. 간단히 스미싱 여부만 알려줄 경우 이용자가 선뜻 신뢰하기 어렵기에, 덧붙인 판단 근거로 이해도를 높여 해당 정보를 신뢰할지 스스로 결정할 수 있도록 도움을 주고자 했습니다. 최근 생성형 AI 모델들은 사용자 의도를 잘 파악해 자연스러운 판단 근거 생성에 사용해 볼 수 있었습니다. 간단한 문자 내용 분류는 규칙 기반(Rule-based) 방식이 정확도와 효율이 높을 수 있지만, 새롭게 생기는 유형에 유연하게 대응하거나 판단 근거까지 생성해 줄 수는 없어서 LLM (Large Language Model)이 유리했습니다.
때문에 카카오뱅크는 단순히 LLM을 도입하는데 그치지 않고 정확하게 스미싱 문자를 판별하고 그 이유를 자세히 설명하도록 개발 방향성을 설정했습니다. 이러한 기능을 구현하기 위해 특정 메시지를 스팸으로 판단한 이유가 적절한지에 대해 다방면으로 방법을 검토했습니다.
더 안전한 금융거래를 지원하는 ‘AI 스미싱 문자 확인’ 서비스
AI로 확장해 나가는 if(kakaoAI) 2024
올해 6회째를 맞는 이프카카오는 카카오 그룹의 기술 비전 공유 행사로, 한 해 동안 역점을 둔 기술 및 연구 개발 성과들을 개발자 커뮤니티에 공개하고 소통하는 장입니다. 특별히 올해는 주제를 AI에 집중시켜 ‘모든 연결을 새롭게’라는 슬로건을 정했으며, 영문 행사명에 AI를 추가하고 장소도 작년 말 완공된 용인 ‘카카오 AI 캠퍼스’에서 개최하게 되었습니다. 금융기술연구소는 카카오뱅크를 대표해 3개 세션 발표를 참여하여 금융 서비스에 LLM을 어떻게 적용하고 개선하고 있는지에 대한 선도적 시도와 상세한 노하우를 전달했습니다.
금융 도메인 LLM 평가 지표 및 방법 / SHAP 가속화 / 스미싱 탐지
금융기술연구소는 현재까지 공개된 데이터와 모델들이 한국어 금융 서비스에 사용하기에는 성능이 제한적인 상황을 극복하기 위해 연구해 온 내용들을 선별해 발표를 준비했습니다. LLM을 금융 도메인에 특화시켜 평가하고 성능을 향상하는 기법, 동작 속도와 설명 정확도를 모두 개선한 새로운 SHAP 알고리즘, 스미싱을 탐지하면서 판단 근거까지 뽑아낼 수 있도록 LLM을 최적화 과정 등을 담았습니다. 다시보기는 이프카카오 공식 홈페이지를 통해 제공될 예정이며, 각 주제별 자세한 소개는 본 홈페이지에서 이어서 다뤄집니다.
금융기술연구소 발표 주제
관련 자료
금융기술연구소 if(kakaoAI)2024 3개 세션 발표
•
본 글의 일부는 <카카오 Tech Ethics> ‘카카오뱅크의 AI를 설명하는 방법’에도 같이 발행되었습니다. 인용된 이미지의 저작권과 출처는 <카카오 Tech Ethics>입니다.
Contents
AI를 통한 새롭고 안전한 이용자 경험 제공
최근 카카오뱅크는 금융 서비스 분야에서 AI를 통해 이용자에게 새로운 경험을 제공하고 있습니다. 24년 1월 출시한 '오늘의 mini 일기'는 AI를 활용해 개발한 서비스 중 하나입니다. 카카오뱅크 mini는 만 7세 이상 18세 이하 청소년만 개설할 수 있는 선불전자지급수단으로 '오늘의 mini 일기'는 mini 카드를 이용하는 청소년 고객의 결제 이력을 분석해 자동으로 일기 형태의 글로 만들어줍니다. mini를 이용 중인 청소년이 1) 방학 중 아침에 게임을 사고 2) 고속버스를 예매한 상황을 상상해 보겠습니다. mini는 이용자의 결제 내역을 바탕으로 아래와 같은 일기를 써줍니다.
안녕! 오늘은 기분이 좋아! 왜냐하면 내가 새로운 게임을 샀거든! 오늘 새벽에 땡떙게임즈에서 게임을 결제했어. 그리고 오늘은 고속시외버스 티켓도 샀어! 방학이니까 친구들이랑 여행을 가기로 했거든. 이번 방학은 정말 즐거울 것 같아!!!
카카오뱅크는 새로운 경험과 더불어 안전한 기술도 중요한 가치로 삼고 있습니다. AI 기술을 부정한 금융 거래를 탐지하는 시스템을 고도화하는 영역에 활용하면 이용자의 자산을 더욱 안전하게 보호할 수 있습니다. 특히 AI 기술을 보안 영역에 적용하면 부정한 금융 거래 탐지 정확성도 높아집니다. 앞서 설명한 mini 카드의 이상 거래 탐지 사례를 설명해 보겠습니다.
예시 상황 : 17세 남학생 mini 카드로 금요일 아침 6시 30분에 아이스크림 할인점에서 약 7,000원 결제
해당 거래에 대해 기존의 AI 알고리즘은 'AI 이상 거래 예측률'을 토대로 이상 거래 여부를 결정했습니다. 하지만 최근 고도화된 AI 기술을 적용하면 아래와 같은 질문 체계를 통해 더욱 높은 확률로 부정거래를 탐지할 수 있습니다.
카카오뱅크의 AI를 설명하는 방법
Contents
국내 은행 최초 AI 전용 데이터센터 개소
카카오뱅크는 지난 2월 AI 센터를 개소했습니다. AI 센터(AI Data Center)는 AI 연구개발 만을 위해 별도 설립하는 전용 데이터센터로 구글, 마이크로소프트, 아마존을 비롯한 빅테크들도 최근 조 단위 투자 계획을 밝히고 있습니다. 카카오뱅크는 국내 은행 중에서는 처음으로 자체 AI 전용 연구 장비를 보유하게 되었으며, 엔비디아 최신 GPU ‘H100’을 도입했다는 점이 인프라 측면에서 가장 눈에 띄는 부분입니다. AI 센터 덕분에 신분증 인식, 셀카인증(Selfie Authentication), 신용평가 모형, 이상거래탐지시스템(FDS), AI 고객센터(AICC) 등 카카오뱅크가 진행 중인 다양한 기술개발에 더욱 박차가 가해질 수 있을 것으로 예상됩니다. 금융기술연구소는 많은 자원과 계산량이 필요했던 안면인식 기술 개발에 H100을 바로 적용해보면서 체험한 개선 효과를 소개하고자 합니다.
안면인식 학습 및 추론 과정
안면인식 과정은 크게 전처리와 안면 특징 추출 2단계로 나누어져 있습니다. 전처리 단계에서는 이미지 내에서 얼굴을 탐지(Detection)하고, 눈, 코, 입 등 특징 좌표를 동일한 좌표로 위치시키는 정렬(Alignment) 작업을 수행합니다. 이후 안면 특징 추출 단계에서 앞서 정렬된 안면 이미지를 바탕으로 개개인을 특성을 ‘식별’하는 분류 모델을 만듭니다. 이때 모델은 개개인을 잘 분류하기보다, 안면 특징 정보를 잘 추출해 낼 수 있는 임베딩(Embedding) 생성을 목표로 합니다. 실제 서비스 단계에서는 학습 단계에서 없었던 새로운 사람이 등장할 수 있기 때문에, 새로운 사람에 대해서도 안면 특징을 잘 표현할 수 있도록 임베딩을 만들어내는 것이 중요합니다. 이렇게 만들어진 두 임베딩을 비교해서 같은 사람인지 다른 사람인지를 판별합니다.
안면인식 기술 개발로 살펴본 H100 도입 효과
Contents
금융권 AI 도입 가속화와 규제 대응
모든 산업에서 AI 도입이 가속화되고 있는 가운데, 범국가적 규제 준수와 기술적으로 안정성과 투명성을 확보하는 문제도 같이 중요해지고 있습니다. 금융 산업에서는 고객 응대와 간단한 상담을 해주는 AI 행원이 시중은행 지점에 등장했고, 증권사는 해외주식 정보를 실시간으로 요약해 주는 서비스나 버추얼 애널리스트가 투자 상품을 추천해 주는 서비스를 앱에 탑재했습니다. 이러한 신기술 도입은 정확하고 책임질 수 있는 정보 전달과 고객 보호를 충분히 고려했는지에 대한 법률 검토가 필요하며, 기존 법체계가 새로운 사회 현상과 위험 요소를 온전히 반영하지 못했을 경우 새로운 입법이 이뤄지게 됩니다.
올해 3월 유럽연합 본회의를 최종 통과한 AI법(EU Artificial Intelligence Act)은 AI가 초래할 수 있는 위험을 광범위하게 검토하고 위법 사항에 강도 높은 제재를 채택했다는 점에서 주목을 받았습니다. 유럽연합의 입법 방향성은 익히 알려져 있었고 개별 기업마다 AI 윤리 측면에서 고객 권리 보호와 서비스 안정성 확보를 자율적으로 준비해 왔으나, AI법 시행으로 강제성이 생긴 만큼 더 탄탄한 대비가 필요해진 것입니다. 카카오뱅크도 지난 1월 ‘오늘의 mini 일기' 서비스 출시하고 AI실 조직을 신설하면서 사내외 서비스들과 AI 접목을 전방위적으로 검토하고 있기에, 국내외 AI 규제 동향을 살펴보고 관련해서 대응해 온 과정을 소개해 보고자 합니다.
유럽연합(EU) AI법
전통적으로 유럽연합은 기업의 독점, 지위남용, 차별과 같은 불공정 행위에 엄격한 규제와 강력한 처벌을 유지해 오는 입장입니다. AI도 기술 우월성에 가려진 잠재 위험을 최대한 예방하고 특정 기업이 시장 질서를 왜곡하는 데 사용할 수 없도록 포괄적 규제가 필요한 대상이 되었습니다. 유럽연합 AI법은 착수 시점도 빠르지만 중간 수정 절차로 생성형 AI처럼 갑자기 급부상한 기술 이슈까지 포함시켰다는 점에서 체계적 완성도를 높였습니다. <유럽의회 - 집행위원회 - 이사회> 3자 간 합의 과정을 보면 규제 강도를 높이는 것에만 초점을 맞추지 않고, 유럽 스타트업들이 미국과 중국 기업들과 혁신 경쟁에 뒤처지지 않도록 하기 위해 불공정한 계약 조건의 구속력을 완화해 주는 등 고민한 흔적도 엿볼 수 있습니다.
3년간 협의를 거친 유럽연합의 최종안은 안보 위협이 명백하지 않다면 인간 기본권 보호 원칙을 최우선으로 꼽고 있습니다. AI 기술 남용이 예상되는 업무나 서비스는 4가지 위험 수준에 따라 적합성 평가와 신뢰성 / 투명성(설명가능성, 사전 고지 등)을 확보하는 보호장치를 의무화하고, AI 사용을 원칙적으로 금지(수인 불가 위험)하는 분야도 지정했습니다. 금융사 입장에서는 신용평가, 대출 심사, 보험 요율 산정과 같은 핵심 업무에 대한 AI 적용이 고위험 영역으로 분류될 수 있다는 점에서 각별한 주의가 필요해졌습니다. 2년 유예기간 후 2026년부터 본격적 효력이 예상되는 만큼 유럽 시장이 중요한 기업들은 빠른 시일 내에 대책 마련이 필요하며, 우리나라를 포함한 많은 국가들이 유럽연합 AI법을 참고하여 규제를 준비하고 있기에 영향력은 점차 더 커질 것으로 보입니다.
AI 규제 동향과 카카오뱅크 AI 거버넌스
금융기술연구소 3주년 기념 주요 성과 리뷰
Contents
대내외 협업 취지
카카오뱅크는 금융기술연구소(이하 연구소)를 필두로 한 대내외 연구개발 협업을 통해 우수한 선진 기술을 도입하고 기술적 한계를 뛰어넘기 위한 노력을 지속해오고 있습니다. 2편에서 먼저 소개한 연구소만의 개방적 연구 환경과 유연한 운영 방식은 카카오뱅크 내 현업 부서 및 외부 전문가들과 협업을 극대화하기 위한 사전 조치입니다. 이는 IT산업이 디지털 기반 투명성과 개방성을 바탕으로 수준 높은 기술을 빠르게 개발하고, 비용 절감은 물론 의사 결정 문화 개선까지 이뤄왔던 것을 금융산업에도 재현해 보려는 바람입니다.
연구소 핵심과제들은 주요 목표와 투입 자원, 일정 등을 정기 운영위원회를 통해 보고하고 연구 방향을 결정합니다. 운영위원회는 연구개발 성과 활용성을 다각도로 검증하는 동시에 대고객 서비스에 필요한 요구 사항을 공유하기 위해 유관 기술 부서 책임자들을 위원으로 위촉하고 있습니다. 운영위원회에서 결정된 사안들은 각 위원들이 책임지고 있는 부서와 긴밀한 체계를 꾸준히 유지하는 것이 관건입니다. 때로는 타 부서와 연구소 상호 간 인력을 파견하거나 TF를 구성해 특별 프로젝트를 전개하는데, 유독 2023년은 공동 프로젝트가 많이 진행된 한 해였습니다.
외부 과제 및 협력 현황
학계 협업은 외부에서 최첨단 기술 역량을 수혈하고 급변하는 기술 트렌드를 받아들이기 위해 연구소가 중점을 두고 추진하고 있습니다. 카카오뱅크는 금융위원회의 ‘금융분야 AI 개발·활용 안내서’(2022년) 발간에 주도적으로 참여하였으며, 신뢰 가능한 AI 도입을 위한 AI거버넌스 체계를 수립했습니다. 또한 AI를 활용한 대고객 금융상품 서비스 신뢰 제고를 위해 국내 금융권 최초로 인공지능경영시스템(ISO/IEC 42001) 인증을 취득한 바 있습니다. 전사적 공로와 업적에도 불구하고 최근 화두인 LLM 토대 위에 안정성을 온전히 확보하려면 더 심도 있는 연구가 아직 많이 필요합니다. 연구소에서 이러한 기술 간극을 보완해 보고자 카이스트와 ‘금융분야 설명 가능 AI’, 고려대와 ‘금융분야 LLM 평가지표 개발’ 등 산학 연구과제 2건을 지난해 새로 착수하였습니다.
이외에도 연구과제 수립과 학술 성과 고도화에 조력을 받고자 자문교수 제도를 처음 시작했습니다. 첫 시도로 인하대, 성균관대와 자문 계약을 체결했고 점진적으로 중요 분야를 발굴해 탁월한 연구자들과 협력해 나갈 계획입니다. 국내 금융지주사들이 외부 기업과 공동 기술 개발을 하거나 초기 투자 목적으로 운영하는 핀테크랩 기능도 연구소가 해야 할 역할 중 하나입니다. 다양한 외부 협력 덕분에 학술 논문의 수준을 한 단계 높였고, 연구 분야 폭이 넓어지면서 FnGuide처럼 산업계 파트너와 함께할 기회도 만들 수 있었습니다.
금융기술연구소 3주년 기념 주요 성과 리뷰 3편 협력과 도전
Contents
연구 배경
최근, 대규모 언어모델(Large Language Models, LLM) 등장으로 자연어처리 기술이 비약적으로 발전했으나 금융 용어 및 도메인 지식에 전문화된 언어모델은 부족해서 은행을 비롯한 금융기관에서 최신 언어모델을 쓰기에 아직 어려움이 많습니다. 사전학습 언어모델(Pre-trained Language Model, PLM)은 범용 언어모델보다 특정 도메인 이해도를 집중적으로 높이기 위한 방식입니다.
카카오뱅크는 기업 금융 정보 전문 기업인 에프엔가이드(FnGuide)와 함께 1년 여 동안 고품질의 한국어 금융 학습 데이터를 구축하고, 이 학습 데이터에 최적화시킨 KF-DeBERTa 언어모델을 국내 금융사 최초로 GitHub와 Hugging Face를 통해 대중에게 공개합니다. KF-DeBERTa는 학술적 공로를 인정 받아 지난 10월 35회 한글 및 한국어 정보처리 학술대회(HCLT 2023)에서 우수상을 수상하기도 했습니다. 모델 이름의 KF는 ‘Korean Finance’와 ‘Kakaobank + FnGuide’를 의미합니다.
문제 정의
일반 언어모델들은 아무리 모델이 크고 학습 데이터가 방대하더라도 범용 말뭉치(General corpus) 기반이라 높은 전문지식(Domain knowledge)이 필요한 분야에서는 한계를 보이는 경향이 있습니다. 그나마 공개된 데이터가 충분한 분야는 준수한 성능을 보이나 금융처럼 전문용어 사용이 많은 분야는 양질의 한국어 데이터 자체가 부족합니다. 특히 금융 산업은 법률 규제로 인해 자체 보유한 데이터를 외부에 공개하기 어려운 보수적 분위기가 강하며, 금융 관련 서비스에 언어모델이 쓰이려면 다음 3가지 요소가 보완되어야 합니다.
금융관련 서비스에 언어모델이 쓰이기 위해 보완되어야 할 3요소
한가지 전문 분야에 특화시키는 언어 모델은 과학기술 Galactica (Meta), 의료 Med-PaLM (Google), 법률 Legal-BERT (Athens University), 임상기록 GatorTron (Nvidia, University of Florida) 등 여러가지가 시도되고 있습니다. 금융 분야는 BloombergGPT (Bloomberg)와 FinBERT (Prosus)가 유명합니다. 주로 영어권 언어모델이며, 국내에서는 2021년 KB국민은행이 KB-ALBERT를 공개했지만 모델 파일은 별도 허가를 얻어야 받을 수 있습니다.
자연어처리 성능이 뛰어나다고 해도 무조건 거대한 언어모델을 활용하는 것은 개발 투자와 서비스 운영 비용 관점에서 부담스럽기도 합니다. 다양한 여건들을 고려해, 카카오뱅크와 에프엔가이드는 양방향(Bi-directional) 구조로 문맥을 양방향으로 이해하고 위치정보를 포함한 Disentangled Attention이 도입된 DeBERTa을 토대로 자체 금융특화 언어모델을 개발했습니다.
카카오뱅크의 금융특화 언어모델 KF-DeBERTa 개발기
카카오뱅크 금융기술연구소
Financial Tech Lab