산업 영역과 학술 영역 모두를 아우르는 뛰어난 연구 성과를 직접 확인할 수 있습니다

Abstract
Financial Large Language Models (LLMs) exhibit strong domain expertise but remain vulnerable to financially harmful prompts. To systematically assess this vulnerability, we introduce \textbf{FinHarmBench}, a benchmark designed to evaluate financially harmful and confusable benign prompts. Our analysis reveals a concerning result that financial LLMs can be less robust than general-purpose models, suggesting that domain adaptation alone does not guarantee financial safety alignment. To address this issue, we propose \textbf{Financial Refusal Steering Distillation (FiRSD)}, an unsupervised training framework that strengthens financial-domain safety by learning and distilling a financial refusal direction at the representation level. FiRSD enhances refusal behavior without requiring annotated refusal responses. Experiments show that FiRSD substantially improves safety while largely preserving task capability. These results highlight the importance of domain-aware safety alignment for high-stakes financial applications.
FinHarmBench: Financial Jailbreak Benchmark and Unsupervised Safety Fine-Tuning via Refusal Steering Distillation
2026/04/18
ACL 2026 Industry Track

본 특허는 대규모 코퍼스에서 사전 구축한 분위수(CDF)로 유사도 점수를 실시간 정규화해, 입력 분포 변화에도 일관된 판정을 가능하게 하는 임베딩 기반 후처리 방법입니다.
특히 단일 키워드를 관련어를 유연하게 삽입한 “문장 형태”로 확장해 컨텍스트 커버리지를 크게 넓히고, 임베딩 모델이 의미를 더 풍부하게 표현하도록 하여 유사도 판별 정확도를 높입니다.
임베딩 모델 기반의 텍스트 유사도 결정 방법 및 이를 수행하는 서버
2026/03/18
10-2026-0048680

본 발명은 유해한 사용자 질의를 안전한 형태로 변환하는 방법에 관한 것이다.
기존 가드레일 방식의 과도한 차단 문제를 해결하기 위해 법적 판례 데이터를 활용하여 질의의 의도는 유지하면서 표현을 안전하게 변환한다.
이를 통해 과도한 차단을 완화하고, 질의를 무해한 형태로 처리할 수 있도록 한다.
판례기반 질의 무해화 방법
2026/03/09
10-2026-0041505

Abstract
Jailbreaking poses a significant risk to the deployment of Large Language Models (LLMs) and Vision Language Models (VLMs). VLMs are particularly vulnerable because they process both text and images, creating broader attack surfaces. However, available resources for jailbreak detection are scarce, particularly in finance. To address this gap, we present FENCE, a bilingual (Korean-English) multimodal dataset for training and evaluating jailbreak detectors in financial applications. FENCE emphasizes domain realism through finance-relevant queries paired with image-grounded threats. Experiments with commercial and open-source VLMs reveal consistent vulnerabilities, with GPT-4o showing measurable attack success rates and open-source models displaying greater exposure. A baseline detector trained on FENCE achieves 99 percent in-distribution accuracy and maintains strong performance on external benchmarks, underscoring the dataset's robustness for training reliable detection models. FENCE provides a focused resource for advancing multimodal jailbreak detection in finance and for supporting safer, more reliable AI systems in sensitive domains. Warning: This paper includes example data that may be offensive.
FENCE: A Financial and Multimodal Jailbreak Detection Dataset
2026/02/20
LREC 2026

Abstract
Large language models (LLMs)-based chatbots are increasingly being adopted in the financial domain, particularly in digital banking, to handle customer inquiries about products such as deposits, savings, and loans. However, these models still exhibit low accuracy in core banking computations-including total payout estimation, comparison of products with varying interest rates, and interest calculation under early repayment conditions. Such tasks require multi-step numerical reasoning and contextual understanding of banking products, yet existing LLMs often make systematic errors-misinterpreting product types, applying conditions incorrectly, or failing basic calculations involving exponents and geometric progressions. However, such errors have rarely been captured by existing benchmarks. Mathematical datasets focus on fundamental math problems, whereas financial benchmarks primarily target financial documents, leaving everyday banking scenarios underexplored. To address this limitation, we propose BankMathBench, a domain-specific dataset that reflects realistic banking tasks. BankMathBench is organized in three levels of difficulty-basic, intermediate, and advanced-corresponding to single-product reasoning, multi-product comparison, and multi-condition scenarios, respectively. When trained on BankMathBench, open-source LLMs exhibited notable improvements in both formula generation and numerical reasoning accuracy, demonstrating the dataset's effectiveness in enhancing domain-specific reasoning. With tool-augmented fine-tuning, the models achieved average accuracy increases of 57.6%p (basic), 75.1%p (intermediate), and 62.9%p (advanced), representing significant gains over zero-shot baselines. These findings highlight BankMathBench as a reliable benchmark for evaluating and advancing LLMs' numerical reasoning in real-world banking scenarios.
BankMathBench: A Benchmark for Numerical Reasoning in Banking Scenarios
2026/02/19
LREC 2026

본 발명은 유해 질의를 기반으로 의미를 보존한 무해 대체 질의를 생성하여 유해-무해 병렬 데이터를 구축하는 방법에 관한 것이다.
이를 위해 유해 질의에 대한 응답을 활용하여 질의를 무해한 형태로 변환한다.
이를 통해 병렬 데이터 구축을 자동화하고, 대규모 데이터를 효율적으로 확보할 수 있도록 한다.
유해-무해 병렬 데이터 자동 구축 방법
2026/01/15
10-2026-0007983

Abstract
Model-agnostic explanation methods are essential for interpreting machine learning models, but suffer from prohibitive computational costs that scale with the number of baselines. Existing acceleration approaches either lack a theoretical base or provide no principled guidance for baseline selection. To address this gap, we present ABSQR (Amortized Baseline Selection via Rank-Revealing QR). This framework exploits the low-rank structure of value matrices to accelerate multi-baseline attribution methods. Our approach combines deterministic baseline selection via SVD-guided QR decomposition with an amortized inference mechanism that utilizes cluster-based retrieval. We reduce computational complexity from O (m • 2d) to O (k • 2d), where k ≪ m. Experiments demonstrate that ABSQR achieves a 91.2% agreement rate with full baseline methods while providing 8.5× speedup across diverse datasets. As the first acceleration approach that preserves explanation error guarantees under computational speedup, ABSQR makes the practical deployment of interpretable AI systems feasible at scale.
Amortized Baseline Selection via Rank-Revealing QR for Efficient Model Explanation
2025/11/25
CIKM2025

Abstract
While privacy regulations prohibit direct data sharing among institutions, improving fraud detection performance requires collaboration across banks. To mitigate this limitation, we have conducted a real-world case study on privacy-preserving financial fraud detection (FFD) in the South Korean banking sector. During the research, we have identified four major challenges in practice: (C1) the degradation of tabular generative models under extreme class imbalance and sparsity, (C2) the lack of utility–privacy joint evaluation methodology, (C3) the inability of detection models to capture irregular active lifetime of fraudulent activity, and (C4) the absence of robust federated gradient boosting under dynamic participation. In this work, we introduce two novel approaches: (i) Graph-theoretical Generative Models (GGMs), which leverage graph theories to generate high-utility synthetic tabular data; and (ii) Active Lifetime-Aware Fraud Transaction (ALAFT), which adjusts fraud scores by defining and modeling active lifetime of fraudulent patterns. Across two private banking datasets and a public benchmark, GGMs consistently outperform seven baselines, while ALAFT outperforms significant gains over six representative detectors, reducing false positives during high-risk periods. Finally, we outline our ongoing work, fraud scenario-aware and similarity-based FedXGBBagging with KakaoBank, TossBank, and KBank to enable secure collaboration and support nationwide anti-fraud efforts.
Privacy-Preserving Financial Fraud Detection: Challenges and Solutions with Generative Models, Lifetime-Aware Detection, and Federated Boosting
2026/06/24
NeurIPS 2025 Workshop on Generative AI in Finance

본 발명은 안면 인식 기술에 관한 것으로, 입력 영상 시퀀스로부터 안면 특징을 효과적으로 추출하고, 전문가 신경망 및 게이팅 신경망을 활용하여 위변조 여부를 판단하는 단계로 구성된다. 이를 통해 위변조를 판별하고 사용자 인증의 신뢰성을 확보하고자 한다.
혼합전문가 신경망을 이용한 안티스푸핑 방법
2025/11/24
10-2025-0179141

Abstract
With the growing deployment of large language models (LLMs) in real-world applications, establishing robust safety guardrails to moderate their inputs and outputs has become essential to ensure adherence to safety policies. Current guardrail models predominantly address general human-LLM interactions, rendering LLMs vulnerable to harmful and adversarial content within domain-specific contexts, particularly those rich in technical jargon and specialized concepts. To address this limitation, we introduce ExpGuard, a robust and specialized guardrail model designed to protect against harmful prompts and responses across financial, medical, and legal domains. In addition, we present ExpGuardMix, a meticulously curated dataset comprising 58,928 labeled prompts paired with corresponding refusal and compliant responses, from these specific sectors. This dataset is divided into two subsets: ExpGuardTrain, for model training, and ExpGuardTest, a high-quality test set annotated by domain experts to evaluate model robustness against technical and domain-specific content. Comprehensive evaluations conducted on ExpGuardTest and eight established public benchmarks reveal that ExpGuard delivers competitive performance across the board while demonstrating exceptional resilience to domain-specific adversarial attacks, surpassing state-of-the-art models such as WildGuard by up to 8.9% in prompt classification and 15.3% in response classification. To encourage further research and development, we open-source our code, data, and model, enabling adaptation to additional domains and supporting the creation of increasingly robust guardrail models.
ExpGuard: LLM Content Moderation in Specialized Domains
2026/02/27
ICLR 2026

본 발명은 인공지능 기반 텍스트 생성 기술에 관한 것으로, 유해 프롬프트를 자동으로 생성하고 이에 대한 보상 스코어를 산출하여 데이터베이스에 저장하는 단계와, 이를 이용해 유해 프롬프트 탐지 성능이 향상된 생성 모델을 학습시키는 단계로 구성된다.
유형별 멀티 턴 유해 프롬프트 생성 방법 및 이를 수행하기 위한 서버
2025/11/24
10-2025-0179146

Abstract
As financial applications of large language models (LLMs) gain attention, accurate Information Retrieval (IR) remains crucial for reliable AI services. However, existing benchmarks fail to capture the complex and domain-specific information needs of real-world banking scenarios. Building domain-specific IR benchmarks is costly and constrained by legal restrictions on using real customer data. To address these challenges, we propose a systematic methodology for constructing domain-specific IR benchmarks through LLM-based query generation. As a concrete implementation of this methodology, our pipeline combines single and multi-document query generation with an enhanced and reasoning-augmented answerability assessment method, achieving stronger alignment with human judgments than prior approaches. Using this methodology, we construct KoBankIR, comprising 815 queries derived from 204 official banking documents. Our experiments show that existing retrieval models struggle with the complex multi-document queries in KoBankIR, demonstrating the value of our systematic approach for domain-specific benchmark construction and underscoring the need for improved retrieval techniques in financial domains.
Query Generation Pipeline with Enhanced Answerability Assessment for Financial Information Retrieval
2025/11/14
ICAIF 2025

본 발명은 수리적 추론 학습 데이터를 자동 생성·증강·검증하는 방법과 시스템을 제안하며, 다양한 사용자 맥락을 반영한 고품질 데이터셋 구축을 목표로 한다.
복수의 언어 모델과 표현 방식을 활용한 다중 검증을 통해 신뢰성 높은 정답을 확보하고, 이를 학습한 모델이 정확한 자연어 계산 응답을 제공하도록 한다. 궁극적으로 데이터 생성부터 학습·추론까지 전 과정을 자동화하여, 개인화된 고품질 AI 계산 서비스를 구현한다.
언어 모델의 학습을 위한 수리적 추론 데이터 생성 방법 및 이를 통한 수리적 추론에 기반한 서비스 제공 방법
2025/11/05
10-2025-0165360

이 발명은 Text Embedding model 학습에 필요한, Hard Negative를 효과적으로 추출하기 위한 방법론. 기존의 Hard Negative 추출 방식 대비, Negative로 레이블되어 있지만 실제로는 Positive인 샘플들을 더욱 효과적으로 분류할 수 있게 하였다.
텍스트 임베딩 모델을 위한 데이터 구축 방법
2025/09/11
10-2025-0129663

본 발명은 Jailbreak 등 프롬프트 어택 탐지 모델 학습용 데이터 생성 방법으로 현실에서 유해 쿼리 수집이 어려운 점을 보완하기 위해,
무해 쿼리를 수집한 뒤 롤플레잉 기법으로 현실성 높은 유해 쿼리로 자동 변환한다.
이를 통해 경계가 모호한 고품질 유-무해 쿼리 데이터를 확보하여 탐지 모델 성능 향상에 기여한다.
롤플레잉 기반 유해쿼리 생성 방법론
2025/08/08
10-2025-0109654

본 발명은 Vision Language Model (VLM) 학습을 위한 데이터 생성 방법으로, 사용자의 성별, 연령, 지역 등 메타데이터를 활용해 이미지와 어울리는 텍스트를 자동 생성한다.
이를 통해 기존 방식보다 현실적이고 신뢰도 높은 이미지-텍스트 페어 데이터셋 구축에 기여한다.
사용자 정보 기반 이미지-텍스트 데이터 증강 방법론
2025/08/07
10-2025-0108986

Abstract
Federated learning (FL) has emerged as a promising approach for collaboratively training global models and classifiers without sharing private data. However, existing studies primarily focus on distinct methodologies for typical and personalized FL (tFL and pFL), representing a challenge in exploring cross-applicable training methods. Moreover, previous approaches often rely on data and feature augmentation branches, overlooking data-quantity considerations, leading to suboptimal performance and inefficient communication costs, particularly in multi-class classification tasks. To address these challenges, we propose a novel add-on regularization technique for existing FL methods, named Data-quantity Aware Regularization (FedDAR), seamlessly integrating with existing tFL and pFL frameworks. This network-agnostic methodology reformulates the local training procedure by incorporating two crucial components: 1) enriched-feature augmentation, where features of the local model are coordinated with pre-initialized features to ensure unbiased-representations with efficient global communication rounds for unbalanced data distribution, and 2) data-quantity aware branch, which associates with local data size to improve the optimization of the local model using both supervised and self-supervised labels. We demonstrate significant performance improvements in tFL and pFL, achieving state-of-the-art results across MNIST, F-MNIST, CIFAR-10/100, and Tiny-ImageNet benchmarks.
FedDAR: Federated Learning with Data-quantity Aware Regularization for Heterogeneous Distributed Data
2025/07/25
IEEE Access

본 발명은 비자연어 기반 입력 프롬프트의 사전 유해도 평가 방법에 관한 것이다.
구체적으로, 입력 프롬프트 내 비자연어 세그먼트를 분석하여 사전 유해도를 산출하고, 설정된 임계값에 따라 후속 처리 여부를 제어하는 유해도 평가 절차를 제안한다.
이를 통해 코드, 인코딩 문자열 등 비자연어 형태로 위장된 유해 입력을 선제적으로 탐지·차단함으로써 시스템의 보안성을 강화할 수 있으며, 경량화된 함수 기반 평가 방식을 적용함으로써 전체 처리 과정의 효율성을 향상시킬 수 있다.
비자연어 기반 입력 프롬프트 평가 방법 및 이를 수행하는 금융 서버
2025/07/24
10-2025-0100198

본 발명은 입력 쿼리의 유해도 평가를 위한 임계값 자동 결정 방법에 관한 것이다.
구체적으로는 사용자 입력 쿼리에 대한 유해도 평가 모델의 예측 결과를 기반으로 임계값을 동적으로 산출하여, 금융 서비스 환경에서 발생할 수 있는 프롬프트 공격을 효과적으로 차단하고 안전한 서비스 제공을 가능하게 하는 것을 목적으로 한다.
또한, 대규모 언어 모델(LLM)을 활용한 임계값 검증 절차를 통해 판단 오류를 최소화하고, 서비스 제공자의 운영 효율성과 관리 신뢰성을 향상시킬 수 있다.
입력 쿼리의 유해도 평가를 위한 임계값 결정 방법 및 이를 수행하는 금융 서버
2025/07/24
10-2025-0100199

본 발명은 안면 위변조 탐지 방법 및 이를 수행하는 서버에 관한 것이다. 사용자 단말로부터 정보 통계값 및 임베딩 벡터를 기초로 이미지 품질 지표를 산출하는 단계, 신경망 구조로 구성되는 딥러닝 모델로 스푸핑을 예측하는 단계 등을 포함하며, 이를 통해 이미지 품질 변화에 강건한 안면 위변조 탐지 방법을 제공한다.
안면 위변조 탐지 방법 및 이를 수행하는 서버
2025/07/03
10-2025-0088997

본 발명은 기존 Knowledge-Based Authentication(PIN/공인인증서 등)의 노출·도용 위험과 시각장애인 접근성 한계를 해결하기 위해, 청각/촉각 가이드에 따른 터치 입력을 전처리하고 사전 등록된 본인 인증 영상 데이터와 비교하는 멀티모달(영상+터치 정량 정보) 본인 인증 방법을 제안한다.
영상·터치 데이터 쌍에 대한 마스킹 및 정합/비정합 학습으로 모델을 사전 훈련해 비인가 사용자 식별을 강화하며, 그 결과 보안을 높이고 시각장애인의 단말기 기반 인증 접근성을 향상한다.
복합 인증 방법
2025/06/18
10-2025-0080526

본 발명은 단계별 추론 기반 텍스트 생성 방법 및 이를 수행하는 컴퓨팅 장치에 관한 것이다. 구체적으로는 환각 발생 가능성이 높은 문장을 자동으로 식별하고, 해당 문장이 환각 요소에 해당하는지를 정량적 기준 또는 사전 정의된 문장 유형에 따라 검증할 수 있는 방법을 제안한다. 나아가, 검증된 환각 요소를 기반으로 참조 문서를 생성하고, 환각이 제거되거나 보정된 텍스트를 생성함으로써 설명 결과의 신뢰성과 일관성을 향상시킬 수 있다.
단계별 추론 기반 텍스트 생성 방법 및 이를 수행하는 컴퓨팅 장치
2025/06/13
10-2025-0078039

본 발명은 프롬프트 어택 탐지 모델의 학습을 위한 학습 데이터 생성 및 증강 방법에 관한 것이다.
구체적으로는 신뢰도 기반의 데이터 레이블 조정을 활용하여 데이터 셋의 품질을 높이고, 특정 도메인에 최적화된 데이터 셋을 생성하는 것을 목적으로 한다.
또한, 금융 시나리오와 같이 특정 도메인에서 발생할 수 있는 오탐 문제를 해결하기 위해 해당 도메인에 특화된 데이터 증강 기법을 적용하여 데이터 셋의 다양성과 범용성을 증대시켜 프롬프트 어택 탐지 모델의 성능을 높일 수 있다.
프롬프트 어택 탐지 모델의 학습을 위한 학습 데이터 생성 방법 및 이를 통한 프롬프트 어택의 판단 방법
2025/02/14
10-2025-0019692

본 발명은 프롬프트 어택의 탐지 방법에 관한 것이다. 구체적으로는 특정 도메인에서 프롬프트 어택 판단 시, 정상적인 요청을 어택으로 오판하거나 실제 어택을 정상으로 오판하는 문제를 방지하는 방법을 제안한다.
입력된 쿼리의 길이에 따라 적합한 판단 모델을 선택하고 다양한 판단 모델의 조합을 활용, 조건에 따라 가중치를 동적으로 조정하여 프롬프트 어택 여부를 판단한으로써 판단 오류를 최소화하도록 보조한다.
컴퓨팅 장치에서 수행되는 프롬프트 어택 탐지 방법 및 이를 수행하는 컴퓨팅 장치
2025/02/11
10-2025-0017263

본 발명은 복수의 딥러닝 모델의 성능에 대한 우열을 가리기 위한 딥러닝 모델의 스코어링 방법에 관한 것이다.
본 발명의 목적은, 복수의 심판 모델(judge model)을 이용하여 복수의 평가 대상 모델에 대한 평가를 수행함으로써, 복수의 평가 대상 모델에 대한 성능 평가의 편향성을 줄이고, 객관성을 확보할 수 있는 딥러닝 모델의 스코어링 방법을 제공하는 것이다.
비교하는 평가 대상 모델의 수를 늘리거나, 복수의 심판 모델을 이용함에 따라 필연적으로 증가되는 비교 횟수를 감소시킴으로써, 복수의 평가 대상 모델에 대한 스코어링 수행에 필요한 시스템 리소스를 최소화 시키고, 평가 속도는 가속화 시키면서도, 평가 결과에 대한 정확도는 향상시킬 수 있다.
딥러닝 모델의 스코어링 방법 및 이를 수행하는 서버
2025/01/07
10-2025-0002204

본 발명은 복수의 딥러닝 모델 중에서 제공하고자 하는 특정 서비스에 가장 적합한 딥러닝 모델을 선정하기 위한 서비스 맞춤형 딥러닝 모델 평가 방법에 관한 것이다. 복수의 평가요소를 기초로 테스트 셋을 구성함에 따라, 딥러닝 모델의 추론 능력을 정확히 평가하여 객관성을 확보할 수 있다.
또한, 특정 딥러닝 모델의 추론이 실패하는 경우 원인이 되는 입력값을 보완할 수 있으며, 동일한 이슈가 재발하지 않도록 조치할 수 있기에 서비스 맞춤형 딥러닝 평가 방법을 제공할 수 있다.
서비스 맞춤형 딥러닝 모델 평가 방법 및 이를 수행하는 서버
2024/12/26
10-2024-0197400

Abstract
Access to financial tabular data is often restricted owing to strict regulations surrounding personal information. Despite the advanced generative capabilities of large language models (LLMs), methodologies for the effective creation or expansion of financial tabular datasets remains undeveloped. The complexity of attribute relationships and the diverse data ranges in financial services present significant challenges in processing and understanding these datasets. To address these issues, we propose an expertise-centric prompting framework for synthesizing realistic and accessible pseudo-financial data. This framework involves a collaboration between financial experts and LLMs, focusing on schema calibration and attribute constraints. Moreover, we introduce new metrics to evaluate the realism of these pseudo datasets. We validated the effectiveness of the proposed framework and metrics on both English and Korean datasets, encompassing card transactions, loan statements, and deposits and savings, utilizing pre-trained LLMs such as KoGPT, ClovaX, LLAMA 2-Chat, GPT-3.0, and ChatGPT-3.5/4.0.
Expertise-Centric Prompting Framework for Financial Tabular Data Generation using Pre-trained Large Language Models
2024/12/10

Abstract
Federated Learning (FL) for face recognition aggregates locally optimized models from individual clients to construct a generalized face recognition model. However, previous studies present two major challenges: insufficient incorporation of self-supervised learning and the necessity for clients to accommodate multiple subjects. To tackle these limitations, we propose FedFS (Federated Learning for personalized Face recognition via intra-subject Self-supervised learning framework), a novel federated learning architecture tailored to train personalized face recognition models without imposing subjects. Our proposed FedFS comprises two crucial components that leverage aggregated features of the local and global models to cooperate with representations of an off-the-shelf model. These components are (1) adaptive soft label construction, utilizing dot product operations to reformat labels within intra-instances, and (2) intra-subject self-supervised learning, employing cosine similarity operations to strengthen robust intra-subject representations. Additionally, we introduce a regularization loss to prevent overfitting and ensure the stability of the optimized model. To assess the effectiveness of FedFS, we conduct comprehensive experiments on the DigiFace-1M and VGGFace datasets, demonstrating superior performance compared to previous methods.
Federated Learning for Face Recognition via Intra-subject Self-supervised Learning
2024/11/25
BMVC 2024

Abstract
To mitigate the annual financial losses caused by SMS phishing (smishing) in South Korea, we propose an explainable smishing detection framework that adapts to a Korean-centric large language model (LLM). Our framework not only classifies smishing attempts but also provides clear explanations, enabling users to identify and understand these threats. This end-to-end solution encompasses data collection, pseudo-label generation, and parameterefficient task adaptation for models with fewer BertScore 0.90 0.68 BLEU 0.70 0.25 0.19 0.12 0.06 0.52 0.35 0.18 Accuracy 1.00 0.75 0.45 0.22 0.50 0.25 0.25 0.50 0.25 ROUGE 1.25 1.25 2.50 3.75 5.00 Logicalness 2.50 1.25 1.25 2.50 2.50 3.75 3.75 F1 (Normal) 1.00 0.75 0.50 3.75 0.75 5.00 1.00 F1 (Smishing) Format Adherence than five billion parameters. Our approach achieves a 15% improvement in accuracy over GPT-4 and generates high-quality explanatory text, as validated by seven automatic metrics and qualitative evaluation, including human assessments.
KorSmishing Explainer: A Korean-centric LLM-based Framework for Smishing Detection and Explanation Generation
2024/11/12
EMNLP 2024

본 발명은 언어 모델을 이용한 텍스트의 분류에 관한 것이다. 본 발명에 따른 컴퓨팅 장치에서 수행되는 텍스트의 분류 목적에 따른 분류 방법에 있어서, 분류를 위한 대상 텍스트를 입력 받을 수 있으며, 언어 모델을 이용하여 상기 입력된 대상 텍스트로부터 상기 대상 텍스트의 분류에 대한 제1 판단 결과 및 판단 근거를 생성할 수 있고, 상기 생성된 제1 판단 결과 및 판단 근거를 출력할 수 있다. 본 발명에 따르면, 언어 모델 기반의 텍스트 분류 결과와 분류 결과에 대한 자연어로 구성된 상세한 설명을 제공할 수 있다. 본 발명은 사용자가 모델의 예측 결과를 더 쉽게 이해하고, 그에 따라 신속하고 정확한 의사결정을 내릴 수 있도록 보조할 수 있다.
텍스트의 분류 목적에 따른 분류 방법 및 이를 수행하는 컴퓨팅 장치
2024/10/22
10-2024-0144859

본 발명은 적응형 라벨을 이용한 연합 학습 방법과 이를 수행하는 장치를 개시한다. 상기 연합 학습 방법은, 로컬-글로벌 학습 모델에 포함된 제1 신경망의 중간 레이어와, 개인화 학습 모델에 포함된 제2 신경망의 중간 레이어에서 각각 도출된 값을 기초로 제1 로스값을 산출하는 단계, 상기 제1 신경망의 최종 레이어 및 상기 제2 신경망의 최종 레이어에서 각각 도출된 값과, 로컬 모델에서 도출된 값을 기초로 제2 로스값을 산출하는 단계, 상기 제1 로스값 및 상기 제2 로스값을 기초로 상기 로컬-글로벌 학습 모델을 학습시키는 단계, 학습된 상기 로컬-글로벌 학습 모델의 상기 제1 신경망에 임베딩된 로컬-글로벌 파라미터를 상기 글로벌 서버에 전달하는 단계, 상기 로컬-글로벌 파라미터를 이용하여 생성된 글로벌 파라미터를, 상기 글로벌 서버로부터 수신하는 단계, 및 수신된 상기 글로벌 파라미터를 기초로 상기 제1 신경망의 가중치를 업데이트하는 단계를 포함한다.
적응형 라벨을 이용한 연합 학습 방법 및 이를 수행하는 장치
2024/09/05
10-2024-0121039

본 발명은 개인화 인증 방법 및 이를 수행하는 서버가 제공된다. 상기 개인화 인증 방법은, 사용자 단말을 이용하는 사용자에 대한 사용자 데이터를 수집하는 단계, 상기 사용자 데이터와 관련 있는 유사 데이터를 추출하는 단계, 상기 유사 데이터에 대한 적어도 하나의 클러스터를 생성하고, 상기 클러스터에 난이도 태그 를 부여하는 단계, 상기 사용자 데이터를 기초로, 상기 사용자 단말에 제공할 문답 데이터의 질문 난이도를 결정하는 단계, 상기 질문 난이도에 대응되는 질문 및 정답을 포함하는 문답 데이터를 생성하는 단계, 및 생성된 상기 문답 데이터에 포함된 질문을 상기 사용자 단말에 제공하는 단계를 포함한다.
개인화 인증 방법 및 이를 수행하는 서버
2024/08/29
10-2024-0116325

본 발명은 추정 가속화 방법 및 이를 수행하는 서버에 관한 것이다. 상기 추정 가속화 방법은, 설명 대상 모델 및 대리 모델을 이용하여 서버에서 수행되며, 미리 저장된 데이터 셋을 기초로 배경 데이터를 추출하는 단계, 상기 데이터 셋을 기초로 변형 데이터를 생성하는 단계, 상기 데이터 셋 및 상기 배경 데이터를 기초로 생성된 조합 데이터를 입력으로 상기 설명 대상 모델에서 출력된 제1 출력값과, 상기 변형 데이터를 입력으로 상기 대리 모델에서 출력된 제2 출력값의 차이를 기초로 상기 대리 모델을 학습시키는 단계, 새로운 입력 데이터에 대해 상기 학습된 대리 모델에서 출력된 추론 데이터를 설명 모듈에 전달하는 단계, 및 상기 추론 데이터를 입력으로 상기 설명 모듈에서 출력된 출력값을 이용하여, 상기 새로운 입력 데이터에 대한 설명 결과를 제공하는 단계를 포함한다.
대리 모델을 이용한 추정 가속화 방법 및 이를 수행하는 서버
2024/06/28
10-2024-0085425

본 발명은 리소스 기반 연합 학습 방법과 이를 수행하는 로컬 장치 및 서버를 개시한다. 상기 리소스 기반 연합 학습 방법은, 로컬 장치의 하드웨어 정보 또는 미리 저장된 데이터셋의 크기를 기초로, 상기 로컬 장치의 개인화 모델에 적용될 개인화 모델 파라미터의 크기를 결정하는 단계, 상기 결정된 크기의 상기 개인화 모델 파라미터를 상기 개인화 모델에 적용하고, 상기 개인화 모델을 이용하여 상기 로컬 장치의 로컬 모델을 학습시키는 단계, 상기 로컬 모델에 포함된 신경망의 가중치에 대한 로컬 파라미터를 상기 글로벌 서버에 전송하고, 상기 로컬 파라미터를 기초로 도출된 글로벌 파라미터를 상기 글로벌 서버로부터 수신하는 단계, 및 상기 글로벌 파라미터를 상기 로컬 모델에 적용하고, 상기 로컬 모델을 이용하여 새로운 사용자 데이터에 대한 출력값을 도출하는 단계를 포함한다.
리소스 기반 연합 학습 방법과 이를 수행하는 로컬 장치 및 서버
2024/06/05
10-2024-0073874

본 발명은 언어 모델을 이용한 지식 베이스 구축 방법에 관한 것이다. 본 발명에 따른 컴퓨팅 장치에서 수행되는 지식 베이스 구축 방법은, 학습된 언어 모델을 이용하여 원본 데이터를 복수의 조각으로 분할한 각각의 데이터 조각과 관련된 예상 질의를 생성하는 단계; 상기 언어 모델을 이용하여 상기 데이터 조각으로부터 상기 생성된 예상 질의에 대한 요약문을 생성하는 단계; 및 상기 예상 질의를 벡터화한 인덱스와 상기 예상 질의에 대한 요약문을 상기 인덱스에 대한 내용 데이터로 구성하는 지식 베이스를 생성하는 단계를 포함한다. 본 발명에 따르면, 지식 베이스 내 검색 대상과 질의 간의 의미론적 유사성을 높여 질의와 관련된 정보의 검색 정확성을 개선할 수 있다. 나아가 검색된 부가 정보를 통해 언어 모델이 사용자의 질의에 대한 더 정확하고 관련성 있는 응답을 생성할 수 있다.
언어 모델을 이용한 지식 베이스 구축 방법, 지식 베이스를 이용한 응답 제공 방법 및 이를 수행하는 컴퓨팅 장치
2024/05/23
10-2024-0066842

본 발명은 가상 테이블 데이터 생성 방법 및 이를 수행하는 서버를 개시한다. 가상 테이블 데이터 생성 방법은 테이블 스키마의 생성을 위한 제1 프롬프트를 생성하는 단계, 제1 프롬프트를 기초로 생성된 테이블 스키마와 미리 정의된 기준 테이블 스키마를 비교하여 상기 테이블 스키마를 조정하는 단계, 조정된 테이블 스키마를 참조하여 제2 프롬프트를 생성하는 단계, 제2 프롬프트를 기초로 생성된 제1 테이블 데이터에 대한 테이블 조건 데이터를 생성하는 단계, 테이블 조건 데이터 및 상기 조정된 테이블 스키마를 참조하여 제3 프롬프트를 생성하는 단계, 제3 프롬프트를 기초로 생성된 제2테이블 데이터에 대한 검증 동작을 통해 최종 테이블 데이터를 도출하는 단계를 포함한다.
가상 테이블 데이터 생성 방법 및 이를 수행하는 서버
2024/03/11
10-2024-0033751

본 발명은 자산 운용 서비스 제공 방법 및 이를 수행하는 서버를 개시한다. 자산 운용 서비스 제공 방법은 입력 단말과 연동되는 서버에서 수행되는 자산 운용 서비스 제공 방법에 있어서 입력 단말로부터 사용자의 계정 정보를 수신하는 단계, 상기 사용자의 대화 이력 및 상기 계정 정보를 기초로 도출된 투자 이력을 통해 위험 성향을 추론하고, 유사 집단과 비교하여 보정하는 단계 및 상기 위험 성향 또는 시황 정보의 변동이 있는 경우 상기 위험 성향 및 상기 시황 정보에 기초하여 상기 사용자의 자산 리밸런싱(rebalancing)을 수행하는 단계를 포함한다.
자산 운용 서비스 제공 방법 및 이를 수행하는 서버
2024/02/29
10-2024-0029568

본 발명은 언어 모델을 통한 질의에 대한 응답을 제공하는 대화형 추천 방법을 제공하는 방법에 관한 것이다. 컴퓨팅 장치에서 수행되는 언어 모델을 이용한 대화형 추천 방법은 사용자의 자연어 기반 질의를 입력으로 언어 모델이 구조화된 명령문을 생성하는 단계, 명령문에 따라 소스 데이터에서 응답 테이블을 추출하는 단계, 추출된 응답 테이블을 입력으로 상기 언어 모델이 자연어 기반의 응답을 생성하는 단계, 생성된 응답을 상기 사용자에게 제공하는 단계를 포함한다. 본 발명에 따르면 데이터베이스를 통해 언어 모델은 실제 데이터에 접근하여 보다 구체적이고 정확한 정보를 제공할 수 있다.
언어 모델을 이용한 대화형 추천 방법 및 이를 수행하는 컴퓨팅 장치
2024/02/19
10-2024-0023364

본 발명은 개인화 연합 학습 방법, 개인화 연합 학습 방법 및 이를 수행하는 장치를 개시한다. 개인화 연합 학습 방법은 사용자 단말의 인터페이스를 통해 수신된 사용자 데이터를 기초로 입력 데이터를 생성하는 단계, 상기 사용자 단말에 구비된 제1 학습 모델에 상기 입력 데이터를 입력하고 이에 대한 출력을 이용하여 제1 학습 모델을 학습시키는 단계, 제1 학습 모델에 포함된 신경망의 가중치에 대한 로컬 파라미터를 서버에 전송하는 단계, 로컬 파라미터를 기초로 도출된 글로벌 파라미터를 상기 서버로부터 수신하는 단계, 글로벌 파라미터가 적용된 상기 제1 학습 모델, 상기 제1 학습 모델과 연계된 제2학습 모델에 상기 입력 데이터를 입력하고 이에 대한 출력을 이용하여 상기 제2학습 모델을 학습시키는 단계를 포함한다.
개인화 연합 학습 방법, 사용자 인증 방법 및 이를 수행하는 장치
2024/02/14
10-2024-0020869

본 발명은 컨텐츠 제공 서버에서 수행되는 자동 일기 컨텐츠 제공 방법이다. 사용자 단말에 제공되는 제1 입력 신호에 따라 사용자의 금융 거래 데이터와 관련된 자동 일기 컨텐츠를 생성하기 위한 제1 프롬프트를 생성하는 단계, 상기 제1 프롬프트를 컨텐츠 생성 서버에 제공하는 단계, 상기 제1 프롬프트를 기초로 상기 컨텐츠 생성 서버에서 생성된 자동 일기 컨텐츠를 수신하는 단계, 상기 사용자 단말에 상기 자동 일기 컨텐츠를 표시하기 위한 데이터를 사용자 단말에 제공하는 단계를 포함한다.
자동 일기 컨텐츠 제공 방법 및 이를 수행하는 서버
2024/01/25
10-2024-0011330

본 발명은 컨텐츠 제공 서버에서 수행되는 컨텐츠 제공 방법으로서, 사용자의 금융 거래 데이터를 포함하는 입력 데이터를 이용하여 상기 입력 데이터와 관련된 제1 컨텐츠를 생성하기 위한 컨텐츠 생성 프롬프트를 생성하는 단계, 상기 컨텐츠 생성 프롬프트를 컨텐츠 생성 서버에 제공하는 단계 및 상기 컨텐츠 생성 서버에서 생성된 상기 제1 컨텐츠와 상기 제1 컨텐츠를 평가하기 위한 평가 컨텐츠를 수신하는 단계를 포함한다.
프롬프트 생성 방법, 자동 일기 생성 방법 및 이를 이용한 컨텐츠 제공 방법과 이를 수행하는 서버
2023/11/10
10-2023-0155733

본 발명은 평가 모델의 구축 방법에 관한 것이다. 본 발명의 일 실시예에 따른 평가 모델 구축 방법은 모집단을 선정하는 단계, 선정된 모집단에 대해 평가 모델의 목적에 따른 변수를 선택하는 단계를 포함하고, 변수를 선택하는 단계는 변수에 대한 모집단의 구간화된 분포에 따라 통계적 특성을 갖는 것으로 판단된 유효 변수를 선택하는 것이 바람직하다. 본 발명에 따르면 단순히 수치화된 지표로만 판단하기 어려운 변수의 분포와 패턴을 효과적으로 확인할 수 있다. 이를 통해 모델링을 위한 변수의 선택과 분석 과정에서의 시간과 노력을 절약할 수 있다.
컴퓨팅 장치에서 수행되는 부실화 예측 방법 및 이를 수행하는 컴퓨팅 장치
2023/10/23
10-2023-0141684

Abstract
Owing to the advances in image processing technology and large-scale datasets, companies have implemented facial authentication processes, thereby stimulating increased focus on facial anti-spoofing (FAS) against realistic presentation attacks. Recently, various attempts have been made to improve face recognition performance using both global and local learning on face images; however, to the best of our knowledge, this is the first study to investigate whether the robustness of FAS against domain shifts is improved by considering global information and local cues in face images captured using self-attention and convolutional layers.
This study proposes a convolutional vision transformer-based framework that achieves robust performance for various unseen domain data. Our model resulted in 7.3%p and 12.9%p increases in FAS performance compared to models using only a convolutional neural network or vision transformer, respectively. It also shows the highest average rank in sub-protocols of cross-dataset setting over the other nine benchmark models for domain generalization.
Robust Face Anti-spoofing Framework with Convolutional Vision Transformer
2023/10/08
ICIP 2023

본 발명은 평가 모델의 구축 방법에 관한 것이다. 모집단을 선정하는 단계 및 상기 선정된 모집단에 대해 평가 모델의 목적에 따른 변수를 선택하는 단계를 포함하고, 상기 변수에 대한 모집단의 구간화된 분포에 따라 통계적 특성을 갖는 것으로 판단된 유효 변수를 선택하는 것이 바람직하다. 본 발명에 따르면 단순히 수치화된 지표로만 판단하기 어려운 변수의 분포와 패턴을 효과적으로 확인할 수 있다. 이를 통해 모델링을 위한 변수의 선택과 분석 과정에서의 시간과 노력을 절약할 수 있다.
컴퓨팅 장치에서 수행되는 평가 모델 구축 방법 및 이를 수행하는 컴퓨팅 장치
2023/10/05
10-2023-0132444

(This page will be updated soon)
FTL ranks 2nd place in ‘OOD-CV Challenge SSB Challenge Track(Generalized Category Discovery)’.
OOD-CV Challenge SSB Challenge Track(Generalized Category Discovery)
2023/10/02

Hansol Kim and Youngjun Kwak contributed equally to this work
Abstract
Federated learning (FL) is a promising approach for enhancing data privacy preservation, particularly for authentication systems. However, limited round communications, scarce representation, and scalability pose significant challenges to its deployment, hindering its full potential. In this paper, we propose ‘ProtoFL’, Prototypical Representation Distillation based unsupervised Federated Learning to enhance the representation power of a global model and reduce round communication costs. Additionally, we introduce a local one-class classifier based on normalizing flows to improve performance with limited data. Our study represents the first investigation of using FL to improve one-class classification performance. We conduct extensive experiments on five widely used benchmarks, namely MNIST, CIFAR-10, CIFAR-100, ImageNet-30, and Keystroke-Dynamics, to demonstrate the superior performance of our proposed framework over previous methods in the literature.
ProtoFL: Unsupervised Federated Learning via Prototypical Distillation
2023/10/02
ICCV 2023

(This page will be updated soon)
FTL ranks 2nd place in ‘OOD-CV Challenge Object Detection Track(Any Self Supervised)’.
OOD-CV Challenge Object Detection Track(Any Self Supervised)
2023/10/02
ICCV 2023 Workshops

(This page will be updated soon)
FTL took 2nd place in ‘Resource Efficient Deep Learning for Computer Vision(RCV) Track 2, Budgeted Model Inference Challenge’.
Resource Efficient Deep Learning for Computer Vision(RCV) Track 2, Budgeted Model Inference Challenge
2023/10/02
ICCV 2023 Workshops

Abstract
The budgeted model training challenge aims to train an efficient classification model under resource limitations. To tackle this task in ImageNet-100, we describe a simple yet effective resource-aware backbone search framework composed of profile and instantiation phases. In addition, we employ multi-resolution ensembles to boost inference accuracy on limited resources. The profile phase obeys time and memory constraints to determine the models’ optimal batch-size, max epochs, and automatic mixed precision (AMP). And the instantiation phase trains models with the determined parameters from the profile phase. For improving intra-domain generalizations, the multi-resolution ensembles are formed by two-resolution images with randomly applied flips. We present a comprehensive analysis with expensive experiments. Based on our approach, we win first place in International Conference on Computer Vision (ICCV) 2023 Workshop Challenge Track 1 on Resource Efficient Deep Learning for Computer Vision (RCV).
Resource Efficient Deep Learning for Computer Vision(RCV) Track 1, Budgeted Model Training Challenge
2023/10/02
ICCV 2023 Workshops

본 발명은 대규모 언어 모델의 적응을 통한 태스크의 수행 결과를 제공하는 방법에 관한 것이다. 적응형 언어 모델을 이용한 태스크 수행 방법은 대규모 언어 모델의 태스크의 수행 가능성을 판단하는 단계, 태스크의 수행이 가능하다고 판단된 대규모 언어 모델을 수집 데이터로 적응시키는 단계, 적응된 대규모 언어 모델에 쿼리 데이터를 입력 프롬프트로 입력하여 태스크를 수행하는 단계, 태스크의 수행 결과를 출력하는 단계를 포함한다. 본 발명에 따르면 대규모 언어 모델을 다양한 태스크에 유연하게 적용할 수 있게 하며 한정된 태스크나 도메인이 아닌 여러 분야로 활용 분야를 안정적으로 확장할 수 있다.
적응형 언어 모델을 이용한 태스크 수행 방법 및 이를 수행하는 컴퓨팅 장치
2023/09/22
10-2023-0126804
Load more

카카오뱅크 금융기술연구소
Financial Tech Lab

