About
home
금융기술연구소
home

사용자 정보 기반 이미지-텍스트 데이터 증강 방법론

구분
특허
상태
출원
출원번호
10-2025-0108986
날짜
2025/08/07
11 more properties
본 발명은 Vision Language Model (VLM) 학습을 위한 데이터 생성 방법으로, 사용자의 성별, 연령, 지역 등 메타데이터를 활용해 이미지와 어울리는 텍스트를 자동 생성한다. 이를 통해 기존 방식보다 현실적이고 신뢰도 높은 이미지-텍스트 페어 데이터셋 구축에 기여한다.

카카오뱅크 금융기술연구소

Financial Tech Lab
Copyright ⓒ KakaoBank Corp. All rights reserved.