사용자 정보 기반 이미지-텍스트 데이터 증강 방법론

구분

특허

상태

출원

출원번호

10-2025-0108986

날짜

2025/08/07

11 more properties

본 발명은 Vision Language Model (VLM) 학습을 위한 데이터 생성 방법으로, 사용자의 성별, 연령, 지역 등 메타데이터를 활용해 이미지와 어울리는 텍스트를 자동 생성한다. 이를 통해 기존 방식보다 현실적이고 신뢰도 높은 이미지-텍스트 페어 데이터셋 구축에 기여한다.

카카오뱅크 금융기술연구소

Financial Tech Lab

경기도 성남시 분당내곡로 131 판교테크원 타워2 15층 (13529)

문의 하기