메뉴 건너뛰기

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
(이화여자대학교) (숙명여자대학교) (성균관대학교) (성균관대학교)
저널정보
대한전자공학회 대한전자공학회 학술대회 2024년도 대한전자공학회 추계학술대회 논문집
발행연도
수록면
660 - 664 (5page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
이 논문의 연구방법이 궁금하신가요?
🏆
연구결과
이 논문의 연구결과가 궁금하신가요?
AI에게 요청하기
추천
검색
질문

초록· 키워드

This research presents a novel approach to Visual Grounding, addressing the challenge of handling new classes with minimal data. Traditional models often rely on extensive fine-tuning for new tasks, which is time-consuming and inefficient. To overcome this, we propose a few-shot learning architecture that eliminates the need for fine-tuning by incorporating a template-based multimodal prompt with learnable embeddings. Additionally, our model integrates a fusion module and contrastive loss to enhance generalization across unseen classes. Our approach achieves 83.6% accuracy on the RefCOCOg dataset, demonstrating significant improvements in performance on novel classes.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지
정보가 잘못된 경우 알려주세요!

목차

  1. Abstract
  2. I. 서론
  3. II. 본론
  4. III. 실험
  5. Ⅳ. 결론 및 향후 연구 방향
  6. 참고문헌

참고문헌

참고문헌 신청

최근 본 자료

전체보기