메뉴 건너뛰기

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
(세명대학교) (University of California) (한국전자출판학회) (숙명여자대학교)
저널정보
한국멀티미디어학회 멀티미디어학회논문지 멀티미디어학회논문지 제27권 제3호
발행연도
수록면
400 - 409 (10page)
DOI
10.9717/kmms.2024.27.3.400

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
이 논문의 연구방법이 궁금하신가요?
🏆
연구결과
이 논문의 연구결과가 궁금하신가요?
AI에게 요청하기
추천
검색
질문

초록· 키워드

Numerous attempts to interpret charts have historically been more focused on enhancing performance rather than aligning with human practicality, inadvertently steering us away from the fundamental objective. Given that the subjective knowledge in interpreting charts varies depending on its application, it is imperative to ensure autonomy in interpretation based on foundational information. This necessitates the provision of intuitive information grounded in human perception hierarchically. We propose a methodological expansion of caption usage, termed “Caption Hierarchical Segmentation”, which progressively augments caption information based on the spatial characteristics of tokens, offering multi-layered captions. This approach facilitates the training of models to be versatile in application, grounded in human perceptibility. Our method, when integrated with existing chart explanation models, serves to prevent misunderstandings and overfitting by the model. It achieves this by offering simple explanations for samples that are otherwise uninterpretable, thereby providing only intuitive information and averting incorrect responses.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지
정보가 잘못된 경우 알려주세요!

목차

  1. ABSTRACT
  2. 1. 서론
  3. 2. 관련 연구
  4. 3. 계층적 차트 캡션 생성 모델
  5. 4. 실험 및 평가
  6. 6. 결론
  7. REFERENCE

참고문헌

참고문헌 신청

최근 본 자료

전체보기
UCI(KEPA) : I410-151-24-02-089576156