인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
논문 기본 정보
- 자료유형
- 학술저널
- 저자정보
- 저널정보
- Korean Institute of Information Scientists and Engineers Journal of KIISE Journal of KIISE Vol.50 No.6
- 발행연도
- 2023.6
- 수록면
- 476 - 483 (8page)
- DOI
- 10.5626/JOK.2023.50.6.476
이용수
초록· 키워드
동영상 검색은 후보 동영상 중 텍스트 쿼리와 연관된 동영상을 찾는 연구 분야이다. 기존의 동영상 검색 모델은 비디오와 텍스트의 구조적 특징을 고려하지 않고 쌍을 이루는 임베딩이 서로 유사해지도록 학습하는 방식을 사용해왔다. 본 논문에서는 비디오와 텍스트의 구조적 특징 중 하나인 클립 시퀀스와 문장 시퀀스가 일대일대응 관계를 이룬다는 점을 활용하는 새로운 동영상 검색 모델 및 학습 기법을 제안한다. 실험 결과 본 논문에서 제안하는 최종 모델의 성능은 베이스라인 모델 대비 YouCook2 데이터셋에서 문장-클립 검색 R@1과 문단-동영상 검색 R@1에서 각각 0.3%p와 5.4%p의 향상된 성능을 보인다.
#동영상 검색
#계층적 구조 모델
#멀티 모드 학습
#데이터 증식
#video retrieval
#hierarchical structure model
#multi-modal training
#data augmentation
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
목차
- 요약
- Abstract
- 1. 서론
- 2. 관련 연구
- 3. 제안 모델
- 4. 실험 및 평가
- 5. 결론
- References