인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
논문 기본 정보
- 자료유형
- 학술대회자료
- 저자정보
- 발행연도
- 2024.6
- 수록면
- 2,954 - 2,957 (4page)
이용수
초록· 키워드
Recently, automatic speech recognition (ASR) models using large-scale speech data have been proposed. Among them, Whisper has known as a state-of-the-art model showing impressive performance across various multilingual tasks. However, it was reported that Whisper does not perform as well in situations where multiple languages are mixed within a single sentence. In this paper, we proposed a novel Whisper model with a language detector and new token sequences to address this issue. Experimental results show that on a Korean-English code-switching dataset, the character error rate (CER) decreased by 1.7% compared to the conventional Whisper model.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
목차
- Abstract
- Ⅰ. Introduction
- Ⅱ. Proposed Method
- Ⅲ. Experiments
- Ⅳ. Conclusion
- 참고문헌