메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

한석현 (광운대학교, 광운대학교 대학원)

지도교수
박호종
발행연도
2021
저작권
광운대학교 논문은 저작권에 의해 보호받습니다.

이용수5

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
본 논문에서는 멜-스펙트로그램과 스파이크그램 기반의 특성을 함께 사용
하여 음소를 인식하는 방법을 제안한다. 음소 인식에 주로 사용하는 멜-스
펙트로그램은 프레임 단위의 평균 특성으로 시간 해상도가 낮고, 짧은 길이
의 음소를 인식하는 데에 불리하다. 반면에 인간의 청각 기관은 샘플 단위
로 동작해 시간 해상도가 높다. 이에 따라 음소 인식의 성능을 향상하기 위
해 인간의 청각 기관의 동작에 부합하는 새로운 특성 추출 기술이 요구된
다. 본 논문에서는 인간의 청각 기관의 동작을 모델링 하는 기법인 스파이
크그램을 통해 음소 인식을 위한 특성을 추출하고, 멜-스펙트로그램과 결합한
다중 음성 특성 추출 기술을 제안한다. 주의집중 기반의 시퀀스-투-시퀀스 모
델을 사용하여 음소 인식기를 구현하고 성능을 측정하였으며, 기존 멜-스펙트
로그램 단독 특성보다 제안하는 특성이 우수한 성능을 가지는 것을 확인하였
다. 이를 통해 인간의 청각 모델을 기반으로 추출한 제안하는 특성이 기존 음성
특성의 부족한 점을 보완할 수 있는 새로운 특성임을 확인할 수 있다.

목차

등록된 정보가 없습니다.

최근 본 자료

전체보기

댓글(0)

0