메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

장우진 (광운대학교, 광운대학교 대학원)

지도교수
박호종
발행연도
2018
저작권
광운대학교 논문은 저작권에 의해 보호받습니다.

이용수12

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
본 논문은 심층 신경망과 인간의 청각 시스템 기반의 특성 벡터를 이용한 음악 장르 분류 기술을 제안한다. 인간의 청각 시스템은 입력된 신호를 여러 주파수 대역으로 분해하여 부호화한다. 이를 통해 인간은 필요한 에너지와 신경자원은 최소화하고 뇌에 전달되는 정보는 최대화하여 효율적으로 소리를 인식할 수 있다. 이러한 청각 시스템의 동작을 모델링 하여 파형을 분석하는 방법을 스파이크그램 (spikegram)이라고 한다. 제안하는 방법은 스파이크그램을 이용하여 신호를 분석하고 이로부터 장르 분류의 핵심이 되는 주파수 기반, 시간 위치 기반, SNR 기반 정보를 추출하여 심층 신경망의 입력 특성 벡터로 사용한다. 성능 측정에 사용된 데이터는 10개의 음악 장르로 구성된 GTZAN 데이터 세트이고, 제안하는 방법이 기존 방법에 비해 낮은 차원의 특성 벡터를 사용하여 우수한 성능을 제공하는 것을 확인하였다.

목차

제 1 장 서론 1
제 2 장 기존의 음악 장르 분류 기술 3
제 1 절 스펙트로그램과 MFCC 3
제 2 절 기존 방법의 문제점 5
제 3 장 스파이크그램 추출 6
제 4 장 제안하는 청각 특성을 이용한 음악 장르 분류 기술 11
제 1 절 개요 11
제 2 절 스파이크그램 기반의 특성 벡터 추출 방법 12
제 3 절 심층 신경망 17
제 5 장 성능 평가 21
제 6 장 결론 25
참고문헌 26

최근 본 자료

전체보기

댓글(0)

0