메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
오문흠 (전북대학교) 이혜정 (전북대학교) 이준환 (전북대학교)
저널정보
한국통신학회 한국통신학회논문지 한국통신학회논문지 제47권 제12호
발행연도
2022.12
수록면
2,156 - 2,167 (12page)
DOI
10.7840/kics.2022.47.12.2156

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
인공지능 기술을 이용하는 음악 연구가 활발하게 진행되고 있다. 본 연구에서는 한국 전통음악인 판소리의 발림동작과 얼굴 표정의 인식을 목표로 한다. 이를 위해 동영상을 구성하는 매 프래임에서 소리꾼 객체를 검출하고, 소리꾼을 포함하는 프래임에서 동작 및 얼굴 표정 인식을 시도한다. 단 동작 인식은 이전 논문에서 언급하였기 때문에 본 논문에서는 소리꾼 얼굴 표정 인식에 관련된 과정만을 강조하여 언급한다. 본 논문에서 부족한 주석 데이터 때문에 소리꾼 검출에서는 MS COCO 데이터를 혼합하여 활용하였으며, 얼굴 표정 분류에는 ImageNet 데이터 셋과 RAF-DB 데이터를 활용하여 MAE 자기 지도 학습 모델로 구성한 ViT 트랜스포머를 백본으로 활용하였다. 소리꾼 검출의 경우 IoU 문턱치 75%에서 약 91.2%의 평균 정밀도를 얻었으며, 4개 범주의 얼굴 표정의 분류에서 78.44%의 정확도를 달성했다. 본 연구의 결과는 문화 콘텐츠 보존이나 교육에 의미 있는 활용이 예상된다.

목차

요약
ABSTRACT
Ⅰ. 서론
Ⅱ. 관련 연구
Ⅲ. 제안된 소리꾼 얼굴 표정 인식 방법
Ⅳ. 실험 및 결과
Ⅴ. 결론
References

참고문헌 (31)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0