메뉴 건너뛰기

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
(숭실대학교) (숭실대학교)
저널정보
Korean Institute of Information Scientists and Engineers Journal of KIISE Journal of KIISE Vol.50 No.4
발행연도
수록면
344 - 350 (7page)
DOI
10.5626/JOK.2023.50.4.344

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
이 논문의 연구방법이 궁금하신가요?
🏆
연구결과
이 논문의 연구결과가 궁금하신가요?
AI에게 요청하기
추천
검색
질문

초록· 키워드

음성 처리 분야에서 딥러닝은 음성인식의 정밀도를 향상시켜 많은 발전을 이루었다. 그중 하나인 음성 향상은 말하는 음성과 잡음이 섞여있는 입력에서 음성과 잡음을 분리시켜 음성 품질을 향상시킬 수 있는 기법이다. 이는 AI-스피커, 스마트폰 등에 활용되어 사람 대 사람, 기계 대 인간과의 의사소통을 원활하게 하고 로봇이나 문자 음성 변환(Text-to-Speech) 등을 위한 깨끗한 음성 데이터 수집을 가능하게 한다. 하지만 단일 모델만을 사용한 기존 음성 향상 기법은 환경마다 특수적으로 발생하는 잡음 제거에 있어 효과적이지 못하다. 환경 특수적으로 발생할 수 있는 잡음을 효과적으로 제거하기 위해, 본 논문은 음향 장면 분류 기법과 위치 정보 활용 기술을 결합하여 최적의 환경별 음성 향상이 이루어 질 수 있게 하는 딥러닝 모델을 제안한다. 실험 결과 SNR 9 dB을 기준으로 하였을 때, 본 기법이 기존 딥러닝 모델대비 PESQ 값은 평균 0.06 이상, STOI 값은 평균 0.015 이상의 향상된 품질을 보임을 확인하였다.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지
정보가 잘못된 경우 알려주세요!

목차

  1. 요약
  2. Abstract
  3. 1. 서론
  4. 2. 관련 연구
  5. 3. 제안 기법
  6. 4. 실험
  7. 5. 결론
  8. References

참고문헌

참고문헌 신청

최근 본 자료

전체보기
UCI(KEPA) : I410-ECN-0101-2023-569-001338494