메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

박나영 (서울대학교, 서울대학교 대학원)

발행연도
2020
저작권
서울대학교 논문은 저작권에 의해 보호받습니다.

이용수10

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (5)

초록· 키워드

오류제보하기
본 논문은 한국어 음소배열제약에 대한 연구로서, 기계 학습(machine learning) 방법을 한국어 어휘부에 적용하여 가능한 모든 제약을 자동으로 학습하였으며, 학습된 제약의 심리적 실재 가능성을 확인하고 있다. ‘음소배열제약’이란 음소 단위의 결합 회피 혹은 선호에 대한 모국어 화자의 직관적 판단을 나타내고, 이 판단은 전통적으로 ‘적형/비적형’이라는 범주적인 관점에서 다루어졌다(예: blick [적형] vs. lbick [비적형], Chomsky & Halle 1965). 그러나 영어 음소배열제약에 대한 연구를 포함한 다수의 최근 연구에서 통계적 방법론을 적용하여 비범주적 문법을 탐색하고, 그 문법의 심리적 실재를 증명하는 데 성공하였다(Coleman & Pierrehumbert 1997, Hayes & Wilson 2008, Albright 2009 등). 이러한 배경에서 본 연구는 비범주성을 중심으로 한국어 음소배열제약의 실체를 체계적으로 탐색하고자 하였으며, 이를 위해 기계 학습 방법과 적형성 판단 조사를 시행하였다.
먼저, 기계 학습을 시행하여 한국어 어휘부에서 유효한 음소배열제약 목록을 제시하였다. 학습 자료는 단일 형태소인 명사 단어로 구성하였고, 어휘 부류의 차이를 고려하여 고유어 어휘 목록과 한자어의 어휘 목록을 구분하여 학습하였다. 학습 모델은 음운론 문법 습득 모델 중 가장 일반적이며 효과적인 ‘최대 엔트로피 음소배열제약 모델(Hayes & Wilson 2008)’을 이용하였다. 학습된 고유어 및 한자어 문법은 과거 한국어 음소배열제약에 대한 연구에서 산발적으로 제시한 제약 및 통계적 경향을 대부분 포함하고 있다. 그 밖에 과거 연구에서 언급된 적이 없는 제약 및 통계적 경향도 새롭게 학습되었다. 결과적으로 특정 현상 및 주제에 집중하면서 통계적으로 분명하지 않은 방식으로 진행된 대부분의 과거 연구와 비교해서, 본 연구는 총체적이고 통계적으로 정당화될 수 있는 문법을 제시하고 있다.
그리고, 어휘부에서 학습된 제약들이 한국어 화자들의 인식에 실재하는지를 확인하기 위하여 ‘후두자질 발생 및 공기 제한’에 초점을 맞추어 적형성 판단 실험을 시행하였다. 실험 결과, 후두자질 발생 및 공기에 대한 인식이 상당 부분 실재하며, 고유어 및 한자어 어휘부 문법 각각이 독립적으로 적형성 판단에 영향을 미친다는 것을 확인할 수 있었다.
본 연구는 한국어 어휘부에서 학습될 수 있는 음소배열제약 목록을 총괄적으로 제공하고 학습된 제약의 심리적 실재 여부를 모국어 화자를 대상으로 직접 조사하였다. 본 연구에서 제시하고 있는 문법은 최적의 한국어 음소배열제약 모델 개발의 기준 모델로 이해될 수 있다.

목차

1. 서론 1
2. 이론적 배경 5
2.1. 기술 통계량 5
2.1.1. 관찰 빈도/기대 빈도 비율 6
2.1.2. 전이 확률 10
2.1.3. 요약 12
2.2. 분절음 N-gram 모델 13
2.2.1. 바이그램 모델 13
2.2.2. 음소배열제약 확률 계산기 14
2.2.3. 음절두음-운모 모델 16
2.3. 자질 기반 N-gram 모델 17
2.4. 일반화 이웃 모델 19
2.5. 입력형-출력형 대응 조화 문법 22
2.5.1. 구성 및 상대적 수용도 23
2.5.2. 학습: 점진적 학습자 알고리즘 24
2.6. 최대 엔트로피 음소배열제약 모델 29
2.6.1. 발생 확률 계산 26
2.6.2. 음소배열제약의 학습 과정 27
2.7. 문법 모델 예측: 영어 화자의 적형성 판단과 비교 26
3. 기존연구: 한국어의 음소배열제약 33
3.1. 범주적 음소배열제약(전체 한국어 및 고유어 어휘부) 33
3.2. 비범주적 음소배열제약(전체 한국어 및 고유어 어휘부) 38
3.2.1. 인접 연쇄 38
3.2.2. 비인접 연쇄 42
3.3. 한자어 어휘부 특정 제약 48
3.4. 논의 50
3.4.1. 기존 음소배열제약 탐색 방법의 한계 50
3.4.2. 한국어 화자의 비범주적 적형성 51
3.4.3. 최대 엔트로피 음소배열제약 모델의 도입 필요성 52
4. 학습 55
4.1. 학습 방법 55
4.1.1. 학습 어휘부 55
4.1.2. 자질 목록 57
4.1.3. 학습 조건 60
4.2. 결과 61
4.2.1. 고유어 및 한자어 문법 공통 음소배열제약 61
4.2.2. 고유어 문법 특정 음소배열제약 70
4.2.3. 한자어 문법 특정 음소배열제약 76
4.3. 논의 79
5. 모국어 화자의 적형성 판단 조사 81
5.1. 목적과 대상 81
5.2. 연구 방법 82
5.2.1. 조사 단어 생성 82
5.2.2. 조사 과정 83
5.2.3. 피실험자 84
5.3. 결과 85
5.3.1. 실험 관찰과 문법 예측 비교 86
5.3.2. 격음/경음 발생 유형별 학습 점수와 응답 점수 89
5.4. 논의 94
6. 결론 97
참고문헌 101
[부록1] 학습 제약: 고유어 111
[부록2] 학습 제약: 한자어 116
[부록3] 비단어 목록 121
[부록4] 지시 문항 123
[부록5] 비단어에 대한 비적형성 점수와 응답 점수 127
ABSTRACT 139

최근 본 자료

전체보기

댓글(0)

0