메뉴 건너뛰기

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

(강원대학교, 강원대학교 대학원)

지도교수
이창기
발행연도
저작권
강원대학교 논문은 저작권에 의해 보호받습니다.

이용수8

표지
AI에게 요청하기
추천
검색

초록· 키워드

상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지
정보가 잘못된 경우 알려주세요!
기계 번역은 자연 언어로 된 텍스트를 다른 언어로 자동 번역 하는 기술이다. 최근에 주로 연구되고 있는 신경망 기계 번역은 인공 신경망 기반의 번역 모델로, 문장의 의미를 이해한 정보를 바탕으로 번역 결과를 생성한다. 문서 요약은 문서로부터 본문의 핵심적인 내용을 포함하는 요약문을 만들어내는 기술로, 생성 요약은 실제로 사람이 직접 요약문을 만드는 것처럼 모델이 문서 내용을 이해한 것을 기반으로 새로운 요약문을 생성하는 방법이다. 기계 번역과 문서 요약의 생성 요약은 언어 생성 작업으로, 주로 병렬 코퍼스를 이용하여 학습하는 지도 학습 방법을 사용한다. 하지만 지도 학습 방법은 충분한 학습 데이터가 없을 때는 낮은 성능을 보이는 단점이 있다. 최근에는 학습 데이터 부족 문제 해결을 위해 대량의 단일 언어 데이터를 사용하여 학습한 사전학습 모델을 이용하는 전이 학습 방법이 활발하게 연구되고 있다. 본 논문에서는 최근 다양한 자연어 처리 분야에서 사용되고 있는 전이 학습 방법을 언어 생성 작업인 기계 번역과 문서 요약에 적용한다. 그리고, 기계 번역과 문서 요약에서 성능 향상을 위해 사용되는 상대 위치 표현과 복사 메커니즘 방법을 전이 학습 모델에 추가로 적용하여 모델의 성능이 개선됨을 보인다. 또한, mBART 모델을 영어-한국어 신경망 기계 번역에 적용하여 번역 성능이 향상됨을 보이고, 데이터 증축 방법인 EDA를 기계 번역 작업에 사용하여 모델의 번역 성능 개선에 도움이 될 수 있음을 보인다. 추가로, 기계 번역에서 위키백과 문서 또는 HTML같이 마크업 태그가 포함된 문장 번역에서 어텐션이나 단어 정렬 정보를 사용하지 않는 기계 독해를 이용한 마크업 태그 복원 모델을 제안하고, 제안한 마크업 태그 복원 모델의 성능이 어텐션 정보를 이용한 모델보다 개선됨을 보인다.

목차

  1. I. 서론 1
    II. 관련 연구 3
    1. 기계 번역 3
    2. 문서 요약 4
    3. 전이 학습 5
    III. MASS를 이용한 언어 생성 7
    1. MASS 7
    2. 상대 위치 표현 8
    3. 복사 메커니즘 9
    4. 실험 및 결과 10
    4.1 MASS와 상대 위치 표현을 이용한 영어-한국어 신경망 기계 번역 11
    4.2 MASS와 상대 위치 표현을 이용한 한국어 문서 요약 13
    4.3 MASS와 복사 메커니즘을 이용한 한국어 문서 요약 16
    IV. mBART와 EDA를 이용한 영어-한국어 신경망 기계 번역 18
    1. mBART 18
    2. Easy Data Augmentation 18
    3. 실험 및 결과 19
    V. 기계 번역에서 기계 독해 기술을 이용한 마크업 태그 복원 21
    1. 기계 번역에서의 마크업 태그 복원 21
    2. 기계 독해 기술을 이용한 마크업 태그 복원 모델 21
    3. 실험 및 결과 23
    VI. 결론 26
    참고문헌 27
    Abstract 30

최근 본 자료

전체보기