메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

조상현 (부산대학교, 부산대학교 대학원)

지도교수
권혁철
발행연도
2021
저작권
부산대학교 논문은 저작권에 의해 보호받습니다.

이용수18

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
웹 문서는 평문 데이터뿐만 아니라 표나 리스트와 같은 구조화된 데이터도 포함하고 있다. 구조화되지 않은 평문 데이터로 학습한 언어모형은 구조화된 표와 리스트 데이터에 적용했을 때 질의응답 성능이 크게 하락하는 문제가 있다. 본 연구에서는 평문 데이터로 학습한 언어모형과 함께 표 데이터로 사전학습한 언어모형을 활용하여 웹 문서 내의 평문 데이터와 구조화된 리스트, 표 데이터 모두에서 정답을 찾을 수 있는 한국어 다중지문 기계독해 모형을 제안한다. 평문 데이터에 대한 질의응답을 위해 한국어 위키피디아 데이터로 사전학습한 BERT 모형을 사용했으며, 표에 대한 질의응답을 위해서 위키피디아 내에 존재하는 표 데이터로 사전학습한 TAPAS 모형을 활용했다. 입력된 여러 개의 지문에서 정답이 있는 단락 선택을 위해서 입력된 각 단락에 정답이 있을 확률을 예측하는 단락 순위화 모형을 적용했다. TAPAS 모형을 KorQuAD 2.0 개발 데이터의 표 관련 데이터에 적용했을 때 평문 데이터를 위한 언어모형만을 사용했을 때보다 EM이 10.33, F1이 8.08 향상됨을 보였다. 본 논문에서 제안하는 질의응답 시스템의 경우 KorQuAD 2.0 평가 데이터에서 EM은 59.20, F1은 77.52를 보였다.

목차

1. 서론 1
1.1 연구 배경 1
1.2 연구 범위 2
1.3 논문 구성 3
2. 관련연구 3
2.1 질의응답 데이터 3
2.2 사전학습 언어모형 4
2.3 단락 순위화 모형 5
2.4 기계독해 모형 6
2.5 표 질의응답 8
3. 질의응답 시스템 설계 9
3.1 질의응답 시스템 구조 9
3.2 기계독해 모형 10
3.3 단락 순위화 모형 14
3.4 세부 단락 선별 17
3.5 표 질의응답 19
4. 학습 26
4.1 사전학습 언어모형 26
4.2 한국어 기계독해 데이터 28
5. 실험 및 평가 30
5.1 실험 환경 30
5.2 평가 방법 31
5.3 기계독해 모형 실험 결과 32
5.4 단락 순위화 및 세부 단락 선별모형 실험 결과 33
5.5 표 질의응답 모형 실험 결과 35
5.6 질의응답 시스템 실험 결과 36
6. 토의 38
7. 결론 및 향후 과제 39
참고 문헌 40

최근 본 자료

전체보기

댓글(0)

0