본문 바로가기
[학술저널]

  • 학술저널

한광록 오삼권 임기욱

표지

북마크 0

리뷰 0

이용수 128

피인용수 1

초록

본 논문에서는 추출 요약 방식과 질의어 기반의 요약 방식을 혼합한 문서 요약 방법에 관해서 기술한다. 학습문서를 이용해 주제어구 추출을 위한 학습 모델을 만든다. 학습 알고리즘은 Naive Bayesian, 결정트리, Supported Vector Machine을 이용한다. 구축된 모델을 이용하여 입력 문서로부터 주제어구 리스트를 자동으로 추출한다. 추출된 주제어구들을 질의어로 하여 이들의 국부적 유사도에 의한 기여도를 계산함으로써 요약문을 추출한다. 본 논문에서는 주제어구가 원문 요약에 미치는 영향과, 몇 개의 주제어구 추출이 문서 요약에 적당한지를 실험하였다. 추출된 요약문과 수동으로 추출한 요약문을 비교하여 결과를 평가하였으며, 객관적인 성능 평가를 위하여 MS-Word에 포함된 문서 요약 기능과 실험 결과를 비교하였다.

This paper describes the hybrid document summarization using the indicative summarization and the query-based summarization. The learning models are built from learning documents in order to extract topic phrases. We use Naive Bayesian, Decision Tree and Supported Vector Machine as the machine learning algorithm. The system extracts topic phrases automatically from new document based on these models and outputs the summary of the document using query-based summarization which considers the extracted topic phrases as queries and calculates the locality-based similarity of each topic phrase. We examine how the topic phrases affect the summarization and how many phrases are proper to summarization. Then, we evaluate the extracted summary by comparing with manual summary, and we also compare our summarization system with summarization method from MS-Word.

목차

요약

Abstract

1. 서론

2. 관련 연구

3. 요약 시스템 설계 및 구현

4. 실험 및 평가

5. 결론

참고문헌

저자소개

키워드

저자키워드
등록된 정보가 없습니다.

참고문헌(16)

  • 1.

    강승식 , , 한글 형태소 분석 HAM 라이브러리 , , nlp.kookmi (ac.kr)

  • 2.

    류제 , 2000. , 단어의 공기 관계 그래프를 이용한 문서의 핵심 문장 추출에 관한 연구 7 (11) : 3427 ~ 3437

  • 3.

    류제 , 2000. , 단어의 공기 관계 그래프를 이용한 인터넷 문서의 키워드 추출 9 (1) : 894 ~ 899

  • 4.

    한경수 , 2000. , 질의 기반을 이용한 적합성 피드백 기반 자동문서 요약

  • 5.

    Francine R. Chen , 1997. , Extraction of Inductive Summary Sentences from Imaged Documents : 227 ~ 232

리뷰(0)

도움이 되었어요.0

도움이 안되었어요.0

첫 리뷰를 남겨주세요.
Insert title here