인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
논문 기본 정보
- 자료유형
- 학술저널
- 저자정보
- 발행연도
- 1997.2
- 수록면
- 160 - 169 (10page)
이용수
초록· 키워드
본 논문은 통계와 규칙에 기반한 한국어 품사 태깅을 위한 2단계 혼합형 모델을 소개한다. 통계 모델은 좁은 윈도로 인하여 한국어 품사 중의성의 해소에 필요한 어휘직접 의존현상이나 장거리 의존현상을 다루는 데 한계가 있다. 반면, 규칙에 기반한 방법은 통계 모델에 비해 상대적으로 높은 정확도를 제공하지 못하고 새로운 품사집합이나 응용 영역에 대하여 유연성을 갖지 못한다. 이러한 두 가지 독립된 방법의 한계를 극복하기 위하여 통계모델에서 발생하는 오류만 선택적으로 찾아서 규칙을 이용하여 정정해줄 수 있는 통계와 규칙을 상호보완적으로 결합한 혼합형 구조를 소개한다. 이 방법은 두 단계의 학습으로 구성되어 있다. 첫번째 학습 단계는 통계에 기반하고, 두번째 규칙 학습 단계는 통계모델의 범위를 벗어난 영역을 다루는 규칙을 자동으로 생성한다. 여기서 자동 규칙 학습기는 Eric Brill 스타일을 따른다. 이 방법은 규칙의 자동학습으로 새로운 태그집합과 말뭉치에 대하여 유연성을 가지며, 모델을 저장하기 위한 공간이 통계모델에 비하여 작다. 규칙학습기로 생성한 규칙은 형태소기반 통계모델이 다루지 못하는 어절 사이 형태소의 관계를 다룬다. 실험결과는 혼합형 접근방법이 한국어와 같이 형태가 복잡한 언어에 대하여 좋은 성능을 가짐을 보여준다.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
목차
- 요약
- Abstract
- 1. 서론
- 2. 기존의 연구
- 3. 한국어에서 품사 태깅시 고려 사항
- 4. TAKTAG 시스템
- 5. 실험결과 및 문제점
- 6. 결론
- 참고문헌
- 저자소개
참고문헌
참고문헌 신청최근 본 자료
UCI(KEPA) : I410-ECN-0101-2009-569-017747694