메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
임준근 (한국학중앙연구원)
저널정보
인문콘텐츠학회 인문콘텐츠 인문콘텐츠 제28호
발행연도
2013.3
수록면
117 - 143 (27page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
우리나라는 중국, 일본과 함께 ‘한자문화권’에 속해 있기 때문에 인문 콘텐츠에는 많은 한자어가 포함되어 있다. 인터넷에 유통되는 콘텐츠에도 많은 한자어가 있다. 한자어는 중의성을 해소하여 의미를 분명히 하거나 인명, 지명 등의 식별성을 높이는데 필수적이다. 그러나 콘텐츠 생산 또는 가공 단계에서 발생한 많은 한자어 오류들이 그대로 유통되고 있다.
인터넷의 활성화로 최근 일반 이용자들이 생산하여 유통하는 콘텐츠도 급격히 증가하고 있다. ‘복사하여 붙이기(copy and paste)’를 통하여 쉽게 생산할 수 있기 때문이다. 이로 인해 한자어 오류는 더 빠르고 넓게 전파된다. 따라서 인문 콘텐츠를 생산하고 유통할 때는 이러한 오류를 바로잡기 위한 노력이 필수적이다.
이 글에서는 한국학중앙연구원에서 구축한 『한국민족문화대백과사전』, 『한국향토문화전자대전』, 『조선왕조실록 전문사전』 콘텐츠를 중심으로 한자어 오류 검증방법을 살펴본다. 또한 민간 포털의 Open-API를 이용하여 인터넷 상에 유통되는 소량의 데이터를 추출하여 분석하였다.
먼저 출현하는 한자어를 분석하여 오류의 유형을 정리하였다. 그리고 오류의 유형에 따른 검증 방법을 연구하였다. 형태 오류를 판단하기 위하여 ① 한자-한글 음가표 기반 검증, ② 정답과 오류 한자어 사전 기반 검증, ③ 문서 간 한자어 상호비교 기반 검증 방법을 제시한다. 형태적인 오류가 없는 경우 문서 또는 문단 문맥에 함께 출현하는 한자어의 공기(co-occurrence) 한자어 말뭉치(corpus)를 구축하고 이를 적용하여 의미적인 오류를 검증하고 콘텐츠의 품질을 높이는 방안을 제안하였다.

목차

국문초록
Ⅰ. 연구 배경 및 목적
Ⅱ. 한자어의 추출과 정리
Ⅲ. 형태 기반 오류 검증
Ⅳ. 동시 출현 정보를 이용한 중의성 해소를 통한 한자어 검증
Ⅴ. 맺음말과 향후 연구 방향
참고문헌
〈ABSTRACT〉

참고문헌 (20)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2014-000-003051066