본문 바로가기
[학술저널]

  • 학술저널

김문현(세종대학교) 구영현(세종대학교) 유성준(세종대학교)

표지

북마크 0

리뷰 0

이용수 490

피인용수 0

초록

이 논문에서는 비교 및 추천키워드가 들어간 문서 중 추천 내용을 포함한 문서를 자동으로 분류하는 방법을 제안한다. 추천문장을 하나 이상 포함하는 문서를 추천문서로 정의한다. 추천문장의 대부분은 ‘~보다’와 같은 비교키워드를 포함하고 있거나 ‘추천, ‘우위’, ‘월등’, ‘압승’과 같은 추천키워드를 포함하고 있기도 하다. 제안하는 방법은 이 비교 및 추천키워드를 포함하고 있는 문장을 먼저 선정하고 이들 중추천문장만을 분류해 내기 위해 규칙을 추출하거나 기계 방법을 적용한다. ‘보다’를 포함한 다섯 개의 비교 및 추천키워드를 포함하고 있는 문서 1,336개를 Naive Bayes와 Bayesian Net으로 분류한 결과 평균 88.3%의 재현율과 83.5%의 정확률을 얻을 수 있었다. 향후 보다 많은 비교키워드와 추천키워드에 대해 일반화된 추천문서 분류 기술에 대한 연구가 진행될 것이다. 이 논문은 CSA2009에서 발표한 비교문장 분류 방법을 기반으로 추천문장 분류 방법을 추가하여 확장한 것이다.

We propose a novel approach for the automatic classification of Korean text documents containing product recommendations using machine learning and rules. Most of Korean product recommendations include comparative keywords such as ‘than’, or recommendation keywords including ‘recommend’, ‘superior’, ‘excellent’, and ‘overwhelming victory’. We apply some rules or machine learning based classifier to select candidate sentences including such keywords and sort out only the recommendation sentences. The result of classifying 1,336 documents, including five comparative and recommendation keywords using Naive Bayes and Bayesian Net shows a recall rate of 88.3% and a precision of 83.5%. In the future, hopefully, there will be further studies on approaches to classification of generalized recommendation sentences in terms of more comparative and recommendation keywords. The idea of our previous work on mining comparative only sentences published in CSA2009 can be exploited in classifying recommendation sentences by adding the features proposed in this paper.

목차

요약
Abstract
1. 서론
2. 관련 연구
3. 추천문서 분류를 위한 키워드
4. 비교키워드를 이용한 추천문장 분류
5. 추천키워드를 이용한 추천문장 분류
6. 실험 및 성능 평가
7. 결론
참고문헌

참고문헌(20)

  • 1.

    맹성현 , 2008 , An opinion analysis system using domain-specific lexical knowledge , 4th Asia Information Retrieval Symposium, AIRS 2008 : 466 ~ 471

  • 2.

    황재원 , 2008 , 감정 자질을 이용한 한국어 문장 및 문서 감정 분류 시스템 , 정보과학회논문지 : 컴퓨팅의 실제 및 레터 14 (3) : 336 ~ 340

  • 3.

    B. Liu , , Web Data Mining : Exploring Hyperlinks, Contents, and Usage Data , Springer

  • 4.

    B. Liu , 2008 , Mining Opinion in Comparative Sentences , Proceedings of the 22nd International Conference on Computational Linguistics (Coling 2008) : 241 ~ 248

  • 5.

    B. Pang , 2002 , Thumbs up? Sentiment Classification using Machine Learning Techniques , Proc. the Conference on Empirical Methods in Natural Language Processing : 79 ~ 86

리뷰(0)

도움이 되었어요.0

도움이 안되었어요.0

첫 리뷰를 남겨주세요.
Insert title here