도움말

Topic Signature를 이용한 댓글 분류 시스템

Comments Classification System using Topic Signature
정보과학회논문지 : 소프트웨어 및 응용 제35권 제12호, 2008.12, 774-779 (6 pages)
인용정보 복사
Quick View Quick View
구매하기 6,000원
인용하기
이용수 : 252건
피인용수 : 1건
분야내 활용도 : 4%
자세히 보기 >

· 이용수 : 2010년부터 집계한 원문다운로드수

· 피인용수 : DBpia 논문 가운데 해당 논문을 인용한 논문수

· 분야내 활용도 : 최근 24개월간 DBpia 이용수를 기준으로 산출 / 0%에 가까울 수록 활용도가 높고, 100%에 가까울 수록 활용도가 낮음

초록
본 논문에서는 토픽 시그너처(Topic Signature)를 이용하여 댓글을 분류하는 시스템에 대해서 설명한다. 토픽 시그너처는 자질을 선택하는 방법으로 문서요약이나 문서분류에서 사용하는 방법이다. 댓글은 문장의 길이가 짧고 띄어쓰기가 거의 없으며 특수문자들이 많은 특성을 가지고 있다. 따라서 우리는 댓글을 7개의 음절로 나누고 이를 다시 Tri-gram으로 나누어 분류의 기본단위로 본다. 이 Tri-gram을 토픽 시그너처를 이용한 학습 단위로 사용하고, 학습한 자질을 베이지안(Bayesian) 모델을 사용하여 분류한다.
다양한 방법의 모델과 비교·실험을 통하여 구현한 시스템의 성능이 기존의 방법보다 상승되었음을 실험결과를 통해 알 수 있었다.

In this work, we describe comments classification system using topic signature. Topic signature is widely used for selecting feature in document classification and summarization. Comments are short and have so many word spacing errors, special characters. We firstly convert comments into 7-gram. We consider the 7-gram as sentence. We convert the 7-gram into 3-gram. We consider the 3-gram as word. We select key feature using topic signature and classify new inputs by the Naive Bayesian method.
From the result of experiments, we can see that the proposed method is outstanding over the previous methods.

목차
요약
Abstract
1. 서론
2. 관련 연구
3. 제안 댓글 분류 시스템
4. 실험 및 토의
5. 결론 및 향후 연구 과제
참고문헌
키워드

논문의 주요 키워드를 제공합니다. 키워드를 클릭하여 관련 논문을 확인해 보세요!

참고문헌 (13)

현재 논문의 참고문헌을 찾아 신청해주세요!

  1. , , comment and trackback spam statistics

  2. , , MIT Spam Conference 2007

  3. Bo Pang , 2002 , Thumbs up? Sentiment Classification using Machine Learning Techniques , EMNLP : 79 ~ 86

  4. Soo-Min Kim , 2005 , Automatic Detection of Opinion Bearing Words and Sentences , IJCNLP : 61 ~ 66

  5. Soo-Min Kim , 2004 , Determining the Sentiment of Opinions , COLING : 1367 ~ 1373

  6. Ryan McDonald , 2007 , Structured Models for Fine-to-Coarse Sentiment Analysis , EMNLP - CoNLL : 432 ~ 439

  7. , , Spam in blogs, Wikipedia

  8. , , Movable Type Black Filter, with content filtering

  9. Mishne G. , 2005 , Blocking Blog Spam with Language Model Disagreement , 1st International Workshop on Adversarial Information Retrieval on the Web : 1 ~ 6

  10. , , Preventing comment spam using “nofollow” tag

  • 처음
  •  
  • 이전
  •  
  • 1
  •  
  • 2
  •  
  • 다음
  •  
  • 마지막
인용된 논문 (1)

알림서비스 신청하고 '인용된 논문' 정보를 메일로 확인 하세요!

제 1 저자의 다른 논문 (2)

배민영 식별저자 저자의 상세정보를 확인해 보세요.

권호 내 다른 논문 (10)

정보과학회논문지 : 소프트웨어 및 응용 제35권 제12호 의 상세정보를 확인해 보세요.

추천 논문 (10)

DBpia 추천논문과 함께 다운받은 논문을 제공합니다. 논문 초록의 텍스트마이닝과 이용 및 인용 관계 분석을 통해 추천해 드리는 연관논문을 확인해보세요.

DBpia 추천논문

더 많은 추천논문을 확인해 보세요!

함께 다운받은 논문

지표

이용현황

· 이용수

· 이용순위 상위 Top3

자세히 보기 >
No 상위 이용이관 이용수
1 연세대학교 22
2 서울대학교 14
3 대구대학교 12

활용도

· 활용지수

· 논문의 활용도 추이 (주제분야 기준)

자세히 보기 >

: %

2016-09
2016-10
2016-11
2016-12
0
20
40
60
80
100
  • 0%
  • 20%
  • 40%
  • 60%
  • 80%
  • 100%

피인용수

상세정보
저작권 정책

누리미디어에서 제공되는 모든 저작물의 저작권은 원저작자에게 있으며, 누리미디어는 각 저작물의 내용을 보증하거나 책임을 지지 않습니다. 단, 누리미디어에서 제공되는 서지정보는 저작권법에 의해 보호를 받는 저작물로, 사전 허락 없이 임의로 대량 수집하거나 프로그램에 의한 주기적 수집 이용, 무단 전재, 배포하는 것을 금하며, 이를 위반할 경우, 저작권법 및 관련법령에 따라 민, 형사상의 책임을 질 수 있습니다.

맨 위로 이동