본문 바로가기
[학술저널]

  • 학술저널

김철원(호남대학교) 박선(전북대학교)

발행기관의 요청으로 개인이 구매하실 수 없습니다.

표지

북마크 1

리뷰 0

이용수 32

피인용수 1

초록

문서군집은 정보검색의 많은 응용분야에 사용되는 중요한 문서 분석 방법이다. 본 논문은 비음수 행렬 분해(NMF, non-negative matrix factorization)를 군집 방법과 군집의 응집도(coherence of cluster)를 이용한 군집 내 문서들의 정제를 이용한 새로운 문서군집방법을 제안한다. 제안된 방법은 문서 집합의 내부 구조를 나타내는 의미특징 행렬과 의미변수 행렬 이용하여 문서군집의 성능을 높일 수 있고, 문장들 간의 유사도에 기반 한 군집의 응집도를 이용하여 군집내의 문서들을 정제하여서 재 할당함으로써 군집의 효율을 향상시킬 수 있다. 실험 결과 제안 방법을 적용한 문서 군집 방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

Document clustering is an important method for document analysis and is used in many different information retrieval applications. This paper proposes a new document clustering model using the clustering method based NMF(non-negative matrix factorization) and refinement of documents in cluster by using coherence of cluster. The proposed method can improve the quality of document clustering because the re-assigned documents in cluster by using coherence of cluster based similarity between documents, the semantic feature matrix and the semantic variable matrix, which is used in document clustering, can represent an inherent structure of document set more well. The experimental results demonstrate appling the proposed method to document clustering methods achieves better performance than documents clustering methods.

목차

요약
ABSTRACT
Ⅰ. 서론
Ⅱ. 관련연구
Ⅲ. 제안방법
Ⅳ. 실험 및 성능평가
Ⅴ. 결론
참고문헌

참고문헌(12)

  • 1.

    , , The 20 newsgroups data set

  • 2.

    주길홍 , 2008 , 효율적인 문서검색을 위한 레벨별 불용어 제거에 기반한 문서 클러스터링 , 컴퓨터교육학회 논문지 11 (3) : 67 ~ 80

  • 3.

    B. Y. Ricardo , 1999 , Information Retrieval , ACM Press

  • 4.

    D. D. Lee , 1999 , Learning the parts of objects by non-negative matrix factorization’ , Nature 401 : 788 ~ 791

  • 5.

    D. D. Lee , 2001 , Algorithms for non-negative matrix factorization , Advances in Neural Information Processing Systems 13 : 556 ~ 562

리뷰(0)

도움이 되었어요.0

도움이 안되었어요.0

첫 리뷰를 남겨주세요.
Insert title here