메뉴 건너뛰기
소속 기관 / 학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
고객센터 ENG
주제분류

논문 기본 정보

저자정보
(한양대학교) (NHN) (한양대학교) (한양대학교)
저널정보
Korean Institute of Information Scientists and Engineers 정보과학회논문지 : 컴퓨팅의 실제 및 레터 정보과학회논문지 : 컴퓨팅의 실제 및 레터 제17권 제2호
오류 신고하기

검색

    초록·키워드

    최근, 블로그 사용이 활성화됨에 따라 중복포스트가 다량 생성되고 있다. 이 중복포스트들은 블로그 검색 성능 및 품질을 저하시킬 뿐만 아니라 원본 포스트와의 저작권의 문제를 발생시키기 때문에 이를 검출하고 필터링하는 것이 웹 검색 엔진에서 중요한 문제이다. 본 논문은 대용량 블로그 데이터베이스 환경에 적합한 중복포스트 검출 기법을 제안한다. 또한 이를 이용하여 블로그 포스트 검색 인덱스에 반영하지 않는 방안을 제안한다. 다양한 실험을 통하여 제안하는 기법의 우수성을 검증한다.

    본문·목차

    최근 본 자료 전체보기

      UCI(KEPA) : I410-ECN-0101-2012-569-004321592