인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
논문 기본 정보
- 자료유형
- 학위논문
- 저자정보
- 지도교수
- 김도현
- 발행연도
- 2024
- 저작권
- 명지대학교 논문은 저작권에 의해 보호받습니다.
이용수1
초록· 키워드
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
최근 정보기술의 발전으로 인해 수많은 텍스트 데이터가 다양한 소스로부터 빠르게 수집되고 있다. 그러나 텍스트 데이터는 비정형 구조와 동의어, 다의성 등 복잡한 특성으로 인해 정형 데이터와 비교하였을 때 분석이 어렵다는 문제가 존재한다. 이러한 문제점을 해결하기 위해 주어진 텍스트 데이터의 잠재된 구조와 의미를 이해하고 숨겨진 주제를 찾아내는 토픽 모델링은 꾸준히 발전되고 있다. 토픽 모델링은 다양한 자연어처리 분야에서 응용되고 있으며, 최근에는 대규모 텍스트 데이터 분석을 위해 그 필요성이 강조되고 있다. 본 논문에서는 대조학습을 활용한 비지도 토픽 모델링 알고리즘을 제안한다. 대조학습을 토픽 모델링에 도입하여 end-to-end 방식으로 학습이 진행되며, 문서, 토픽, 단어를 하나의 공간에 임베딩하여 그들의 관계를 식별하고 더욱 직관적인 토픽 모델링 결과를 제공한다. 그뿐만 아니라 제안하는 방법은 과학기술 문헌 데이터에 적용하였을 때, 기존의 다양한 토픽 모델링 접근법과 비교하여 일관성과 다양성 관점에서 상대적으로 비슷하거나 더 우수한 정량적 지표 값을 보여주었다.
목차
- 그림목차 ⅲ표목차 ⅳ국문초록 ⅴ제 1 장 서론 1제 1 절 연구의 배경 및 목적 1제 2 절 관련 연구 31.2.1 토픽 모델링 31.2.2 대조학습 13제 3 절 연구의 목적 및 논문의 구성 16제 2 장 대조학습을 활용한 비지도 토픽 모델링 알고리즘 개발 17제 1 절 대조학습을 활용한 비지도 토픽 모델링 알고리즘 172.1.1 전체 프로세스 172.1.2 전처리 단계 182.1.3 임베딩 단계 192.1.4 대조학습 단계 212.1.5 군집분석 단계 22제 2 절 대조학습을 활용한 비지도 토픽 모델링 알고리즘의 학습 252.2.1 제안 알고리즘의 대조학습 손실함수 252.2.2 제안 알고리즘의 군집분석 손실함수 26제 3 절 제안 알고리즘의 특징 27제 3 장 실험 및 결과 28제 1 절 실험 데이터 및 실험 환경 283.1.1 실험 데이터 283.1.2 실험 환경 30제 2 절 실험 설계 및 구성 313.2.1 실험 프로세스 313.2.2 성능 평가 지표 313.2.3 하이퍼파라미터 최적화 33제 3 절 실험 결과 353.3.1 정량적 결과 353.3.2 정성적 결과 37제 4 장 결론 및 향후 과제 49참고문헌 51부록 55Abstract 65