메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
홍서빈 (서원대학교) 김봉현 (서원대학교)
저널정보
아태인문사회융합기술교류학회 아시아태평양융합연구교류논문지 Asia-pacific Journal of Convergent Research Interchange Vol.10 No.2
발행연도
2024.2
수록면
25 - 34 (10page)
DOI
http://dx.doi.org/10.47116/apjcri.2024.02.03

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
본 논문은 현대 사회에서 빠르게 증가하는 데이터의 양과 다양성으로 인해 효과적인 분석과 이해가 중요한 과제로 부각되고 있는 상황에서, 공공데이터의 클러스터링을 통해 데이터 품질과 일관성에 대한 문제점을 도출하고 개선 방안을 모색하는 것을 목표로 하였다. 데이터는 data.go.kr에서 제공되는 체육 분야의 공공데이터를 사용하며 텍스트 데이터에서 명사를 추출하고 TF-IDF 벡터화를 사용하여 클러스터링을 수행하였다. K-means, DBSCAN, GMM 알고리즘과 키워드 추출 방법을 비교하여 성능을 평가하고, 데이터의 일관성과 품질에 대한 문제점을 분석하였다. 연구 결과, 불용어 처리와 키워드 추출 방법의 선택이 클러스터링 결과에 큰 영향을 미침을 확인하였다. 또한 데이터의 길이, 형식, 키워드 품질 등이 클러스터링의 성능에 영향을 미치는 것으로 나타났다. 데이터의 불균형과 일관성 부재, 표준 부재 등이 클러스터링 결과에 영향을 미칠 수 있으며, 향후에는 이러한 문제를 해결하기 위한 표준화된 가이드라인과 연구가 필요하다는 결론을 도출하였다. 클러스터링을 통해 데이터의 다양성을 파악하고, 이를 통해 데이터 수집과 분석 전략을 개선하는 방안을 제시하며, 공공데이터의 효과적인 활용을 위해 데이터의 품질 향상과 클러스터링 기법의 적극적 활용이 중요하다는 점을 강조한다.

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

최근 본 자료

전체보기

댓글(0)

0