인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
개인구독
소속 기관이 없으신 경우, 개인 정기구독을 하시면 저렴하게
논문을 무제한 열람 이용할 수 있어요.
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
논문 기본 정보
- 자료유형
- 학위논문
- 저자정보
- 지도교수
- 김상진
- 발행연도
- 2023
- 저작권
- 동아대학교 논문은 저작권에 의해 보호받습니다.
이용수3
초록· 키워드
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
본 연구는 개인회생을 예측을 위해 데이터 취합과 변수선택에 중점을 두고 머신러닝 모델을 활용하여 개인회생을 예측하는데 활용할 수 있는 방법을 연구하였다. 본 연구에서 데이터 취합은 가중평균과 단순결합을 사용하였고 변수선택은 Filter-Based Feature Selection Method와 Embedded Method를 사용하였다.
이에따라, 본 논문에서는 해당 방법을 활용하여 예측하는 것을 목적으로 한다. 본 연구에서는 개인 회생 예측을 위해, 머신러닝 알고리즘 중 Support Vector Machine(SVM), Random Forest, Extreme Gradient Boost(XGBoost), Light Gradient Boosting Machine(LGBM)을 사용한다. 이를 위해, 개인의 신용점수, 연체금액, 대출금액 등의 변수를 수집하고 전처리하고 2022년 3월부터 2023년 3월 회생신청 데이터 3,477건과 정상데이터 140,828건의 분석데이터를 기반으로 데이터셋을 모델에 입력하여 학습 및 성능 평가를 수행 하였다.
실험 결과 LGBM 모델이 개인 회생 예측에 대해 가장 높은 성능을 보였다. 또한, 변수 중요도 분석을 통해 불필요한 변수를 제거하고 모델의 복잡성을 낮춤으로써, 예측 성능을 향상시켰다.
이에따라, 본 논문에서는 해당 방법을 활용하여 예측하는 것을 목적으로 한다. 본 연구에서는 개인 회생 예측을 위해, 머신러닝 알고리즘 중 Support Vector Machine(SVM), Random Forest, Extreme Gradient Boost(XGBoost), Light Gradient Boosting Machine(LGBM)을 사용한다. 이를 위해, 개인의 신용점수, 연체금액, 대출금액 등의 변수를 수집하고 전처리하고 2022년 3월부터 2023년 3월 회생신청 데이터 3,477건과 정상데이터 140,828건의 분석데이터를 기반으로 데이터셋을 모델에 입력하여 학습 및 성능 평가를 수행 하였다.
실험 결과 LGBM 모델이 개인 회생 예측에 대해 가장 높은 성능을 보였다. 또한, 변수 중요도 분석을 통해 불필요한 변수를 제거하고 모델의 복잡성을 낮춤으로써, 예측 성능을 향상시켰다.
목차
- Ⅰ. 서 론 11. 연구의 배경 및 목적 12. 연구의 범위 및 방법 2Ⅱ. 이론적 배경 및 선행연구 검토 21. 이론적배경 32. 변수선택 33. 기계학습 4Ⅲ. 회생 예측을 위한 알고리즘 구축 51. 데이터 분포 62. 데이터 전처리 63. 머신러닝 모델 7Ⅳ. 학습 및 성능평가 81. 평가 방법 및 학습 방법 81) 평가 방법 82) 학습 방법 92. 성능 평가 91) Original Data 92) Filter-Based Feature Selection Method 103) Embedded Method 12Ⅴ. 결론 및 향후 연구방향 141. 결론 142. 한계점 및 향후 연구방향 14참고문헌 16Abstract 17보충자료 19