도움말

K-NN과 최대 우도 추정법을 결합한 소프트웨어 프로젝트 수치 데이터용 결측값 대치법

A Missing Data Imputation by Combining K Nearest Neighbor with Maximum Likelihood Estimation for Numerical Software Project Data
이동호, 윤경아, 배두환식별저자
정보과학회논문지 : 소프트웨어 및 응용 제36권 제4호, 2009.4, 273-282 (10 pages)
인용정보 복사
Quick View Quick View
구매하기 6,000원
인용하기
이용수 : 180건
피인용수 : 0건
분야내 활용도 : 12%
자세히 보기 >

· 이용수 : 2010년부터 집계한 원문다운로드수

· 피인용수 : DBpia 논문 가운데 해당 논문을 인용한 논문수

· 분야내 활용도 : 최근 24개월간 DBpia 이용수를 기준으로 산출 / 0%에 가까울 수록 활용도가 높고, 100%에 가까울 수록 활용도가 낮음

초록
소프트웨어 프로젝트 데이터를 이용한 각종 분석·예측 모델 생성시 직면하는 문제 중 하나는 데이터에 포함된 결측값이며 이에 대한 효과적인 방안은 결측값 대치법이다. 대표적인 결측값 대치법인 K 최근접 이웃 대치법은 대치과정에서 결측값을 포함하는 인스턴스의 관측정보를 활용하지 못한다는 단점이 있다. 본 연구에서는 이러한 단점을 극복하기 위해 K 최근접 이웃 대치법과 최대 우도 추정법을 결합한 새로운 소프트웨어 프로젝트 수치 데이터용 결측값 대치법을 제안한다. 또한 결측값 대치법의 정확도를 비교하기 위한 새로운 측도를 함께 제안한다.

Missing data is one of the common problems in building analysis or prediction models using software project data. Missing imputation methods are known to be more effective missing data handling method than deleting methods in small software project data. While K nearest neighbor imputation is a proper missing imputation method in the software project data, it cannot use non-missing information of incomplete project instances. In this paper, we propose an approach to missing data imputation for numerical software project data by combining K nearest neighbor and maximum likelihood estimation; we also extend the average absolute error measure by normalization for accurate evaluation. Our approach overcomes the limitation of K nearest neighbor imputation and outperforms on our real data sets.

목차
요약
Abstract
1. 서론
2. 배경 지식: 결측 메커니즘(missingness mechanism)
3. 관련 연구
4. K-NN과 MLE 결합에 의한 결측값 대치
5. 사례 연구
6. 결론 및 향후 연구
참고문헌
키워드
참고문헌 (12)

현재 논문의 참고문헌을 찾아 신청해주세요!

  1. Kevin Strike , 2001 , Software Cost Estimation with Incomplete Data , IEEE Transactions on Software Engineering 27 (10) : 890 ~ 908

  2. Ingunn Myrtveit , 2001 , Analyzing Data Sets with Missing Data: An Empirical Evaluation of Imputation Methods and Likelihood-Based Methods , IEEE Transactions on Software Engineering 27 (11) : 999 ~ 1013

  3. M. H. Cartwright , 2003 , Dealing with Missing Software Project Data , Proceeding of the Ninth International Software Metrics Symposium : 154 ~ 165

  4. Roderick J. A. Little , 1987 , Statistical Analysis with Missing Data , John Wiley & Sons

  5. Donald B. Rubin , 1987 , Multiple imputation for nonresponse in surveys , John Wiley & Sons

  6. Bhekisipho Twala , 2005 , Comparison of Various Methods for Handling Incomplete Data in Software Engineering Databases , International Symposium on Empirical Software Engineering : 105 ~ 114

  7. Qinbao Song , 2007 , A new imputation method of small software project data sets , The Journal of Systems and Software 80 (1) : 51 ~ 62

  8. Qinbao Song , 2005 , A Short Note on Safest Default Missingness Mechanism Assumptions , Empirical Software Engineering 10 (2) : 235 ~ 243

  9. Jason Van Hulse , 2008 , A comprehensive empirical evaluation of missing value imputation in noisy software measurement data , The Journal of Systems and Software 81 (5) : 691 ~ 708

  10. Taghi Khoshgoftaar , 2007 , Multiple Imputation of Missing Values in Software Measurement Data , International Journal of Software Measurement 1 (1) : 1 ~ 12

  • 처음
  •  
  • 이전
  •  
  • 1
  •  
  • 2
  •  
  • 다음
  •  
  • 마지막
인용된 논문 (0)

알림서비스 신청하고 '인용된 논문' 정보를 메일로 확인 하세요!

해당 논문은 인용된 논문 정보가 없습니다.

제 1 저자의 다른 논문 (0)

해당 논문은 제 1저자의 다른 논문 정보가 없습니다.

권호 내 다른 논문 (11)

정보과학회논문지 : 소프트웨어 및 응용 제36권 제4호 의 상세정보를 확인해 보세요.

  • 처음
  •  
  • 이전
  •  
  • 1
  •  
  • 2
  •  
  • 다음
  •  
  • 마지막
추천 논문 (10)

DBpia 추천논문과 함께 다운받은 논문을 제공합니다. 논문 초록의 텍스트마이닝과 이용 및 인용 관계 분석을 통해 추천해 드리는 연관논문을 확인해보세요.

DBpia 추천논문

더 많은 추천논문을 확인해 보세요!

지표

이용현황

· 이용수

· 이용순위 상위 Top3

자세히 보기 >
No 상위 이용이관 이용수
1 한국과학기술원 16
2 고려대학교 13
3 전남대학교 12

활용도

· 활용지수

· 논문의 활용도 추이 (주제분야 기준)

자세히 보기 >

: %

2016-09
2016-10
2016-11
2016-12
0
20
40
60
80
100
  • 0%
  • 20%
  • 40%
  • 60%
  • 80%
  • 100%

인용수

상세정보
저작권 정책

누리미디어에서 제공되는 모든 저작물의 저작권은 원저작자에게 있으며, 누리미디어는 각 저작물의 내용을 보증하거나 책임을 지지 않습니다. 단, 누리미디어에서 제공되는 서지정보는 저작권법에 의해 보호를 받는 저작물로, 사전 허락 없이 임의로 대량 수집하거나 프로그램에 의한 주기적 수집 이용, 무단 전재, 배포하는 것을 금하며, 이를 위반할 경우, 저작권법 및 관련법령에 따라 민, 형사상의 책임을 질 수 있습니다.

맨 위로 이동
  • 개인회원으로 로그인하셔야 이용이 가능합니다.
  •  개인회원
  •  기관회원
  • 소속기관
  • 아이디
  • 비밀번호
  • 개인회원가입으로 더욱 편리하게 이용하세요. 일반회원 가입하기

    아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기