본 논문에서는 페이스북 사용자들의 공개된 정보만으로, 그들의 출생지 정보를 추론할 수 있음을 보인다. 다양한 기계학습 알고리즘 및 노출 정보들의 조합을 통한 실험을 통해, 지지벡터기계 알고리즘 및 졸업고등학교소재지, 현 주소, 고등학교 졸업연도가 추론의 가장 최적의 성능을 나타냄을 발견하였고, 약 78%의 출생지 정보를 추론할 수 있었다. 출생지 정보는 패스워드 분실시 복구에 사용되는 질문에 자주 사용되고, 또한 주민등록번호의 일부를 이루는 중요한 정보이므로, 사용자들은 이러한 사실에 주의하여 페이스북을 사용하는 것이 필요하다.
This paper shows the users’ birthplace information can be inferred with only the public information in FaceBook SNS. Through experiments with various machine learning algorithms and various parameters, we have found that SVM algorithm with the location of the highschool, the current address, and the graduate year of highschool performs best for the inference, as this can infer 78% of users’ birthplaces correctly. Since the birthplace information is used for various security purpose such as questions for getting the forgotten password and a part of korean residence registration number, this is a non-trival security breach and users need be cautious about it.