4차 산업혁명 시대의 도래에 따라 호텔산업 패러다임도 변화하고 있다. 이러한 패러다임의 변화 속에 4차 산업혁명의 궁극적인 목적은, 사람과 사물 그리고 공간을 연결하여 자동화뿐만 아니라 지능화된 의사결정으로 인간의 움직임과 조직 시스템 그리고 인간 본성의 욕구를 해결시키는데 있다. 이러한 환경의 변화는 정보통신 기술과 연계하는 산업의 혁명이 가장 중요한 핵심 개념이므로 고객의 니즈를 최우선으로 하는 호텔 분야에서도 4차 산업혁명 시대를 다른 분야와 함께 개척해 나아가야 한다. 인간 본성의 욕구를 파악하는 방법으로 아직 학계에서는 설문조사 방법을 활용하고 있으나 이 방법은 샘플링 오류 등의 문제와 설문조사의 한계점 등이 존재한다. 이러한 문제를 벗어나기 위해 빅데이터를 이용하여 분석한 본 연구는 새로운 호텔 품질 속성과 외래 관광객들의 호텔 이용에 대한 만족과 불만족 등 의견을 활용하여 폭 넓은 고객의 요구를 분석할 수 있게 되었다. 따라서 이러한 시대 흐름에 맞게 다양한 고객들이 자유롭게 호텔에 대한 감정과 태도 및 의견을 보여주는 사용자 리뷰를 활용한 연구는 매우 시의적절하다고 할 수 있다. 국내호텔을 방문한 외래 관광객들이 자발적으로 기록한 온라인 리뷰는 다양한 의미를 담고 있으며 그들의 니즈를 솔직하게 보여주는 것이므로 외래 관광객들의 리뷰와 평점을 분석하는 연구는 국내 호텔에 개선방향을 제시할 수 있을 것이다. 그러므로 본 연구는 호텔 이용 고객이 온라인상에 기록한 리뷰에 담긴 의미를 분석하여 의미 있는 결과를 도출하고 고객 평점 만족도와의 관계도 분석하였다. 이러한 영향관계를 파악하기 위해 리뷰에 대한 감성분석을 활용하였다. 이러한 연구 목적을 달성하기 위하여 국내?외 문헌 고찰을 통하여 호텔 품질 속성, 호텔의 가격 품질, 객실 품질, 서비스 품질, 위치 품질, 청결 품질, 수면 품질, 온라인 리뷰, 고객 만족 등에 관련된 탐구를 하였고, 공학적 접근을 위해 웹 크롤링, 데이터마이닝, 텍스트 마이닝, 오피니언 마이닝, 감성사전, 감성분석 등에 관련된 문헌 고찰도 하였다. 먼저 가장 적합하고 글로벌한 호텔 관광 커뮤니티를 TripAdvisor로 선정하고 분석하였다. 해당 커뮤니티에 등록된 고객이 남긴 리뷰와 평점 등을 수집하고 리뷰 내용에 대해 텍스트 마이닝을 하였다. 리뷰 데이터를 활용하여 감성사전을 구축하였고 감성분석을 통하여 감성 값을 도출하는데 가장 적합한 단어의 계수 값을 구하였다. 감성에 대한 단어의 계수를 이용하여 극성 값 즉, 리뷰의 감성에 대한 만족도를 계산하였다. 이를 이용하여 리뷰에 대한 만족의 극성값과 고객이 부여한 평점 만족도와의 영향 관계를 확인하였다. 본 연구에 필요한 많은 온라인 리뷰를 수집하기 위하여 Python으로 개발하여 데이터를 수집하는 방식을 채택하였다. 텍스트 마이닝과 통계분석을 위하여 Python과 R program을 사용하였다. 분석 자료는 국내 호텔을 유형별로 나누어 서울에 있는 비즈니스호텔 5개, 제주의 리조트호텔 5개, 인천의 공항호텔 5개에서 총 11,240개를 선정하였다. 본 연구에서 제시한 연구 문제에 대한 실증 결과를 정리하면 다음과 같다. 첫째, 본 연구에서 채택한 엘라스틱 넷 회귀분석(Elastic net regression)의 감성분석 정확도는 97.2%, Kappa는 94.4%(p=0.000)의 값으로 유의미한 결과가 나타났다. 이는 감성사전으로 구축한 만족과 불만족의 단어 분류는 유의미하게 구분되었다는 것을 의미하며 동시에 회귀분석으로 나타난 단어들에 대한 계수 값은 감성 영향력으로 볼 수 있다. 높은 정확도를 고려할 때 호텔 분야에서 활용 가능한 감성사전이 구축되었고 이는 유의미한 것으로 검증되었다. 둘째, 온라인 리뷰에 대한 감성분석 결과로 얻은 만족에 대한 극성값은 고객의 평점에 영향을 미치는 것으로 나타났다. 온라인 리뷰 분석은 평점을 설명할 수 있게 되었다. 게다가 평점만으로는 분석할 수 없는 고객들의 의견이 많이 내포되어있는 온라인 리뷰는 예비 고객뿐만 아니라 호텔 경영자에게도 매우 중요하다는 것이 입증되었다. 특히 호텔 기업 입장에서는 높은 평점을 받았다 하더라도 리뷰 내용을 반드시 검토하고 더 감사한 마음으로 그들의 의견을 접수하고 개선해야만 한다는 사실이다. 셋째, 호텔의 부문별 품질 속성들에 대한 리뷰의 감성 만족에 대한 극성값은 전체 평점 만족도에 모두 정(+)의 영향을 미친다는 유의미한 결과가 나타났다. 이것을 통하여 모든 호텔 품질 속성들은 전부 중요하며 어느 것 하나 소홀할 수 없다는 것을 확인할 수 있었다. 본 연구는 감성분석을 활용하여 외래 관광객들의 국내 호텔 온라인 리뷰가 고객의 감성과 의견을 파악할 수 있는 매우 중요한 정보이며 이는 전체 평점과 깊은 관계가 있음을 보여 주었다. 따라서 다양한 의견과 감정이 담긴 온라인 리뷰는 호텔 기업에게 중요한 기업 정보가 됨을 알 수 있었으며, 본 연구를 통하여 제공된 감성분석을 활용한 과학적 방법은 호텔 기업들이 그동안 활용해 온 마케팅 활성화 방법보다 발전된 접근 방법이 될 것이다.
The paradigm of the hotel industry is also changing with the advent of the era of the fourth industrial revolution. In this paradigm change, the ultimate goal of the Fourth Industrial Revolution is to solve human movement, organizational system and desire of human nature through intelligent decision making as well as automation by linking people, things and space. The main key point of this environmental change is the industrial revolution linked with information and communication technology. Therefore, the hotel field where customer needs are the top priority should also develop the fourth industrial revolution era with other fields. As a method of grasping the desire of human nature, academics still use the survey method, but this method has several problems such as sampling error and limitations of the survey. This study has used Big Data to solve this problem so that it was able to analyze the needs of a wide range of customers by using new hotel quality attributes and opinions such as satisfaction level of foreign tourists’ hotel experience. Therefore, with the flow of this era, it is well-timed study that utilized various customers’ reviews which show the emotions, attitudes, and opinions of the hotel freely. Online reviews voluntarily recorded by foreign customers have a variety of meanings and their candidness is clearly shown. The study of analyzing these reviews and ratings of visitors will suggest ways to improve hotels in Korea. Therefore, this study analyzed the implications of the hotel user’s online reviews and found meaningful results with verifications of the relationship between customer’s rating and their comments. For this study, sentiment analysis regarding reviews was used for understanding impact relationships. In order to accomplish this research purpose, we studied regarding the properties of hotel attributes, hotel price quality, room quality, service quality, location quality, cleanliness quality, sleep quality, online review, and customer satisfaction through investigating domestic/foreign literature. We also reviewed various literature related to web crawling, data mining, text mining, opinion mining, natural language processing, sentiment dictionary, sentiment analysis for engineering approach. We selected and analyzed ‘TripAdvisor’ which is the most suitable and global hotel tourism community. We collected reviews and ratings from customers registered in the community and used text mining method through using the reviews. The sentiment dictionary was built using the review data, and sentiment analysis was performed to obtain coefficient values of the most suitable word for drawing emotional value. We calculated polarity values, which is emotional satisfaction of review using the coefficient of emotional words. For the purpose of this study, we have selected a method of collecting data by programming using Python to collect many online reviews. Python and R program were used for text mining and statistical analysis. 11,240 samples which are from 5 business hotels in Seoul, 5 resort hotels in Jeju-island, and 5 airport hotels in Incheon were used for the analysis data. The result of this study is summarized as follows. Firstly, from the sentiment analysis of the Elastic Net regression analysis, accuracy is 97.2%, Kappa is 94.4%, and the p-value is 0.000 which is significant results. This means that the classification of satisfaction and dissatisfaction words that are built using sentiment dictionary is significantly distinguished, and at the same time, the coefficient value regarding the words represented by regression analysis can be shown as emotional influences. Based on the consideration of high accuracy, the sentiment dictionary which is effectively useful in the hotel fields is built and it is also proved that this dictionary is meaningful significantly. Secondly, the satisfaction level from the sentiment analysis result regarding the online review has an effect on the customer’s rating. An online review analysis can describe the rating. However, it is proved that online reviews with a lot of comments that cannot be only analyzed using rating are not only important for prospective customers but also for hotel managers. Especially, hotel companies must analyze customers’ reviews and accept their opinion with appreciative minds to improve hotel service even though they get a high rating. Thirdly, the emotional satisfaction level of the review on selection attributes of each type of hotels showed significant positive effects on the overall rating satisfaction level. Through this result, it is confirmed that all hotel selection attributes are important and none of it can be neglected. Scientific methods from this study will be a chance for further improvement of hotel companies. This study using sentiment analysis shows that online review is very important information for understanding customer’s emotions and their opinions through foreigners’ online review after using domestic hotels, and it is also related to overall ratings. Through online reviews with a variety of opinions and emotions, this study gives important corporate information to the hotel companies that they are required to have an effort to improve their service.
제 1 장 서론 1제 1 절 연구의 배경 및 문제제기 1제 2 절 연구의 목적 및 필요성 5제 3 절 연구의 내용 및 범위 8제 4 절 연구의 구성 및 체계 11제 2 장 이론적 배경 13제 1 절 호텔품질속성 131. 서비스 품질의 개념 132. 호텔 서비스 품질속성 143. 호텔 부문별 품질속성 181) 가격 품질(Value Quality) 192) 객실 품질(Room Quality) 213) 서비스 품질(Service Quality) 224) 위치 품질(Location Quality) 235) 청결 품질(Cleanliness Quality) 266) 수면 품질(Sleep Quality) 27제 2 절 고객만족 321. 고객만족 개념 332. 호텔 서비스 품질과 고객만족 37제 3 절 빅데이터와 감성분석 391. 설문조사와 빅데이터 391) 설문조사 392) 빅데이터 403) 웹크롤링 422. 온라인 리뷰 451) 온라인 리뷰의 특징 452) SNS 및 온라인 리뷰와 평점 463) TripAdvisor의 온라인 리뷰 활용 및 분석 493. 오피니언 마이닝 531) 데이터 마이닝 542) 텍스트 마이닝 553) 오피니언 마이닝 614. 감성분석 621) 감성의 개념 622) 감성분석 633) 감성분석의 선행연구 654) 감성사전 71제 3 장 연구 방법 76제 1 절 연구 과제 76제 2 절 조사 방법 781. 표본 및 수집방법 782. 감성분석의 극성값과 평점 만족도 79제 3 절 분석 방법 821. 분석절차의 개요 822. 웹 크롤러(Web Crawler)를 통한 자료수집 853. 자료 전처리(Data Preprocessing) 914. 자료 수치화 925. 통계분석 방법 95제 4 장 실증 분석 96제 1 절 표본의 특성 971. 표본의 인구통계적 특성 972. 표본의 호텔 유형별 인구통계적 특성 993. 표본의 고객 평가에 대한 특성 103제 2 절 연구과제를 위한 기초 분석 1041. TF-IDF를 활용한 단어 빈도분석 1042. 감성사전 구축 115제 3 절 연구과제 분석 1181. 감성분석 1182. 리뷰의 만족 극성값과 평점만족도의 관계 126제 4 절 분석결과의 해석 136제 5 장 결론 140제 1 절 연구의 요약 140제 2 절 연구의 시사점 1421. 이론적 시사점 1422. 실무적 시사점 144제 3 절 연구의 한계 및 향후 연구 방향 149참고문헌 1521. 국내문헌 1522. 국외문헌 162Abstract 185