Прогнозирование отмены бронирования отелей: сравнительная характеристика спецификаций моделей

  • Elena Ivanovna Rusakova Национальный исследовательский университет «Высшая школа экономики», Пермский филиал http://orcid.org/0000-0001-7229-9097
  • Marina Vladimirovna Radionova Пермский государственный национальный исследовательский университет http://orcid.org/0000-0002-8339-3326

Аннотация

Неотъемлемой частью любой поездки является бронирование номера в отеле. В связи с этим за последние годы существенно возросла популярность и востребованность туристических онлайн-агентств, позволяющих клиентам сократить время и издержки прямой коммуникации с отелем, а также без штрафов и комиссий отменить бронирование. Рост количества отмен бронирований, наблюдаемый в последние несколько лет, негативно сказывается на финансовом положении и репутации отелей, которые в целях сокращения данных рисков вынуждены применять жесткую политику бронирования и стратегии овербукинга. Особую актуальность данная проблема имеет сегодня в связи с существенным сокращением туристического потока вследствие пандемии коронавируса. Решению проблемы будет способствовать разработка моделей прогнозирования отмены бронирования отелей с высокими показателями достоверности и точности прогноза. Обзор существующих решений показал, что наилучшие результаты прогнозирования обеспечивают следующие методы машинного обучения: случайный лес (Random Forest), нейронные сети, CatBoost и XGBoost. В связи с вышесказанным целью исследования является построение различных моделей прогнозирования отмены бронирования отелей на основе методов машинного обучения и их сравнительный анализ для обоснования выбора наилучшей модели при помощи метрик Accuracy, Precision, Recall, F-меры и площади под ROC-кривой. Информационную базу исследования составил набор данных “Hotel Booking Demand Dataset”, подготовленный N. Antonio, A. de Almeida и L. Nunes и опубликованный на портале ScienceDirect. В ходе исследования определено, что модель случайного леса (Random Forest) наилучшим образом предсказывает отмену бронирования отелей. В частности, на тестовой выборке данная модель показала процент правильных ответов среди всех прогнозов – 84,5 %; процент бронирований, названных классификатором отмененными и при этом действительно являющихся отмененными, – 87,3 %. В перспективе целесообразно совершенствование модели случайного леса и других моделей машинного обучения посредством включения дополнительных, ранее не учтенных гиперпараметров.

Ключевые слова

бронирование отеля, методы прогнозирования отмены бронирования, методы машинного обучения, случайный лес, нейронная сеть, CatBoost классификация, XGBoost классификация, прогнозирование.

Список литературы

1. Smith S.J., Parsa H.G., Bujisic M., van der Rest J-P. Hotel cancelation policies, distributive and procedural fairness, and consumer patronage: A study of the lodging industry // Journal of Travel and Tourism Marketing. 2015. № 32 (7). P. 886–906. doi: 10.1080/10548408.2015.1063864.
2. Talluri K.T., van Ryzin G.J. The theory and practice of revenue management. NY: Kluwer Academic Publishers. 2004. 745 p.
3. Chen C.-C., Schwartz Z., Vargas P. The search for the best deal: How hotel cancellation policies affect the search and booking decisions of deal-seeking customers // International Journal of Hospitality Management. 2011. № 30 (1). P. 129–135. doi: 10.1016/j.ijhm.2010.03.010.
4. Huang H.-C., Chang A. Y., Ho C.-C. Using artificial neural networks to establish a customer-cancellation prediction model // Przeglad Elektrotechniczny. 2013. № 89 (1b). P. 178–180.
5. Yoon M.G., Lee H.Y., Song Y.S. Linear approximation approach for a stochastic seat allocation problem with cancellation and refund policy in airlines // Journal of Air Transport Management. 2012. № 23. P. 41–46.
6. Antonio N., Almeida A., Nunes L. Predicting hotel booking cancellations to decrease uncertainty and increase revenue // Tourism and Management Studies. 2017. № 13 (2). P. 25–39. doi: 10.18089/tms.2017.13203.
7. Zeytinci E. Predicting hotel reservation cancellations with machine learning. 2019. URL: https://towardsdatascience.com/predicting-hotel-cancellations-with-machine-learning-fa669f93e794 (дата обращения: 29.02.2021).
8. Wingen M. EDA of bookings and ML to predict cancelations. URL: https://www.kaggle.com/marcuswingen/eda-of-bookings-and-ml-to-predict-cancelations (дата обращения: 30.06.2021).
9. Denyse T. Learning Pitstop: Predicting hotel booking cancellations using Classification Techniques. 2020. URL: https://medium.com/tech4she/investigating-factors-affecting-hotel-booking-cancelations-9ec9bf81b0a8 (дата обращения: 20.06.2021).
10. Michta M., Wojciechowski K. Story hotel booking cancellations: eXplainable predictions for booking cancellation. URL: https://pbiecek.github.io/xai_stories/story-hotel-booking-cancellations-explainable-predictions-for-booking-cancellation.html#bias-correction (дата обращения: 10.05.2021).
11. Banza M. Predicting hotel booking cancellations using machine learning – Step by step guide with real data and python. 2020. URL: https://www.hospitalitynet.org/opinion/4099297.html (дата обращения: 30.06.2021).
12. Kelman J. Predicting hotel booking cancellations using customer segmentation and neural networks. 2020. URL: https://medium.com/@julkel/predicting-hotel-booking-cancellations-using-customer-segmentation-and-neural-networks-8a31c2755f5c (дата обращения: 30.06.2021).
13. Antonio N., Almeida A., Nunes L. Hotel booking demand datasets // Data in Brief. 2019. Vol. 22. P. 41–49. doi: 10.1016/j.dib.2018.11.126.
14. Breiman L. Random forest // Machine Learning. 2001. Vol. 45. P. 5–32. doi: 10.1023/A:1010933404324.
15. Morde V. XGBoost algorithm: Long may she reign! 2019. URL: https://towardsdatascience.com/https-medium-com-vishalmorde-xgboost-algorithm-long-she-may-rein-edd9f99be63d (дата обращения: 25.07.2021).
16. Dorogush A.V., Ershov V., Gulin A. CatBoost: Gradient boosting with categorical features support // Workshop on ML Systems at NIPS. 2017.
17. Sharma A.V. Understanding activation functions in neural networks. 2017. URL: https://medium.com/the-theory-of-everything/understanding-activation-functions-in-neural-networks-9491262884e0 (дата обращения: 30.06.2021).
18. Powers D.M.W. Evaluation: From Precision, Recall and F-Factor to ROC, Informedness, Markedness and Correlation // Journal of Machine Learning Technologies. 2011. Vol. 2, Iss. 1. P. 37–63.

Сведения об авторах

Elena Ivanovna Rusakova, Национальный исследовательский университет «Высшая школа экономики», Пермский филиал

Елена Ивановна Русакова – студентка факультета экономики, менеджмента и бизнес-информатики, Национальный исследовательский университет «Высшая школа экономики», Пермский филиал (Россия, 614070, г. Пермь, ул. Студенческая, 38; e-mail: elena.rusakova.2000@mail.ru).

Marina Vladimirovna Radionova, Пермский государственный национальный исследовательский университет

Марина Владимировна Радионова – кандидат физико-математических наук, доцент, доцент кафедры информационных систем и математических методов в экономике, Пермский государственный национальный исследовательский университет (Россия, 614990, г. Пермь, ул. Букирева, 15; e-mail: m.radionova812@gmail.com).

Опубликована
2021-12-30
Как цитировать
Rusakova E.I., Radionova M.V. Прогнозирование отмены бронирования отелей: сравнительная характеристика спецификаций моделей // Вестник Пермского университета. Серия «Экономика» = Perm University Herald. ECONOMY. 2021. Том 16. № 4. С. 327-345. doi: 10.17072/1994-9960-2021-4-327-345
Раздел
Математические, статистические и инструментальные методы в экономике