Прогнозирование отмены бронирования отелей: сравнительная характеристика спецификаций моделей

Авторы

  • Елена Ивановна Русакова Национальный исследовательский университет «Высшая школа экономики», Пермский филиал https://orcid.org/0000-0001-7229-9097
  • Марина Владимировна Радионова Пермский государственный национальный исследовательский университет https://orcid.org/0000-0002-8339-3326

DOI:

https://doi.org/10.17072/1994-9960-2021-4-327-345

Аннотация

Неотъемлемой частью любой поездки является бронирование номера в отеле. В связи с этим за последние годы существенно возросла популярность и востребованность туристических онлайн-агентств, позволяющих клиентам сократить время и издержки прямой коммуникации с отелем, а также без штрафов и комиссий отменить бронирование. Рост количества отмен бронирований, наблюдаемый в последние несколько лет, негативно сказывается на финансовом положении и репутации отелей, которые в целях сокращения данных рисков вынуждены применять жесткую политику бронирования и стратегии овербукинга. Особую актуальность данная проблема имеет сегодня в связи с существенным сокращением туристического потока вследствие пандемии коронавируса. Решению проблемы будет способствовать разработка моделей прогнозирования отмены бронирования отелей с высокими показателями достоверности и точности прогноза. Обзор существующих решений показал, что наилучшие результаты прогнозирования обеспечивают следующие методы машинного обучения: случайный лес (Random Forest), нейронные сети, CatBoost и XGBoost. В связи с вышесказанным целью исследования является построение различных моделей прогнозирования отмены бронирования отелей на основе методов машинного обучения и их сравнительный анализ для обоснования выбора наилучшей модели при помощи метрик Accuracy, Precision, Recall, F-меры и площади под ROC-кривой. Информационную базу исследования составил набор данных “Hotel Booking Demand Dataset”, подготовленный N. Antonio, A. de Almeida и L. Nunes и опубликованный на портале ScienceDirect. В ходе исследования определено, что модель случайного леса (Random Forest) наилучшим образом предсказывает отмену бронирования отелей. В частности, на тестовой выборке данная модель показала процент правильных ответов среди всех прогнозов – 84,5 %; процент бронирований, названных классификатором отмененными и при этом действительно являющихся отмененными, – 87,3 %. В перспективе целесообразно совершенствование модели случайного леса и других моделей машинного обучения посредством включения дополнительных, ранее не учтенных гиперпараметров.

Ключевые слова

бронирование отеля, методы прогнозирования отмены бронирования, методы машинного обучения, случайный лес, нейронная сеть, CatBoost классификация, XGBoost классификация, прогнозирование.

Для цитирования

Русакова Е.И., Радионова М.В. Прогнозирование отмены бронирования отелей: сравнительная  характеристика спецификаций моделей // Вестник Пермского университета. Сер. «Экономика». 2021.  Том 16. № 4. С. 327–345. DOI 10.17072/1994-9960-2021-4-327-345

Список литературы

1. Smith S.J., Parsa H.G., Bujisic M., van der Rest J-P. Hotel cancelation policies, distributive and procedural fairness, and consumer patronage: A study of the lodging industry // Journal of Travel and Tourism Marketing. 2015. № 32 (7). P. 886–906. doi: 10.1080/10548408.2015.1063864.
2. Talluri K.T., van Ryzin G.J. The theory and practice of revenue management. NY: Kluwer Academic Publishers. 2004. 745 p.
3. Chen C.-C., Schwartz Z., Vargas P. The search for the best deal: How hotel cancellation policies affect the search and booking decisions of deal-seeking customers // International Journal of Hospitality Management. 2011. № 30 (1). P. 129–135. doi: 10.1016/j.ijhm.2010.03.010.
4. Huang H.-C., Chang A. Y., Ho C.-C. Using artificial neural networks to establish a customer-cancellation prediction model // Przeglad Elektrotechniczny. 2013. № 89 (1b). P. 178–180.
5. Yoon M.G., Lee H.Y., Song Y.S. Linear approximation approach for a stochastic seat allocation problem with cancellation and refund policy in airlines // Journal of Air Transport Management. 2012. № 23. P. 41–46.
6. Antonio N., Almeida A., Nunes L. Predicting hotel booking cancellations to decrease uncertainty and increase revenue // Tourism and Management Studies. 2017. № 13 (2). P. 25–39. doi: 10.18089/tms.2017.13203.
7. Zeytinci E. Predicting hotel reservation cancellations with machine learning. 2019. URL: https://towardsdatascience.com/predicting-hotel-cancellations-with-machine-learning-fa669f93e794 (дата обращения: 29.02.2021).
8. Wingen M. EDA of bookings and ML to predict cancelations. URL: https://www.kaggle.com/marcuswingen/eda-of-bookings-and-ml-to-predict-cancelations (дата обращения: 30.06.2021).
9. Denyse T. Learning Pitstop: Predicting hotel booking cancellations using Classification Techniques. 2020. URL: https://medium.com/tech4she/investigating-factors-affecting-hotel-booking-cancelations-9ec9bf81b0a8 (дата обращения: 20.06.2021).
10. Michta M., Wojciechowski K. Story hotel booking cancellations: eXplainable predictions for booking cancellation. URL: https://pbiecek.github.io/xai_stories/story-hotel-booking-cancellations-explainable-predictions-for-booking-cancellation.html#bias-correction (дата обращения: 10.05.2021).
11. Banza M. Predicting hotel booking cancellations using machine learning – Step by step guide with real data and python. 2020. URL: https://www.hospitalitynet.org/opinion/4099297.html (дата обращения: 30.06.2021).
12. Kelman J. Predicting hotel booking cancellations using customer segmentation and neural networks. 2020. URL: https://medium.com/@julkel/predicting-hotel-booking-cancellations-using-customer-segmentation-and-neural-networks-8a31c2755f5c (дата обращения: 30.06.2021).
13. Antonio N., Almeida A., Nunes L. Hotel booking demand datasets // Data in Brief. 2019. Vol. 22. P. 41–49. doi: 10.1016/j.dib.2018.11.126.
14. Breiman L. Random forest // Machine Learning. 2001. Vol. 45. P. 5–32. doi: 10.1023/A:1010933404324.
15. Morde V. XGBoost algorithm: Long may she reign! 2019. URL: https://towardsdatascience.com/https-medium-com-vishalmorde-xgboost-algorithm-long-she-may-rein-edd9f99be63d (дата обращения: 25.07.2021).
16. Dorogush A.V., Ershov V., Gulin A. CatBoost: Gradient boosting with categorical features support // Workshop on ML Systems at NIPS. 2017.
17. Sharma A.V. Understanding activation functions in neural networks. 2017. URL: https://medium.com/the-theory-of-everything/understanding-activation-functions-in-neural-networks-9491262884e0 (дата обращения: 30.06.2021).
18. Powers D.M.W. Evaluation: From Precision, Recall and F-Factor to ROC, Informedness, Markedness and Correlation // Journal of Machine Learning Technologies. 2011. Vol. 2, Iss. 1. P. 37–63.

Показать весь текст

Сведения об авторах

  • Елена Ивановна Русакова, Национальный исследовательский университет «Высшая школа экономики», Пермский филиал

    Факультет экономики, менеджмента и бизнес-информатики

  • Марина Владимировна Радионова, Пермский государственный национальный исследовательский университет

    Кандидат физико-математических наук, доцент, доцент кафедры информационных систем и математических методов в экономике

Загрузки

Опубликован

30.12.2021

Выпуск

Раздел

Экономико-математическое моделирование