Los 31 tipos de datos que se encuentran en el dataset llamado “hotel_bookings.csv” provienen de dos hoteles, el primero que es un hotel resort (H1) y el segundo que es un city hotel (H2). El primero proporciono 40 060 observaciones, mientras que el segundo 79 330 observaciones. Esos datos fueron adquiridos por medio de la extracción de la base de datos SQL hotels’ Property Management System (PMS). Por otro lado, estos dos hoteles se encuentran en Portugal. H1 está en la región turística de Algarve y H2 en la ciudad Lisboa.
Estos datos comprenden todas las reservas que empezaron el 1 de julios de 2015 hasta el 31 de agosto 2017.
Este tipo de datos son importantes para investigadores, investigadores de maching learning y educadores, ya que al realizar el análisis de estos datos podrán comprender mejor los patrones, tendencias, las anomalías en los datos y aprender de estos.
En el sector de las empresas de viaje y turismo, las cuales se concentran en la hospitalidad, los cruceros, los parques temáticos, etc. A estas, se les dificulta mucho explorar sus datos, debido a que poseen requisitos y particularidades diferentes, que necesitan datos específicos de la empresa. Pero gracias, a la data de H1 y H2 pueden ayudar a superar esa valla.
Estos datos también pueden ser utilizados para el desarrollo de modelos de predicción para clasificar la probabilidad de cancelación de una reserva de hotel. Esto con el fin mejorar las reservas de hotel, de esta manera aumentando la eficiencia de los hoteles. También tenemos otras investigaciones como la segmentación de clientes, estacionalidad,etc.
En cuanto a los investigadores, estos pueden usar los datos para comparar modelos de predicción de cancelación de reservas con otros ya conocidos. Esto para realizar mejoras o evitar errores.
Los que investigan el maching learning, pueden usar los datos para conocer la eficiencia de diferentes algoritmos hacia distintos problemas.
Y finalmente los educadores, pueden usar los datos para obtener capacitación de data mining. Además, pueden usarlo para realizar problemas de segmentación.