Aquí te explicamos el paso a paso que realizamos en el análisis titulado ‘El precio del inquilino temporal en CDMX: la diferencia entre renta tradicional y Airbnb’.

    A. Descargar la base de datos pública de los anuncios en Airbnb disponible en InsideAirbnb con la fecha más reciente. Para poder analizar esta base de datos ser realizó el siguiente proceso de limpieza y procesamiento:

    1. Filtrar a la variable ‘room_type’ para seleccionar únicamente aquellos anuncios descritos como ‘Entire home/apt’ (casa/apartamento entero) y descartar aquellos que son cuartos de habitaciones u otro tipo de alojamientos; con este filtro.
    2. Geolocalizar la ubicación de los anuncios con ‘latitude’ y ‘longitude’ para saber en qué colonia y alcaldía está ubicado cada anuncio. Para esto, se utilizó la delimitación territorial de las colonias de la Ciudad de México por el Instituto Nacional Electoral); por esa razón algunas colonias conocidas generalmente con un solo nombre, aparecen subdivididas en varios. Por ejemplo, Doctores en Cuauhtémoc se divide en Doctores I, Doctores II, Doctores III, Doctores IV y Doctores V. 
    3. Detectar si el anuncio es de una casa o un departamento, mediante una función que permite detectar las palabras clave dentro de una celda y asignarle una categoría (Casa o departamento), a partir de palabras clave. 

    Departamentos agrupa los anuncios que contienen: penthouse, flat, pent house, loft, apt, departamento, apartment, dpto, depto, ph, apartamento, studio, condo, dep.

    Casa agrupa los anuncios que contienen: house, townhouse, casa, home. 

    1. Detectar errores en la función y corregirla. Realizar el proceso anterior por segunda vez, comparar los resultados, y limpiar los errores que persisten de forma manual.
    2. Limpiar los outliers o valores anómalos de precios mediante la función de percentiles, que indica en una escala del 1 al 100 en qué punto se encuentra una cifra dentro de una muestra de datos. Seleccionar aquellos anuncios que se encontraran entre el percentile 1 y 99, descartando los posibles valores anómalos hacia arriba y abajo de la muestra de datos.
    3. Multiplicar el precio por noche (columna ‘price’) por 30 noches para tener el precio mensual estimado de un Airbnb. En este cálculo no se contemplan descuentos, tarifas administrativas ni de limpieza, porque pueden variar de un alojamiento a otro. Por eso se dice que el precio mensual de la renta de estos alojamientos es un estimado.
    4. Determinar un precio promedio por cada colonia.

    B. Descargar la base de datos de los anuncios de viviendas en renta publicadas en Trovit y aplicar los pasos 2, 5 y 7 para tener lista la base de datos.

    C. Unir los resultados de ambas bases de datos con el objetivo de comparar los precios en Airbnb y el mercado de rentas tradicional.

    D. Realizar la siguiente operación para determinar la diferencia de precio en ambas colonias: ((precio promedio mensual airbnb – precio promedio mensual trovit)/ (precio promedio mensual trovit)) *100.

    E. Determinar una cantidad de anuncios mínima que debe tener una colonia para ser incluida en el análisis final, filtrando aquellas colonias que no cuentan con una muestra representativa en ‘recuento precio mensual airbnb’ y ‘recuento precio mensual trovit’. 

    F. Como resultado de este último filtro, quedan 135 colonias que cumplen los requisitos para ser incluidas en el análisis final de departamentos, y 11 colonias en el de casas.