Determinantes del precio de la vivienda en Sevilla: un enfoque interpretativo con aprendizaje automático

Autores/as

Resumen

Este artículo analiza los factores asociados al precio de oferta de los apartamentos en la ciudad de Sevilla. Para ello se utiliza una base de datos de 1.710 anuncios recopilados en línea, incorporando características estructurales de las viviendas, indicadores socioeconómicos a nivel de sección censal y variables de proximidad a servicios locales. Se estiman dos modelos: una regresión hedónica mediante mínimos cuadrados ordinarios (MCO) y un modelo de random forest. Los resultados muestran que random forest alcanza un desempeño predictivo superior, reduciendo tanto el error absoluto medio como el error cuadrático medio respecto del modelo lineal. Además, el uso de técnicas de interpretabilidad (valores SHAP, curvas ICE y gráficos PDP) permite examinar la contribución de cada atributo en la predicción del precio. Las variables socioeconómicas (como la renta media y la proporción de población con estudios superiores) desempeñan un papel central en la variación espacial del precio de oferta, junto con las características estructurales de la vivienda. El estudio destaca la utilidad de combinar enfoques hedónicos con herramientas de aprendizaje automático para comprender mejor los determinantes del valor residencial en mercados urbanos.

Palabras clave:

aprendizaje automático , mercado inmobiliario , modelo hedónico , vivienda , Sevilla (España)

Biografía del autor/a

Emiliano Gutiérrez, Universidad Nacional del Sur

Dr. Universidad Nacional del Sur (Argentina).
Profesor Departamento de Economía, Universidad Nacional del Sur.
Investigador postdoctoral, Instituto de Ciencias e Ingeniería de la Computación-Consejo Nacional de Investigaciones Científicas y Técnicas Universidad Nacional del Sur.

Lorena Caridad López del Río, Universidad de Sevilla

PhD Universidad de Córdoba (España)
Profesora del Departamento de Economía Financiera y Dirección de Operaciones, Universidad de Sevilla.

José María Caridad Ocerín, iManagement & Tourism

PhD Universidad de Sevilla (España), PhD hc Technical University of Ostrava (República Checa).

Citas

Baldominos, A., Blanco, I., Moreno, A. J., Iturrarte, R., Bernárdez, Ó., y Afonso, C. (2018). Identifying real estate opportunities using machine learning. Applied Sciences, 8(11), 2321. https://doi.org/10.3390/app8112321

Bengochea Morancho, A. (2003). A hedonic valuation of urban green areas. Landscape and Urban Planning, 66(1), 35-41. https://doi.org/10.1016/S0169-2046(03)00093-8

Breiman, L. (2001). Random forest. Machine Learning, 45, 5-32. https://doi.org/10.1023/A:1010933404324

Caridad, J. M. y Ceular, N. (2001). Un análisis del mercado de la vivienda a través de redes neuronales artificiales. Estudios de Economía Aplicada, (18), 67-81.

Caridad, J. M. y Ceular, N. (2004). Determinación de los precios implícitos en bienes inmuebles: una alternativa a la modelización hedónica. Revista de Estudios Regionales, (71), 85-105. http://www.revistaestudiosregionales.com/documentos/articulos/pdf800.pdf

Caridad, J. M., Nuñez, J. M. N., y Ceular, N. C. (2008). Metodología de precios hedónicos vs. redes neuronales artificiales como alternativas a la valoración de inmuebles. Un caso real. CT: Catastro, (62), 27-42. https://www.catastro.hacienda.gob.es/documentos/publicaciones/ct/ct62/ct62_3.pdf

Cespedes-Lopez, M. F., Mora-Garcia, R. T., Perez-Sanchez, V. R., y Marti-Ciriquian, P. (2020). The influence of energy certification on housing sales prices in the province of Alicante (Spain). Applied Sciences, 10(20), 7129. https://doi.org/10.3390/app10207129

Cespedes-Lopez, M. F., Perez-Sanchez, V. R., y Mora-Garcia, R. T. (2022). The influence of housing location on energy ratings price premium in Alicante, Spain. Ecological Economics, 201, 107579. https://doi.org/10.1016/j.ecolecon.2022.107579

Chica-Olmo, J. y Cano-Guervos, R. (2020). Does my house have a premium or discount in relation to my neighbors? A regression-kriging approach. Socio-Economic Planning Sciences, 72, 100914. https://doi.org/10.1016/j.seps.2020.100914

Cutler, A., Cutler, D. R., y Stevens, J. R. (2012). Random forests. En C. Zhang y Y. Ma (Eds.), Ensemble machine learning: Methods and applications (pp. 157-175). Springer. https://doi.org/10.1007/978-1-4419-9326-7_5

Deaconu, A., Buiga, A., y Tothăzan, H. (2022). Real estate valuation models performance in price prediction. International Journal of Strategic Property Management, 26(2), 86-105. https://doi.org/10.3846/ijspm.2022.15962

Díaz Parra, I. (2009). Procesos de gentrificación en Sevilla en la coyuntura reciente. Análisis comparado de tres sectores históricos: San Luis-Alameda, Triana y San Bernardo (2000-2006). Scripta Nova, 13(304). https://www.ub.edu/geocrit/sn/sn-304.htm

Echaves García, A. (2017). El difícil acceso de los jóvenes al mercado de vivienda en España: precios, regímenes de tenencia y esfuerzos. Cuadernos de Relaciones Laborales, 35(1), 127-149. https://doi.org/10.5209/CRLA.54986

Friedman, J. H. (2001). Greedy function approximation: a gradient boosting machine. Annals of Statistics, 29(5), 1189-1232. https://doi.org/10.1214/aos/1013203451

Friedman, J. H. y Popescu, B. E. (2008). Predictive learning via rule ensembles. The Annals of Applied Statistics, 2(3), 916-954. https://doi.org/10.1214/07-AOAS148

Garcia, A. F. (2006, 30 de agosto). Housing market in Malaga: An application of the hedonic methodology [ponencia en congreso]. 46th Congress of the European Regional Science Association: Enlargement, Southern Europe and the Mediterranean, Volos, Grecia. https://hdl.handle.net/10419/118208

Gila, A. y Novás, M. (2012). El uso del método hedónico para ajustar los cambios de calidad: la experiencia del IPV. Estadística Española, 54(179), 299-310.

Guijarro, F. (2019). Assessing the impact of road traffic externalities on residential price values: A case study in Madrid, Spain. International Journal of Environmental Research and Public Health, 16(24), 5149. https://doi.org/10.3390/ijerph16245149

Guijarro, F. (2023). Valoración automática de inmuebles residenciales mediante modelos de Machine Learning. Revista de Estudios Empresariales, (2), 27-40. https://doi.org/10.17561/ree.n2.2023.7823

Handbook on residential property price indices (RPPIs). (2013). Publications Office of the European Union. https://doi.org/10.1787/9789264197183-en

Hastie, T., Tibshirani, R., y Friedman, J. (2009). The elements of statistical learning. Springer. https://doi.org/10.1007/978-0-387-84858-7

Instituto Nacional de Estadística. (2017). Índice de precios de vivienda. Base 2015. Metodología. https://www.ine.es/daco/daco42/ipv/metodologia2015.pdf

Instituto Nacional de Estadística. (2021). Censo de población y viviendas 2021. https://ine.es/dynt3/inebase/es/index.htm?padre=8952&capsel=8953

Jover, J. y Díaz-Parra, I. (2022). Who is the city for? Overtourism, lifestyle migration and social sustainability. Tourism Geographies, 24(1), 9-32. https://doi.org/10.1080/14616688.2020.1713878

La nueva agenda urbana ilustrada en español. (2020). Centro Urbano, ONU-Habitat. https://onu-habitat.org/index.php/la-nueva-agenda-urbana-en-espanol

Lajer Baron, A., López Rodríguez, D., y San Juan, L. (2024). El mercado de la vivienda residencial en España: evolución reciente y comparación internacional. Documentos Ocasionales, (2433). https://doi.org/10.53479/37873

Lancaster, K. J. (1966). A new approach to consumer theory. Journal of Political Economy, 74(2), 132-157. https://doi.org/10.1086/259131

Lundberg, S. M. y Lee, S. I. (2017). A unified approach to interpreting model predictions. Advances in Neural Information Processing Systems, 30.

Marmolejo-Duarte, C., Espinoza-Zambrano, P., y Biere-Arenas, R. (2024). Cambios en el impacto de la eficiencia energética, la centralidad y la calidad arquitectónica sobre los valores plurifamiliares en Barcelona 2020-2023. Ciudad y Territorio Estudios Territoriales, 56(222), 1283-1306. https://doi.org/10.37230/CyTET.2024.222.10

Martínez Pagés, J. y Maza, L. Á. (2003). Análisis del precio de la vivienda en España. Banco de España. https://www.bde.es/wbe/es/publicaciones/analisis-economico-investigacion/documentos-trabajo/analisis-precio-vivienda-espana.html

McIlhatton, D., McGreal, W., Taltavul de la Paz, P., y Adair, A. (2016). Impact of crime on spatial analysis of house prices: evidence from a UK city. International Journal of Housing Markets and Analysis, 9(4), 627-647. https://doi.org/10.1108/IJHMA-10-2015-0065

Mejia Dorantes, L., Paez, A., y Vassallo, J. M. (2011). Analysis of house prices to assess economic impacts of new public transport infrastructure: Madrid metro line 12. Transportation Research Record: Journal of the Transportation Research Board, 2245(1), 131-139. https://doi.org/10.3141/2245-16

Molnar, C. (2020). Interpretable machine learning: A guide for making black box models explainable. LeanPub. https://christophm.github.io/interpretable-ml-book/

Montoriol Garriga, J. y Álvarez Ondina, P. (2025). El mercado residencial español se adentra en una nueva fase expansiva. CaixaBank. https://www.caixabankresearch.com/es/analisis-sectorial/inmobiliario/mercado-residencial-espanol-se-adentra-nueva-fase-expansiva

Mora-Garcia, R. T., Cespedes-Lopez, M. F., y Perez-Sanchez, V. R. (2022). Housing price prediction using machine learning algorithms in COVID-19 times. Land, 11(11), 2100. https://doi.org/10.3390/land11112100

Mora-Garcia, R. T., Cespedes-Lopez, M. F., Perez-Sanchez, V. R., Marti, P., y Perez-Sanchez, J. C. (2019). Determinants of the price of housing in the province of Alicante (Spain): Analysis using quantile regression. Sustainability, 11(2), 437. https://doi.org/10.3390/su11020437

Núñez Tabales, J. M., Rey Carmona, F. J., y Caridad y Ocerin, J. M. (2016). Artificial intelligence (AI) techniques to analyze the determinants attributes in housing prices. Inteligencia Artificial, 19(58), 23-38. https://doi.org/10.4114/ia.v19i58.1156

Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M. y Duchesnay, É. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830. https://www.jmlr.org/papers/v12/pedregosa11a.html

Ramírez-Juidías, E., Amaro-Mellado, J. L., y Leiva-Piedra, J. L. (2022). Influence of the urban green spaces of Seville (Spain) on housing prices through the hedonic assessment methodology and geospatial analysis. Sustainability, 14(24), 16613. https://doi.org/10.3390/su142416613

Rampini, L. y Re Cecconi, F. (2022). Artificial intelligence algorithms to predict Italian real estate market prices. Journal of Property Investment & Finance, 40(6), 588-611. https://doi.org/10.1108/JPIF-08-2021-0073

Reglero, J. (2022). Evolución actual del mercado inmobiliario en España y reseñas sobre Latam. OBS Busines School.

Rey Simeón, S. d. (2018). Un análisis econométrico del precio de la vivienda en Sevilla en el año 2017 [proyecto máster, Universidad de Sevilla]. idUS. https://hdl.handle.net/11441/86407

Rey-Blanco, D., Arbués, P., López, F. A., y Páez, A. (2024). Using machine learning to identify spatial market segments. A reproducible study of major Spanish markets. Environment and Planning B: Urban Analytics and City Science, 51(1), 89-108. https://doi.org/10.1177/23998083231166952

Ribeiro, M. T., Singh, S., y Guestrin, C. (2016). Model-agnostic interpretability of machine learning. arXiv. https://doi.org/10.48550/arXiv.1606.05386

Rico-Juan, J. R. y Taltavull de La Paz, P. (2021). Machine learning with explainability or spatial hedonics tools? An analysis of the asking prices in the housing market in Alicante, Spain. Expert Systems with Applications, 171, 114590. https://doi.org/10.1016/j.eswa.2021.114590

Ridker, R. G. y Henning, J. A. (1967). The determinants of residential property values with special reference to air pollution. The review of Economics and Statistics, 49(2), 246-257. https://doi.org/10.2307/1928231

Rosen, S. (1974). Hedonic prices and implicit markets: product differentiation in pure competition. Journal of Political Economy, 82(1), 34-55. https://doi.org/10.1086/260169

Sánchez-Cabrera, D., González-Arias, J., y Rey-Blanco, D. (2024). Metodología de estimación del tiempo de venta a través de modelos de supervivencia. Revista INVI, 39(110), 164-202. https://doi.org/10.5354/0718-8358.2024.69772

Seabold, S., y Perktold, J. (2010). Statsmodels: Econometric and statistical modeling with Python. Proceedings of the 9th Python in Science Conference (SCIPY). https://doi.org/10.25080/Majora-92bf1922-011

Shapley, L. S. (1953). Stochastic games. Proceedings of the National Academy of Sciences, 39(10), 1095-1100. https://doi.org/10.1073/pnas.39.10.1095

Solano Sánchez, M. Á., Núñez, J. M., y Caridad Ocerín, J. M. (2021). Un modelo hedónico para los alquileres turísticos en la ciudad de Sevilla. Revista de Métodos Cuantitativos para la Economía y la Empresa, 31, 144-160. https://doi.org/10.46661/revmetodoscuanteconempresa.4043

Štubňová, M., Urbaníková, M., Hudáková, J., y Papcunová, V. (2020). Estimation of residential property market price: Comparison of artificial neural networks and hedonic pricing model. Emerging Science Journal, 4(6), 530-538. https://doi.org/10.28991/esj-2020-01250

Tchuente, D. y Nyawa, S. (2022). Real estate price estimation in French cities using geocoding and machine learning. Annals of Operations Research, 308(1), 571-608. https://doi.org/10.1007/s10479-021-03932-5

United Nations. (2015). Transforming our world: the 2030 agenda for sustainable development. https://sdgs.un.org/2030agenda

Yazdani, M. (2021). Machine learning, deep learning, and hedonic methods for real estate price prediction. arXiv. https://doi.org/10.48550/arXiv.2110.07151

Zaragoza, A. e Ibáñez, R. (2024). Previsiones sobre la demanda de vivienda residencial en España para los próximos años. En S. Carbó Valverde (Coord.), Mercado inmobiliario y política de la vivienda en España (pp. 17-31). FUNCAS. https://www.funcas.es/libro/mercado-inmobiliario-y-politica-de-la-vivienda-en-espana/