
Por María Camila Ardila
La seguridad urbana es uno de los principales retos de las ciudades latinoamericanas. En Medellín, la criminalidad sigue impactando el bienestar de los ciudadanos y limitando el desarrollo económico de muchas zonas. Pero ¿y si pudiéramos anticipar los delitos antes de que ocurran?
Esa fue la pregunta que motivó mi tesis de maestría en Economía. Usando algoritmos de aprendizaje automático (machine learning), analicé más de una década de datos georreferenciados sobre criminalidad y características socioeconómicas de los barrios de Medellín. ¿El objetivo? Identificar patrones y predecir dónde y cuándo hay mayor probabilidad de ocurrencia de delitos como hurtos, extorsión u homicidios. ¿Cómo se hizo?
Para este estudio, usé bases de datos públicas con registros de delitos, estadísticas socioeconómicas (Sistema de Información para la Seguridad y la Convivencia de Medellín, SISC), y características poblacionales de todos los barrios y grillas (áreas pequeñas de 200x200 metros) de Medellín. A partir de esta información, entrené tres modelos para predecir la probabilidad de que ocurriera un delito en cada zona: Mínimos Cuadrados Ordinarios (MCO), Random Forest y Extreme Gradient Boosting (XGBoost). Los modelos fueron evaluados con métricas estándar: precisión, sensibilidad, F1-score y exactitud. El modelo Random Forest fue el de mejor desempeño, con una exactitud del 86% a nivel de barrio.
La metodología de esta investigación se desarrolló en cuatro fases secuenciales (ver Figura 1). Primero, se realizó la adquisición de datos sobre crimen (SISC), factores socioeconómicos (ECVM) y geográficos (Geomedellín). A continuación, en la fase de preprocesamiento, estos datos fueron limpiados y agregados en una cuadrícula espacial de 200x200 metros, generando variables predictoras. Posteriormente, en la etapa de modelamiento, se entrenaron modelos de machine learning como Random Forest y XGBoost, junto con un modelo de regresión lineal (MCO) como referencia, para predecir la incidencia delictiva. Finalmente, la fase de evaluación consistió en medir el rendimiento de los modelos con métricas de precisión y analizar los resultados mediante visualizaciones geoespaciales para interpretar los patrones predichos.
Figura 1. Metodología propuesta

¿Qué se encontró?
Los resultados fueron contundentes: variables como la proporción de jóvenes entre 16 y 30 años, el desempleo, la pobreza multidimensional o la pertenencia al SISBEN, están altamente relacionadas con la probabilidad de que ocurran delitos. Las zonas con mayores niveles de vulnerabilidad son también las más propensas a reportar incidentes.
Uno de los hallazgos más importantes es que los delitos se concentran en ciertas zonas de la ciudad, como el centro de Medellín y particularmente el barrio La Candelaria, donde convergen el turismo, el comercio y una alta circulación de personas. Allí se presentan problemas como el hurto, las extorsiones y conflictos por el control territorial.
Con los resultados, se construyeron mapas de calor de riesgo delictivo que permiten identificar “puntos calientes” (hotspots) y zonas prioritarias para intervención. Ver la Figura 2.
Entonces, ¿qué factores y/o variables son la clave para predecir el crimen?
El modelo nos permitió crear una radiografía del riesgo, destacando tres áreas críticas. En primer lugar, la inercia delictiva: la densidad de crímenes en la última semana y el último mes fue el predictor más potente. En segundo lugar, la vulnerabilidad socioeconómica: factores como la pobreza multidimensional, el déficit de vivienda y la pertenencia al SISBEN resultaron cruciales. Finalmente, el factor humano: la composición demográfica (proporción de hombres y jóvenes) y, de forma reveladora, la propia percepción de inseguridad de los residentes, actuaron como un termómetro que anticipa el riesgo.
Figura 2: Mapas de calor de los reportes de crímenes del periodo 2019 a nivel de grilla

Fuente: Elaboración propia.
¿Por qué importa?
Pero lo más valioso de esta investigación no es solo describir, sino predecir. Los resultados muestran que la inteligencia artificial no solo puede ayudar a entender el crimen urbano, sino también anticiparlo. Esta capacidad predictiva permite a las autoridades:
- Planear operativos más focalizados.
- Asignar recursos con base en evidencia.
- Diseñar intervenciones preventivas que tengan en cuenta las condiciones estructurales de cada territorio.
Este trabajo demuestra que la tecnología y los datos bien utilizados pueden ser aliados en la construcción de ciudades más seguras y equitativas. La inteligencia artificial no reemplaza el trabajo humano, pero puede ser una herramienta poderosa para tomar mejores decisiones públicas.
Mi esperanza es que este tipo de investigaciones ayuden a generar políticas públicas más informadas, que tomen en cuenta los contextos sociales detrás del crimen, y no solo lo castiguen. Medellín ha demostrado ser una ciudad resiliente, y con el uso inteligente de la tecnología, puede seguir construyendo caminos hacia la paz urbana.