10 Introducción a la estadística espacial

Resultados de aprendizaje

R4. Importar y manipular información espacial en R.
R5. Usar paquetes para el análisis espacial en R.

La estadística espacial estudia fenómenos donde la ubicación importa. Su premisa fundamental es la Primera Ley de la Geografía de Waldo Tobler (Tobler 1970):

“Todo está relacionado con todo lo demás, pero las cosas cercanas están más relacionadas que las cosas distantes.”

Esto se traduce en dos preguntas que recorrerán los próximos capítulos:

¿Hay un patrón? ¿Los valores altos (o los eventos) tienden a agruparse en el espacio, o se distribuyen al azar?
¿Dónde está el patrón? ¿En qué lugares específicos se concentra?

10.1 Dos familias de datos, dos familias de métodos

Tipo de dato	Ejemplo	Pregunta típica	Métodos
Datos de área (polígonos con un valor)	% de pobreza por comuna	¿Las comunas pobres están juntas?	Autocorrelación espacial (Moran) — Chapter 11, Chapter 12
Patrones de puntos (ubicaciones de eventos)	colegios, delitos, viviendas Airbnb	¿Los eventos se concentran? ¿se mezclan tipos?	Densidad, K/L/M, colocación — Chapter 13, Chapter 14

10.2 El concepto de vecindad

Casi todo en estadística espacial parte de definir quién es vecino de quién. Hay varias formas:

Contigüidad: comparten un borde (polígonos vecinos).
Distancia: todo lo que esté a menos de d metros.
K vecinos más cercanos (k-nearest neighbors): los k puntos más próximos, sin importar la distancia.

En R moderno, el paquete sfdep construye estas estructuras de vecindad de forma compatible con sf:

install.packages(c("sfdep", "sfhotspot", "spatstat", "dbmss"))

library(sf)
library(sfdep)

# Vecinos por contigüidad (comparten borde)
vecinos <- st_contiguity(comunas)

# Vecinos por k más cercanos (para puntos)
vecinos_knn <- st_knn(st_geometry(puntos), k = 6)

A partir de la vecindad se construyen pesos espaciales, que cuantifican cuánta influencia tiene cada vecino. Son el insumo de los indicadores de autocorrelación de los próximos capítulos.

10.3 La lógica de las pruebas de Monte Carlo

¿Cómo sabemos si un patrón observado es “real” o producto del azar? La estrategia general es:

Calcular un estadístico (Moran’s I, función K, etc.) sobre los datos reales.
Reordenar los valores al azar muchas veces (ej. 99 o 999 simulaciones), recalculando el estadístico cada vez.
Comparar el valor observado con la distribución simulada. Si es más extremo que casi todas las simulaciones, el patrón es significativo.

Verás el argumento nsim (número de simulaciones) en casi todas las funciones.

Ejercicios

Ejercicio 10.1 — Conceptual

Responde con tus palabras:

Da un ejemplo geográfico propio de autocorrelación espacial positiva y uno de negativa.
Para tu ejemplo, ¿qué definición de vecindad usarías y por qué?
¿Por qué necesitamos pruebas de Monte Carlo en lugar de simplemente “mirar” el mapa?