POLITEKONGPT

sábado, mayo 16, 2026

Más allá de la pobreza: identidad lingüística y persistencia territorial del voto en el Perú

Durante años se ha instalado en el debate político peruano una idea aparentemente evidente: las regiones más pobres votan por opciones antisistema o por candidaturas de izquierda porque son pobres. Bajo esa interpretación, el ascenso electoral de Pedro Castillo en 2021 habría sido simplemente la expresión política de la precariedad económica acumulada en el interior del país. Es una lectura cómoda porque ordena el mapa electoral en términos familiares —clase, ingreso, desigualdad— y porque parece confirmada por la imagen superficial de un candidato rural, docente, del norte profundo, que movilizó a zonas que los partidos tradicionales nunca habían logrado articular. El problema es que esa imagen, cuando se la somete a los datos, no resiste el escrutinio.

Para ello es necesario realizar una precisión metodológica previa. Algunos trabajos recientes han pretendido correlacionar resultados electorales con indicadores de pobreza a nivel distrital o provincial, presentando esos cruces como evidencia empírica de la relación entre los niveles de vida y el voto. Conviene señalar que los datos de pobreza que publica oficialmente el INEI — provenientes de la Encuesta Nacional de Hogares — tienen representatividad estadística únicamente a nivel departamental y para Lima Metropolitana. Cualquier desagregación por debajo de ese umbral no está respaldada por el diseño muestral del instrumento y produce estimaciones sin validez estadística reconocida. El análisis que se presenta en este artículo trabaja exclusivamente con la unidad de observación para la cual los datos tienen respaldo: el departamento.

La hipótesis intuitiva… y el problema empírico

La hipótesis tradicional parecería sencilla. Si un departamento tiene mayores niveles de pobreza, entonces debería mostrar mayor respaldo a candidaturas antisistema o anti-establishment, y la correlación entre ambas variables debería ser visible y estadísticamente robusta. Sin embargo, al comparar los resultados electorales de 2021 con los datos departamentales de pobreza monetaria del INEI, esa relación prácticamente desaparece. La correlación de Spearman entre el nivel de pobreza departamental y la intensidad relativa del voto Castillo sobre Keiko en primera vuelta es de apenas −0.08, sin significancia estadística, y el coeficiente de determinación de un modelo de regresión simple entre ambas variables es de 0.003: la pobreza explica el 0.3% de la varianza del voto. El resultado es igualmente magro para el índice de Gini: ρ = 0.04, p = 0.86.

El contraste más instructivo al respecto no es una ecuación sino un par de casos. Loreto exhibe niveles de pobreza cercanos al 40%, pero mostró una inclinación relativamente favorable hacia Keiko Fujimori en 2021, con un ratio votos Castillo/votos Keiko de apenas 0.30. Huancavelica, con una pobreza menor —34%— y un coeficiente de Gini también inferior, se convirtió en uno de los bastiones más intensos del voto por Castillo, con un ratio de 9.46. Si la pobreza estructurara el voto, este par de casos sería inexplicable. La pobreza por sí sola no logra explicar el patrón territorial del voto, y la desigualdad medida mediante el coeficiente de Gini tampoco ofrece una explicación suficientemente robusta.

La variable que cambia el modelo

El panorama cambia de manera sustantiva cuando se introduce una variable distinta: el porcentaje de población con lengua materna indígena —quechua o aimara— por departamento, utilizando información del Censo Nacional de 2017 (en adelante, LMI). La correlación de Spearman entre esta variable y la intensidad relativa del voto Castillo/Keiko (C/K) en primera vuelta alcanza ρ = 0.73, con p < 0.001, y un modelo de regresión simple con LMI como único predictor explica el 43% de la varianza del voto. La distancia respecto al modelo de pobreza es de una magnitud que difícilmente puede atribuirse al azar o a problemas de medición.


Más importante aún: cuando se construye un modelo que incluye simultáneamente LMI, pobreza y Gini, la capacidad explicativa global sube a R²adj = 0.56, pero el coeficiente asociado a pobreza no solo pierde fuerza sino que adquiere signo negativo y resulta estadísticamente significativo (β = −0.060, p = 0.012). A igual nivel de identidad lingüística y desigualdad, más pobreza se asocia con menos intensidad del voto Castillo, no con más. El resultado es incómodo para muchas interpretaciones convencionales: el llamado "voto Castillo" no parece haber sido simplemente el voto de los pobres. Lo que los datos sugieren es que la variable LMI actúa como el mecanismo principal, y que la pobreza, una vez controlada por la identidad, pierde no solo relevancia estadística sino también dirección.

El territorio político permanece

Existe además otro elemento que refuerza esta lectura: la enorme estabilidad territorial del comportamiento electoral peruano entre instancias de votación y entre ciclos electorales. La correlación de Pearson entre el ratio Castillo/Keiko en primera y segunda vuelta de 2021 es r = 0.94, con p < 0.001. Los departamentos que votaron intensamente por Castillo en primera vuelta tendieron también a hacerlo en la segunda, y los territorios con dominancia Keiko mantuvieron esa preferencia sin excepción. Huancavelica pasó de 9.46 a 5.58, Apurimac de 8.16 a 4.40, Cusco de 8.56 a 4.95: los ratios se comprimen —el voto se racionaliza en la lógica del balotaje— pero el orden relativo entre departamentos se mantiene intacto. No hubo inversiones. Arequipa es quizás el caso más llamativo de compresión extrema, al caer de 6.37 a 1.84, lo que anticipa un patrón que reaparece con claridad en 2026.

Cinco años después, gran parte de esa misma geografía reaparece apoyando a Roberto Sánchez en la primera vuelta de 2026. La correlación de Spearman entre el ratio Sánchez/Keiko en 2026 y el ratio Castillo/Keiko en primera vuelta 2021 es ρ = 0.93, con p < 0.001, y el coeficiente de determinación de un modelo log-log entre ambas variables es R² = 0.87. Por cada punto porcentual de ventaja que Castillo tenía sobre Keiko en un departamento en 2021, Sánchez reproduce el 84% de esa ventaja en 2026. El candidato cambia; el territorio permanece.


Esta continuidad no es trivial. Sugiere que no estamos observando un fenómeno puramente coyuntural ni una simple protesta pasajera que se agota con el candidato que la encarna. Más bien, parece existir una fractura territorial persistente que organiza el sistema político peruano contemporáneo con independencia de los liderazgos específicos que la expresan en cada ciclo electoral. Hay, sin embargo, un bloque donde la transferencia falla parcialmente y que merece atención: el sur andino no quechua. Arequipa cae de 6.37 a 1.38; Moquegua de 7.29 a 1.94; Tacna de 6.89 a 1.74. Ese voto de identidad regional —más que étnico-lingüística en sentido estricto— que fue intensamente Castillo en 2021 no se transfiere a Sánchez con la misma intensidad, lo que abre un espacio de disputa real en el balotaje del 7 de junio.

Cajamarca y Puno: los límites más interesantes del modelo

Los casos más reveladores suelen ser aquellos que el modelo no logra explicar completamente, porque es ahí donde aparecen las complejidades que ninguna variable simple puede capturar. Cajamarca constituye uno de ellos. Con apenas 4% de LMI —el tercero más bajo del país—, 41% de pobreza y un Gini de 38%, registra un ratio C/K de 4.23 en primera vuelta 2021, cuando el modelo predice un valor cercano a 0.6. Esa divergencia no se explica por identidad étnico-lingüística. Lo que probablemente opera en Cajamarca es una lógica distinta: la economía política del conflicto territorial alrededor de la minería, el agua y la relación entre las comunidades locales y un Estado que históricamente llegó a esa zona a extraer y no a proveer. No es voto étnico ni voto de pobreza en sentido estricto: es voto de disputa institucional con el orden establecido, lo que lo hace igualmente refractario a las candidaturas del establishment pero por razones que la variable lingüística no captura.

Puno representa el otro extremo. Con LMI de 37% y un ratio C/K de 16.68 —el más alto del país por un margen amplio—, el modelo lo subestima significativamente. El LMI captura la presencia lingüística de la población quechua y aimara, pero no captura la densidad política e histórica de la identidad altiplánica, que tiene una dimensión organizativa, una memoria de largo aliento y una capacidad de movilización que difícilmente puede resumirse en una variable censal. Puno no es simplemente un departamento con alta proporción de hablantes de lengua indígena: es un territorio donde esa identidad tiene una expresión política activa y una direccionalidad electoral que ningún dato agregado a nivel departamental puede agotar plenamente.

¿Qué expresa realmente la "identidad"?

La discusión pública suele tratar la identidad como una categoría cultural estática, como si fuera simplemente el registro de una herencia lingüística o étnica que los individuos portan de manera pasiva. Pero electoralmente, la identidad étnico-territorial parece estar funcionando como algo mucho más dinámico y políticamente denso. Probablemente resume experiencias históricas acumuladas: exclusión estatal, centralismo, racialización, distancia respecto de Lima, percepción de subrepresentación política en las instituciones que deciden sobre el territorio y los recursos. En ese sentido, variables como la lengua materna podrían no estar midiendo únicamente idioma, sino formas históricas de incorporación desigual a la ciudadanía peruana —o de exclusión de ella. Esto ayudaría a entender por qué determinadas figuras políticas, particularmente liderazgos andinos o provinciales, logran conectar con electorados que no necesariamente son los más pobres, pero sí aquellos que perciben una distancia persistente respecto al poder central y que reconocen en esos liderazgos algo que las candidaturas limeñas no logran transmitir.

Esa dimensión más profunda —reconocimiento, representación, participación en la distribución del poder político nacional— es la que el debate político limeño suele subestimar cuando reduce el voto del interior a una expresión de precariedad económica. Y es también la que señala los límites del análisis cuantitativo a escala departamental: lo que los datos muestran es que la identidad lingüística predice mejor el voto que la pobreza, pero no pueden decirnos con precisión qué mecanismos operan dentro de esa identidad ni cómo se articulan con las demandas concretas que circulan en esos territorios.

Una fractura más profunda que la pobreza

Nada de esto implica que la pobreza no importe. El INEI reporta que en 2025 el 25.7% de la población peruana se encuentra en situación de pobreza monetaria, y que el Perú sigue siendo uno de los pocos países de la región que no ha recuperado los niveles prepandemia —la tasa de 2019 era de 20.2%. A eso se suma que el 32.8% adicional se encuentra en zona de vulnerabilidad, lo que significa que cerca del 60% de los peruanos no tiene bienestar consolidado. La pobreza sigue siendo uno de los principales problemas sociales del país, y cualquier gobierno que la ignore paga un costo político. Pero electoralmente, al menos a escala departamental, no parece ser el principal organizador del voto ni el mecanismo que estructura las preferencias entre candidatos.

La evidencia disponible sugiere más bien que el Perú continúa estructurado por fracturas territoriales, culturales e históricas que sobreviven incluso al colapso de liderazgos específicos, y que se reproducen con una estabilidad que debería llamar la atención de quienes diseñan estrategias electorales y de quienes pretenden gobernar el conjunto del territorio nacional. Quizás el error central del debate político peruano ha sido asumir que el mapa electoral expresa únicamente desigualdad económica, cuando en realidad podría estar expresando algo más profundo y más difícil de resolver con política pública convencional: distintas formas de pertenecer —o de no pertenecer— al Perú nacional.

Anexo estadístico

A continuación publico la tabla con los datos del porcentaje de población con lengua materno indígena cuya fuente es el Censo 2017, los porcentajes de pobreza publicado recientemente por el INEI, los índice de Gini departamental que lo he calculado utilizando los microdatos del INEI 2025 y procesado con Stata, y los ratios de votación Castillo sobre Keiko (C/K) en primera y segunda vuelta de las elecciones 2021, y el ratio de votación Sánchez sobre Keiko (S/K) de la primera vuelta.





No hay comentarios.: