INTRODUCCIÓN
La población mundial creciente continuará afectando el medio ambiente generando grandes impactos en los ecosistemas, especialmente en las zonas costeras (Malanson & Alftine, 2016), las regiones áridas tienen un clima y un entorno ecológico frágil y sensible (Wang & Qin, 2017; Wardropper & Rissman, 2019; West et al., 2017; Zhang, 2000). Los ecosistemas terrestres áridos tienen una función muy importante en los procesos biofísicos al reflejar y absorber la radiación solar y mantener el equilibrio de los componentes atmosféricos (Bawden, 2017; Gaur & Squires, 2017b, 2017a; Sidahmed, 2017). El desierto de Atacama es uno de los principales desiertos hiperáridos del mundo (Stein et al., 2013). La región tiene un clima hiperárido, se encuentra en el extremo sur de Perú y norte de Chile, caracterizada por su extrema aridez (Pino-Vargas & Ascencios-Templo, 2021; Pino-Vargas & Huayna, 2022; Pino et al., 2018; Pino, 2019; Pino et al., 2019, 2020; Pino, 2021; Pino & Chávarri, 2022; Vera et al., 2021), esta se atribuye a su ubicación subtropical (Garreaud et al., 2003; Garreaud et al., 2010).
La inteligencia artificial (IA) y las tecnologías de comunicación de datos nos dan una amplia gama de oportunidades en la investigación científica (Kua et al., 2021; Pino-Vargas et al., 2022). Por su parte el Machine Learning (ML), es una disciplina del campo de la IA, que usando algoritmos permite identificar patrones en datos masivos y generar predicciones (Wiemken & Kelley, 2020; Zhang et al., 2019).
Se ha confirmado la utilidad de los índices de vegetación para expresar la variabilidad de esta en condiciones climáticas semiáridas (Bagherzadeh et al., 2020; Martinez & Labib, 2023). Utilizando los Índices de Vegetación por Diferencia Normalizada (NDVI) e Índice de Vegetación Ajustado al Suelo (SAVI), es posible identificar el comportamiento temporal de la vegetación en las cuencas (Alves et al., 2019). Las tendencias interanuales de la vegetación a escala global se analizan utilizando imágenes satelitales e índices de vegetación en áreas desérticas (Kawabata et al., 2001). La cobertura vegetal, la disponibilidad de humedad de la superficie y la temperatura de la superficie radiante constituyen variables microclimáticas derivables de imágenes satelitales multiespectrales (Carlson & Arthur, 2000). El NDVI, representa con alta precisión la variabilidad temporal de la biomasa (Yang et al., 2024; Richards et al., 2023).
La información de los satélites Landsat y Sentinel se pueden usar para detectar cambios en el uso de la tierra y el agua (Xiang et al., 2023; Yang et al., 2024), asimismo, podemos evaluar los impactos potenciales del cambio climático mediante el estudio de la temperatura máxima promedio anual y la precipitación (Hashim et al., 2019). El acelerado desarrollo de los sistemas de detección remota, la mecatrónica, el análisis de big data y la IA ha revolucionado la ciencia al permitir una gestión de procesos más precisa, eficiente y rentable (Kakarla et al., 2022; Singh et al., 2022).
En este sentido, buscamos identificar el efecto de las condiciones climáticas cambiantes sobre los índices de vegetación, en la zona de estudio para el período 1985 a 2022; utilizando índices de vegetación como el NDVI y el SAVI. Asimismo, previo al cálculo de los índices de biomasa se busca realizar un proceso de clasificación de biomasa usando ML, específicamente el clasificador Randon Forest (RF).
METODOLOGÍA
2.1. Descripción del área de estudio
La región de estudio, se encuentra ubicada al sur de Perú y norte de Chile (Figura 1), pertenece a la cabecera del Desierto de Atacama, caracterizado como el más árido del mundo (Houston & Hartley, 2003; Ritter et al., 2019).
La región andina corresponde al sector centro-oeste del Altiplano, en el que la precipitación acumulada anual es relativamente baja (300 - 700 mm/año) y la variabilidad temporal es muy marcada con períodos húmedos de diciembre a marzo y muy secos de abril a noviembre (Garreaud et al., 2003; Garreaud et al., 2010; Ritter et al., 2019). La región costera presenta un clima desértico; con precipitaciones anuales escasas y hasta nulas (Chucuya et al., 2022; Condori-Tintaya et al., 2022; Gomez-Tunque et al., 2023; Machaca-Pillaca et al., 2022; Pocco et al., 2023). El clima en la región costera de Tacna es templado, desértico y con amplitud térmica moderada (Condori-Tintaya et al., 2022). La media anual de temperatura máxima y mínima (periodo 1950-2019) es 23,6 °C y 12,7 °C, respectivamente (Chucuya et al., 2022).
2.2. Obtención y procesamiento de imágenes satelitales
Este trabajo se realizó utilizando imágenes multi-espectrales de los sensores ETM (Enhanced Thematic Mapper Plus) y OLI (Operational Land Imager), tienen una resolución espacial de 30 m. para espectros de onda corta visible e infrarroja, y una resolución temporal de 16 días (Alvino et al., 2020); se adquirieron del portal del USGS (Servicio Geológico de los Estados Unidos), específicamente de la plataforma Google Earth Engine, que combina un catálogo de varios petabytes de imágenes satelitales y conjuntos de datos geoespaciales con capacidades de análisis a escala planetaria y lo pone a disposición de científicos, investigadores y desarrolladores para detectar cambios, mapear tendencias y cuantificar diferencias en la superficie de la Tierra (Ariza et al., 2014; Nieto et al., 2019). La selección se realizó en base a la nubosidad y luego se estimaron los índices de vegetación utilizando imágenes hasta 10% de cobertura de nubes.
En este trabajo, se utilizó imágenes del repositorio GEE, LANDSAT LT05/C01/T1_SR y LC08/C01/T1_SR. A continuación, se evaluó por medio de composi-ciones anuales medias de imágenes obtenidas entre el 1 de enero y el 31 de diciembre de cada año en los años 1985 a 2020 cada 5 años y el año 2022, las cuales se encentran corregidas radiométrica y geométrica-mente; finalmente, se evalúa el área de estudio para calcular los índices de vegetación usando las respectivas ecuaciones (Figura 2). Se utilizaron índices NDVI, EVI, RVI, GVI y SAVI; cada uno de ellos tiene características especiales que los diferencian entre sí, por lo tanto, procedimos al análisis del efecto temporal del cambio climático usando estos índices (Bagherzadeh et al., 2020).
Las temperaturas se descargaron de la colección de imágenes del repositorio GEE del centro europeo de previsiones meteorológicas a plazo medio (ECMWF climate reanalysis), ERA5-Land, con resolución espacial de 0,1 grados de arco (Muñoz-Sabater et al., 2021), y las precipitaciones del repositorio GEE, TerraClimate: Monthly Climate and Climatic Water Balance for Global Terrestrial Surfaces, University of Idaho, con una con resolución espacial de 2,5 arc minutes (Abatzoglou et al., 2018).
En el procesamiento de las imágenes, se generó 16.370 grillas aleatorias, separados a 1 km entre ellas, lo que permitió cubrir el total del área de estudio. Los datos originales fueron filtrados y se eliminaron los valores extremos atípicos.
2.3. Clasificación de biomasa usando ML
El ML agrupa varias estrategias con el propósito de usar algoritmos para extraer información de los datos para la explicación, clasificación o predicción (Wiemken & Kelley, 2020). Surge en la década de los cincuenta para emular computacionalmente, elementos del proceso cognitivo humano a través de reconcomiendo de patrones y procesos de toma de decisión (Jiang et al., 2017; Wiemken & Kelley, 2020). El primer algoritmo para bosques de decisión aleatoria (RF) fue creado por Ho (1995) y la extensión del algoritmo fue desarrollada por Breiman (2001) (Wiemken & Kelley, 2020). El uso de esta herramienta es una de las técnicas más eficientes y se utiliza ampliamente por el balance que ofrece entre su complejidad y los resultados obtenidos (Munir et al., 2022; Vergni & Todisco, 2023).
2.4. Índices de biomasa
Son combinaciones algebraicas de varias bandas espectrales, diseñadas para resaltar el vigor y las propiedades de la vegetación (biomasa del dosel, radiación absorbida, contenido de clorofila, otros) (Bagherzadeh et al., 2020). Los índices de vegetación o biomasa pueden ser calculados en base a las imágenes Landsat, Sentinel u otras; considerando efectos atmosféricos y ajustados al suelo (Wiemken & Kelley, 2020). En la Tabla 1, se muestran los índices de vegetación utilizados.
2.4.1. Índice de Vegetación por Diferencia Normalizada (NDVI)
El NDVI (Normalized Difference Vegetation Index), se obtiene usando la reflectancia del infrarrojo cercano (NIR) y la reflectancia de la parte roja visible (RED) (Rouse et al., 1973); es un índice usado para estimar la cantidad, calidad y desarrollo de la vegetación, por medio de sensores remotos instalados comúnmente desde una plataforma espacial. Sus valores fluctúan entre -1 y 1, valores por encima de 0,1 indican presencia de vegetación, y cuanto más alto sea el valor de este índice, las condiciones de vigor son mejores (Aboutalebi et al., 2018).
2.4.2. Índice de vegetación mejorada (EVI)
El EVI (Enhanced Vegetation Index), fue desarrollado para optimizar la señal de la vegetación con una sensibilidad mejorada en regiones de alta biomasa y un mejor monitoreo de la vegetación mediante un desacoplamiento de la señal de fondo del dosel y una reducción de las influencias atmosféricas (Huete et al., 2002). Donde (NIR), (RED) y (BLUE) son reflectancias de superficie corregidas atmosféricamente o parcialmente corregidas por atmósfera (Rayleigh y absorción de ozono), L es el ajuste de fondo de la marquesina que trata la transferencia radiante roja, NIR diferencial no lineal a través de una marquesina, y C1, C2 son los coeficientes del término de resistencia a aerosoles, que utiliza la banda azul para corregir las influencias de aerosoles en la banda roja; los coeficientes adoptados en el algoritmo LANDSAT-EVI son; L = 1, C1 = 6, C2 = 7,5 y G (factor de ganancia) = 2,5 (Huete et al., 2002).
2.4.3. Índice de relación simple (RVI)
Pearson & Miller (1972) proponen este índice, considerados como los pioneros en la historia de los índices de vegetación al proponer el primer índice, el RVI (Ratio Vegetation Index), es el cociente entre las reflectividades del infrarrojo cercano (NIR) y la banda del rojo (RED), basado en la diferencia espectral en la vegetación en las longitudes de onda del rojo y del infrarrojo cercano, el rango de valores es de 0 a más de 30, la vegetación sana generalmente se encuentra entre valores de 2 a 8 (Gupta, 1992).
2.4.4. Índice de vegetación verde (GVI)
El GVI (Green Vegetation Index) o índice de vegetación verde, fue propuesto por Kauth & Thomas (1976), es el cociente entre la reflectividad del infrarrojo cercano y de la banda verde. También se conoce como el índice de vegetación verde Landsat TM. Fue diseñado originalmente para usarse con Landsat TM, pero también funciona con las bandas correspondientes de Landsat ETM + y Landsat 8 (Sripada et al., 2005).
2.4.5. Índice de vegetación ajustado al suelo (SAVI)
El SAVI (Soil Adjusted Vegetation Index), se utiliza para corregir el NDVI por la influencia del brillo del suelo en áreas donde la cobertura vegetativa es baja (Huete, 1988). Este índice fue derivado de la reflectancia de la superficie del Landsat; se calcula como una relación entre los valores RED y NIR con un factor de corrección de la luminosidad del suelo (L) definido en 0,5 para acomodar la mayoría de los tipos de cobertura del suelo (Alvino et al., 2020; Benabdelouahab et al., 2015) y sus valores fluctúan entre -1 y 1.
RESULTADOS Y DISCUSIÓN
frecuencia por los investigadores en el mundo, y se han reportado múltiples fuentes de variación en sus resultados, a pesar de esto, no se presentaron diferencias significativas. En la Figura 3 se observa la clasificación de la distribución de la biomasa como resultados de la aplicación RF. Los índices multitemporales presentan una correlación impor-tante entre la topografía y la cobertura vegetal, presentándose esta última con mayor evidencia de conservación en las zonas de mayor altitud. La Tabla 1 (Ver Material Suplementar), muestra la evaluación de la precisión del uso y la cobertura del suelo usando RF para el período 1985-2022. Se obtuvieron valores para el Kappa Coefficient (k) superiores a 0,96 en todos los casos. Según Alencar da Silva et al. (2019), la vegetación de menor densidad es la más abundante en el área de la cuenca.
El análisis anual de la variación media de los índices de biomasa evidencia una ciclicidad de los valores estadísticos, la fracción de vegetación y la visualización de los mapas. En la Figura MS1 a MS5, se muestra los resultados espaciales de los índices de biomasa calculados. En la Figura 4, se muestra como referencia representativa la variación espaciotemporal del NDVI para el período de análisis establecido.
Los datos analizados muestran una variabilidad muy marcada en el año 2020 entre abril a diciembre, en toda la región Tacna; asimismo se ha identificado un incremento de vegetación cíclico de 5 años, siendo notorio en las áreas de la zona media y alta, y en la zona baja existen áreas recientes como las Lomas de Sama y el Cerro Arunta. A excepción de esto, en el acuífero Caplina donde el índice de vegetación históricamente es alto, siendo su incremento más marcado en los últimos años (Pino-Vargas & Ascencios, 2022; Pino-Vargas & Huayna, 2022). En la Figura 5 se observa la alta correlación entre los índices NDVI, EVI, RVI, GVI y SAVI. En la Figure MS6 (Ver material suplementar) se muestra la variación de los índices de biomasa para el período 1985 a 2022.
3.1. Análisis de Correlación
La Figura 5 evidencia la baja dispersión en el período de análisis 1985 a 2022, siendo buena la correlación entre el NDVI con los índices EVI, RVI, GVI, SAVI. Esto representa el grado de relación lineal existente entre los índices respecto al NDVI, esto se repite en los años otros períodos analizados; las relaciones gráficas NDVI-SAVI, NDVI-RVI y NDVI-GVI arrojan una relación directa y positiva (Tabla 2, Coeficiente de correlación simple (CCS), Coeficiente de determinación (r2) y Numero de observaciones (No)).
Para el año 2022 se tiene una correlación fuerte de 0,82 entre NDVI y EVI. Los demás índices respecto al NDVI arrojaron una relación muy fuerte superior a 0,90 respecto al NDVI. Asimismo, el coeficiente de determinación r² entre el NDVI y los demás índices, de igual manera indican buen ajuste.
3.2. Análisis de regresión
El NDVI (en función de los índices EVI, RVI, GVI y SAVI), y sus respectivos estadísticos de su obtención se muestran en la Tabla 3.
3.3. El NDVI, temperatura y precipitación
En la zona baja de la región de estudio en el año 2010 presentó altos registros de temperaturas y baja precipitación (Tabla 4, Figura 6), y una inversa respecto a la humedad relativa del aire; asimismo, las áreas calientes, coinciden con las menos lluviosas (Figura 7, Figura 8). En la parte media, las temperaturas fluctúan entre los 18 a 22 °C y las precipitaciones entre los 150 a 240 mm por año, es la zona donde se presenta la mayor cobertura vegetal.
Se obtuvo la regresión entre NDVI en meses lluviosos y precipitaciones acumuladas anuales del año 1985 hasta el 2020 de tres estaciones pluviométricas representativas parte baja, media y alta, aplicando la correlación de Pearson (Figura 9), se observa que, en las estaciones pluviométricas de Candarave y Pucarani, presentan una tendencia positiva baja para el mismo periodo analizado r2 = 0,3 para una precipitación media de 210 mm. Asimismo, se observa que las otras estaciones no presentan tendencias significativas. La mayor densidad de cobertura vegetal y valores más elevados de NDVI coincide con la zona media y alta, donde se registran las precipitaciones más altas entre noviembre y marzo, lo que indica que la pluviometría es un factor condicionante para su distribución y conservación.
La curva del NDVI sigue el modelo estacional regional de precipitaciones (Figura 10, Figura 11), definido en una estación húmeda estival, con predominio de valores elevados de NDVI, y una estación seca invernal, con predominio de valores bajos de NDVI, similitud importante se observa en procesos estacionales de cobertura vegetal en la zona de la parte media y alta.
Tomado como base el perfil longitudinal de NDVI de la región de estudio (Figura 12), para el año 2020, se observa un marcado incremento de la cobertura vegetal y un incremento del NDVI con respecto a los años 2010 y 2020. Asimismo, se observa que la cobertura vegetal se extiende hacia la parte baja elevaciones del orden de los 1100 msnm. Asimismo, los índices del año 2010 son menores al 2000 en la parte media y alta producto de las menores precipitaciones. Las evidencias de cambio climático son visibles, el efecto del cambio climático en esta región, considerada como una de las más secas del mundo según las evidencias encontradas y registradas, puede darse como favorable o desfavorable para la disponibilidad hídrica (Pino & Chávarri, 2022).
CONCLUSIONES
Haciendo una comparación del NDVI, con el SAVI, GVI, RVI y EVI, bajo condiciones de aridez e hiperaridez, al sur Perú y norte de Chile, y específicamente en el entorno de las condiciones especiales que impone el Desierto de Atacama, se obtuvo similitud entre las variaciones espaciotemporales del NDVI y SAVI. Por su lado, existen diferencias estadísticas entre el EVI y el NDVI. Se puede afirmar que el NDVI, SAVI, GVI y RVI son más eficientes para identificar las condiciones climáticas cambiantes de esta región.
El NDVI responde en forma directa a las lluvias, en el período de verano; asimismo, no refleja respuesta de la vegetación en la temporada de lluvias invernales, estas respuestas fueron muy débiles y amplias. Los valores más altos de NDVI se obtuvieron en la estación de verano a continuación de un proceso de sequías extensas.
En los períodos de tiempo más recientes se registra un aumento de vegetación en lugares de mayor tempe-ratura, esto se puede atribuir a las precipitaciones estacionales que se generan con mayor frecuencia en lugares donde no estas no existían. Estas alteraciones son evidencias resultantes del cambio climático en la región y se ven identificadas en el comportamiento de los índices de biomasa.