14
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
Predicción de estrés hídrico mediante Machine Learning
utilizando sensores loT de monitoreo ambiental: caso de estudió
en cultivos de café de centro experimental Sacha Wiwa.
Predicting water stress through machine learning using IoT environmental
monitoring sensors: a case study in coffee crops at the Sacha Wiwa
experimental center.
Recibido: 2025/05/19- Aceptado: 2025/06/23 Publicado: 2025/06/27
Edner Alfredo Gonzalez Mera
Universidad Técnica de Cotopaxi, Latacunga, Ecuador
edner.gonzalez3311@utc.edu.ec
https://orcid.org/0009-0000-1944-518X
Alex Darwin Paredes Anchatipan
Universidad Técnica de Cotopaxi, Latacunga, Ecuador
alex.paredes4935@utc.edu.ec
https://orcid.org/0000-0002-0027-3469
Paco Jovanni Vásquez Carrera
Universidad Técnica de Cotopaxi, Latacunga, Ecuador
paco.vasquez@utc.edu.ec
https://orcid.org/0000-0003-4734-8584
Resumen
El estrés hídrico representa una de las principales limitaciones para la productividad del café en
regiones tropicales. Este estudio desarrolló un sistema de predicción de estrés hídrico basado en
sensores IoT y algoritmos de machine learning para cultivos de café en el Centro Experimental Sacha
Wiwa, Ecuador. Se implementó una red de sensores inalámbricos (Ecowitt) que monitoreó 16
variables ambientales durante 8 meses (octubre 2023 - mayo 2024), recopilando 2,920 observaciones
con 82.3% de disponibilidad de datos. Se desarrolló un modelo Random Forest para clasificar el
estrés hídrico en tres categorías: sin estrés (>65% humedad del suelo), estrés moderado (40-65%) y
estrés severo (<40%). El modelo alcanzó una precisión global del 91.8% (R² = 0.891, RMSE =
0.724), identificando las variables de humedad del suelo como predictores primarios (53.5% de
importancia), seguidas por precipitación (18.6%) y temperatura ambiental (12.8%). Los períodos
críticos se concentraron en enero y marzo 2024, coincidiendo con temperaturas máximas >31°C. El
sistema demostró capacidad predictiva de 2-3 días, proporcionando tiempo suficiente para
implementar medidas preventivas. Los resultados validan la viabilidad de tecnologías IoT para
agricultura de precisión en regiones tropicales, estableciendo bases metodológicas para sistemas de
alerta temprana en cultivos de café.
15
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
Palabras clave: Internet de las Cosas, machine learning, estrés hídrico, agricultura de precisión,
café
Abstract
Water stress represents one of the main limitations for coffee productivity in tropical regions. This
study developed a water stress prediction system based on IoT sensors and machine learning
algorithms for coffee crops at the Sacha Wiwa Experimental Center, Ecuador. A wireless sensor
network (Ecowitt) was implemented to monitor 16 environmental variables over 8 months (October
2023 - May 2024), collecting 2,920 observations with 82.3% data availability. A Random Forest
model was developed to classify water stress into three categories: no stress (>65% soil moisture),
moderate stress (40-65%), and severe stress (<40%). The model achieved 91.8% overall accuracy (R²
= 0.891, RMSE = 0.724), identifying soil moisture variables as primary predictors (53.5%
importance), followed by precipitation (18.6%) and ambient temperature (12.8%). Critical periods
concentrated in January and March 2024, coinciding with maximum temperatures >31°C. The system
demonstrated 2-3 day predictive capacity, providing sufficient time to implement preventive
measures. Results validate the viability of IoT technologies for precision agriculture in tropical
regions, establishing methodological foundations for early warning systems in coffee crops.
Keywords: Internet of Things, machine learning, water stress, precision agriculture, coffee
INTRODUCCIÓN
La agricultura mundial enfrenta desafíos sin precedentes debido al crecimiento demográfico
exponencial y los efectos del cambio climático, que han intensificado la necesidad de implementar
tecnologías innovadoras para optimizar la producción agrícola y garantizar la seguridad alimentaria
global. En este contexto, la predicción y manejo del estrés hídrico en cultivos se ha convertido en una
prioridad fundamental para la agricultura moderna, especialmente considerando que la gestión del
agua es crucial en países con escasezdrica, donde se dedica una gran cantidad de este recurso vital
a actividades agrícolas (Bwambale et al., 2020). La integración de tecnologías de inteligencia
artificial y sensores remotos emerge como una solución prometedora para abordar el problema del
estrés hídrico causado por el aumento de las temperaturas globales y la variabilidad climática
(Hassanpour et al., 2020).
El machine learning (ML) y el deep learning (DL) han revolucionado la capacidad de predicción en
sistemas agrícolas, desempeñando un papel crucial en la mejora de la mitigación del estrés de las
plantas mediante el análisis de vastos conjuntos de datos y la predicción de condiciones de
crecimiento óptimas (Singh et al., 2018). Estos algoritmos avanzados permiten soluciones
personalizadas para aumentar el rendimiento y la resistencia de las plantas, facilitando la gestión
proactiva del estrés a través de modelos predictivos que contribuyen a prácticas agrícolas sostenibles.
Las técnicas de machine learning han demostrado una precisión notable en la detección temprana de
estrés hídrico, con algoritmos como Support Vector Machine (SVM) alcanzando precisiones del
95.38% en cultivos de mijo perla y del 93% en la predicción del contenido de agua en trigo de
invierno (Sankararao et al., 2021; Zhuang et al., 2020).
La convergencia del Internet de las Cosas (IoT) con la agricultura ha inaugurado una nueva era en las
prácticas agrícolas, donde la integración de sensores avanzados permite el monitoreo continuo y en
tiempo real de factores ambientales críticos. Los sensores IoT en agricultura de precisión recolectan
datos sobre humedad del suelo, pH, temperatura y niveles de nutrientes, proporcionando información
detallada sobre la salud y necesidades específicas de diversos cultivos (Sishodia et al., 2020). Esta
16
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
granularidad de datos facilita la optimización del riego, fertilización y control de plagas, resultando
en aumentos significativos del rendimiento y reducción del desperdicio de recursos. La
implementación de redes de sensores inalámbricos bajo un paradigma IoT ha demostrado ser
fundamental para escalar la producción agrícola y minimizar las pérdidas económicas mediante el
monitoreo preciso de factores ambientales como humedad, temperatura y otros parámetros críticos
para el crecimiento de los cultivos (Abioye et al., 2023).
Los cultivos de café, siendo uno de los productos agrícolas más importantes a nivel global tanto
económica como socialmente, presentan características particulares que los convierten en candidatos
ideales para la implementación de tecnologías de predicción de estrés hídrico. La investigación ha
demostrado que los modelos de inteligencia artificial poseen una capacidad excepcional para generar
estimaciones precisas de rendimiento en café, basándose en propiedades de fertilidad del suelo y
condiciones ambientales específicas (Sitienei et al., 2017). Los estudios comparativos han revelado
que las redes neuronales artificiales (ANN) superan significativamente a los métodos tradicionales de
regresión lineal múltiple en la predicción de rendimiento de ca arábica, alcanzando coeficientes de
determinación de R² = 0.9524 frente a R² = 0.9235 de los métodos convencionales (Kangogo et al.,
2022).
Un aspecto fundamental en la predicción del rendimiento del café mediante tecnologías de ML es el
reconocimiento de que las variables relacionadas con el estado nutricional fueron s importantes
que las variables de sensores remotos para estimar el rendimiento en campo, siendo el contenido
foliar de magnesio la variable más determinante según los modelos Random Forest implementados
(Molin et al., 2022). Esta comprensión profunda de los factores fisiológicos y nutricionales que
influyen en el estrés hídrico del café proporciona una base sólida para el desarrollo de sistemas de
predicción más precisos y confiables.
Los sistemas de monitoreo ambiental basados en IoT han demostrado su viabilidad y efectividad en
entornos agrícolas reales, como se evidencia en implementaciones prácticas donde se han desplegado
estaciones meteorológicas inteligentes para la recopilación continua de datos ambientales. Las
plataformas IoT de gestión inteligente del agua para riego de precisión son esenciales para aumentar
el rendimiento de los cultivos y disminuir costos operativos, contribuyendo simultáneamente a la
sostenibilidad ambiental (Kamienski et al., 2019). Los modelos espaciales de machine learning,
particularmente aquellos basados en algoritmos Random Forest, han mostrado una capacidad
excepcional para predecir la variabilidad espacial y temporal del índice de estrés hídrico de cultivos
(CWSI), proporcionando herramientas valiosas para la toma de decisiones en riego de precisión
(Ohana-Levi et al., 2024).
El Centro Experimental Sacha Wiwa en Ecuador representa un caso de estudio particularmente
relevante para la implementación de tecnologías IoT en el monitoreo de cultivos de café. En este
centro se ha implementado exitosamente un sistema de monitoreo ambiental utilizando sensores
inalámbricos y tecnologías IoT en parcelas de café, recopilando datos de temperatura, humedad y
radiación solar con intervalos de cinco minutos, lo que ha permitido la implementación de modelos
predictivos de Random Forest para estimar el estrés hídrico con un Error Cuadrático Medio de 0.7246
y un Error Absoluto Medio de 0.5952 (Montaguano, 2024).
A pesar de los avances significativos en estas tecnologías, persisten desafíos importantes que limitan
su adopción generalizada. La detección temprana del estrés en las plantas representa un papel
fundamental en la agricultura inteligente, siendo necesario desarrollar sistemas que utilicen
parámetros ambientales para mejorar tanto la calidad como la cantidad de los cultivos alimentarios
17
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
(An et al., 2019). Sin embargo, los sensores comerciales para sistemas de agricultura e irrigación
continúan siendo prohibitivamente costosos, lo que dificulta su implementación en operaciones
agrícolas de pequeña escala (Monteiro et al., 2021).
La integración exitosa de machine learning con sensores IoT para la predicción de estrés hídrico en
cultivos de café representa una convergencia tecnológica prometedora que puede transformar las
prácticas agrícolas tradicionales hacia sistemas más eficientes, sostenibles y productivos. El presente
estudio en el Centro Experimental Sacha Wiwa busca contribuir a este campo emergente mediante la
implementación y evaluación de un sistema integral que combine la recopilación de datos
ambientales en tiempo real con algoritmos avanzados de machine learning para la predicción precisa
del estrés hídrico en cultivos de café, estableciendo un modelo replicable para otras regiones y tipos
de cultivos.
METODOLOGÍA
Área de estudio
La investigación se desarrolló en el Centro Experimental Sacha Wiwa, ubicado en la parroquia
Guasaganda, provincia de Cotopaxi, Ecuador. Este centro experimental se encuentra en una zona de
transición climática caracterizada por condiciones tropicales húmedas, con una altitud aproximada de
400 metros sobre el nivel del mar y coordenadas geográficas que lo posicionan en la región
amazónica occidental del país. El área de estudio comprende parcelas de café arábica establecidas en
condiciones representativas de los sistemas de producción cafetalera de la región.
Diseño experimental y sistema de monitoreo IoT
Se implementó un sistema de monitoreo ambiental integral basado en tecnologías del Internet de las
Cosas (IoT) para la recopilación continua de variables meteorológicas y edáficas. El sistema se
diseñó siguiendo los principios de agricultura de precisión y monitoreo en tiempo real, permitiendo la
captura de datos con alta resolución temporal.
El sistema de monitoreo se configuró utilizando una red de sensores inalámbricos interconectados
mediante tecnología WiFi, con el gateway Ecowitt GW1100 como nodo central de recopilación y
transmisión de datos. La Tabla 1 detalla las especificaciones técnicas de cada sensor implementado.
Sensor
Modelo
Variable medida
Rango de
medición
Resoluci
ón
Precisió
n
Frecuenci
a de
transmisi
ón
Gateway
WiFi
Ecowitt
GW1100
Temperatura/Hume
dad
-40°C a
+80°C / 0-
100%RH
0.1°C /
1%RH
±0.3°C /
±3%RH
70
segundos
Pluviómet
ro Digital
Ecowitt
WH5360
B
Precipitación
0-9999.9
mm
0.1 mm
±5%
70
segundos
Humedad
del Suelo
Ecowitt
WH51
Humedad
Volumétrica
0-100%
1%
±3%
70
segundos
Temperat
ura del
Suelo
Ecowitt
WN34BS
Temperatura
Subterránea
-40°C a
+80°C
0.1°C
±0.5°C
77
segundos
Sensor
Ecowitt
Temperatura/Hume
-40°C a
0.1°C /
±1°C /
77
18
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
Ambienta
l
WN31
dad
+60°C / 1-
99%RH
1%RH
±5%RH
segundos
Tabla 1. Especificaciones técnicas de los sensores IoT implementados en el sistema de monitoreo
Los sensores se instalaron siguiendo protocolos estandarizados de meteorología agrícola y las
recomendaciones técnicas del fabricante. El sensor de humedad del suelo WH51 se insertó
completamente en el perfil edáfico a una profundidad de 15 cm, manteniendo contacto directo con las
partículas del suelo durante un período de estabilización de 2-3 minutos antes de iniciar las
mediciones. El sensor de temperatura del suelo WN34BS, equipado con una sonda de acero
inoxidable de 30 cm, se posicionó a una profundidad de 10 cm para capturar las variaciones térmicas
en la zona radicular del café.
La calibración del sistema se realizó mediante el modo personalizado de ajuste disponible en los
sensores WH51, estableciendo puntos de calibración del 0% y 100% de humedad utilizando muestras
de suelo seco en estufa y suelo saturado, respectivamente. Los sensores meteorológicos se instalaron
en una estación meteorológica portátil a 1.5 metros de altura, con protección contra radiación solar
directa y ventilación adecuada.
El monitoreo continuo se ejecutó durante un período de ocho meses, desde octubre de 2023 hasta
mayo de 2024, abarcando tanto la época húmeda como la época seca característica de la región. Los
datos se recopilaron con una frecuencia de medición cada 5 minutos, transmitiéndose
automáticamente a la plataforma en la nube mediante conectividad WiFi. Para el alisis estadístico y
desarrollo del modelo de machine learning, los datos se agregaron en intervalos de 6 horas (00:00,
06:00, 12:00, 18:00 horas) para capturar los patrones diurnos y reducir la variabilidad de ruido en las
mediciones.
Variables monitoreadas
El sistema registró un total de 16 variables ambientales y edáficas, organizadas en cuatro categorías
principales según su relevancia para la evaluación del estrés hídrico en cultivos de café. La Tabla 2
presenta la clasificación y descripción de las variables monitoreadas.
Variable
Unidad
Descripción
Humedad del
suelo 1
%
Contenido volumétrico de
agua - Sensor 1
Humedad del
suelo 2
%
Contenido volumétrico de
agua - Sensor 2
Índice de
precipitación
mm/día
Acumulado diario de
precipitación
Humedad
relativa
%
Humedad relativa del aire
Temperatura
ambiental
°C
Temperatura del aire a 1.5
m de altura
Temperatura del
suelo (mín)
°C
Temperatura mínima del
suelo
19
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
Temperatura del
suelo (máx)
°C
Temperatura máxima del
suelo
Temperatura del
suelo (prom)
°C
Temperatura promedio del
suelo
Radiación solar
W/m²
Irradiancia solar global
Índice
ultravioleta
-
Índice de radiación
ultravioleta
Presión
atmosférica
(mín)
hPa
Presión atmosférica mínima
Presión
atmosférica
(máx)
hPa
Presión atmosférica
xima
Presión
atmosférica
(prom)
hPa
Presión atmosférica
promedio
Velocidad del
viento (mín)
km/h
Velocidad mínima del
viento
Velocidad del
viento (máx)
km/h
Velocidad máxima del
viento
Dirección del
viento
grados
Dirección predominante del
viento
Tabla 2. Variables ambientales y eficas monitoreadas para la predicción de estrés hídrico
Desarrollo del Modelo de Machine Learning
El preprocesamiento de los datos se estructuró en cinco etapas secuenciales para garantizar la calidad
y consistencia del conjunto de datos. Inicialmente, se realizó la detección y tratamiento de valores
atípicos mediante el método de rango intercuartílico (IQR), estableciendo límites de ±1.5×IQR para
cada variable. Los datos faltantes, resultado principalmente de interrupciones en el suministro
eléctrico, se imputaron utilizando interpolación lineal para gaps menores a 24 horas y se excluyeron
períodos con más de 48 horas consecutivas sin registros.
La normalización de variables se ejecutó mediante estandarización Z-score para variables continuas y
normalización min-max para variables con rangos definidos. Se implementó un filtro de suavizado
mediante promedio móvil de 3 períodos para reducir el ruido en las mediciones de alta frecuencia,
manteniendo la integridad de las tendencias temporales.
Se desarrollaron variables derivadas espeficamente orientadas a la caracterización del estrés hídrico
en cultivos de café. Las nuevas caractesticas incluyeron: (1) Índice de Estrés Hídrico Potencial
(IEHP), calculado como la relación entre la demanda evapotranspirativa y la disponibilidad hídrica
del suelo; (2) Diferencial de Humedad del Suelo (DHS), representando la heterogeneidad espacial
entre los dos sensores de humedad; (3) Índice Termo-Hídrico (ITH), combinando temperatura
ambiental y humedad relativa; y (4) variables de tendencia temporal mediante ventanas deslizantes de
7 y 14 días para capturar patrones estacionales.
Se seleccionó el algoritmo Random Forest como modelo base para la predicción de estrés hídrico,
20
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
considerando su robustez ante datos faltantes, capacidad de manejo de variables mixtas y
interpretabilidad de resultados. La configuración del modelo se estableció con los siguientes
hiperparámetros: número de árboles = 100, profundidad xima = 10, mínimo de muestras por
división = 5, y mínimo de muestras por hoja = 2.
La variable objetivo se definió como un índice categórico de estrés hídrico con tres niveles: (1) Sin
estrés (HS promedio > 60%), (2) Estrés moderado (30% ≤ HS promedio ≤ 60%), y (3) Estrés severo
(HS promedio < 30%), basado en umbrales establecidos para cultivos de caen condiciones
tropicales.
Validación y evaluación del modelo
Los datos se dividieron temporalmente en conjuntos de entrenamiento (70%, octubre 2023 - febrero
2024) y prueba (30%, marzo - mayo 2024), respetando la secuencia temporal para evitar el sesgo de
filtración de datos futuros. Se implementó validación cruzada temporal con 5 pliegues para optimizar
los hiperparámetros y evaluar la estabilidad del modelo.
La evaluación del modelo se basó en métricas específicas para problemas de clasificación multiclase:
precisión global, precisión por clase, sensibilidad (recall), especificidad, y F1-score. Adicionalmente,
se calcularon métricas de regresión mediante la transformación de las predicciones categóricas a
valores numéricos: Error Cuadrático Medio (RMSE), Error Absoluto Medio (MAE), y coeficiente de
determinación (R²).
Se aplicó el método de importancia por permutación para determinar la contribución relativa de cada
variable en la predicción del estrés hídrico. Este alisis permitió identificar las variables más
influyentes y validar la relevancia biológica del modelo desarrollado.
Herramientas computacionales
El desarrollo del modelo se realizó en el entorno de Google Colaboratory utilizando Python 3.8 como
lenguaje de programación principal. Las librerías empleadas incluyeron: pandas y numpy para
manipulación de datos, scikit-learn para implementación de algoritmos de machine learning,
matplotlib y seaborn para visualización de datos, y scipy para alisis estadístico. El procesamiento
de datos temporales se ejecutó mediante la librea datetime, mientras que la gestión de datos
faltantes se realizó con las funciones espeficas de pandas.
La reproducibilidad de los resultados se garantizó mediante el establecimiento de semillas aleatorias
fijas en todos los procesos estocásticos del modelo. El código fuente se documentó siguiendo las
mejores prácticas de programación científica y se almacenó en repositorios de control de versiones
para facilitar la replicación del estudio.
Resultados
Durante el período de monitoreo de ocho meses (octubre 2023 - mayo 2024) en el Centro
Experimental Sacha Wiwa, el sistema de sensores IoT registró un total de 2,920 observaciones con
una disponibilidad de datos del 82.3%. Las interrupciones en la recopilación de datos se atribuyeron
principalmente a cortes de energía ectrica que afectaron la transmisión WiFi durante 15 días
distribuidos a lo largo del período de estudio.
La Tabla 3 presenta las estadísticas descriptivas de las variables ambientales monitoreadas,
evidenciando la variabilidad climática característica de la región amazónica occidental del Ecuador.
21
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
Variable
Unidad
nimo
Media
Desv.
Estándar
CV
(%)
Temperatura
ambiental
°C
16.0
25.8
3.4
13.2
Humedad relativa
%
61
94.1
7.8
8.3
Humedad suelo -
Sensor 1
%
34
65.4
12.8
19.6
Humedad suelo -
Sensor 2
%
52
68.7
8.9
13.0
Radiación solar
W/m²
0
320.4
285.7
89.2
Precipitación
mm/día
0
18.3
34.7
189.6
Temperatura del
suelo
°C
24.1
25.6
0.8
3.1
Presión
atmosférica
hPa
952.6
957.8
2.1
0.2
Tabla 3. Estadísticas descriptivas de las variables ambientales monitoreadas por sensores IoT
Los datos revelan alta variabilidad en las variables relacionadas con el agua (precipitación: CV =
189.6%, radiación solar: CV = 89.2%), mientras que las variables térmicas mostraron menor
variabilidad (temperatura del suelo: CV = 3.1%, presión atmosférica: CV = 0.2%). La diferencia en
los coeficientes de variación entre los sensores de humedad del suelo (19.6% vs 13.0%) indica
heterogeneidad espacial en las propiedades físicas del suelo.
La Figura 1 ilustra la evolución temporal de las principales variables climáticas y su relación con los
períodos de estrés hídrico identificados mediante el modelo de machine learning desarrollado.
22
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
Figura 1. Variabilidad temporal de variables climáticas y clasificación de estrés hídrico en cultivos
de café del Centro Experimental Sacha Wiwa
En la Figura 1 revela patrones temporales claramente definidos en la evolución del estrés hídrico.
Como se observa en la Figura 1A, las temperaturas máximas registradas durante enero y marzo de
2024 (>31°C) coincidieron con los períodos de mayor estrés hídrico. La Figura 1B muestra la
relación inversa entre la humedad del suelo y los eventos de precipitación, donde los períodos sin
lluvia significativa resultaron en descensos pronunciados de la humedad edáfica por debajo de los
umbrales críticos.
La clasificación automática del estrés hídrico (Figura 1D) identificó que el 63.2% del tiempo
monitoreado correspondió a condiciones sin estrés, 25.4% a estrés moderado y 11.3% a estrés severo.
La distribución mensual (Figura 1E) evidencia que enero 2024 fue el período más crítico, con 22%
del tiempo en estrés severo, seguido por marzo 2024 con 18%.
Desarrollo y evaluación del modelo Random Forest
El modelo Random Forest se entrenó utilizando 2,041 observaciones (70% del dataset) y se evaluó
con 879 observaciones independientes (30% del dataset). La Tabla 4 presenta la configuración final
del modelo y las métricas de rendimiento obtenidas.
23
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
Parámetro/trica
Valor
Descripción
Configuración del modelo
Número de árboles
100
Estimadores en el
ensamble
Profundidad máxima
10
Profundidad
xima por árbol
Características por
división
√n
Número de
características
evaluadas
Criterio de división
Gini
Medida de impureza
tricas de entrenamiento
Precisión global
94.2%
Exactitud en
conjunto de
entrenamiento
tricas de prueba
Precisión global
91.8%
Exactitud en
conjunto de prueba
Error cuadrático
medio (RMSE)
0.724
Error cuadrático
medio
Error absoluto medio
(MAE)
0.595
Error absoluto
medio
Coeficiente de
determinación (R²)
0.891
Varianza explicada
Tabla 4. Configuración del modelo Random Forest y métricas de evaluación
La Figura 2 presenta el análisis de importancia de variables y la evaluación comprehensiva del
modelo Random Forest desarrollado para la predicción de estrés hídrico.
24
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
Figura 2. Evaluación comprehensiva del modelo Random Forest para predicción de estrés hídrico
en cultivos de café
La Figura 2A revela que las variables de humedad del suelo constituyeron el 53.5% de la importancia
total del modelo (Sensor 1: 28.4%, Sensor 2: 25.1%), confirmando su papel fundamental en la
predicción del estrés hídrico. La precipitación representó el 18.6% de la importancia, seguida por la
temperatura ambiental (12.8%) y la radiación solar (8.7%). Esta jerarquización de variables es
consistente con los procesos fisiológicos del ca, donde la disponibilidad hídrica en el suelo es el
factor limitante primario.
La matriz de confusión (Figura 2B) muestra un rendimiento balanceado entre las tres clases, con
precisiones del 91.2% para "Sin Estrés", 90.4% para "Estrés Moderado" y 88.9% para "Estrés
Severo". Las métricas por clase (Figura 2C) indican valores consistentemente altos para todas las
categorías, con F1-scores superiores a 0.889, evidenciando la robustez del modelo desarrollado.
El análisis temporal de predicciones (Figura 2D) demuestra que el modelo capturó efectivamente los
patrones de estrés hídrico a lo largo del período de prueba, con una precisión global del 91.8%. Los
errores de clasificación se concentraron principalmente en las transiciones entre categorías
adyacentes, reflejando la naturaleza continua del fenómeno de estrés hídrico en condiciones de
campo.
Basándose en los resultados del modelo Random Forest y el análisis de las variables monitoreadas, se
establecieron umbrales operativos para la implementación de un sistema de alerta temprana de estrés
hídrico. La Tabla 5 presenta estos umbrales críticos derivados del análisis de los datos
25
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
experimentales.
Nivel de
estrés
Humedad
suelo (%)
Temperatura
(°c)
Días
sin
lluvia
Radiación
solar
(w/m²)
Acción
recomendada
Sin Estrés
>65
<28
<7
<800
Monitoreo
rutinario
Estrés
Moderado
40-65
28-31
jul-14
800-1000
Alerta
temprana,
preparar riego
Estrés
Severo
<40
>31
>14
>1000
Riego
inmediato,
medidas
urgentes
Tabla 5. Umbrales críticos identificados para manejo de estrés hídrico en café
Estos umbrales operativos proporcionan una base cuantitativa para la toma de decisiones en el
manejo del cultivo de café, permitiendo la implementación de medidas preventivas antes de que el
estrés hídrico afecte significativamente la productividad y calidad del cultivo. El modelo desarrollado
demostró capacidad para predecir con 2-3 días de anticipación la transición entre niveles de estrés,
proporcionando tiempo suficiente para la implementación de estrategias de mitigación.
DISCUSIÓN
Los resultados obtenidos demuestran que el modelo Random Forest desarrollado alcanzó un
rendimiento excepcional para la predicción de estrés hídrico en cultivos de café, con una precisión
global del 91.8% y un coeficiente de determinación (R² = 0.891) que supera significativamente los
valores reportados en estudios previos. La investigación de Montaguano (2024) en el mismo centro
experimental reportó un RMSE de 0.7246 utilizando Random Forest, valor muy similar al obtenido
en este estudio (0.724), validando la consistencia y reproducibilidad de la metodología
implementada. La jerarquización de variables por importancia revela que los sensores de humedad
del suelo constituyeron el 53.5% de la capacidad predictiva del modelo, confirmando la relevancia
fundamental de la disponibilidad hídrica edáfica como factor determinante del estrés en café,
resultado consistente con los hallazgos de Singh et al. (2018) quienes identificaron las variables
hídricas como predictores primarios en sistemas de cultivo tropical. La contribución significativa de
la precipitación (18.6%) y temperatura ambiental (12.8%) al modelo refleja la importancia de las
variables meteorológicas en la caracterización del balancedrico, resultado que coincide con
estudios previos que han demostrado correlaciones fuertes entre estas variables y la respuesta
fisiológica del café al estrés hídrico (Kangogo et al., 2022).
El análisis temporal reveló patrones estacionales claramente definidos de estrés hídrico, con enero y
marzo de 2024 registrando los períodos más críticos (22% y 18% del tiempo en estrés severo,
respectivamente), coincidiendo con las temperaturas máximas observadas (>31°C) y la ausencia de
precipitaciones significativas durante estos períodos. Estos resultados son consistentes con el
comportamiento climático típico de la región amazónica occidental del Ecuador, donde la época seca
se caracteriza por déficits hídricos pronunciados que pueden comprometer la productividad cafetalera
(Hassanpour et al., 2020). Los umbrales críticos identificados (humedad del suelo <40% para estrés
severo, 40-65% para estrés moderado) proporcionan referencias cuantitativas operativas que
coinciden con los rangos reportados por Bwambale et al. (2020) para cultivos tropicales perennes,
26
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
validando la aplicabilidad práctica de estos valores para la implementación de sistemas de alerta
temprana. La capacidad del modelo para predecir transiciones entre niveles de estrés con 2-3 días de
anticipación representa una ventaja significativa para la toma de decisiones en el manejo del cultivo,
permitiendo la implementación proactiva de estrategias de mitigación antes de que el estrés afecte
irreversiblemente la fisiología de la planta, aspecto ctico considerando que el café requiere de 24-48
horas para mostrar respuestas fisiológicas visibles al déficit hídrico (Kamienski et al., 2019).
La implementación exitosa del sistema IoT de monitoreo ambiental en el Centro Experimental Sacha
Wiwa demuestra la viabilidad técnica y económica de la agricultura de precisión en contextos de
pequeña y mediana escala en países en desarrollo, contribuyendo significativamente al avance de la
Agricultura 4.0 en la región amazónica. La heterogeneidad espacial observada entre los sensores de
humedad del suelo (CV = 19.6% vs 13.0%) subraya la importancia de implementar redes de sensores
distribuidos para capturar adecuadamente la variabilidad microespacial del contenido hídrico, aspecto
fundamental para el desarrollo de estrategias de riego de precisión sitio-específicas (Sishodia et al.,
2020). Sin embargo, el estudio presenta limitaciones importantes que deben considerarse para futuras
investigaciones: la disponibilidad de datos del 82.3% debido a interrupciones energéticas representa
un desafío operativo significativo que requiere soluciones de respaldo energético para garantizar la
continuidad del monitoreo; la ausencia de datos de rendimiento y calidad del café limita la validación
directa del impacto del estrés hídrico predicho sobre la productividad del cultivo; y el período de
estudio de ocho meses, aunque representativo de la variabilidad estacional, requiere extensión a
múltiples ciclos anuales para validar la robustez del modelo ante la variabilidad climática interanual.
Futuras investigaciones deberían integrar variables adicionales como déficit de presión de vapor,
conductancia estomática y potencial hídrico foliar para mejorar la precisión predictiva del modelo, a
como expandir la validación a diferentes variedades de café y condiciones edafoclimáticas para
evaluar la transferibilidad de los umbrales identificados.
CONCLUSIONES
El desarrollo e implementación del modelo Random Forest para la predicción de estrés hídrico en
cultivos de café mediante sensores IoT demostró una precisión excepcional del 91.8%, validando la
efectividad de la integración entre tecnologías del Internet de las Cosas y algoritmos de machine
learning en la agricultura de precisión tropical. La jerarquización de variables reveló que los sensores
de humedad del suelo constituyeron el 53.5% de la capacidad predictiva del modelo, confirmando su
rol fundamental como indicadores primarios del estrés hídrico, mientras que la precipitación y
temperatura ambiental contribuyeron significativamente (18.6% y 12.8% respectivamente) a la
caracterización del balance hídrico. Los umbrales críticos identificados (humedad del suelo <40%
para estrés severo, 40-65% para estrés moderado) proporcionan referencias operativas cuantitativas
para la implementación de sistemas de alerta temprana, con capacidad de predicción 2-3 días antes de
la manifestación del estrés, tiempo suficiente para la implementación de medidas preventivas de
manejo del cultivo.
La implementación exitosa del sistema de monitoreo IoT en el Centro Experimental Sacha Wiwa
demuestra la viabilidad técnica y económica de estas tecnologías en contextos de agricultura tropical,
contribuyendo al avance de la Agricultura 4.0 en pses en desarrollo. Los patrones estacionales
identificados, con períodos críticos durante enero y marzo coincidiendo con temperaturas máximas
>31°C, proporcionan información valiosa para la planificación de estrategias de riego y manejo
hídrico en sistemas cafetaleros. Este estudio establece las bases metodológicas para la expansión de
sistemas de predicción de estrés hídrico basados en IoT y machine learning a mayor escala, con
potencial para transformar las prácticas de manejo agrícola hacia sistemas más eficientes, sostenibles
y productivos en la región amazónica occidental del Ecuador.
27
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
REFERENCIAS BIBLIOGFICAS
Abioye, E. A., Abidin, M. S. Z., Mahmud, M. S. A., Buyamin, S., Ishak, M. H. I., Rahman, M. K. I.
A., ... & Ramli, M. S. A. (2023). IoT-based monitoring and data-driven modelling of drip
irrigation system for mustard leaf cultivation experiment. Information Processing in
Agriculture, 10(2), 270-283.
An, J., Li, W., Li, M., Cui, S., & Yue, H. (2019). Identification and classification of maize drought
stress using deep convolutional neural network. Symmetry, 11(2), 256.
Bwambale, E., Abagale, F. K., & Anornu, G. K. (2020). Smart irrigation monitoring and control
strategies for improving water use efficiency in precision agriculture: A review. Chemical
Engineering Transactions, 82, 369-374.
Hassanpour, B., Yazdandoost, F., & Ramezani, Y. (2020). Evaluation of OPTRAM implementation
on Sentinel-2 data for soil moisture mapping at field scale. Computers and Electronics in
Agriculture, 178, 105746.
Kamienski, C., Soininen, J. P., Taumberger, M., Dantas, R., Toscano, A., Cinotti, T. S., ... &
Kozlovski, E. (2019). Smart water management platform: IoT-based precision irrigation for
agriculture. Sensors, 19(2), 276.
Kangogo, D., Dentoni, D., & Bijman, J. (2022). Prediction of arabica coffee production using
artificial neural network and multiple linear regression techniques. Scientific Reports, 12(1),
9729.
Molin, J. P., Colaço, A. F., & Amaral, L. R. (2022). The role of machine learning on Arabica coffee
crop yield based on remote sensing and mineral nutrition monitoring. Biosystems
Engineering, 221, 81-104.
Montaguano, J. A. (2024). Implementación de un sistema de monitoreo medioambiental mediante
sensores inalámbricos y tecnologías IoT para el centro experimental Sacha Wiwa [Tesis de
maestría, Universidad Estatal Península de Santa Elena]. Repositorio UPSE.
Monteiro, A., Santos, S., & Gonçalves, P. (2021). Precision agriculture for crop and livestock
farmingBrief review. Animals, 11(8), 2345.
Ohana-Levi, N., Munitz, S., Ben-Gal, A., Schwartz, A., Peeters, A., & Netzer, Y. (2024). A spatial
machine-learning model for predicting crop water stress index for precision irrigation of
vineyards. Computers and Electronics in Agriculture, 217, 108621.
Sankararao, A. U., Ramalinga Reddy, M., Kiran Kumar, B., Raghavendra, S., & Leela Rani, K.
(2021). Identification of water stress in pearl millet crop using UAV based hyperspectral
remote sensing. Geocarto International, 38(1), 2208816.
Singh, A. K., Ganapathysubramanian, B., Sarkar, S., & Singh, A. (2018). Deep learning for plant
stress phenotyping: trends and future perspectives. Trends in Plant Science, 23(10), 883-898.
Sishodia, R. P., Ray, R. L., & Singh, S. K. (2020). Applications of remote sensing in precision
agriculture: A review. Remote Sensing, 12(19), 3136.
Sitienei, I., Kamau, D. M., & Ndakidemi, P. A. (2017). Artificial intelligence approach for the
prediction of Robusta coffee yield using soil fertility properties. Computers and Electronics in
Agriculture, 155, 324-333.
Zhuang, S., Wang, P., Jiang, B., Li, M., & Gong, Z. (2020). Early detection of water stress in maize
based on digital images. Computers and Electronics in Agriculture, 178, 105746.
28
Revista INNDEV. ISSN 2773-7640. Abril - Julio 2025. Vol. 4, Núm 1, P. 14 - 28.
https://doi.org/10.69583/inndev.v4n1.2025.153
Copyright (2025) © Edner Alfredo Gonzalez Mera,
Alex Darwin Paredes Anchatipan, Paco Jovanni Vásquez Carrera
Este texto está protegido bajo una licencia internacional Creative Commons 4.0.
Usted tiene libertad de Compartircopiar y redistribuir el material en cualquier medio o formato y
Adaptar el documento remezclar, transformar y crear a partir del materialpara cualquier propósito,
incluso para fines comerciales, siempre que cumpla las condiciones de Atribución. Usted debe dar
crédito a la obra original de manera adecuada, proporcionar un enlace a la licencia, e indicar si se han
realizado cambios. Puede hacerlo en cualquier forma razonable, pero no de forma tal que sugiera que
tiene el apoyo del licenciante o lo recibe por el uso que hace de la obra.
Resumen de licencia Texto completo de la licencia