INTRODUCCIÓN
El Perú concentra el 72% de la población mundial alpacas, con 4.3 millones de cabezas, siendo Arequipa la tercera región con mayor porcentaje de alpacas representado por el 12.7% de la población total (MIDAGRI 2021). La comercialización de las fibras de alpaca como materia prima para la industria textil en las regiones altoandinas es una de las actividades de mayor importancia, lo que brinda oportunidades de desarrollo mediante la exportación de fibras procesadas o como productos textiles incrementando su valor agregado (ONUDI, 2006; Guillen et al., 2023). La industria textil de Arequipa es la principal demandante de fibras de alpaca, abarcando el 85% de la producción nacional, la cual es mayormente adquirida por empresas que acopian fibras de pequeños y medianos productores (66.5%) (Infoalpaca, 2013), que, en base a sus características textiles, establecen el precio (Frank, 2008). Algunas empresas privadas dan mejores precios por vellones más finos (González et al., 2008). La producción y comercialización de fibras desde el punto de vista socioeconómico es de gran relevancia, puesto que gran parte de pequeños, medianos productores y empresas agropecuarias dependen económicamente de su explotación (Carpio, 2017).
La finura de la fibra está relacionada directamente con la calidad de la fibra, pues diámetros de fibra más finos son más apreciados para la comercialización y transformación en prendas (Cordero et al., 2011). El grado de finura se expresa en el factor de confort (Bustinza, 2001), el cual se relaciona a la suavidad del tejido, y se define como el porcentaje de diámetro de fibra debajo de los 30 ìm (Naylor y Hansford 1999; Frank et al., 2014; Tadesse et al., 2021) ya que la presencia de fibras gruesas le confiere una apariencia heterogénea a los tejidos o hilos (Wang et al., 2005) y aumenta el efecto de picazón en la piel (Professor, 2021). También se ha encontrado que una alta incidencia de medulación y tipo de medulación en las fibras causan el mismo efecto (Frank et al., 2014, 2017). Las fibras meduladas que tienen efecto sobre el factor de confort son consideradas como objetables, y según IWTO (1998) son las que tienen una opacidad superior al 94% y un diámetro superior a 25 µm.
Por lo tanto, para la determinación de la calidad de fibra y su grado de confort se debería de abordar variables adicionales que relacionen las principales características textiles, tales como el diámetro de fibra, diámetro de médula, porcentaje de medulación por volumen y porcentaje de fibras objetables. Por otro lado, se dispone de métodos para la determinación de las principales características textiles como el Analizador de Diámetro de Fibra Óptica (OFDA), que es el más aplicado por las industrias textiles (Brims et al., 1999), pero no muestra una relación entre características, de allí que se hace necesario realizar un estudio que evalúe estas interacciones en un solo factor con el cual se pueda identificar y dar una predicción precisa y eficaz; lo cual debería incluir modelos predictivos aplicando inteligencia artificial.
El desarrollo de inteligencia artificial (IA) ha permitido que las computadoras puedan procesar automáticamente datos y obtener una predicción a partir de ellos, mediante el cual es posible obtener valores muy cercanos a la realidad (Krizhevysky et al., 2012).
Diversos estudios han demostrado que la aplicación de un modelo basado en IA, como el modelo convencional de regresión lineal múltiple (MLR), puede proporcionar datos precisos, incluso cuando la cantidad de datos proporcionados es baja (Uyak et al., 2005; Kulkarni y Chellam, 2010; Peleato et al., 2018). Por lo tanto, el presente estudio tuvo como objetivo el uso de inteligencia artificial basada en el modelo de MLR evaluando un nuevo factor para determinar la calidad en fibras de alpaca Huacaya.
MATERIALES Y MÉTODOS
Lugar de Estudio, Animales y Muestras
El trabajo de investigación se realizó con muestras de vellón obtenidas de alpacas del centro poblado Chalhuanca, distrito de Yanque, provincia de Caylloma, Región Arequipa, Perú, ubicada a 4349 msnm. Las muestras de fibra (20 g) se tomaron del costillar medio sobre la antepenúltima costilla de alpacas Huacaya (Aylan-Parker y McGregor 2002). El tamaño de muestra corresponde a una mínima cantidad requerida por el modelo de inteligencia artificial que comprende seis alpacas blancas, de sexo macho y con edades de entre 1 y 3 años.
Análisis de Laboratorio
Las muestras de fibra de alpaca fueron analizadas en el Laboratorio de Investigación e Innovación en Energías Renovables y Medio Ambiente (INNOVERGY) de la Universidad Católica de Santa María, en Arequipa, Perú.
Las muestras fueron lavadas repetidas veces con agua a 50 °C con detergente industrial (50 g/l), luego se sumergieron en alcohol etílico al 96% (PA) y se secaron a condiciones de medioambiente. Con ayuda de pinzas y un estereoscopio (Stemi 508, Zeiss), se colocaron las fibras de manera aleatoria en el portaobjetos en forma vertical para luego colocar el cubreobjetos y proceder a la observación por microscopía óptica (MO) (Zhong et al. 2016; Xing et al., 2020; Zang et al., 2021).
Se analizaron 1200 fibras en total, 200 fibras por cada paquete de vellón colectado de las 6 alpacas, nombrándolos como M1, M2, M3, M4, M5 y M6. Seguidamente, se realizó el análisis con MO con objetivo de 10x y 40x con la finalidad de analizar fibras independientes, descartando así las fibras sobrepuestas (Figura 1). Asimismo, se tomaron fotografías mediante el microscopio trinocular con una cámara CMEX-10 PRO 10 mp de Euromex acoplada en conjunto con el software de visualización, captura de imágenes y medición Zen Blue v. 2.3.
En cada fibra se determinó el diámetro total y diámetro de médula. Se determinó el diámetro medio de fibra (DMF), la desviación estándar de diámetro fibra (DEF), el coeficiente de variación de diámetro de fibra (CVF), el factor de confort (FC) que considera el porcentaje de fibras menores de 30 ìm (McGregor 1997; Frank et al., 2006), el diámetro medio de médula (DMM), la desviación estándar de diámetro de médula (DEM), el porcentaje de fibras objetables (FO) que considera el porcentaje de fibras con medulas mayores a 25 ìm (IWTO-8-2011 2017) y el porcentaje de modulación por volumen (MV) que se calculó con la fórmula de Bray (% Med. Vol. = ([Nm/ Nw]*100*[d2m + o2m/d2w + o2w])) [Ecuación 1], donde Nw = número total de fibras medidas, d2w = promedio de diámetro de fibra, o2w = desviación estándar de diámetro de fibra, Nm = número de fibras con medula, d2w = promedio de diámetro de medula y o2w = desviación estándar de diámetro de médula (Merrick, 1998).
Desarrollo del Modelo Usando Inteligencia Artificial
Se utilizó un modelo de machine learning, regresión lineal múltiple (RLM), usando el método de optimización de descenso de gradientes estocástico (Pillaud-Vivien et al., 2018), que fue implementado para la predicción de un nuevo factor denominado Soft (FS) de fibras de alpaca. La implementación del modelo de IA se realizó en el computador HP Pavilion Intel Core i5 de décima generación de 2.50 GHz hasta 4.50 GHz con TurboBoost de Intel. Para el desarrollo del modelo se usó el lenguaje de programación Python 3.9.2 en conjunto con las librerías pandas y numpy.
Toma de muestra y configuración del sistema
Las muestras se tomaron por conjuntos de datos, cada uno de estos contenía los parámetros DMF, DMM, MV, FO y el FC de 30 fibras individuales para generar una muestra (dato). Para generar un dataset se tomaron 1200 fibras individuales obteniendo 40 datos. Se incluyen también seis (6) datos adicionales al dataset provenientes del equipo OFDA.
Hold out set
A partir de la información tomada de las muestras se construyó la matriz de datos. Un dato contiene cinco (5) variables independientes (DMF, DMM, MV, FO y FC) y un dato dependiente (% Soft). De los 46 datos se realizó una división aleatoria con el propósito de generalizar el modelo de forma optimizada seleccionando datos aleatorios, 75% del dataset para datos de entrenamiento y verificación de modelo, y 25% para datos de prueba y la validación de modelo.
Descenso de gradientes estocástico
La aplicación de la regresión lineal múltiple (RLM) mediante el método del descenso de gradientes estocástico (SGD) es computacionalmente más eficiente que otros algoritmos, adaptativo a datasets pequeños permitiendo realizar la generalización de predicciones, gestionando anomalías de manera correcta y evitando la sobreestimación de la correlación de la variable dependiente y las predicciones. Se formula el modelo (Ecuación 2) que define la estructura de las variables independientes y la variable dependiente, en la que n=5, almacenando los pesos procesados permitiendo actualizar los pesos. Se aplica regularización para mejorar la generalización (Ecuación 3) para mejorar la estimación de datos nuevos que ingresen al modelo, y permitir un modelo escalable y preparado para retroalimentación y mantener un modelo estable (Zhang, 2004).
Estimación de muestras foráneas
El cálculo de la estimación mediante mínimos cuadrados permite la transformación de datos numéricos continuos en forma de matrices a datos enteros continuos, de esta manera utilizar los pesos actualizados y operarlos con los datos entregados, y poder calcular la estimación por un conjunto de datos, o de manera individual.
Análisis de robustez y sensibilidad
El análisis de sensibilidad se llevó a cabo utilizando cuatro métodos estadísticos. El error medio absoluto (MAE), el error medio cuadrado (MSE), la raíz cuadrada del error medio cuadrado (RMSE) y el coeficiente de determinación (R2) (Amor et al., 2022). Se utilizó el MAE para poder analizar las diferencias individuales de las estimaciones y los datos reales (Ecuación 4). Se empleó el MSE para poder observar la diferencia generalizada de valores atípicos o anomalías (Ecuación 5). Se utilizó el RMSE para calcular la desviación estándar de la varianza y poder analizar el ajuste de estimación (Ecuación 6). Se aplica por último el coeficiente de determinación R cuadrado para determinar el ajuste de regresión (Ecuación 7).
Validación de la inteligencia artificial
El proceso de validación consistió en comparar el método MLR para determinar el FS. Por un lado, inicialmente se evaluaron seis muestras de fibras de alpaca Huacaya mediante MO, donde se recopilaron datos correspondientes a las 1200 fibras. Por otro lado, se utilizaron seis ejemplares de alpaca Huacaya blanca, cada muestra preparada de acuerdo con la International Wool Textile Organization (IWTO, 2017a) y se evaluaron siguiendo el procedimiento descrito por dicha institución (IWTO, 2017b) mediante el equipo OFDA 100 en el laboratorio de control de calidad de la empresa Inca Tops S.A., Arequipa. Para concluir la validación se evaluaron las mismas fibras mediante la IA basada en MLR donde se obtuvo el FS de cada muestra.
RESULTADOS Y DISCUSIÓN
Características de las Fibras
Diámetro de fibra
En el Cuadro 1 se muestra la distribución estadística descriptiva del diámetro de la fibra de las muestras trabajadas.
El diámetro de fibra promedio fue 26.80±6.95 µm (Rango: 23.37 - 31.63 µm), los cuales mostraron diferencias significativas entre medias (p<0.05), lo que indica una constante por efecto de la edad, y se corrobora con otros estudios que reportan un impacto significativo por esta variable en el DMF, ya que a menor edad se pueden observar en la alpaca fibras más finas (Gutierrez, 2011). Machaca et al. (2017) encontraron diámetros de fibra en el rango de 21.61 y 23.87 µm en alpacas de 1 y 3 años, respectivamente. Asimismo, Lupton et al. (2006) reportaron que en alpacas criadas en EEUU se obtuvo 24.3, 26.5 y 30.1 µm para animales de 1, 2 y >2, respectivamente. El diámetro de fibra se considera como la característica más importante, ya que de esta depende la calidad, el rendimiento de la hilabilidad, la vellosidad del hilo, el valor y el uso final (Lupton et al., 2006).
Diámetro de médula
En el Cuadro 2 se muestra que todas las muestras presentaron algún porcentaje de fibras meduladas. Esto confirma que la presencia de medulación está presente en la mayoría de fibras muestreadas, pudiendo determinarse el nivel mediante marcadores genéticos (Allain y Renieri, 2010). Por otro lado, el análisis de medulación es más sencillo por microscopia si las fibras son blancas o claras (Moore et al., 2011).
El diámetro de médula de las muestras se presentó en un rango entre 2.22 µm como valor mínimo y 48.33 µm como valor máximo., siendo valores semejantes a los reportados por Cruz et al. (2019) en alpacas Huacaya (14.00 -38.80 µm), indicando que la medición realizada por microscopía se encuentra dentro del rango de los diámetros de medula analizados por equipamiento especializado como el OFDA.
Las fibras de alpaca se diferenciaron en meduladas y no meduladas (Cuadro 2), obteniendo un rango promedio de DMM de 11.63 a 20.59 µm. La muestra 1 presentó el mayor valor de DMM con un valor de 20.59 µm, así como el segundo mayor porcentaje de fibras meduladas (68%), antecedido por la muestra 4 (79% de fibras meduladas). Por otra parte, la muestra 2 presentó el menor DMM (11.63 µm y 40% de fibras meduladas, lo cual indica que las fibras de alpaca presentan varios grados de medulación, lo cual afecta la heterogeneidad de los tejidos y el factor de confort (Pinares et al., 2018; Bonilla et al., 2022). Sin embargo, las fibras meduladas también pueden ser utilizadas en la industria para artículos que requieran ser más livianos como ropa deportiva, o para ropa de invierno y sacos de dormir (Shishoo, 1995; Tao, 2001). Además, las fibras meduladas proporcionan un mayor aislamiento térmico natural en comparación con las fibras no meduladas, lo que proporciona a las prendas una alta calidad aislante y térmica (Tao 2001; Wang et al., 2005).
Se determinaron diferencias significativas entre las medias del diámetro de médula (p<0.05), además de una variabilidad media-baja de sus datos.
Porcentaje de medulación por volumen
La cantidad de fibras meduladas presentes en una muestra puede ser representada en porcentaje de acuerdo con el número, el volumen o por ambos, según el método de medición utilizado (Merrick, 1998). Para fines específicos de este estudio se consideró que la medulación por volumen porcentual era la más relevante, debido a que considera más variables en su desarrollo (porcentaje de medulación por número, y la media y la desviación estándar del diámetro de fibra y del diámetro de médula) (Merrick, 1998).
El porcentaje promedio de MV fue 24.75 ± 13.20 µm, con un rango entre 14.48 a 42.32 µm (p<0.05). La muestra 4 presenta el mayor MV, con lo que se puede afirmar que casi el 50% del volumen de algunas de sus fibras está ocupado por la médula, siendo considerada como una muestra altamente medulada y de médula gruesa. Este resultado indica el alto grado de medulación de algunas fibras de alpaca, lo cual tendría gran influencia en la apariencia y la capacidad de teñido (Lupton et al., 2006).
Factor de confort
Los valores de confort presentaron un promedio de 71.56 ± 13.04% (rango: 46.0 85.33%) (Cuadro 4), valores promedio inferiores a los reportados por Lupton et al. (2006), quienes obtuvieron 82.7, 74.1 y 58.6% en alpacas de 1, 2 y >2 años, respectivamente. Por otro lado, Machaca et al. (2017) reportaron para alpacas Huacaya de Cotaure valores entre 92.38 y 86.45%, además de indicar que el color, el sitio de muestreo y el sexo tienen influencia sobre el factor de confort. En el presente estudio, el sexo, color, y sitio de muestreo fueron fijos por lo que estas diferencias entre las medias de las muestras (p<0.05) puede estar muy relacionado a la edad.
Fibras objetables
Las fibras objetables se caracterizan por ser fuertemente meduladas (Hunter et al. 2013), siendo consideradas como fibras que parecen tener una opacidad superior al 94% y un diámetro superior a 25 µm (IWTO-57, 1998). Se obtuvieron valores de fibras objetables entre 3.33 y 26.0%, resultados similares a los obtenidos por Lupton et al. (2006), quienes reportaron valores entre 0.09 % y 22.37%. Por otro lado, no hubo diferencia entre las medias de las muestras para este factor.
Análisis de Correlación
Efecto del diámetro de médula y el porcentaje de medulación por volumen
La relación entre FS con las variables DMF, DMM, MV y FO presentaron correlaciones negativas, lo que indica que son inversamente proporcionales. Por otro lado, la correlación entre FS y FC fue positiva y fuerte (Cuadro 5), lo que indica que ante un mayor valor de confort resultará en un mayor valor de FS. Asimismo, se obtuvo una correlación alta entre DMM y MV (Cuadro 5), lo que indica que a mayores diámetros de médula se obtiene un mayor espacio ocupado por la médula (Merrick, 1998).
DMF: diámetro medio de fibra; DMM: diámetro medio de médula; MV: porcentaje de modulación por volumen; FC: factor de confort; FO: porcentaje de fibras objetables
*** Correlación fuerte; ** Correlación moderada; * Correlación débil
Al relacionar el DMF y DMM se obtuvo una correlación moderada positiva con el diámetro de fibra, relación que ha sido muy estudiada, y se corrobora con en el estudio de Berolatti et al. (2021), quienes obtuvieron una correlación positiva moderada alta en alpacas adultas entre medulación y diámetro de fibra. Así mismo, Onal et al. (2007) y Cordero et al. (2011) obtuvieron un comportamiento similar al correlacionar la medulación con el diámetro de fibra en fibras de alpaca y otros, obteniendo un valor positivo con una correlación moderada alta y moderada, respectivamente.
Las correlaciones entre DMM y MV con FC fueron negativas y moderadas, indicando relaciones inversas, ya que con una mayor incidencia de fibras meduladas gruesas se obtiene porcentajes de confort inferiores. Bonilla et al. (2022) indican, asimismo, que al aumentar la incidencia de medulación, la sensación de picor y la heterogeneidad en los tejidos son más intensos. La fibra medular y el tipo de medulación son responsables de la disminución de la sensación de confort (Frank et al., 2014, 2017).
Se obtuvo una correlación moderada entre las fibras objetables con el DMM y el MV, por lo que una mayor cantidad de fibras meduladas gruesas provoca un aumento en el porcentaje de fibras objetables, ya que las fibras objetables se caracterizan por ser meduladas y de mayor diámetro (IWTO-57, 1998). En este sentido, tanto el porcentaje de medulación como el diámetro de médula son variables de importancia para las industrias textiles, con las que puedan obtener productos textiles de calidad, sin que interfieran con el proceso de teñido.
Efecto del factor de confort
Los resultados de la correlación de Pearson muestran una fuerte correlación entre el FC con el FS. La fuerte correlación de DMF y el FC, entendiéndose que a mayor finura de fibra se brinda mayor comodidad (McGregor y Butler, 2004). Por lo contrario, a fibras más gruesas la sensación de picazón aumenta, la cual se ajusta a una distribución de ley potencia (Mamani et al., 2022). Las correlaciones entre DMM y MV con FS fueron significativas y negativas, en tanto que la correlación entre FO y FS mostró una significancia débil, pero igualmente negativa. Es así que el aumento de DMM, MV y FO disminuye la FS. La relación de estas tres variables afecta directamente a la calidad de fibra, ya que a mayor DMM y MV se aumenta la incidencia de FO. McGregor (2006) reportó que la incidencia de medulación se incrementa entre 10 a 60% en fibras de 22 y 40 µm.
Efecto del porcentaje de fibras objetables
Se encontró una correlación moderada negativa entre FO y FS, por lo que ante un aumento de las fibras objetables se tienen menores valores del factor Soft. Asimismo, se obtuvo una fuerte correlación entre FO con FC y DMF; y una correlación moderada positiva con DMM y MV. Por lo tanto, un mayor porcentaje de FO se obtendrá el existir más fibras meduladas y que posean un diámetro de médula mayor. Esta misma tendencia se observó en el estudio de Lupton et al. (2006).
Ajuste de Datos para el Modelamiento de IA
Para la predicción de FS en fibras de alpaca se trató de extraer datos que estuvieran relacionados entre ellos para ser parte del dataset del modelo de RLM, toda vez que la precisión y confiabilidad del modelo se basa principalmente en este aspecto (Fong et al., 2020). Inicialmente se seleccionaron variables relacionadas (diámetro de fibra, diámetro de médula, porcentaje de fibras meduladas, porcentaje de medulación por volumen y factor de confort), pero el error era muy grande (MAE training = 5.1028+e28; MAE test = 4.0192e+28), afectando al modelo. Para solucionarlo, se retiró el porcentaje de fibras meduladas y se agregó la variable de porcentaje de fibras objetables. Este tipo de fibras está más relacionado al disconfort por fibras que causan comezón o picazón (Naebe et al., 2018) La vinculación entre confort y disconfort está fuertemente asociada a la medulación y al diámetro de fibra (Pinares et al., 2018). Es por esto que el nuevo factor denominado "Soft" es una variable resultante de la diferencia del factor de confort y las fibras objetables.
Modelo de Regresión Lineal Múltiple con el Enfoque del Descenso de Gradientes Estocástico
Se encontró que el modelo RLM propuesto con el enfoque SGD presenta una gran precisión en la predicción del FS. Se tomó como valor k = 17 de 34 datos en total de cada muestra (M1, M2, M3, M4, M5 y M6) de los cuales a partir de ellos se encontró el error (MSE, MAE, RMSE y r2) El modelo realiza 1000 iteraciones y del total de datos solo usa 17 por iteración lo que permite generar todo tipo de combinación y obtener el mejor resultado.
Análisis de robustez del modelo RLM con el enfoque SGD
El modelo de IA propuesto realiza 1000 iteraciones teniendo un tiempo de respuesta promedio de 0.80 s. Los datos con poblaciones pequeñas se ajustaron al modelo con una excelente precisión sin mostrar sobre entrenamiento o poco entrenamiento de datos. Debido a esto, el modelo puede estar preparado para hacer una predicción muy precisa con datos nuevos. El modelo RLM convencional sin el proceso SGD muestra una precisión aún mayor para los datos, pero no estaría preparado para datos extraños, ya que al enfrentarse con datos nuevos la distancia que habría entre la curva y el dato nuevo sería muy grande, obteniendo un error mayor, caso contrario cuando se utiliza SGD que permite determinar datos foráneos con más precisión.
Los resultados obtenidos por RLM con el algoritmo SGD son los siguientes: Para los datos de entrenamiento MSE = 0.1192, MAE = 0.2782, RMSE = 0.3452 y r2 = 0.9996 y para los datos de prueba MSE = 0.1103, MAE = 0.2998, RMSE = 0.3321 y R2 = 0.9999. Debido a la resultante de errores mínimos los datos observados son muy similares a los de predicción, de allí que en la curva de tendencia se observan los valores de predicción con distancias mínimas o muy cercanas a los datos observados. La curva de tendencia de los datos observados y de predicción en el entrenamiento y en la prueba se muestran en las figuras 2 y 3.
El MSE permite obtener la disminución de error de estimación por cada iteración y la correcta actualización de los pesos en la gradiente. Se calculan estos datos con el propósito de evaluar la convergencia del modelo. En otras palabras, el punto máximo en el cuál no se puede generalizar más la predicción de datos y pueda entregar las predicciones más acertadas y reales. Los errores se grafican en la Figura 4 por actualización de pesos en cada iteración.
CONCLUSIONES
Existe una relación inversa y significativa entre el Factor Soft (FS) y las variables diámetro medio de fibra (DMF), diámetro medio de médula (DMM), porcentaje de modulación por volumen (MV) y porcentaje de fibras objetables (FO); y una correlación directa y fuerte con el factor de confort (FC), por lo que tienen el mismo efecto sobre la calidad de fibras.
La técnica de regresión lineal múltiple (RLM) con el enfoque estocástico (SGD) satisface la predicción del FS, ya que se ajusta a las variables seleccionadas como DMF, DMM, MV, FC y FO. El modelo RLM optimizado por SGD se adapta al tamaño muestral y a las variables mencionadas con gran precisión.
Los datos de la predicción mostraron una gran robustez y con bajos valores en el error medio absoluto (MAE), el error medio cuadrado (MSE) y la raíz cuadrada del error medio cuadrado (RMSE) y un valor R2 aceptable.
Los datos mostrados por el equipo OFDA validaron la confiabilidad del modelo, de modo que este modelamiento de inteligencia artificial sea apto para la evaluación de fibras y ser un atributo computacional agregado en la industria textil.