Download aplicación de redes neuronales artificiales (rna) en la predicción y

Document related concepts

Perceptrón multicapa wikipedia , lookup

ART (RNA) wikipedia , lookup

Red neuronal artificial wikipedia , lookup

Redes neuronales probabilísticas wikipedia , lookup

Redes neuronales convolucionales wikipedia , lookup

Transcript
VIII CAIQ2015 y 3 JASP
APLICACIÓN DE REDES NEURONALES ARTIFICIALES (RNA)
EN LA PREDICCIÓN Y MODELADO DE LA CINÉTICA DE
EXTRACCIÓN DE ACEITE DE CANOLA
R. J. Sánchez*1, M. B. Fernández1,2, S. M. Nolasco1.
1
Grupo TECSE – Facultad Ingeniería
(Universidad Nacional del Centro de la Provincia de Buenos Aries)
Av. Del Valle 5737 – Olavarría – Argentina
2
CIFICEN
(Universidad Nacional del Centro de la Provincia de Buenos Aries - CONICET)
Pinto 399 – Tandil – Argentina
*E-mail: ([email protected])
Resumen. En este trabajo, se utilizó una Red Neuronal Artificial (RNA)
feedforward con una capa oculta y algoritmos de entrenamiento
backpropagation (BP) y de ajuste de pesos Levenberg-Marquartd (LM) para
la predicción de la cinética de extracción con hexano de aceite de canola.
Para el entrenamiento y validación, se emplearon los datos de tiempo de
extracción (5 - 1080 minutos) y temperatura de proceso (25, 40 y 60 °C)
como datos de entrada y los valores de rendimiento en base seca (% b.s.)
como datos de salida, los cuales se obtuvieron en un sistema de extracción
batch agitado. Se estudiaron distintas arquitecturas variando el número de
neuronas en la capa oculta, encontrando que la RNA con 4 neuronas
brindaba el mejor ajuste de los datos experimentales. Se evaluó la
efectividad de la red mediante la predicción de los rendimientos a 50°C; los
cuales se contrastaron con datos experimentales. A su vez, se realizó un
ajuste de estos datos con un modelo de Difusión Modificado. Con respecto a
los datos experimentales, se evaluó el error cuadrado medio porcentual
(ECM%) y el R2, encontrándose para la RNA valores de ECM%=2,29 y
R2=0,99;
mientras que el ajuste con el modelo matemático arrojó
AAIQ Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
ECM%=2,24 y R2=0,99. Estos resultados muestran la eficacia y
potencialidad del uso de las redes neuronales para el modelado y predicción
de la cinética de extracción con solvente de aceite de canola dentro del
dominio de los datos de entrenamiento.
Palabras clave: REDES NEURONALES ARTIFICIALES, EXTRACCIÓN DE
ACEITE, CANOLA.
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
1. Introducción
La canola es una oleaginosa con alto contenido de aceite, cuya composición de ácidos
grasos y elevado contenido de compuestos bioactivos lo convierte en un aceite único
para el consumo humano (Shahidi, 1990; Thiyam-Holländer y col., 2012).
Industrialmente la extracción de aceite es llevada a cabo por prensado y/o extracción
por solvente; siendo el hexano el solvente utilizado convencionalmente. El manejo de
este tipo de solventes presenta ciertas dificultades, dada su inflamabilidad y efectos al
ambiente y la salud; por lo que adquiere relevancia el desarrollo de herramientas que
permitan reducir la incertidumbre sobre las variables del proceso de extracción.
Las redes neuronales artificiales (RNA) son técnicas de modelado con elevada potencia
inspiradas en la forma en la que las neuronas biológicas desarrollan las funciones de
aprendizaje y memoria. Las RNA presentan varias ventajas sobre las técnicas de
modelado convencionales ya que son capaces de modelar sin necesidad de suposiciones
sobre la naturaleza de los mecanismos fenomenológicos, comprender la base
matemática del problema que subyace en el proceso y ser capaces de aprender
relaciones lineales y no lineales entre las variables a partir de un conjunto de ejemplos
(Fathi y col., 2009). Las unidades fundamentales de las RNA son las neuronas (análogas
a las neuronas biológicas) y los pesos, conexiones ponderadas comparables a las
sinapsis en un sistema biológico. A partir de cálculos simultáneos en paralelo de sus
elementos, una RNA es capaz de aprender a partir de ejemplos y generalizar
permitiendo abordar distintos problemas; aún cuando los datos sean incompletos o
contengan errores (Rafiq y col. 2001). Se han realizado estudios utilizando RNA como
una herramienta de modelado útil para predecir la cinética de extracción de aceite
esencial de anís, encontrando que el modelo desarrollado resulto más preciso en
comparación con un modelo matemático de difusión (Shokri y col., 2011).
El objetivo de este trabajo fue desarrollar una estructura de RNA que permita modelar y
predecir con éxito la cinética de extracción con solvente de aceite de canola.
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
2. Materiales y métodos
2.1. Materia Prima y acondicionamiento de las muestras
Se contó con una partida de 10 kg de granos de canola suministrados por AL HIGH
TECH S.R.L. (Argentina) los cuales se caracterizaron en función del contenido de
aceite (IUPAC 1.122 1992) y humedad (ASAE S352.2 DEC 97, 1999). Previo a la
extracción, los granos se molieron en un molino de cuchillas y se seleccionó un rango
de partículas de 0,420-1,000 mm, acorde a la bibliografía (Pérez y col., 2011; Fernández
y col., 2012; Zárate et al., 2015) utilizando un tamiz vibratorio (ZONYTEST, EJR 2000,
Industria Argentina).
2.2. Ensayos cinéticos
Los ensayos se llevaron a cabo por duplicado, a diferentes tiempos: 5, 15, 30, 60,
120, 240 y 1080 minutos, considerándose este último como tiempo infinito, a
temperaturas constantes de 25, 40, 50 y 60°C. El proceso de extracción se realizó en un
sistema batch agitado (agitador magnético) con un baño termostáticamente controlado.
Se utilizó una relación 17 mL de solvente/g de harina, previamente al contacto se llevó a
temperatura de extracción durante 5 minutos. Se mantuvo la temperatura y agitación
constantes en todos los ensayos, para asegurar un buen contacto entre el solvente y la
muestra. Transcurrido cada tiempo preestablecido, se centrifugó el contenido en un
equipo Thermo SCIENTIFIC, SORVALL LEGEND X1 durante 5 minutos a 14069 G.
Posteriormente se filtró el contenido, la micela se recogió en un balón y el solvente se
evaporo en un evaporador rotatorio R-3000 Büchi (Suiza). Para eliminar el resto de
hexano, los balones se colocaron en estufa de aire forzado (Drying oven DHG-9123) a
105ºC por una hora. La cantidad de aceite obtenido se determinó gravimétricamente.
2.3. Red Neuronal Artificial (RNA)
Se utilizó una red perceptrón feedforward multicapa (MLP, por sus siglas en inglés)
totalmente interconectada para la predicción de la cinética de extracción con hexano de
aceite de canola a una temperatura constante. La estructura perceptrón multicapa es una
de las más comunes (Rafiq y col. 2001; Fathi y col., 2009; Shokri y col., 2011 Ramzi y
col., 2015), consta de una o más entradas que representan las variables independientes,
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
una capa de salida con neuronas que representan la variables dependientes y una o más
capas ocultas (Hagan y col., 1996) que contiene neuronas para ayudar a capturar la no
linealidad en el sistema. La complejidad de la red depende del número de capas y el
número de neuronas en cada capa. La capa oculta correlaciona las entradas x con las
salidas y, a través de una serie de pesos w interconectados matemáticamente (Shokri y
col., 2011):
 n

y i  f   wij xi  bi 
 j 1

(1)
Donde wij es el peso de la i-ésimo vector de entrada que es conectado a la j-ésima
neurona; n es el número de entradas a la neurona; bi es el umbral asociado con la
neurona j-ésimo, que añade una variable extra, lo que puede mejorar la potencia con
respecto a una red sin umbrales (Hagan y col., 1996) y f es la función de activación que
le confiere el comportamiento no lineal a la neurona. La función de activación puede ser
lineal o no lineal (tangente hiperbólica o comúnmente función sigmoide) dependiendo
de la topología de la red. En este trabajo, se utilizaron las variables tiempo y
temperatura como datos de entrada (x) y el rendimiento de aceite se consideró como
dato de salida (y).
Con el fin de asegurar un modelado exitoso, se deben considerar dos factores
importantes. En primer lugar, el número de capas y en segundo lugar el número de
neuronas en cada capa oculta. Puesto que muchos problemas prácticos de modelado con
redes neuronales podría resolverse con una capa oculta (Rafiq y col. 2001), se utilizó
una RNA con dos capas (una capa oculta y una capa de salida), tomando como función
de activación tangente hiperbólica para la capa oculta, y una función lineal para la capa
de salida. Por otro lado, para encontrar la mejor arquitectura, se construyeron redes con
distintos números de neuronas en la capa oculta, variando de 2 a 11. Se utilizó un
algoritmo de retropropagación (Backpropagation, BP) como algoritmo de entrenamiento
supervisado, ya que proporciona un ajuste rápido y es fácilmente aplicable (Shokri y
col., 2011). BP se centra en la búsqueda de una superficie de error (error como una
función de los pesos de la red). Para el ajuste de los pesos se empleó el algoritmo
Levenberg-Marquardt, el cual permite una convergencia más rápida que los métodos de
gradiente descendente (Hagan y col., 1996).
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
Para el entrenamiento y validación se tomaron los rendimientos promedios
correspondientes a las temperaturas 25, 40 y 60 °C para todos los tiempos ensayados
(21 datos en total), los cuales fueron divididos en dos grupos. El primer grupo (datos de
entrenamiento, 70% de los datos) se seleccionó de manera tal que se abarquen los datos
que establece el método modificado de Jenkins’, que consiste en un “hipercubo” con
datos en el centro que abarca los rango superiores e inferiores de las variables
independientes; el cual se considera adecuado para modelar y predecir problemas no
lineales (Rafiq y col., 2001), los datos restantes necesarios para completar el grupo de
entrenamiento fueron seleccionados aleatoriamente. El segundo grupo (validación) se
utilizó para evaluar la calidad de predicción de la red durante el entrenamiento (30% de
los datos). El entrenamiento se realizó hasta un máximo de 50 épocas o hasta que el
error de los datos de validación llegó a un mínimo, de esta forma se evitó un sobre
entrenamiento de la red (Hagan y col., 1996). Finalmente, para estimar el rendimiento
de predicción de la red entrenada, se utilizó un tercer grupo de datos (prueba) que no
fueron utilizados durante el entrenamiento y validación (rendimientos obtenidos a 50°C)
para contrastar con los valores predichos. La evaluación de la eficiencia de la red
entrenada se basa en la precisión de la red para predecir las salidas correspondientes al
grupo de prueba; para lo cual se utilizaron el error cuadrado medio porcentual (EMC%)
y el coeficiente de determinación cuadrático (R2) calculados mediante el uso de las
Ecuaciones 2 y 3 (Fathi y col., 2009).
 m
2
N
EMC %  100
i 1
 m
i 1
 m

(2)
exp
i
 mipred

exp
i
m

2
2
N
i 1
m
pred
i
N
N
R2  1
exp
i
p exp
(3)
Donde miexp representa el valor de la respuesta experimental para el i-ésimo dato,
mipred representa el valor predicho para el i-ésimo dato, m p exp el valor de la respuesta
promedio y N el número total de datos. A su vez estos parámetros se utilizaron para
comparar el rendimiento de diferentes arquitecturas de RNA. Para el procesamiento de
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
los datos y el diseño y entrenamiento de la RNA se utilizó el software MATLAB
(2013).
2.4. Pre procesamiento de los datos
Es posible lograr mayor eficiencia en el entrenamiento de la red neuronal pre
procesando los datos de entrada y salida antes de ingresarlos a la red.
Dado que la forma en que los datos son presentados afecta el aprendizaje de la red, se
recomienda normalizar los datos de entrada y de salida antes de presentarlos a la red
(Rafiq y col. 2001). Los datos de entrada normalizados fueron, con valor central en cero
y desviación estándar unitaria. Por otro lado, los datos de salida (rendimiento de aceite,
%b.s.) fueron expresados relativos al
valor obtenido a tiempo infinito para cada
temperatura constante estudiada (25, 40, 50 y 60°C) obteniendo un valor máximo de 1
para cada temperatura, posibilitando el ajuste de las respuestas con el modelo
matemático de difusión modificado detallado en la sección 2.5.
2.5. Modelo matemático
Para modelar la cinética de extracción de aceite para los datos de la tercera partición
(50°C constante) se utilizó un modelo difusivo modificado de la ley de Fick,
considerando estado no estacionario y partículas de geometría esférica, suspendidas en
un medio de concentración constante, en su forma simplificada, adecuada considerando
largos períodos de tiempo de extracción (Fernández y col., 2012; Zárate y col., 2015).
Mt
 1  Ae bt
M
(4)
Donde t es el tiempo de difusión; Mt y M∞ la masa de aceite que difunde en el tiempo
t y tiempo infinito, respectivamente. A y B son los coeficientes del modelo. Se utilizó el
software SigmaPlot (2011) para el ajuste y construcción de gráficos.
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
3. Resultados
3.1. Caracterización de la muestra
Los granos
presentaron un contenido de aceite total de 46,34±0,31 % b.s.,
encontrándose dentro del rango reportado en la literatura (33-55%, Windauer y
Ploschuk, 2006) y un contenido de humedad de 5,71±0,02 % b.s.
3.2. Rendimientos de extracción de aceite
En la Tabla 1 se informan los rendimientos de extracción de aceite en base seca
obtenidos para todos los tiempos y temperaturas ensayados.
Tabla 1. Rendimientos de extracción de aceite en base seca (% b.s.), promedios y
desviaciones estándar.
Tiempo (min)
Temperatura (°C)
25
40
50
60
5
14,49 ± 0,06
14,73 ± 0,33
15,77 ± 0,14
16,20 ± 0,01
15
15,90 ± 0,11
17,52 ± 0,13
18,54 ± 0,29
19,52 ± 0,14
30
17,87 ± 0,04
20,19 ± 0,84
20,57 ± 0,04
21,71 ± 0,38
60
20,79 ± 0,81
23,89 ± 0,74
25,35 ± 1,00
27,40 ± 0,69
120
24,02 ± 0,24
29,85 ± 0,44
28,33 ± 0,01
32,52 ± 0,01
240
29,03 ± 0,71
33,99 ± 0,19
37,85 ± 0,77
39,15 ± 0,50
1080
39,80 ± 1,46
40,89 ± 0,80
40,72 ± 0,14
41,44 ± 0,72
3.3. Optimización de la RNA
La cantidad óptima de neuronas en la capa oculta se determinó mediante un proceso de
prueba y error (Fathi y col., 2009; Ramzi y col., 2014), minimizando la diferencia entre
los valores experimentales y los predichos por la red para el grupo de prueba. En la
Tabla 2 se muestran los ECM% y R2 de las predicciones con respecto a los datos
experimentales para RNA con distintos números de neuronas en la capa oculta.
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
Tabla 2. Eficiencia en la predicción de rendimientos con diferentes números de
neuronas en la capa oculta.
N° de neuronas R2
EMC (%)
2
0,96 4,12
3
0,99 2,33
4
0,99 2,29
5
0,98 3,18
6
0,92 6,12
7
0,94 5,56
8
0,94 5,56
9
0,27 24,47
10
0,05 22,35
11
0,08 22,61
Se encontró que la RNA con 4 neuronas en la capa oculta proporcionó la mejor
predicción, la Figura 1 representa un diagrama esquemático de la estructura de la red
adoptada. A su vez, en la Tabla 3 se informan los pesos (w) y umbrales (b)
correspondientes a cada neurona.
Tabla 3. Parámetros de la RNA óptima
Capa oculta
Capa de salida
w
b
-1,2079
Neurona
Tiempo
Temperatura
b
Neurona
w
1
2,3488
1,1317
-3,0160
1
0,1110
2
-2,3940
1,1601
1,1925
2
-0,1844
3
-2,8431
1,5568
-0,3058
3
0,2005
4
-2,5644
-0,0309
-2,7569
4
-2,3290
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
Capa oculta
Ca
Capa de salida
Ca
Entrada
Salida
Figura 1. Diagrama esquemático del modelo óptimo de RNA feedforward multicapa encontrado.
3.4. Comparación de datos predichos, ajustados y experimentales
La Figura 2 muestra los datos de rendimientos de extracción de aceite relativo
(Mt/M∞) en función del tiempo obtenidos experimentalmente, la curva de ajuste del
modelo matemático y los valores predichos por la RNA para una temperatura constante
de 50 °C. El modelo matemático de ajuste de los datos experimentales hallado fue:
Mt
 1  0,6232e  0, 0075t
M
con R2 = 0,99 y ECM% = 2,24.
Figura 2. Rendimientos relativos a tiempo infinito (Mt/M∞). Valores experimentales, predichos por la RNA y curva
de ajuste con el modelo matemático.
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
Con respecto a los datos experimentales, tanto para los datos predichos como para
los ajustados el R2 resultó equivalente, siendo el EMC% levemente menor en el caso
del modelo de ajuste matemático (2,24) respecto al predicho por RNA (2,29). Cabe
destacar que los datos predichos por la RNA presentan una elevada correspondencia con
la curva de ajuste proporcionada por el modelo matemático, mostrando la capacidad de
la red para captar las interacciones no lineales del fenómeno independientemente del
ruido asociado a los datos experimentales, siendo ésta una característica observada por
otros autores (Parlos y col., 1994).
4. Conclusiones
El modelo de RNA con 4 neuronas en la capa oculta fue adecuado para la predicción
de rendimientos de extracción de aceite de canola a 50 °C; este modelo mostró mayor
exactitud que las otras arquitecturas estudiadas (número de neuronas de 2 a 11) Los
valores de coeficiente de correlación y error cuadrado medio porcentual (R2 = 0,99 y
EMC% = 2,29) muestran la alta correspondencia entre los datos predichos y
experimentales; resultando un modelo adecuado para predecir rendimientos de
extracción de aceite en el sistema estudiado. A su vez, se pudo observar la capacidad de
la red para captar la relación existente entre las variables, demostrando la potencialidad
del uso de esta herramienta de inteligencia artificial para el modelado y la predicción de
procesos complejos que dependen de múltiples variables a partir de un conjunto de
datos experimentales, así como su capacidad de captar el comportamiento del fenómeno
aún procesando datos con ruido.
Reconocimientos
Los autores agradecen el financiamiento a la Facultad de Ingeniería (Universidad
Nacional del Centro de la Provincia de Buenos Aires), a CONICET y a la ANPCyT
(Agencia Nacional de Promoción Científica y Tecnológica). También agradecen en
forma especial AL HIGH TECH S.R.L. (Argentina) por donar la canola utilizada
durante este trabajo.
Referencias
ASAE. (1999). Standard Engineering Practices data, 46 th edn. American Society of Agricultural Engineers. St.
Joseph, USA
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ
VIII CAIQ 2015 y 3das JASP
Fathi, M., Mohebbi, M., Razavi, S. M. A. (2011). Application of image analysis and artificial neural network to
predict mass transfer kinetics and color changes of osmotically dehydrated kiwifruit. Food and Bioprocess
Technology,4(8), 1357-1366.Fernández, M. B., Perez, E. E., Crapiste, G. H., Nolasco, S. M. (2012). Kinetic study
of canola oil and tocopherol extraction: parameter comparison of nonlinear models. Journal of Food Engineering,
111(4), 682-689.
Hagan, M. T., Demuth, H. B., Beale, M. H. Neural network design, 1996.PWS Pub, Boston, London.
IUPAC. (1992). Standard Methods for the Analysis of Oils, Fats and Derivatives, 7th edn. C. Paquot and A.
Hautfenne, International Union of Pure and Applied Chemistry, Blackwell Scientific. Oxford.
Parlos, A. G., Chong, K. T., Atiya, A. F. (1994). Application of the recurrent multilayer perceptron in modeling
complex process dynamics. Neural Networks, IEEE Transactions on, 5(2), 255-266.
Perez, E. E., Carelli, A. A., Crapiste, G. H. (2011). Temperature-dependent diffusion coefficient of oil from different
sunflower seeds during extraction with hexane. Journal of Food Engineering, 105(1), 180-185.
Rafiq, M. Y., Bugmann, G., Easterbrook, D. J. (2001). Neural network design for engineering applications.
Computers & Structures, 79(17), 1541-1552.
Ramzi, M., Kashaninejad, M., Salehi, F., Mahoonak, A. R. S., Razavi, S. M. A. (2015). Modeling of rheological
behavior of honey using genetic algorithm–artificial neural network and adaptive neuro-fuzzy inference system.
Food Bioscience, 9, 60-67.
Shahidi, F. (1990). Canola and rapeseed: production, chemistry, nutrition, and processing technology. Springer
Science & Business Media.
Shokri, A., Hatami, T., Khamforoush, M. (2011). Near critical carbon dioxide extraction of Anise (Pimpinella
Anisum L.) seed: Mathematical and artificial neural network modeling. The Journal of Supercritical Fluids, 58(1),
49-57.
Thiyam-Holländer, U., Eskin, N. M., Matthäus, B. (Eds.). (2012). Canola and Rapeseed: Production, Processing,
Food Quality, and Nutrition. CRC Press.
Windauer L.B., Ploschuk E.L. (2006). Cultivos productores de aceites. En de la Fuente E.B., Gil A., Gimenez P.I.,
Kantolic A.G., López Pereira M., Ploschuk E.L., Sorlino D.M., Vilariño P., Wassner D.F., Windauer L.B. (Eds).
Cultivos Industriales. Editorial Facultad de Agronomía (UBA). Buenos Aires, Argentina. 65.
Zárate, V., Perez, E. E., Crapiste, G. H., Nolasco, S. M., Fernández, M. B. (2015). Oil extraction kinetics of
hydrothermally pretreated canola seeds. The Canadian Journal of Chemical Engineering, 93(5), 842-848.
AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ