Download Descargar el archivo PDF

Document related concepts
no text concepts found
Transcript
6CFE01-436
1/11
Cálculo del área foliar mediante técnicas basadas en el análisis RGB-HSB
PÉREZ-RODRÍGUEZ, F.1,2, CAMINO-SACO, A.1, MOSQUERA, A.1, ROJO-ALBORECA,
A.1,2 y GOMEZ-GARCÍA, E.1
1
VSonCLOUD S.L. www.vsoncloud.com
Unidade de Xestión Forestal Sostible, Departamento de Enxeñaría Agroforestal, Escola Politécnica Superior de Lugo,
Universidade de Santiago de Compostela. Campus universitario s/n, 27002 Lugo, España.
2
Resumen
El Índice de Área Foliar (IAF) – LAI en inglés – es la principal variable para modelizar
muchos procesos de fisiología vegetal, como por ejemplo la evapotranspiración, la capacidad
fotosintética o la captura de carbono. Para el cálculo de este índice es necesario realizar una
estimación de la superficie foliar total, por lo que es necesario conocer la superficie de una
cantidad representativa de hojas, en un proceso que ha de ser lo más objetivo, rápido y preciso
posible. Sin embargo, este cálculo es complicado debido a la gran diversidad de especies y a
la heterogeneidad en la forma de las hojas. Por ello, se ha desarrollado un algoritmo que
calcula la superficie de cada hoja partiendo de una imagen de la misma, y que utiliza la
técnicas de análisis RGB-HSB, aplicada píxel por píxel. Esta metodología puede ser aplicada
de manera destructiva (con extracción de hojas) o no destructiva (sin extracción). Además del
cálculo rutinario de la superficie foliar, la aplicación de este algoritmo puede diferenciar
partes sanas, dañadas e intermedias en las hojas.
Palabras clave
Sanidad foliar, LAI, píxel
1. Introducción
El cálculo de la superficie de las hojas de una planta es utilizado en muchas disciplinas
de las ciencias forestal y agrícola. A modo de ejemplo, el cálculo de la superficie foliar es
necesario para la obtención del Índice de Área Foliar (IAF, o LAI en inglés), que es uno de
los índices más importantes para el modelado de la capacidad fotosintética de las copas de los
árboles, la evapotranspiración y microclimas, entre otros (WEISS et al., 2004). En otros
campos, como el de la sanidad vegetal, también es importante ya que se puede estimar la
disminución de la capacidad fotosintética de las plantas por pérdida de superficie foliar debida
a defoliadores u otros agentes patógenos.
Sin embargo, no resulta sencillo determinar con precisión la superficie de un elemento
como es la hoja de una planta, cuya forma puede ser más o menos compleja según la especie
considerada, e incluso puede existir variabilidad morfológica dentro de una misma especie en
sus diferentes estadios. Por ello resulta necesario aplicar una metodología de cálculo de la
superficie que no dependa de la subjetividad de un usuario, como puede ser el análisis de las
imágenes (SANGWINE & HORNE, 1998). Actualmente existen ciertos software basados en
la delimitación de la superficie de hojas, como pueden ser Leaf Analyser® (PARNHAM,
2007), Leaf Gui® (PRICE et al., 2011), WinFOLIA® (WINFOLIA REG, 2004), entre otros,
1/11
que ayudan a determinar con más o menos acierto la superficie foliar; sin embargo, no
discriminan las partes de la hoja según su estado sanitario.
Una de las metodologías más utilizadas en la delimitación automatizada de la superficie
de hojas es la aplicación de técnicas de RGB (Rojo, Verde, Azul) (MA et al., 2008; WANG et
al., 2008; TENG & CHUN, 2011), es decir, técnicas basadas en el análisis del color mediante
la caracterización de los píxeles que componen una imagen. A este respecto, en las especies
forestales los rangos de color verde del espectro visible se pueden asimilar en un porcentaje
muy alto a hojas con buena salud, pero no es viable especificar un rango único porque hay
una gran variabilidad entre especies. En la Figura 1 se muestra todo el abanico de posibles
combinaciones RGB.
(255,255,255)
(0,255,255)
(255,255,0)
(0,255,0)
(0,255,255)
(255,0,0)
(0,0,0)
(0,0,255)
Figura 1: Rango de variabilidad de colores según la variación de la magnitud de RGB con respecto al verde puro
RGB (0,255,0) en 16 bits.
En este trabajo se presenta un sencillo algoritmo para el cálculo de la superficie de una
hoja y para determinar su estado sanitario, basado en la caracterización de los valores RGB de
cada uno de píxeles (píxel a píxel). Debido a la comentada amplia gama del espectro verde en
especies forestales, este algoritmo se calibra bajo un método empírico y observacional, y se
discute si es suficiente para determinar objetivamente la superficie de la hoja, o si es necesario
trabajar con conjuntos de píxeles.
2. Objetivos
El objetivo principal de este trabajo es el desarrollo de un algoritmo para automatizar
la evaluación de píxeles RGB / HSB (Saturación). Con este algoritmo se puede delimitar de
forma automatizada la forma de las hojas y su superficie, así como diferenciar partes en la
misma. Además, se compara el algoritmo con otros programas.
3. Metodología
Una fotografía o imagen escaneada se puede describir como una matriz (x, y) donde xmax
e ymax representan la resolución de la imagen, que se compone de (xmax · ymax) elementos, en
este caso píxeles. Cada elemento de esa matriz contiene información, como puede ser la
1/11
caracterización RGB, que viene dada por un vector de tres elementos de la siguiente manera:
RGB ([R],[G],[B]), donde [R], [G] y [B] son la concentración de rojo, verde y azul,
respectivamente, y que se acota de 0 a 255 en colores de 16 bits. Además, uno de los
componentes del HSB se define como el grado de saturación del color que indica la pureza, y
viene definida como un porcentaje, siendo 0 el mínimo de saturación, lo que indica un color
pálido y 100% el máximo, lo que indica un color muy vivo.
Para la obtención de píxeles es necesario programar una rutina que recorra cada
elemento de la imagen, como se indica a continuación:
‘“Pixel by Pixel” Routine
Dim I As New Bitmap(file)
For Y = 1 To I.Height - 1
For X = 1 To I.Width
I.GetPixel(X,
I.GetPixel(X,
I.GetPixel(X,
I.GetPixel(X,
Next
Next
- 1
Y).R
Y).G
Y).B
A).GetSaturation
Un ejemplo de la caracterización RGB de una imagen es la que se muestra en la Figura
2, donde se presentan gráficamente las magnitudes obtenidas en ciertas partes de una hoja.
Figura 2: Representación Grafica de las magnitudes RGB obtenidas en ciertas partes de una hoja.
Partiendo de la obtención de un barrido RGB de una muestra representativa de hojas
tipo obtenida de una base de datos, se ha procedido a la desagregación de las partes de una
hoja según su sanidad aplicando las siguientes tres hipótesis para cada zonificación:
Hipótesis I: “Las zonas de la hoja de buena salud son de color verde”
En este caso (Buen estado sanitario), y aunque el verde se pueda descomponer en una
combinación de rojo, verde y azul, la concentración de verde siempre será mayor al resto,
obteniéndose toda la gama de verdes posible, desde el verde puro (0, 255, 0), al verde muy
1/11
pálido (200, 255, 200). Matemáticamente, esta hipótesis se puede traducir en la siguiente
ecuación:
[G] > a · [R] ∩ [G] > b · [B] = Estado Sanitario Bueno
donde se va a suponer que la concentración de verde es mayor a la concentración de rojo
multiplicada por un parámetro a y también superior a la concentración de azul multiplicada
por un parámetro b. Estos parámetros se establecen para poder ajustar el algoritmo final
mediante validación.
Dentro de esta zonificación de Buen estado sanitario se puede establecer un umbral de
transición hacia zonas de Mal estado sanitario, para lo que se puede suponer la siguiente
hipótesis:
Hipótesis II: “La diferencia entre un estado de buena salud y uno de mala salud depende de
la concentración de color rojo, que da como resultado una combinación de amarillo-verde
pálido”
Según esta hipótesis, es posible establecer la zonificación en los puntos de la hipótesis 1
según la siguiente ecuación:
[R] > c · [G] = Estado Sanitario Medio
siendo c el parámetro necesario para el calibrado y validación.
Finalmente, el resto de la imagen escaneada será hoja verde con menor concentración, o
simplemente zonas fuera de la hoja. Esto significa que las concentraciones de rojo y azul
serán mayores que la concentración de verde, lo que da paso a la siguiente hipótesis:
Hipótesis III: “Los colores marrones son síntoma de mala salud”
Esta hipótesis se materializa en la siguiente ecuación:
[R] > d · [G] ∩ [R] > e · [B] = Estado Sanitario Malo
siendo d y e los parámetros necesarios para el calibrado y validación.
En el caso que no entre dentro de ninguna zona de estado sanitario definida en las tres
hipótesis, el algoritmo entiende que no hay hoja. El algoritmo completo se muestra a
continuación:
‘Desagregación y zonificación de la superficie foliar
If [G] > a * [R] And [G] > b * [B] And [HSB] > 0.1 Then
If [R] > d * [G] Then
‘Estado Sanitario Medio
Else
‘Estado Sanitario Bueno
End If
Else
If [R] > e * [G] And [R] > f * [B] Then
‘Estado Sanitario Malo
Else
1/11
‘Rango fuera de hoja
End If
End If
Para la estimación de los parámetros a, b, c, d y e se ha aplicado la metodología de
prueba y error, validada de forma empírica. Para ello se han probado diferentes
combinaciones de los parámetros aplicando la comentada rutina "píxel a píxel" a una muestra
de 10 hojas extraídas de distintas especies forestales, y luego se han comparado los resultados
de la zonificación (estado sanitario bueno, medio y malo) que realiza el algoritmo con la
obtenida de manera visual en la muestra de hojas.
Una vez desagregada la superficie de la hoja en los diferentes estados sanitarios, se debe
proceder al cálculo de su superficie. En este caso se pueden diferenciar dos casos, según el
método de obtención de la imagen:
Método no destructivo: La imagen de la hoja se obtiene mediante fotografía digital. En este
caso el cálculo se efectúa según la siguiente ecuación:
Aleaf
X Y
0 0
(( f ( x, y))· Apixel
donde f ( x, y) 1 cuando el píxel (x,y) entra dentro de la zonificación de Buena, Media o
Mala salud, mientras que Apixeles la superficie del píxel.
En este caso Apixel es muy difícil de determinar con precisión porque intervienen
variables desconocidas, como la distancia de la hoja a la cámara o la resolución. Por lo tanto,
se propone que las fotos se tomen con alguna referencia para conocer la escala.
Método destructivo: En este método la hoja es extraída y escaneada. La ecuación de cálculo
de la superficie en este caso es:
X Y
Aleaf
0 0
(( f ( x, y))
· Apanel
X ·Y
donde f ( x, y) 1 cuando el píxel (x,y) entra dentro de la zonificación de Buena, Media o
Mala salud, Apanel es la superficie de barrido del scanner y X·Y es la resolución de la imagen
escaneada.
Para la validación de la metodología y del algoritmo propuestos se ha utilizado una
muestra de 20 imágenes de hojas obtenidas mediante el fotografiado y escaneado de diversas
especies forestales, anotando de forma manual regiones de píxeles pertenecientes a zonas de
las hojas con diferente nivel de salud y comparando los resultados.
Por otra parte, con el fin de comparar el algoritmo con otras metodologías, se ha
explorado el procesamiento de imágenes de forma no-supervisada (esto es, no basado en
reglas) con el objetivo de detectar la salud de las hojas empleando técnicas de cuantización
(HECKBERT, 1982). El propósito general es, partiendo de los colores presentes
1/11
originalmente en la imagen, obtener una nueva imagen que cuente con un subconjunto
mínimo de colores esenciales pero que conserve la forma de los objetos que componen la
imagen inicial. El método aplicado se basa en crear regiones de color homogéneo sobre la
base de un nivel de tolerancia que se calcula según el algoritmo de corte de mediana
(HECKBERT, 1982) sobre el espacio de color RGB.
El proceso de cuantización consiste en:
Recorrer cada píxel de la imagen.
Construir un conjunto reducido de colores que sean representativos de la imagen a partir
del paso anterior.
Establecer una correspondencia entre los colores originales y el conjunto de colores
encontrado en el paso anterior.
Convertir la imagen original utilizando el nuevo conjunto de colores.
4. Resultados
4.1. Determinación de los parámetros
Aplicando a una muestra de hojas la rutina “píxel a píxel” con diferentes combinaciones
de los parámetros, y comparando los resultados de la zonificación (estado sanitario bueno,
medio y malo) que realizaba el algoritmo con la obtenida de manera visual se han obtenido los
siguientes valores: a = 1,02; b = 1,00; c = 0,82; d = 1,05 y e= 1,03. En la Figura 3 se pueden
observar los rangos de color que delimitan cada estado sanitario al aplicar estos parámetros.
Superficie Buena Sanidad
Superficie media Sanidad
Superficie mala Sanidad
Figura 3: Rangos de color obtenidos para cada estado sanitario.
Aplicando estos parámetros a un ejemplo práctico se obtiene el resultado mostrado en
la Figura 4.
1/11
Figura 4: Ejemplo de aplicación del algoritmo propuesto.
Con respecto a la zonificación de Buen estado sanitario, se ha añadido un filtro
corrector, dependiendo de la saturación de color o HSB, que ha de ser mayor del 10%, cifra
que es arbitraria y que posiblemente requerirá un ajuste.
En cuanto a la validación de la metodología y del algoritmo propuestos, en la Figura 5
se muestra un ejemplo de su comparación en una hoja en la que se han acotado de forma
manual las regiones de píxeles pertenecientes a zonas de las hojas con diferente nivel de
salud, y aleatoriamente dentro de esas zonas, se han extraído los RGB de puntos en esos
recintos, con esos datos, se realizó una regresión lineal para establecer las pendientes de la
relación [G] –[R] y [G]-[B] y obtener los parámetros según esa zonificación manual.
1/11
Figura 5: Prueba de validación del método comparándolo con los parámetros inicialmente propuestos y los obtenidos
mediante regresión de datos. En la figura se muestra el ejemplo de la regresión para el parámetro a.
Empleando las técnicas de regresión lineal sobre la relación entre los valores RGB de los
píxeles presentes en zonas de buena, media y baja sanidad de las hojas se ha comprobado la
validez de los parámetros inicialmente propuestos de forma empírica (ver Tabla 1).
Tabla 1: Parámetros obtenidos mediante regresión lineal.
a = 1,00522
b = 0,85610
b = 0,65402
c= 0,73367
d = 0,71576
Empíricamente se ha observado que aplicando el algoritmo con los parámetros iniciales,
se acotaban las zonas manualmente definidas como tal (Figura 5) correctamente, y que los
parámetros obtenidos mediante regresión lineal de las zonas acotadas manualmente no
mejoraban los parámetros del algoritmo propuestos inicialmente.
4.2. Comparación con métodos no-supervisados
Aplicando la metodología de cuantificación (HECKBERT, 1982) se consigue dividir el
espacio de color de la imagen en aquellas partes en las que la variabilidad del color es mayor,
reduciendo artefactos (elementos inherentes a la imagen en si, elementos de la compresión,
polvo, huellas, etc.) y filtrando las geometrías internas de la hoja, tales como los patrones de
las venas o los estomas. El resultado de puede observar en la Figura 6.
Figura 6: Ejemplo de aplicación del técnicas de cuantización.
Este proceso permite evaluar visualmente de forma más rápida la salud de la hoja que en la
imagen original, pero sin embargo, y debido a la simplificación del espacio de color, es
mucho menos preciso que la metodología propuesta a la hora de detectar los diferentes niveles
de salud, como se observó en la Figura 4.
5. Conclusiones
En este trabajo se presenta un algoritmo muy sencillo para calcular la superficie de una
hoja y para diferenciar sus partes sanas, dañadas e intermedias, a partir de una metodología
1/11
de recorrido “píxel a píxel” en la que se han supuesto varias hipótesis para la zonificación de
la sanidad foliar. Se puede asumir que las hipótesis supuestas son ciertas en un porcentaje
muy alto de los casos, pero debido a la gran variabilidad de colores y formas que pueden
presentar las hojas de distintas especies (e incluso sus diferencias con la edad), cada uno de
los parámetros de las hipótesis propuestas han de ser calibrados con más precisión en cada
aplicación. En este estudio la parametrización se ha realizado después de una zonificación
visual, ya que ha generado mejores resultados que los obtenidos con técnicas más objetivas o
con otras como la cuantización.
Aunque el estudio se ha ideado para su aplicación en el campo forestal, el algoritmo
propuesto se puede aplicar en cualquier otra investigación que requiera la determinación de la
superficie y estado sanitario de hojas, como por ejemplo en viñedos. También puede ser
utilizado para modelar hojas sanas y después determinar qué partes faltan en hojas dañadas
por defoliadores.
6. Agradecimientos
El Grupo de Investigación UXFS esta parcialmente financiado por la Xunta de Galicia
a través del Programa de Consolidación y Estructuración de Unidades de Investigación
Competitivas 2011, cofinanciado por el FEDER (Fondo Europeo de Desarrollo Regional).
7. Bibliografía
HECKBERT, P.S.; 1982. Color Image Quantization for Frame Buffer Display. ACM
SIGGRAPH '82 Proceedings.
MA, W.; ZHA, H.; LIU, J.; ZHANG, X.; XIANG, B.; 2008. Image-based Plant Modeling by
Knowing Leaves from Their Apexes ICPR 2008. 19th International Conference. IEEE
Computer Society. 1-4.
PARHAM; 2007. LeafAnalyser. Disponible en: leafanalyser.openillusionist.org.uk
PRICE, C.A.; SYMONOVA, O.; MILEYKO, Y.; HILLEY, T.; WEITZ J.S.; 2011. Leaf
Extraction and Analysis Framework Graphical User Interface: Segmenting and Analyzing the
Structure of Leaf Veins and Areoles. Plant Physiology 155, 236-245.
SANGWINE, S.J.; HORNE, R.E.N.; 1998. The colour Image Processing Handbook.
Chapman & Hall. 443 pág. Londres.
SHARMA, A.; 2004. Understanding Color Management. Thomson Delmar Learning. 367
pág. Nueva York.
TENG, M.; CHUN JIANG, Z.; 2011. An interactive method for modeling leaves. Fourth
International Conference on Intelligent Computation Technology and Automation. IEEE
Computer Society 22-25.
WANG, L.; YANG, T.; TIAN, Y.; 2008. Crop disease leaf image segmentation method based
on color features. In IFIP International Federation for Information Processing, Volume 258;
Computer and Computing Technologies in Agriculture, Vol. 1; Daoliang Li; (Boston:
Springer). 713-717.
1/11
WEISS, M.; BARET, F.; SMITH, G.J.; JONCKHEERE, I.; COPPIN, P.; 2004. Review of
methods for in situ leaf area index (LAI) determination. Part II. Estimation of LAI, errors and
sampling. Agric. For. Meteorol. 121, 37-53.
WINFOLIA; 2004. Disponible en www.regent.qc.ca/products/folia/WinFOLIASoftware.html