Download Descargar el archivo PDF - Sistema de Revistas Electrónicas de la

Document related concepts

Imagen médica wikipedia , lookup

Transcript
John Díaz
Abstract This paper is about a computer vision system to determine
the quality of the coffee. The study consists in the generation of three
classification systems (first is creates a bank of images for the realization
of the study, is used two phases (pre-processing and processing) to get good
images). The first system is based on the comparison of histograms using
the Bhattacharyya coefficient (the technique is tested with color and gray
scale images). The second system is based on the color segmentation using
the Mahalanobis distance (also tested the Euclidean distance),
morphological operations (dilatation and open) and logical operations
(AND in specific). The third technique is based on the neural network feedforward using the training algorithm Backpropagation based On
Levenberg Marquardt, the features used in this system are the Kurtosis
and the mean (also tested with the Skewness and variance). After perform
testing with the three systems is determines the best.
Coffee, Computer vision, Threshold, ROI, Histogram
Keywords
comparison, Bhattacharyya Coefficient, Color segmentation, Euclidean
distance, Mahalanobis distance, Morphological operations.
I. INTRODUCCIÓN
L
as aplicaciones que se basan en un sistema de visión por
computador para dar solución a una problemática por lo
general requieren de una gran variedad de técnicas para lograr
su objetivo, más aun si el sistema tiene que trabajar con
imágenes a color en donde cada uno de los elementos a
identificar, seleccionar, reconocer y/o clasificar poseen el
mismo color pero con diferentes tonalidades que no están
distribuidas uniformemente, además las tonalidades de algunos
objetos de una clase son muy similares con respecto a la otra
clase, y los objetos tienen formas similares. Este es el caso de
un clasificador de granos de café que determina la calidad del
producto mediante un sistema de visión por computador, lograr
que este sistema funcione correctamente no es una tarea muy
sencilla ya que no es como los seleccionadores que solo
identifican si el grano esta bueno o malo, la clasificación es la
fase siguiente de la selección, el clasificador debe determinar la
calidad del producto sin importar las clases (cinco son las
manejadas en el proyecto) de granos que se le impongan.
El café es una parte fundamental de la economía del país y
para que exista una gran acogida por parte de los compradores,
ya sean extranjeros o nacionales, este producto debe ser de
buena calidad. En Colombia existe una gran exigencia en este
tema ya que es uno de los mayores productores de café de
calidad en el mundo.
En cuanto a los precios para la exportación hay ciertos
criterios que se manejan como es
[1] que se encarga que los productores de café reciban el precio
justo. Para que los campesinos puedan obtener una gran parte
de ingresos por el producto se les da el privilegio de que lleven
a cabo la mayoría de los procesos de producción del café, sin
embargo hay una parte dentro del proceso que es muy
John Diaz, Universidad de Cundinamarca (UdeC), Fusagasugá, Colombia,
[email protected]
importante pero que es demorado y requiere de cuidado, este es
el proceso de clasificación del café, debido a que este proceso
se lleva a cabo manualmente no por los campesino si no por una
persona experta la cual determina la calidad y por ende el
precio, los criterios de calidad pueden variar de acuerdo al
estado de animo de la persona, cansancio, o simplemente
porque otro experto tiene otros criterios para evaluar la calidad
lo cual pueden llevar a una discrepancia por consiguiente, se
pretende que este proceso se realice de manera imparcial por
medio de un sistema autónomo de clasificación de café ya que
una maquina no tiene esos problemas, el sistema solo actúa de
acuerdo a las características técnicas que se le especifiquen.
Se enfatiza en que las características de un buen grano de
café están dadas por el tamaño y el color, ya que son los rasgos
más significativos en la determinación de la calidad del grano.
También existen otras características como aroma, textura,
forma, humedad, entre otros, sin embargo estos no serán
tomados en cuenta para el desarrollo del proyecto ya que se
pretende es el diseño de un sistema clasificador de granos de
café mediante la caracterización de imágenes con el fin de
determinar la calidad del producto, y las características como
aroma no se podrían medir con este sistema, la textura y el
forma no son muy significativos a la hora de determinar la
calidad del café. Como se presenta en la ficha técnica del café
[2] el aspecto más importante es el color (Verde
mismo en la norma técnica de café verde [3], se toma muy en
cuenta el tamaño del grano así como el color (verde azulado y
verde claro lo cual coincide con [2], esto quiere decir que
únicamente se tienen en cuenta los cafés buenos y muy buenos)
para determinar la calidad del café.
En cuanto a la temática ya han realizado sistemas de visión
por computador que clasifican el café y determinan la calidad
del producto, uno de estos sistemas es [4] que desarrolla un
sistema de clasificación automático que consiste en un
programa informático de procesamiento de imágenes y una red
neuronal artificial que identifica la calidad del café verde, por
otro lado en [5] se presenta un trabajo desarrollado en indonesia
basado también en una red neuronal que intenta solucionar el
problema en cuanto a la dificultad e irregularidades en la
clasificación del café bajo el estándar N º SNI 01-2907-1999 de
ese país, y en [6] también se propone un sistema de clasificación
de granos mediante clasificación de Naive Bayes y
clasificadores de redes neuronales.
Como se puede ver, es muy común hablar de redes
neuronales en este tipo de sistemas, sin embargo este trabajo no
se enfoca en el trabajo con redes neuronales, además se
presentan alternativas de solución poco comunes en este tipo de
sistemas no obstante, los resultados obtenidos son buenos.
En el sistema la característica más importante del café es el
color, existe una gran variedad de técnicas de procesamiento
con las cuales se pueden clasificar los granos de acuerdo a esta
característica pero, en este documento únicamente se realiza el
estudio con las técnicas de; comparación de histogramas,
segmentación por color y redes neuronales, en la primera
técnica se utiliza el coeficiente de Bhattacharyya, para el caso
de la segmentación además de la distancia euclidiana y la
distancia de Mahalanobis se utilizan operaciones morfológicas
debido a que el solo proceso de segmentación no es suficiente
para lograr una clasificación adecuada, por último la red
neuronal utilizada es de tipo Feed-forward entrenada mediante
el algoritmo backpropagation basado en Levenberg Marquardt,
en donde las características usadas para el entrenamiento son la
media y la curtosis, de la intensidad de los pixeles de cada
canal.
La característica del tamaño también es importante sin
embargo, es la más fácil de adquirir mediante la obtención y
determinación de áreas para el caso de la primer y tercer técnica,
en la segunda se utiliza el conteo y eliminación de áreas. Una
vez desarrollados los sistemas se identifica cual es el más
adecuado para llevar a cabo el proceso de clasificación con el
cual se determinará la calidad del producto.
En cuanto al tamaño únicamente se trabaja con granos
medianos y grandes debido a que en la región no son muy
comunes los granos pequeños (en la recolección de los granos
no se encontraron aquellos que tuvieran un tamaño inferior a 6
mm).
III. DESCRIPCIÓN GENERAL DEL SISTEMA
En general el proyecto es un sistema de visión artificial
(Teniendo en cuenta a [7], [8] y [9] en la figura 1 se presenta un
diagrama de bloques general de un sistema de visión artificial)
con el cual se determina a calidad del producto, para no hacer
tan extenso el documento en la figura 2 se explica en que
consiste el proyecto mediante un diagrama de bloques.
La primer fase es la generación del banco de imágenes que
consiste en el procesamiento de bajo nivel, la segunda fase y las
más larga consiste en la realización de pruebas con las
diferentes técnicas señaladas para así clasificar los granos de
café de acuerdo a las características de color y tamaño (Tabla
4), y la última fase consiste en interpretar los datos obtenidos
mediante las técnicas escogidas en la fase anterior con el fin de
determinar la calidad del producto.
II. CARACTERÍSTICAS PARA DETERMINAR LA CALIDAD DEL
CAFÉ
Este documento no se centrara en el proceso del café porque
la temática principal es la visión artificial y se desea que el
documento se enfoque a ella por consiguiente, a continuación
únicamente se muestran las características técnicas del grano.
COLOR
CALIFICATIVO
Verde grisáceo/azulado
Muy bueno
Verde claro
Bueno
Ligeramente pálido
corriente
Blanquecino
bajo
Tabla 1. Calidad del café según su color
NÚMERO
20
19
18
17
16
15
14
TAMAÑO (mm)
7,94
7,54
7,14
6,75
6,35
5,95
5,57
Figura 1. Diagrama de bloques general de un sistema de visión artificial
Tabla 2. Tamaños del café
Por cuestiones prácticas en cuanto al tamaño se toma lo
siguiente:
Grande
Mayor a 7,94 mm
Mediano
Entre 6 mm y 7,9 mm
Tabla 3. Clasificación del tamaño
Tenido en cuenta estas dos características se determinara la
calidad del café de la siguiente manera:
CARACTERÍSTICAS
CALIFICATIVO
Verde grisáceo, Tamaño mediano
Excelente (5)
Verde grisáceo, Tamaño grande
Muy Bueno (4)
Verde claro, Tamaño mediano
Bueno (3)
Verde claro, Tamaño grande
corriente (2)
Blanquecino, Cualquier tamaño
Bajo (1)
Tabla 4. Calidad del café según su color y tamaño
Figura 2. Diagrama de bloques general del sistema
IV. GENERACIÓN DEL BANCO DE IMÁGENES
Inicialmente se deben realizar las capturas de las imágenes
con los diferentes granos de café. Lograr unas imágenes
adecuadas para la realización del estudio, y así mismo si se
deseara la implementación en tiempo real del sistema, se
requiere principalmente de una luminosidad adecuada, sin
embargo en muchas ocasiones lograr que esa luminosidad sea
la mejor es algo complicado ya que existe una gran variedad de
técnicas de iluminación y cada una de ellas exige un grado de
complejidad a la hora de implementar el sistema de adquisición
de las imágenes [10]. En esta aplicación la técnica utilizada es
la iluminación polarizada, en donde el material utilizado para la
polarización es una cartulina blanca (dependiendo del color de
la cartulina se polarizara la luz y dará una iluminación con el
color del material), se escogió este material ya que además de
económico, absorbe y distribuye muy bien la luz (ver figura 4).
También hay otra forma de realizar la iluminación e
igualmente es recomendable, esta se hace mediante iluminación
directa con un bombillo ahorrador (ya que emite una luz pálida)
a una distancia mayor a la del reflector haciendo uso de un
cuarto normal sin mucha iluminación, mediante este método
también se puede obtener imágenes de muy buena calidad
Para la obtención de las imágenes se utiliza la herramienta
procesamiento) y para mejorar un más las imágenes se utiliza la
curva de transformación [11], y finalmente para lograr obtener
imágenes con un fondo uniforme y de color totalmente blanco
se utiliza el algoritmo que se muestra en la figura 3.
Como se puede observar en la figura 5, los resultados
obtenidos después del procesamiento son muy buenos, estos
resultados son los que se esperan obtener en un sistema de
visión artificial y aunque se toma bastante tiempo realizar este
procesamiento a cada imagen del banco, los resultados hacen
que valga la pena ese esfuerzo adicional ya que en las etapas
posteriores reduce tiempo y trabajo.
Pre-procesamiento
Procesamiento
Figura 5. Comparación entre una imagen obtenida mediante la herramienta
V. TÉCNICAS DE ESTUDIO PARA LA CLASIFICACIÓN DE COLOR
A. Histograma
Consiste en tomar un patrón para cada grano (verde
grisáceo, verde claro,) y determinar su histograma, después se
prosigue a seleccionar una región de interés (ROI) en donde esté
ubicado el grano de café en una de las capturas del banco de
imágenes, sin embargo se presenta el inconveniente de la
ubicación de los granos, es decir para que esta técnica funcione
correctamente se requiere que los granos este muy bien
alineados y ubicados, además se debe especificar un numero de
granos y las posiciones por ende, la ubicación de los granos
siempre tendrían que ser la misma y debe tener siempre la
misma cantidad de granos.
Para la comparación de histogramas se utiliza el coeficiente
de Bhattacharyya [12] definido por la ecuación (1) sin embargo,
para poderlo aplicar a un histograma se puede asumir que Ri y
Si son una distribución variable aleatoria de Poisson [13]
obteniendo como resultado la ecuación (2) que en definitiva es
la que se utiliza para la comparación de histogramas.
p ( R, S )
n
R(i) S (i)
(1)
Ri Si
(2)
i 1
p ( R, S )
Figura 3. Proceso para obtener imágenes con fondo totalmente blanco
Figura 4. Prototipo implementado del sistema de adquisición de imágenes
(vista superior con y sin la cubierta de cartulina que ajusta la luminosidad
emitida por el reflector)
i
En cuanto a la comparación de los histogramas, se puede
realizar mediante dos formas, las primera es convirtiendo la
imagen del grano de café a escala de gris para así trabajar con
un único histograma y la segunda es trabajando directamente
con la imagen a color teniendo en cuenta los tres canales (se
realiza una aproximación para utilizar únicamente ocho
contenedores ya que reduce enormemente el coste
computacional de la aplicación). Para esta aplicación resulta
mejor utiliza imágenes a escala de gris (figura 6) que imágenes
a color (figura 7).
d x, y
x y
y x
[( x1 y1 )2 ..... ( xn
yn ) 2 ]
1
2
(3)
En definitiva la DE esta dada por:
d x, y
k
( xn
yn )2
(4)
n 1
La distancia de Mahalanobis (DM) también se llama
distancia cuadrática. Se mide la separación de dos grupos de
objetos. Supóngase que se tienen dos grupos llamado z y a, la
DM [16] es dada por la siguiente ecuación:
D z, a
Figura 6. Histogramas de las tres clases de café según su color (escala de gris)
Figura 7. Histogramas RGB de las tres clases de café según su color
(imágenes a color)
Como se puede observar en la figura 7, los granos
blanquecinos y verde claro poseen una similitud bastante
elevada lo cual puede ocasionar que estos granos se confundan,
sin embargo haciendo uso de imágenes a escala de gris este
problema disminuye como se muestra en la figura 6, esto sucede
ya que los granos poseen tonos diferentes fáciles de separar
(brillos y contrastes bastante diferenciables). Por consiguiente
en esta aplicación es mejor utilizar imágenes a escala de gris
que a color.
Los datos de las figuras 6 y 7 son tomadas de la media de 15
granos de cada clase, es decir se hallan 15 histogramas por cada
tipo de grano y luego se realiza la media entre cada grupo, para
así obtener un valor de histograma total que representa la
población de granos, estos datos también funcionan como
patrones
B. Distancia Euclidiana y de Mahalanobis
En cuanto a medidas de distancia computacional se trata la
más común es la distancia euclidiana (DE), esta examina el
origen de las diferencias cuadradas entre las coordenadas de un
par de objetos [14], es decir la DE entre dos vectores de n
dimensionales x e y se define [15] como escalar:
( z a)T C 1 ( z a)
(5)
Inicialmente se plantea utilizar como técnica de
segmentación por color la DE, sin embargo se presentan
algunos inconvenientes a la hora de diferenciar los granos verde
grisáceo y verde claro.
Lo primero que se debe tener en cuenta son los patrones a
utilizar ya que de ellos depende que la aplicación funcione
correctamente con cualquier imagen del banco, para cada
patrón se escoge una tonalidad de los granos con el fin de
determinar la matriz de covarianza C y el vector m (llamado
patrón y en la ecuación (4)), el vector m si se trata de varios
datos (pixeles) se conoce como el valor medio del conjunto de
pixeles.
Para determinar los valores de m y C se toman 300 granos
de café (135 verde grisáceo, 135 verde claro y 30 blanquecino,
solo se encontraron 30 granos blanquecinos lo cual quiere decir
que son escasos, no por nada Colombia tiene uno de los mejores
cafés del mundo, es por ello que es raro encontrar de calidad
baja), estos granos se separan en grupos de 15, de cada grupo
se halla un vector de media y una matriz de covarianza, al final
los valores obtenidos de cada grupo son promediados y el valor
resultante es el escogido como patrón para cada clase, a
continuación se muestran los valores obtenidos después de
realizar este procedimiento.
Verde Grisáceo
C=[658.9938 561.0452 375.5837
561.0452 572.8051 393.7808
375.5837 393.7808 407.4899];
m=[129.7335 111.1463 73.3943];
Verde Claro
C=[ 621.1485 481.5995 269.9496
481.5995 566.2108 360.4601
269.9496 360.4601 534.0861];
m=[182.2080 142.9570 69.2871];
Blanquecino
C=[290.8003 306.8977 307.1194
306.8977 443.2569 555.6072
307.1194 555.6072 925.7031];
m=[205.6220 192.9130 138.9192];
A continuación se muestra la distribución de la media de
cada uno de los granos en donde se puede observar que las
clases están bastante separadas, gracias a esta distribución se
pueden llegar a obtener muy buenos resultados ya que las clases
se diferencian notablemente. (Se establece que se va a utilizar
la DM, sin embargo definiendo un buen umbral y realizando
pruebas se puede llegar a utilizar la DE). Con esta misma
grafica se puede definir el umbral a utilizar (de 10 o 15), debido
a que los grupos se encuentran tan separados, (se utiliza 2 y 4
en la aplicación ya que se usa la DM y en palabras sencillas la
matriz de covarianza hace que el umbral disminuya, para el caso
de la DE si se toma un umbral de 10 a 15), el umbral se
determina tomado la distancia del centro con respecto a uno de
los puntos lejanos.
Para el caso del color verde claro, los resultados son muy
diferentes, es decir, con la DE no se obtienen granos muy bien
definido (áreas grandes) ya que no se aumenta más el umbral
con el fin de no obtener falsos positivos, a continuación en la
figura 9 se puede observar este resultado en donde el área que
está encerrada en un círculo es un café blanquecino, indicando
que si se aumenta más el umbral este puede ser confundido
como un verde claro, por otro hay granos verde claro que
pueden no ser tomados por el sistema mediante la DE, esto se
puede apreciar con los granos que están encerrados en el círculo
verde.
Figuera 9. Resultados obtenidos mediante las distancias euclidiana y de
Mahalanobis con los granos verde claro.
Grafica 1. Distribución de la media de todos los granos de café en el plano RGB
Una vez obtenidos estos datos se prosigue a la realización
de las pruebas (Vale la pena recordar que la DE solo utiliza el
vector m).
Para el documento únicamente se presentan las pruebas más
relevantes, por esta razón se ha presentado a propósito la
imagen de la figura 5 ya que posee las 5 diferentes clases de
granos de café (3 clases para el caso del color) y hay un grano
verde claro en específico que tiene una similitud elevada con
respecto a los verde grisáceo lo cual puede llevar a que el
sistema confunda este tipo de granos.
En la figura 8 se muestran los resultados obtenidos con las
dos técnicas para los granos verde grisáceo. En esta imagen se
puede apreciar que tanto la DE como la DM funcionan
correctamente aunque la DM es un poco mejor, por otro lado
no se define un umbral mayor ya que si se llega a aumentar más
el umbral en cualquiera de los dos casos el grano verde claro de
tamaño grande que está al lado derecho de la imagen puede
llegar a ser confundido como un grano verde grisáceo.
Figura 8. Resultados obtenidos mediante las distancias euclidiana y de
Mahalanobis con los granos verde grisáceo.
Teniendo en cuenta los resultados anteriores se decide
trabajar con la distancia de Mahalanobis sin embargo, para
poder identificar los granos de café se requiere de otras técnicas
ya que como se puede observar en las figuras 8 y 9 hay muchas
áreas y no se pueden ver formas bien definidas, por
consiguiente con estos resultados no se pueden llegar a
clasificar los granos de café.
A continuación se presenta el algoritmo utilizado para la
clasificación de los granos por color mediante esta técnica.
Figura 10. Algoritmo para la clasificación del café de acuerdo al color
mediante la distancia de Mahalanobis
entrenamiento de la red). La media y la varianza están dadas por
las ecuaciones (8) y (9) respectivamente.
Y
V
Como se puede observar en la figura 11, en este punto se
obtienen únicamente los granos indicados con las áreas
exactamente igual a las de la imagen original a excepción de un
grano verde claro, sin embargo es un área bástate parecida a la
original por lo cual puede asumir un valor correcto de área (un
grano grande).
C. Redes Neuronales
Se utiliza una Red Multi-Layer Feed-Forward [17] y se
entrena mediante el algoritmo Backpropagation vasado en
Levenberg Marquardt [18]. Para el entrenamiento de la red se
realizara una extracción de características a partir de las
intensidades de cada pixel, mediante algunas medidas
estadísticas. Dentro de las características más significativas que
se tienen en cuenta son la asimetría y la curtosis [19].
Una distribución, o conjunto de datos, es simétrica si se ve
la misma distribución a izquierda y a derecha del punto central,
la simetría está dada por la ecuación (6), en donde
3
i 1
3
La curtosis es una medida de si los datos alcanzaron su
punto máximo o plana en relación con una distribución
normal. Es decir, los conjuntos de datos con alta curtosis
tienden a tener un pico distinto cerca de la media, disminución
con bastante rapidez, y tienen colas pesadas. Los conjuntos de
datos con curtosis baja tienden a tener una parte superior plana
cerca de la media en lugar de un pico agudo. Una distribución
uniforme sería el caso extremo. La curtosis de una desviación
normal estándar está dada por la ecuación (7)
R
Grafica 2. Distribución de la varianza de las tres clases en el plano RGB
Kur
En la gráfica anterior se puede ver que las tres cases
notablemente están separadas entre sí, sin embargo hay unos
puntos de varianza que pertenecen al verde claro que está muy
cerca a las otras clases a tal punto de que se mescla con los
blanquecinos, por consiguiente esta característica no va a ser
tomada en cuenta para el entrenamiento de la red.
4
(Yi Y )
i 1
( N 1)
4
B
N
(Yi Y )
i 1
es la
(Yi Y )
( N 1)
2
N
G
datos
Skew
Y
i 1
Antes de empezar a entrenar la red hay que observar la
distribución de cada clase de las características seleccionadas,
esto se hace con el fin de utilizar únicamente las características
necesarias en el entrenamiento y no incurrir en un sobre
entrenamiento. A continuación se muestran las distribuciones
en el plano RGB de la varianza (grafica 2), la media (grafica 1),
la curtosis (grafica 3) y la asimetría (grafica 4).
desviación estándar, Yi son los datos y Y es la media de los
N
N
B
Figura 11. Imagen binaria con los granos de café de interés
1
N
1
N
3
Las otras características tomadas en cuenta para entrenar la
red son la media y la varianza ya que [20] las utiliza para el
entrenamiento de su red neuronal en cuento a la clasificación
por color ([20] utiliza la desviación, sin embargo la desviación
es la raíz cuadrada de la varianza, por consiguiente escoger
varianza o desviación no afecta significativamente el
G
R
Grafica 3. Distribución de la curtosis de las tres clases en el plano RGB
B
En las gráficas 1 y 3 se puede ver como las clases se
encuentran totalmente separadas, (la curtosis no esta tan
separada como la media, no obstante se logra diferenciar la
distribución entre las clases y los puntos entre clases no se
mesclan aunque hay muy pocos que están cerca), en la gráfica
4 se encuentra la de la distribución de la asimetría en donde se
muestra que posee el mismo inconveniente de la varianza, por
esta razón únicamente se tienen en cuenta las características de
la media y la curtosis para entrenar la red.
G
R
Grafica 4. Distribución de la asimetría de las tres clases en el plano RGB
En para el entrenamiento de la red y determinación del
número adecuado de capas ocultas se utiliza validación cruzada
[21]. El promedio del proceso de validación cruzada haciendo
uso de tres capas ocultas (que es el numero óptimo de capas
ocultas hallado para esta aplicación) es de 0.99, es decir solo un
grano fue seleccionado erróneamente (un grano blanquecino
fue tomado como verde claro).
En esta parte ya se puede dar por terminada la red, sin
embargo aún se puede optimizar más, para lograrlo únicamente
se utilizan las tres características más significativas; la media de
cada canal en este caso. Como se puede observar en la gráfica
1, las distribuciones entre los tres grupos son linealmente
separables y están bastante separados un grupo del otro.
Realizando esto se desea que los resultados mejoren o se
mantenga (porque la eficiencia de la anterior red es del 99.9%),
pero que el coste computacional de la aplicación disminuya.
Haciendo uso únicamente de la media no es necesaria la
validación cruzada (se toman 60 granos para entrenamiento y
240 para prueba), además se podría llegar a utilizar una sola
neurona en la capa oculta ya que las distribuciones son
linealmente separables, no obstante en esta aplicación los
resultados no son los mejores, por consiguiente se utilizan dos
neuronas. Los resultados obtenidos haciendo uso únicamente de
estas tres características son realmente buenos, es más, aumento
la eficiencia del sistema al 100%.
A continuación en la figura 12, se muestra la estructura de
la red neuronal utilizada en el sistema clasificador. Consta de 3
neuronas de entradas, 2 neuronas en la capa oculta y 1 neurona
de salida (con tres estados -10, 0, 10).
Figura 12. Estructura de la red neuronal utilizada en la clasificación por color.
VI. DETERMINANDO LA CALIDAD DEL PRODUCTO
El desarrollo del sistema clasificador de granos de café para
determinar la calidad del producto se basa en aplicar las dos
técnicas de clasificación por color, junto a la clasificación de
acuerdo al tamaño, juntando las dos características se le da una
calificación a cada grano como se estipula en la tabla 4. La
clasificación por tamaño es bastante simple, únicamente se basa
en la obtención y determinación de áreas para el caso del
histograma y en el conteo y eliminación de áreas para el caso
de la segmentación (Distancia de Mahalanobis en este caso).
Para calcular la calidad a partir de la red neuronal se hace de
forma similar a la manejada en la comparación de histogramas
en cuento al tamaño, el resto del proceso se realiza con la red
neuronal, pero en si la metodología para determinar la calidad
mediante las características de color y tamaño es la misma que
la presentada en la figura 13, por consiguiente este clasificador
también posee el mismo problema de la ubicación y cantidad de
granos debido a que se utilizan regiones de interés.
Figura 13. Algoritmo utilizado para determinar la calidad del café por medio
de la comparación de histogramas y determinación de áreas.
Figura 14. Algoritmo utilizado para determinar la calidad del café por medio
de la distancia de Mahalanobis, y el conteo y eliminación de áreas.
VII. ANÁLISIS DE LOS RESULTADOS
En cuanto a la clasificación por tamaño no hay ningún
inconveniente con la comparación de histogramas y en la red
neuronal ya que únicamente lo que se hace es binarizar el grano
de interés (la ROI con la que el sistema esté trabajando en el
momento) y determinar su área por consiguiente, se pueden
clasificar granos de cualquier tamaño. Con la segmentación no
ocurre lo mismo debido al proceso de eliminación de ruido
(áreas pequeñas), se escoge eliminar áreas considerablemente
grandes (menores a los granos medianos) con el objetivo de
reducir la posibilidad de que se presenten falsos positivos.
La clasificación por color es un proceso más complicado
que el anterior. Lo primero que se debe tener en cuenta es la
selección de un buen patrón; un buen patrón no es aquel que se
toma del mejor grano, un buen patrón es aquel que en lo posible
reúna las características de todos los granos que se encuentren
dentro de esa clase sin que lleguen a confundirse con los de las
otras clases.
En primer sistema planteado (clasificador de café basado en
la comparación de histogramas) se puede llegar a pensar que
utilizando los tres canales (RGB) en la comparación de
histogramas se obtienen mejores resultados que con imágenes a
escala de gris, sin embargo en esta aplicación los histogramas
RGB de las tres clases eran muy similares (más que todo el
verde claro y el blanquecino), por esta razón se decide observar
el comportamiento de estos en escala de gris, con los
histogramas a escala de gris se obtiene una diferencia mayor
entre clases. Aunque se escogió la mejor distribución entre los
histogramas para hacer la comparación, los resultados no fueron
para nada buenos, de 300 granos 154 fueron clasificados por el
sistema erróneamente, con esto el sistema basado en la
comparación de histogramas queda descartado inmediatamente.
Si bien los resultados del sistema anterior fueron muy
malos, se ideo una forma de mejorar el sistema; como se puede
observar en la tabla 6, la mayoría de granos que son
confundidos, son los verde claro con respecto a
los
blanquecinos, pero los blanquecinos con respecto a los verde
claro no es muy común que se confunda, por consiguiente se
decide sacar esta clase (blanquecino) dentro del proceso y
determinarla mediante el descarte, es decir los granos que no
pertenezcan a la clase verde grisáceo ni a verde claro son
considerados como blanquecinos, de esta forma el sistema
mejoro bastante, de 300 granos 10 fueron clasificados
erróneamente, es decir el sistema paso de ser pésimo a aceptable
o relativamente sobresaliente. Aunque los resultados son
buenos mediante esta solución, no es aconsejable ya que se ha
retirado una clase del sistema, si algún grano verde claro o verde
grisáceo no es tomado por el sistema, este pasa a ser
considerado como un grano blanquecino ocasionando más
errores al sistema, otro caso es por ejemplo que si N (suponga
que solo hay N granos blanquecinos) granos blanquecinos son
tomados como verde claro el sistema dice que hay N granos
blanquecinos, lo cual lleva al sistema a una inconsistencia
bastante grande causando grabes errores en la clasificación del
producto.
La segmentación por color en esta aplicación no es algo tan
trivial, debido a las características de color que presentan los
granos de café, con una segmentación por color en si no pueden
clasificar los granos de café, sin embargo es el primer y más
importante subproceso para llevar a cabo la clasificación por
color mediante una segmentación, es por ello que se realizan
pruebas con las dos técnicas propuestas; DE y DM, la primera
es más sencilla que la segunda y genera un menor coste
computacional (0.14s frente a 2.2s) y es muy efectiva en cuanto
a objetos que presenten tonos uniformes o muy simulares pero,
para objetos que presentan tonos no uniformes es mejor la DM
ya que con ella se puede segmentar varios tonos de color es
decir, si un grano verde claro posee en alguna parte una
coloración más oscura la DE no la toma como parte del grano
ocasionado un área incompleta (con respecto al grano),
mientras que la DM toma las dos tonalidades como parte del
mismo objeto no obstante, hay que tener cuidado con las
tonalidades para que sistema no confunda los granos verde
grisáceo con los verde claro, es por ello que el umbral juega un
papel importante en este proceso de segmentación. Una vez
seleccionado un patrón y umbral adecuado se determina que
para esta aplicación es mejor utilizar la DM (aunque la DE
puede funcionar bien si se selecciona un buen patrón y umbral,
en esta aplicación la DM resulta ser mejor pero no lo suficiente
como para descartar DE como solución).
Una vez se identifica la técnica para segmentar los colores
más representativos de la imagen, aun no se tienen unos buenos
resultados para llevar a cabo la clasificación es por ello que
surgen como alternativa de solución las operaciones
morfológicas y lógicas, es así como en la sección V(B) se
muestra que haciendo uso de estas operaciones se pueden
obtener áreas bien definidas o completas de los granos, con
estas áreas ya es posible clasificar los granos de café sin
embargo, debido a las operaciones morfológicas surge el
inconveniente con los granos pequeños pero, es necesario
realizarlas para que el proceso de segmentación tenga éxito.
El sistema basado en la segmentación por color brida unos
resultados realmente buenos, de 340 granos solo 1 es clasificado
erróneamente. La ventaja que posee este sistema frente a los
otros dos es que no le importa la cantidad de granos ni la
ubicación de los mismos, esto para el usuario es de mucha
ayuda porque no tiene que contar los granos ni ubicarlos
ordenadamente. No obstante el sistema presenta fallos ante
granos muy pequeños, es decir que posean un área en pixeles
inferior a 1500 o 1600 ya que son eliminados en el proceso de
eliminación de ruido, aunque es un fallo del sistema, este
tamaño en los granos de la región no es muy común, por esta
razón no se le da mucha importancia a este inconveniente.
Clasificación
Mediante
Comparación
De
Histogramas
Clasificación
Mediante
Segmentación De
Color
Clasificación
Mediante
Redes
Neuronales
Coste
Computacional
0.2 segundos
0.65 segundos
(Dependiendo del
tamaño de la imagen,
son 0.65segundos para
una imagen igual de
grande a las que se
utilizan para el
histograma)
4.5 segundos
Cantidad De
Granos
El sistema está
diseñado para
exactamente 15
granos
(Se puede
aumentar sin
embargo, la
cantidad de
granos siempre
tiene que ser la
misma)
Indefinido, los que el
usuario desee
(El límite es la cantidad
de granos que la
cámara pueda capturar
a la distancia indicada,
20cm en este caso)
Coste
Computacional
Y Cantidad De
Granos
Si la cantidad
de granos se
aumenta el
coste
computacional
también lo hace
Ubicación De
Los Granos
Tienen que
estar ubicados
siempre en los
mismo lugares
Factor
cantidad de
granos
clasificados
erróneamente y
errores
(10 granos
clasificados
erróneamente)
Existe una
posibilidad
bastante grande
posibilidad de
que los granos
se confundan
El cote computacional
siempre es el mismo,
independiente de la
cantidad de granos
(lo único que puede
ocasionar que el coste
computacional aumente
o disminuya es el
tamaño de la imagen)
Pueden estar ubicados
como el usuario lo
desee
(siempre y cuando los
granos no se toquen)
(1 grano clasificado
erróneamente)
Los granos de café con
un tamaño inferior a
6mm (tamaño pequeño)
no son tomados por el
sistema (Esto se debe al
proceso de eliminación
de áreas para eliminar
el ruido).
Igual que en el
sistema basado
en la
comparación
de
histogramas.
Si la cantidad
de granos se
aumenta el
coste
computacional
también lo
hace
Tienen que
estar ubicados
siempre en los
mismo lugares
(Ningún grano
clasificado
erróneamente)
Ninguno
encontrado
Tabla 5. Comparación entre los tres sistemas clasificadores de café
Los resultados obtenidos por la rede neuronal es excelente
de 240 granos de prueba todos fueron clasificados
correctamente, este sistema es realmente bueno, sin embargo
como se está trabajando mediante regiones de interés surge
mismo inconveniente que en la comparación de histogramas; la
ubicación y la cantidad. Aparte de este inconveniente el sistema
de clasificación basado en redes neuronales no presentan
ningún otro fallo.
Según la tabla 5, los sistemas más indicados para llevar a
cabo la tarea de clasificación son; el basado en segmentación y
el de redes neuronales, aunque los dos sistemas son realmente
buenos (excepto por el coste computacional a comparación de
los otros dos sistemas, pero el coste computacional no importa
mucho en este proyecto ya que el objetivo es determinar la
calidad del producto), por sencillez para el usuario se decide
que el mejor sistema es el basado en la segmentación, el sistema
basado en redes neuronales es muy bueno y puede llegar a ser
mejor que el de segmentación, no obstante trabaja con regiones
de interés y los granos deben estar ubicados en ciertas
posiciones de la imagen, así mismo deben tener un número fijo
de granos.
VIII. CONCLUSIONES
las imágenes logradas para la generación del banco son
bastante buenas, a ellas se debe el éxito de los clasificadores,
estas imágenes poseen un fondo netamente blanco, es decir un
valor de 255 en cada canal, esto facilita la extracción de los
valores RGB del café sin tomar el fondo, esto hace que el
sistema se concentre únicamente con el objeto de interés. Este
fondo blanco se logra con el algoritmo de procesamiento
propuesto (Figura 3). Esto hace que los granos de las imágenes
conserven su coloración, es decir que en el fondo las imágenes
no se encuentran ruidos o manchas de color generadas ante
algún factor externo, gracias a esto se puede realizar una
eficiente extracción de características.
En cuanto a la comparación de histogramas no se lograron
buenos resultados, inicialmente de 300 granos el sistema
selecciono 154 granos erróneamente lo cual es inaceptable, más
del 50% de los grano es seleccionado erróneamente, esta
relación de error se logró disminuir eliminado la clase
blanquecina en el proceso de clasificación, es decir el sistema
realmente clasifica dos clases y la tercera la sume, el problema
de este método es que se pueden presentar más errores y muy
graves, como por ejemplo: un grano verde grisáceo puede ser
confundido con un verde claro o viceversa, también puede
ocurrir que un grano sea tomado como verde grisáceo y verde
claro al mismo tiempo lo que ocasiona que la cantidad de granos
malos disminuya según el sistema (o en el peor caso dar una
cantidad negativa de granos malos). En definitiva el sistema
clasificador de café basado en la comparación de histogramas
no recomendable para determinar la calidad del producto.
Puede ser que el sistema basado en histogramas no funciona
correctamente ya que este toma en cuenta toda la ROI
(incluyendo el fondo), por este motivo los histogramas de las
tres clases poseen valores elevados de brillo. Una forma de
solucionar esto es extrayendo únicamente el color del grano
aprovechando el fondo uniforme de las imágenes (como se hizo
con la extracción de características de la red neuronal).
Mediante el sistema de clasificación que se basa en la
comparación de histogramas se puede ver que no siempre es
Coffee Beans Classifier By Characterizing Images To Determine The Product Quality
mejor trabajar con los tres canales de la imagen ya que con
imágenes a escala de gris también se puede llegar a diferenciar
las tonalidades (en el caso de diferenciar colores si es mejor
utilizar los tres canales), ya que como se puede observar en la
sección V(A), mediante imágenes a escala de gris existe una
diferencia mayor entre las clases que utilizando los tres canales,
inicialmente se podría llegar a pensar lo contrario (puede que
así sea en muchas aplicaciones) pero en esta aplicación
funciona mejor con imágenes a escala de gris.
El sistema que se basa en la segmentación (que resulto ser
la mejor opción para determinar la calidad del producto) resulto
ser más complicado de lo esperado cuando se planteó la técnica
como alternativa de solución, ya que no se tenía previsto
trabajar con operaciones morfológicas ni lógicas que fue la
solución propuesta para los problemas que se presentaron
después de aplicar la distancia de Mahalanobis, por otro lado se
planteó trabajar con la distancia Euclidiana sin embargo se
obtuvieron mejores resultados con la otra distancia, es por ello
que se decide trabajar con la distancia de Mahalanobis. Aunque
se lleva a cabo un proceso bastante largo para conseguir una
segmentación adecuada, los resultados obtenidos son muy
buenos ya que de 340 granos solo uno fue clasificado
erróneamente, esto significa que el sistema posee una eficiencia
del 99%.
Finalmente el clasificador basado en redes neuronales
resulto ser uno de los mejores y utiliza únicamente tres
características (la media de cada canal), este sistema fue capaz
de seleccionar todos los granos correctamente, es decir la
eficiencia del sistema es del 100%, no obstante tiene el
inconveniente de a cantidad de granos en la imagen y la
ubicación de los mismos, si se logra solucionar este
inconveniente este sistema puede llegar a ser el mejor debido a
que no posee el inconveniente que presenta la segmentación;
que no toma en cuenta los granos muy pequeños (aunque como
ya se dijo, no son muy comunes en la región). Pero por el
momento el mejor sistema entre los tres es el basado en la
segmentación por color.
Trabajos futuros
Dentro de los trabajos futuros hay dos fases importantes que
se deben tener en cuenta para dar por finalizado el sistema, la
primera fase es solucionar el inconveniente que posee el sistema
basado en redes neuronales y la segunda es adecuar el sistema
para que realice las capturas de los granos cuando el usuario se
lo indique, porque el sistema actual únicamente puede ser
utilizado con las imágenes del banco.
REFERENCIAS
[1]
[2]
[3]
Grounds For Change, What is Fair Trade Certification [Online],
disponible_en_<http://www.groundsforchange.com/learn/fairtrade.php?
HPSESSID=daa6ca9f51cb05a2ed38f2e38d7ea286> [Citado 13 de mayo
del 2012]
Ficha técnica del café, Coffea arábica, Perú [Online], disponible en
<http://clasev.net/v2/pluginfile.php/51611/mod_forum/attachment/1517
9/ficha%20tecnica%20del%20cafe.doc> [Citado 08 de Septiembre del
2012]
Normas Jurídicas de Nicaragua, Norma Técnica De Café Verde [Online],
Disponible_en<http://legislacion.asamblea.gob.ni/Normaweb.nsf/fb812b
d5a06244ba062568a30051ce81/3b18bf362633187c062572dc006fa835?
OpenDocument>[Citado 01 de Septiembre del 2012]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
Dedy Wirawan Soedibyo, Kudang Boro Seminar, Usman Ahmad, I Dewa
Made Subrata, The Development of Automatic Coffee Sorting System
Based on Image Processing and Artificial Neural Network, IPB Bogar
Agricultural University Scientific Repository, 2010.
Faridah, Gea O. F. Parikesit, Ferdiansjah, Coffee Bean Grade
Determination Based on Image Parameter, TELKOMNIKA, Vol.9, No.3,
December 2011, pp. 547~554.
Habtamu Minassie Aycheh, Image Analysis For Ethiopian Coffee
Classification [online], Addis Ababa University School of Graduate
Studies,
2008,
disponible
en
la
pagina:
<http://shawndra.pbworks.com/f/IMAGE+ANALYSIS+FOR+ETHIOPI
AN+COFFEE+CLASSIFICATION.pdf> [Citado 13 de mayo del 2012]
Mathworks, Visión Artificial Con MatLab [Webinar], producido por
David_Pérez,_43_min,_disponible_en<http://www.mathworks.com/web
ex/recordings/ES_110928_ComputerVision/index.html> [Citado 08 de
Septiembre de 2012]
Carlos Platero Dueñas, Universidad Politécnica de Madrid, Cap.5
Segmentación, 216 pág., 2008.
González, Woods, Digital Image Processing, second edition, Cap.1
Introduction, Prentice Hall, ISBN 0-201-18075-8, 2002.
Cesar Bustacara, Departamento de Ingeniería de Sistemas, Pontificia
Universidad Javeriana, Visión Artificial, Técnicas De Iluminación, 2011,
Disponible_en<http://sophia.javeriana.edu.co/~cbustaca/Vision_Artifici
al/presentaciones/pdf/Iluminacion.pdf> [Citado el 14 de diciembre de
2012]
González, Woods, Digital Image Processing using matlab, second edition,
Cap.6 Color Processing, Prentice Hall, ISBN 9780982085400, 2009.
Konstantinos G. Derpanis, The Bhattacharyya Measure [Online], 2008,
Disponible_en<http://www.cse.yorku.ca/~kosta/CompVis_Notes/bhattac
haryya.pdf> [Citado el 8 de diciembre de 2012]
N. A. Thacker, F. J. Aherne and P. I. Rockett, The Bhattacharyya Metric
as an Absolute Similarity Measure for Frequency Coded Data,
Kybernetika, 34, 4, 363-368, 1997.
Kardi Teknomo, Eunclidean Distance [Online], Disponible en
<http://people.revoledu.com/kardi/tutorial/Similarity/EuclideanDistance.
html> [Citado 6 de diciembre de 2012]
González, Woods, Digital Image Processing using matlab, second edition,
Cap.12 object recognition, Prentice Hall, ISBN 9780982085400, 2009.
González, Woods, Digital Image Processing, second edition, Cap.6 Color
Image Processing, Prentice Hall, ISBN 0-201-18075-8, 2002.
Daniel Svozil and others, Introduction to multi-layer feed-forward neural
networks, Chemometrics and Intelligent Laboratory Systems 39, 43-62,
PII SO169-7439(97)00061-O, 1997
S.Sapna and others, Backpropagation Learning Algorithm Based On
Levenberg Marquardt, Computer Science & Information Technology (CS
& IT), pp. 393 398, ISSN 2231-5403, 2012.
NIST SEMATECH, e-Handbook of Statistical Methods, Measures of
Skewness
and
Kurtosis
[Online],
Disponible
en
<http://www.itl.nist.gov/div898/handbook/index.htm> [Citado 15 de
Abril de 2013]
Kivanç Kiliç and others, A
78 (2007) 897 904.
Cosma Shalizi, Evaluating Statistical Models, Carnegie Mellon
University, Departament of Statistic, 2011.
Jhon Alexander Díaz Acevedo. Estudiante de
ingeniería electrónica de la Universidad de
Cundinamarca de Fusagasugá y tiene un diplomado
en web 2.0 y VoIp. Trabaja como monitor en el
laboratorio de electrónica de la UdeC. Temas de
interés: Control inteligente, Visión por computador,
Seguridad informática, Software y nuevas
tecnologías.