ties

Publicación semestral • ISSN 2683-2968 • Octubre 2021 • Número de revista 4
DOI del número: https://doi.org/10.22201/dgtic.26832968e.2021.4


Clasificación de poblaciones nativas de frijol utilizando visión artificial

DOI del artículo: https://doi.org/10.22201/dgtic.26832968e.2021.4.2

 

1/4

Introducción

El frijol y el maíz son la base de la alimentación mexicana. Ambos representan una rica fuente de proteínas, carbohidratos, vitaminas y fibra. [1] Las variedades de frijol son cultivadas a gran escala para su comercialización bajo preferencias de consumo, tipo de semilla y color. [2] Comúnmente, cada variedad está conformada por semillas con características similares, definidas por su forma y color homogéneo. Este es el criterio que permite identificar las distintas variedades comerciales. [2-4] A diferencia de una variedad comercial de frijol, una población nativa es un tipo de variedad local criolla, que ha sido preservada a través de generaciones para el consumo particular del agricultor. Estas poblaciones son el resultado de las prácticas que los agricultores realizan, esto en la selección y la mezcla de diferentes granos que se adapten a condiciones climáticas y de suelo diversas, con lo que se ve maximizada su probabilidad de subsistencia. [1, 5-7] Las poblaciones nativas de frijol pueden estar conformadas por semillas de color homogéneo, semillas de color variegado y una mezcla de semillas de distintos patrones colorimétricos.

Las propiedades colorimétricas de una población de frijol, están directamente relacionadas con su composición química y, por ende, con sus propiedades nutrimentales. Por ello resulta importante contar con métodos, que permitan analizar su color para el estudio de las relaciones que existen entre las propiedades colorimétricas y las químicas, además de comparar las similitudes y las diferencias entre las poblaciones.

Una de las técnicas más utilizadas para caracterizar el color en las poblaciones de frijol, es la espectrofotometría. [8, 9] Esto se lleva a cabo con un equipo de análisis de color de alta precisión, llamado espectrofotómetro. [10, 11] Éste cuenta con una abertura de 8 mm, donde es colocado el objeto a medir. Dado que las mediciones con un espectrofotómetro son puntuales, medir la totalidad de color de un grano no es práctico, por lo que varias mediciones de color son realizadas sobre la semilla. [8, 12] La dificultad para representar el color de un grano aumenta cuando está conformado por diferentes tonalidades (variegados). Una alternativa de caracterización del color es la que se hace mediante un sistema de visión artificial, a través del cual es posible capturar el color de una imagen adquirida por medio de una cámara digital. [13]

A continuación se reportan los trabajos que hacen uso de las propiedades colorimétricas de los granos. En Digital camera images processing of hard-to-cook beans, [14] se representa el color de los granos mediante 4 valores obtenidos de los histogramas: el valor del nivel mínimo y máximo del rango dinámico, el valor del nivel con mayor frecuencia y el valor de la frecuencia. En el estudio Identification of bean varieties according to color features using artificial neural network, [15] las características colorimétricas son representadas por el promedio del color principal y el promedio de las manchas de la semilla, en caso de contenerlas.

En el trabajo Beans quality inspection using correlation-based granulometry, [16] se considera como característica el color dominante que presenta una semilla, el cual comprende el 70% de los pixeles. Algunos trabajos no se limitan a trabajar únicamente con color. Se emplean descriptores de textura y forma, considerados para la clasificación; [17, 18] sin embargo, debido a que nuestro interés es estudiar la relación entre las propiedades colorimétricas y las nutrimentales, nuestro análisis se focaliza solamente en el color.

En la literatura existen diversos trabajos de clasificación de semillas. En muchos de ellos se reporta la clasificación individual de éstas, mientras que en el presente trabajo, la población de frijol se analiza como un conjunto de semillas que conforma la población. Se propone la utilización de un sistema de visión artificial, cuya viabilidad se evalúa mediante el cálculo del índice de precisión al clasificar las poblaciones. Como parte de la validación del método, se comparan los resultados de la precisión de clasificación de nuestra propuesta, contra las obtenidas mediante mediciones puntuales aleatorias, adquiridas con el espectrofotómetro.

El artículo está dividido en cuatro secciones: en la primera se exponen los materiales y los métodos utilizados en el proyecto. La segunda muestra los resultados obtenidos con nuestra propuesta de representación. En la tercera sección se discuten los resultados, para, finalmente, en la cuarta dar las conclusiones y exponer el trabajo futuro.


2/5

Materiales y métodos


Las poblaciones nativas de frijol, utilizadas en el presente proyecto, proceden de distintas regiones del estado de Oaxaca. Todas ellas pertenecen a variedades locales criollas, donde el cultivo es la fuente principal de alimento. En este trabajo se consideran 54 poblaciones de frijol. Cada una es representada con una muestra de 20 granos. En la figura 1 se muestran algunos ejemplos de poblaciones incluidas en este trabajo.

“frijol

Figura 1.  Ejemplos de poblaciones de frijol. De izquierda a derecha: a) Mezcla negro y rojo, b) Mezcla café y rojo, c) Negro, d) Mezcla amarillo, amarillo con café y negro, e) Mezcla amarillo, negro y rosa, f) Mezcla amarillo con negro, café, negro, rojo y rosa con negro.

Entorno de iluminación


El prototipo utilizado en este trabajo, tiene la finalidad de ofrecer un entorno de iluminación controlada y de intensidad uniforme. Fue fabricado a base de triplay, con medidas de 30x30x45 cm de largo, ancho y alto, respectivamente. La conexión eléctrica utilizada en el interior, fue en paralelo. Se utilizaron cuatro fuentes luminosas de 40 watts de luz cálida, que fueron colocadas en cada una de las esquinas, para proporcionar intensidad y dispersión de luz uniforme (figura 2a).

“frijol

Figura 2.  a) Entorno de iluminación, b) Caja de difuminación en el interior del prototipo de iluminación.

Caja de difuminación


En este trabajo se empleó una caja de difuminación como complemento del entorno de iluminación, con la finalidad de reducir reflejos especulares y evitar sombras entre granos. La caja de luz es un cubo con dimensiones 19.5x19.5x19.5 cm de largo, ancho y alto, respectivamente. Fue forrado con tela translúcida en cuatro laterales, dejando libre la parte superior para la visibilidad y la adquisición de imagen. La figura 2b muestra la caja de luz empleada en este trabajo.

Utilizando este dispositivo, la difuminación de luz prácticamente eliminó los reflejos y las sombras. La intensidad luminosa en el interior del prototipo de iluminación fue de 3600 Lx. Fue medida con un fotómetro sekonic multimeter l-408.

Cámara fotográfica digital


En este trabajo se utilizó una cámara fotográfica digital SONY, modelo ILCE 3500 de 20 MP, con configuración de disparo mostrada en la tabla 1. La configuración sirvió para estandarizar la adquisición de imágenes. Adicionalmente, la corrección automática de brillo y contraste fue deshabilitada. El balance de blancos se indicó incandescente, como especificación al tipo de fuente luminosa. Se utilizó un zoom óptico de 50 mm para la adquisición de imagen a una distancia de 45 cm del objetivo.

El proceso de adquisición de las imágenes consistió en colocar dentro de la caja de difuminación una muestra de 20 granos, separados entre sí, para evitar oclusiones y/o sombras entre granos. El fondo de color negro se utilizó para contrastar las poblaciones con granos de color blanco. El fondo blanco se usó para contrastar poblaciones de color negro y rojo, así como combinar ambas. Por último, el fondo de color azul se utilizó para contrastar las poblaciones con granos de distintos colores.

Tabla 1. Configuración de disparo de la cámara fotográfica 

“tabla


Segmentación de imágenes

Como primer paso, fue necesario identificar en cada imagen la superficie correspondiente a las semillas. Para esto se utilizó el algoritmo de segmentación por crecimiento de regiones. Este algoritmo busca agrupar pixeles, con base en un criterio de similitud predefinido. [19, 20]

Para el presente trabajo, el criterio de similitud fue definido por el atributo de color. Los tres colores utilizados como fondos de contraste, se usaron como atributo predefinido para la segmentación. Como métrica de similitud entre pixeles, se utilizó la distancia euclidiana ponderada en el espacio de color CIE L*a*b*, por ser el que mejores resultados arrojó.

“formula

 

Para la obtención del valor de los pesos wi de cada componente de color, se aplicó la fórmula:

“formula

Donde:
   wi: es el resultado de la normalización de cada componente de color

   σi: es la desviación estándar del componente de color


Caracterización del color

Una imagen digital puede ser representada por una función de dos dimensiones, cuyas coordenadas y valores de amplitud son enteros. El número de niveles de gris (k), comúnmente está expresado como una potencia de 2n.[19] Un espacio de color está conformado por tres canales. Por lo tanto, es posible obtener el promedio de los valores de cada canal y conformar el vector de tres valores. Los espacios de color considerados, fueron RGB (Rojo, Verde, Azul), HSI (Matiz, Saturación, Intensidad) y CIE L*a*b*, por ser los más comúnmente utilizados en trabajos relacionados. [14-18]


Paleta de colores

El objetivo principal del presente trabajo es la clasificación de las poblaciones de frijol, con respecto a su color. La clase principal está definida por la etiqueta que identifica a cada población (clase primaria); sin embargo, con la finalidad de estudiar cómo se agrupan estas poblaciones, de acuerdo a sus similitudes colorimétricas, fue creada una paleta de colores (súper clase), que agrupa las semillas de acuerdo a la coloración del grano. Esta paleta de colores contiene doce categorías (figura 3). La relación entre las clases primarias y la súper clase, se detalla en la tabla 2.

“frijol

Figura 3.  Paleta de color creada con los granos de las poblaciones de frijol. Fue utilizada como referencia para generar una súper clase por población de frijol.

 

Aprendizaje automático

Aun cuando se experimentó con diferentes algoritmos de clasificación, como máquinas de soporte vectorial y árboles de decisión, la clasificación de las poblaciones de frijol se realizó con el algoritmo de aprendizaje supervisado k vecinos más cercanos o k-NN (k-Nearest Neighbor), por haber obtenido mejores resultados. Para la clasificación, se utilizaron diferentes métricas de similitud, encontrándose los mejores resultados con la métrica Cityblock. Se utilizó la distancia cuadrada inversa, para ponderar el peso de cada uno de los k vecinos, de acuerdo a su proximidad a la instancia a clasificar. [21]

Los resultados de clasificación fueron medidos en términos de precisión, que se calculó a partir del promedio de las instancias correctamente clasificadas. Como método de evaluación, se utilizó la validación cruzada, particularmente la técnica de holdout, considerándose 50% de los datos para entrenamiento y el restante 50%, para validación. Se ejecutaron 20 corridas. Los algoritmos de procesamiento digital de imagen y aprendizaje automático, se implementarion en Matlab 2019b, y fueron ejecutados en una estación de trabajo Dell Precission T3610.

Tabla 2. Lista de etiquetas de clase, utilizadas para la clasificación de poblaciones nativas de frijol. La clase fue utilizada para clasificar poblaciones por variedad local y la súper clase fue utilizada para clasificar por coloración las semillas 

“tabla


3/5

Metodología

La metodología propuesta para el análisis de clasificación, se muestra en la figura 4. En primer término, se utilizan las imágenes de cada población para realizar la separación aleatoria de las semillas, con la finalidad de formar conjuntos de entrenamiento y prueba de cada población de frijol.

El siguiente paso consistió en la conversión del espacio de color RGB a HSI y CIE L*a*b*, para posteriormente extraer las características colorimétricas de las semillas representadas como promedios. Estos promedios fueron calculados por cada canal, de cada uno de los 3 espacios de color, obteniéndose un vector de 3 características para cada uno de ellos. Finalmente, se aplicó el algoritmo de aprendizaje supervisado k-NN. Los resultados de las precisiones reportadas, se calcularon como los promedios de realizar 20 corridas de este proceso.


“frijol

Figura 4.  Procedimiento para la generación de resultados de clasificación de poblaciones nativas de frijol.


Resultados

Con la finalidad de comparar los resultados de clasificación obtenidos con nuestra propuesta, contra los obtenidos por un método tradicional, como la adquisición colorimétrica puntual, adquirida con un espectrofotómetro, se procedió a realizar la medición de color con un espectrofotómetro en cada una de las poblaciones utilizadas en este trabajo. [22] Por otra parte, fue calculado el vector de promedios de cada canal de los espacios de color RGB; HSI y CIE L*a*b*, obtenidos de las regiones de interés.

Cabe aclarar que aun cuando se realizaron pruebas con distintos valores de k en el algoritmo k-vecinos cercanos, por cuestiones de espacio solo se presentan los casos donde se obtuvieron los mejores resultados. En la tabla 3 se muestran los resultados de precisión de clasificación, para la clase primaria (población).


Tabla 3. Lista de etiquetas de clase utilizadas para la clasificación de poblaciones nativas de frijol. La clase fue utilizada para clasificar poblaciones por variedad local y la súper clase fue utilizada para clasificar por coloración de las semillas. 

“tabla


En la tabla 4 se muestran los resultados en precisión de clasificación para la súper clase (paleta de color).


Tabla 4. Resultados en precisión de clasificación. Valores reportados como media desviación estándar de 20 corridas. Se especifica el valor k, con el que se obtuvieron las precisiones más altas. 

“tabla


En la figura 5 se muestran las matrices de confusión, pertenecientes a los resultados obtenidos con el vector compuesto por los 9 valores, correspondientes a los 3 espacios de color, el mismo con que se obtuvo el mejor resultado en el análisis de imagen.


“frijol

Figura 5. Matrices de confusión. a) Clase. Las letras entre paréntesis hacen referencia al color predominante en la población: (A) Amarillo, (B) Blanco, (M) Mezcla de granos de diferente color, (N) Negro, (R) Rojo b) Súper clase


Discusión

La precisión de clasificación alcanzada con las mediciones promedio del espectrofotómetro, HSI, CIE L*a*b*, RGB y conjunto de HSI+CIELab+RGB, fueron 68.24 %, 50.0% , 51.48%, 46.94% y 54.91%, respectivamente. Lo que se muestra es que aun cuando el método propuesto alcanza un nivel de precisión cercano al del espectrofotómetro, no lo logra superar. Esto sugiere que los nueve promedios no son suficientes para capturar las diferencias entre las poblaciones. Un comportamiento similar se observó en los resultados de clasificación obtenidos, usando la etiqueta súper clase.

Las matrices de confusión muestran que los errores de clasificación para el caso Clase, se deben a que existen diferentes poblaciones con colores similares, cuyos valores no pueden ser discriminados a partir de los promedios. Tal es el caso de la POB-58 roja, que fue clasificada como POB-62 roja (ver figura 5a). De manera similar, para el caso de las poblaciones hetogéneas o mezcla de granos de varios colores, presentan una problemática similar al clasificar erróneamente poblaciones que comparten algunos de los colores (ver figura 5b).

4/5


Conclusiones

Las condiciones de iluminación controladas y la configuración de la cámara, fueron determinantes para estandarizar la adquisición fotográfica, permitiendo la reproducibilidad del método. Trabajos relacionados utilizan promedios de color de granos. Además, muchos de ellos se enfocan en la clasificación individual de granos y no en su población en conjunto. En este trabajo se mostró que el uso de los promedios de color fue suficiente para alcanzar niveles de precisión, similares a los obtenidos con un espectrofotómetro. Debido a que las poblaciones de frijol son variedades que pueden estar conformadas por semillas similares o por una combinación de semillas de distintos colores, como trabajo futuro, se propone utilizar una forma de representación de color que considere el uso de la tonalidad total de una semilla, por ejemplo, histogramas de cromaticidad que capturen toda la distribución de probabilidad de los colores y no solo sus medias. Esto podría mejorar considerablemente los niveles de precisión de nuestro método.


Reconocimientos

El primer autor de este artículo agradece al Consejo Nacional de Ciencia y Tecnología (CONACyT), la beca (712056) concedida para la realización de estudios doctorales.

5/5

Bibliografía

[1] S. H. Guzman-Maldonado and O. Paredes-López, "Pérdidas irreversibles de un rico legado de la naturaleza para la humanidad. El caso del frijol común en México," Ciencia, vol. 49, no. 4, pp. 5-13, 1998.

[2] P. Graham and P. Ranalli, "Common bean (Phaseolus vulgaris L.)," Field Crops Research, vol. 53, no. 1-3, pp. 131-146, 1997.

[3] D. L. Luthria and M. A. Pastor-Corrales, "Phenolic acids content of fifteen dry edible bean (Phaseolus vulgaris L.) varieties," Journal of Food Composition and Analysis, vol. 19, no. 2, pp. 205-211, 2006/03/01/ 2006, doi: https://doi.org/10.1016/j.jfca.2005.09.003.

[4] C. W. a. H. Beninger, L. George, "Antioxidant Activity of Extracts, Condensed Tannin Fractions, and Pure Flavonoids from Phaseolus vulgaris L. Seed Coat Color Genotypes," Journal of Agricultural and Food Chemistry, vol. 51, pp. 7879--7883, 2003/12/01 2003, doi: 10.1021/jf0304324.

[5] J. L. Chávez-Servia, et al., "Diversity of common bean (Phaseolus vulgaris L.) landraces and the nutritional value of their grains," in Grain Legumes: InTech, 2016.

[6] Y. D. García-Díaz, E. N. Aquino-Bolaños, J. L. Chávez-Servia, et al., "Bioactive compounds and antioxidant activity in the common bean are influenced by cropping season and genotype," Chilean journal of agricultural research, vol. 78, no. 2, pp. 255-265, 2018.

[7] A. Capistrán-Carabarin, E. N. Aquino-Bolaños, Y. D. García-Díaz, et al., "Complementarity in Phenolic Compounds and the Antioxidant Activities of Phaseolus coccineus L. and P. vulgaris L. Landraces," Foods, vol. 8, no. 8, p. 295, 2019.

[8] E. N. Aquino-Bolaños, Y. D. García-Díaz, J. L. Chavez-Servia, et al., "Anthocyanins, polyphenols, flavonoids and antioxidant activity in common bean (Phaseolus vulgaris L.) landraces," Emirates Journal of Food and Agriculture, pp. 581-588, 2016.

[9] C. Montalvo-Paquini, R. Avila-Sosa, A. López-Malo, et al., "Preparation and Characterization of Proteinaceous Films from Seven Mexican Common Beans (Phaseolus vulgaris L.)," Journal of Food Quality, vol. 2018, p. 9782591, 2018/01/03 2018, doi: 10.1155/2018/9782591.

[10] A. H. Beckett and J. B. Stenlake, "Practical Pharmaceutical Chemistry: Part II Fourth Edition," Bloomsbury Academic, Practical Pharmaceutical Chemistry, pp. 255-272, 1988. [Online]. Available: https://books.google.com.mx/books?id=Up3L2dAI7k8C.[Accessed february 14, 2019]

[11] R. D. Simoni, R. L. Hill, M. Vaughan, et al., "A classic instrument: The Beckman DU spectrophotometer and its inventor, Arnold O. Beckman," Journal of Biological Chemistry, vol. 278, pp. 79–81, 2003, doi: doi:10.1016/s0021-9258(20)75750-9.

[12] L. G. Espinosa-Alonso, A. Lygin, J. M. Widholm, et al., "Polyphenols in wild and weedy Mexican common beans (Phaseolus vulgaris L.)," Journal of agricultural and food chemistry, vol. 54, no. 12, pp. 4436-4444, 2006, doi: 10.1021/jf060185e.

[13] J. C. del Valle, A. Gallardo-López, M. L. Buide, et al., "Digital photography provides a fast, reliable, and noninvasive method to estimate anthocyanin pigment concentration in reproductive and vegetative plant tissues," vol. 8, no. 6, pp. 3064-3076, 2018, doi: doi:10.1002/ece3.3804.

[14] B. Laurent, B. Ousman, T. Dzudie, et al., "Digital camera images processing of hard-to-cook beans," Journal of Engineering and Technology Research, vol. 2, no. 9, pp. 177-188, 2010.

[15] A. Nasirahmadi and N. Behroozi-Khazaei, "Identification of bean varieties according to color features using artificial neural network," Spanish Journal of Agricultural Research, vol. 11, no. 3, pp. 670-677, 2013.

[16] S. A. De Araújo, J. H. Pessota, and H. Y. Kim, "Beans quality inspection using correlation-based granulometry," Engineering Applications of Artificial Intelligence, vol. 40, pp. 84-94, 2015.

[17] M. L. Bianco, O. Grillo, R. Cremonini, et al., "Characterisation of Italian bean landraces ('Phaseolus vulgaris' L.) using seed image analysis and texture descriptors," Australian Journal of Crop Science, vol. 9, no. 11, p. 1022, 2015.

[18] G. Venora, O. Grillo, C. Ravalli, et al., "Identification of Italian landraces of bean (Phaseolus vulgaris L.) using an image analysis system," Scientia Horticulturae, vol. 121, no. 4, pp. 410-418, 2009.

[19] R. C. Gonzalez and R. E. Woods, "Digital image processing," 2002.

[20] T. Jun, "A color image segmentation algorithm based on region growing," in 2010 2nd International Conference on Computer Engineering and Technology, 16-18 April 2010 2010, vol. 6, pp. V6-634-V6-637, doi: 10.1109/ICCET.2010.5486012.

[21] G. Batista and D. F. Silva, "How k-nearest neighbor parameters affect its performance," in Argentine symposium on artificial intelligence, 2009: sn, pp. 1-12.

[22] R. G. McGuire, "Reporting of objective color measurements," HortScience, vol. 27, no. 12, pp. 1254-1255, 1992.