Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR THE CHARACTERISATION AND CLASSIFICATION OF KIDNEY STONES
Document Type and Number:
WIPO Patent Application WO/2012/136874
Kind Code:
A1
Abstract:
The invention relates to a method for the characterisation and classification of kidney stones, comprising the following steps in which: (a) a plurality of samples of kidney stones are obtained and cut in order to observe the interior thereof, obtaining the flattest surface possible; (b) hyperspectral imaging (HSI) is used to obtain the spectra of the pre-cut kidney stones, with a plurality of regions of interest (ROI) being selected and the image being analysed using principal component analysis (PCA); (c) the main species are identified using factor analysis (FA); (d) atypical values are identified using principal component analysis (PCA); (e) the different types of kidney stones are analysed using principal component analysis (PCA); and (f) the artificial neural network (ANN) technique is applied to the data obtained from the principal component analysis (PCA) for the classification thereof.

More Like This:
Inventors:
BLANCO FRANCISCO (ES)
BONIFAZI GIUSEPPE (IT)
GARGIULO ALDO (IT)
HAVEL JOSEF (CZ)
LOPEZ MONTSERRAT (ES)
SERRANTI SILVIA (IT)
VALIENTE MANUEL (ES)
Application Number:
PCT/ES2012/070239
Publication Date:
October 11, 2012
Filing Date:
April 10, 2012
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
UNIV BARCELONA AUTONOMA (ES)
MASARYK UNIVERSITY (CZ)
UNI LA SAPIENZA (IT)
BLANCO FRANCISCO (ES)
BONIFAZI GIUSEPPE (IT)
GARGIULO ALDO (IT)
HAVEL JOSEF (CZ)
LOPEZ MONTSERRAT (ES)
SERRANTI SILVIA (IT)
VALIENTE MANUEL (ES)
International Classes:
G01N21/00; A61B6/00; G01J3/40; G06F19/00; G06T1/40
Domestic Patent References:
WO2010019515A22010-02-18
Foreign References:
JP2001089510A2001-04-03
JP2005060712A2005-03-10
JP2005343934A2005-12-15
JP2005281484A2005-10-13
JPH11124467A1999-05-11
JPH1087710A1998-04-07
JPH07238105A1995-09-12
Other References:
BOSKEY A. L. ET AL.: "Infrared spectroscopic characterization of mineralized tissues.", VIB. SPECTROSC., vol. 38, no. 1-2, 2005, pages 107 - 114, XP004978657
HAMED AKBARI ET AL.: "Wavelet-based compression and segmentation of hyperspectral images in surgery.", LECTURE NOTES IN COMPUTER SCIENCE, vol. 5128, 2008, pages 142 - 149, XP019101936
HAMID A. ET AL.: "Artificial neural networks in predicting optimum renal stone fragmentation by extracorporeal shock wave lithotripsy: a preliminary study.", BRITISH JOURNAL UROLOGY INTERNATIONAL, vol. 91, no. 9, 2003, pages 821 - 824, XP055137245
GOYAL N. K. ET AL.: "A comparative study of artificial neural network analysis and multivariate regression analysis to analyze optimum renal stone fragmentation by extracorporeal shock wave lithotripsy.", SAUDI JOURNAL OF KIDNEY DISEASES AND TRANSPLANTATION, vol. 21, no. 6, 2010, pages 1073 - 1080, XP055137247
See also references of EP 2696191A4
Download PDF:
Claims:
REIVINDICACIONES

1 . - Procedimiento de caracterización y clasificación de cálculos renales, caracterizado porque comprende las siguientes etapas:

(a) se toman una pluralidad de muestras de cálculos renales y se cortan para observar su interior, obteniendo una superficie lo más plana posible,

(b) se aplica la técnica de Formación de Imágenes Hiperespectrales (HSI) obteniendo los espectros de los cálculos renales anteriormente cortados, seleccionando una pluralidad de Regiones de Interés (ROI) y analizando la imagen a través de Análisis de Componentes Principales (PCA)

(c) se identifican las especies principales mediante Análisis de Factores (FA)

(d) se identifican valores atípicos a través de Análisis de Componentes Principales (PCA)

(e) se analizan los diferentes tipos de cálculos renales a través de un Análisis de Componentes Principales (PCA)

(f) a los datos obtenidos del Análisis de Componentes Principales (PCA) se aplica la técnica de Redes Neuronales Artificiales (ANN) para su clasificación.

2. - Procedimiento de caracterización y clasificación de cálculos renales, según reivindicación 1 , caracterizado porque para la obtención de los espectros a través de la técnica de Formación de Imágenes Hiperespectrales (HSI), donde a través de una cámara combinada con un espectrógrafo de formación de imágenes se captura un espectro para cada píxel de imagen de la muestra adquirida, fijando las muestras de cálculos renales a un soporte con el lado interior hacia arriba para visualizar el núcleo a través de un detector.

Description:
PROCEDIMIENTO DE CARACTERIZACIÓN Y CLASIFICACIÓN DE

CÁLCULOS RENALES

DESCRIPCIÓN

Procedimiento de caracterización y clasificación de cálculos renales

Objeto de la invención

La presente invención trata de un procedimiento de caracterización y clasificación de cálculos renales, a través del análisis por la Formación de Imágenes Hiperespectrales (HIS) y las Redes Neuronales Artificiales (ANN), permitiendo altas velocidades en las mediciones, y no necesitando de gran preparación previa de las muestras iniciales.

Antecedentes de la invención

La formación de piedras en el riñon es una enfermedad que afecta a un porcentaje considerable de la población. Pueden encontrarse una diversidad de sustancias como compuestos principales en los cálculos renales; por lo tanto, su caracterización es de enorme importancia para encontrar las causas de este problema. En este sentido, el análisis de la composición y de la estructura de la piedra pueden proporcionar información clave sobre las condiciones de la orina durante el crecimiento del cristal.

Se han realizado muchos estudios en este campo, básicamente dirigidos a la reducción de los índices de incidencia y al aumento de la calidad de vida de los pacientes que la padecen, recortando al mismo tiempo los costes médicos para tratamientos relacionados y cirugía. Un estudio cuidadoso de la estructura de la piedra renal expulsada puede proporcionar información clave sobre el proceso de formación de la piedra y las condiciones de la orina durante el crecimiento del cristal. Por lo tanto, analizando específicamente el núcleo y la corteza externa de la muestra, es posible determinar el compuesto que sirve como núcleo de precipitación y las sustancias que precipitan después.

Se han desarrollado hasta la fecha muchas metodologías para la clasificación de las piedras renales. Las más extendidas son el examen de las piedras renales por microscopía estereoscópica y análisis de IR. La primera tiene la ventaja principal de que permite la identificación de diferentes sustancias en toda el área de la muestra, de modo que es posible determinar en su totalidad las características morfológicas de la piedra. Sin embargo, esta metodología es pesada y, más significativamente, altamente dependiente de los conocimientos del operario. Respecto a las metodologías de IR desarrolladas, requieren la molienda de la muestra, proceso por el cual el análisis espacial de la muestra pierde cualquier significado.

Además, se han llevado a cabo hasta la fecha algunos estudios de la estructura de las piedras renales, incluyendo otras técnicas tales como NIR, Microscopía Electrónica de Barrido - Espectroscopia de Rayos X de energía Dispersiva (SEM-EDS) e incluso difracción de rayos X. La espectroscopia en el NIR muestra un buen funcionamiento para la determinación de la composición de los cálculos renales, e incluso de cuantificación para mezclas. No obstante, esos trabajos requieren todavía cierto pretratamiento de la muestra, lo que hace que el análisis no sea práctico de aplicar en un hospital. Descripción de la invención

La invención que aquí se describe trata de un nuevo procedimiento de caracterización y clasificación de cálculos renales, basado en la Formación de Imágenes Hiperespectrales, para el estudio de dichas piedras en el riñon, en combinación con análisis a través de Redes Neuronales Artificiales (ANN). Los espectros de reflectancia en el NIR de las piedras analizadas muestran diferencias significativas que pueden usarse para su clasificación. También se evaluó la posibilidad de usar Redes Neuronales Artificiales para la clasificación de los cálculos renales. Los resultados muestran más de un 90% de clasificación correcta para todas las clases de piedras, incluyendo aquellas que son mezclas de compuestos. Estos prometedores resultados demuestran el buen funcionamiento de la metodología desarrollada y proporcionan nuevas perspectivas para mejorar la calidad de vida de los pacientes.

El procedimiento de caracterización de piedras en el riñon que aquí se describe utiliza la técnica de Formación de Imágenes Hiperespectrales o Formación de Imágenes Químicas (HSI), que combina una cámara con un espectrómetro para permitir la captura de un espectro para cada píxel de la imagen adquirida, siendo entonces posible caracterizar la superficie completa de la muestra. En lo que se refiere a la importancia de la caracterización espacial de la muestra, la Formación de Imágenes Hiperespectrales o Formación de Imágenes Químicas (HSI) es muy útil para los objetivos de este trabajo, puesto que permite la caracterización de áreas realmente pequeñas en la superficie de la muestra. Además de la resolución espacial, la formación de imágenes hiperespectrales puede permitir altas velocidades para las mediciones, siendo necesaria una escasa preparación de la muestra. En esencia, la Formación de Imágenes Hiperespectrales o Formación de Imágenes Químicas (HSI) es una posibilidad interesante para analizar muestras de piedra renales en un hospital. Para la gestión de la enorme cantidad de datos disponibles a partir de la formación de imágenes hiperespectrales son necesarias algunas técnicas quimiométricas. El Análisis de Componentes Principales (PCA) se usa habitualmente para explorar los datos sin procesar antes de la aplicación de una técnica de clasificación, tal como Redes Neuronales Artificiales (ANN). Las Redes Neuronales Artificiales ANN muestran un número continuamente creciente de aplicaciones en muchos campos, puesto que pueden resolver satisfactoriamente problemas analíticos complejos. Aunque es simple en estructura, el amplio número de interconexiones en el interior de la estructura de la Red Neuronal Artificial (ANN) muestra un potencial interesante para cálculos. En realidad, ya se han usado Redes Neuronales Artificiales (ANN) en medicina con buenos resultados, incluso en urología, donde las aplicaciones principales han estado relacionadas con el diagnóstico del cáncer y otras enfermedades, aunque nunca se han usado para la clasificación de piedras renales.

El objetivo principal de este trabajo es evaluar la posibilidad de usar NIR-HSI y Redes Neuronales Artificiales (ANN) para la caracterización y clasificación de cálculos renales, ya que esto podría ser útil para el diagnóstico médico, mejorando la caracterización convencional realizada hasta ahora.

Así, el procedimiento propuesto para la caracterización de piedras en el riñon comprende las siguientes fases:

Seleccionar una pluralidad de tipos de cálculos renales Cortar las piedras para ver la parte interna y obtener una superficie tan plana como fuera posible

Se analizan dichas superficies de las piedras por HSI en combinación con Análisis de Factores (FA), Análisis de Componentes principales (PCA) y Redes Neuronales Artificiales (ANN) Las mediciones hiperespectrales se realizan usando una cámara espectral en el NIR que consiste en un espectrógrafo de formación de imágenes y una cámara. Funciona como una cámara de exploración en línea de tipo escoba que proporciona información espectral contigua completa para cada píxel en la línea. La cámara espectral está alojada en una plataforma de laboratorio para realizar la inspección de diferentes muestras. La plataforma está equipada con una cinta transportadora que permite el movimiento de partículas para que se adquieran los espectros, con un marco para sostener el sensor espectral y la fuente de luz, con una consola de control usada también como mesa de trabajo y un lugar para un ordenador digital y un monitor. El dispositivo está controlado por una unidad de PC equipada con un software de adquisición/preprocesamiento.

Los espectros de las muestras se miden fijándolos a un soporte de plástico con el lado interior hacia arriba, de modo que el núcleo sea visible para el detector, para minimizar el error en las mediciones que podrían causar las vibraciones que venían de la cinta transportadora.

El análisis de las piedras se realiza seleccionando una pluralidad de regiones de interés en la superficie de la muestra. Aunque este análisis de regiones de interés pierde la información para cada píxel individual, tiene dos ventajas principales. En primer lugar, al seleccionar algunas áreas en lugar de pixeles individuales, se está alisando la superficie de la muestra, ya que algunos pixeles podrían ser ligeramente diferentes del resto de la muestra. Esta diferencia puede explicarse atendiendo a la naturaleza de la muestra, ya que podría haberse mantenido algo de materia orgánica dentro de la estructura de la piedra durante el proceso de cristalización. En segundo lugar, la cantidad de información que se va a gestionar es mucho más pequeña que en el análisis de píxel por píxel.

Además, se realiza un análisis de la imagen por Análisis de Componentes Principales (PCA) sobre cada píxel individual, mostrando las capacidades de esta técnica para la clasificación de imágenes completas.

Para el tratamiento de los datos se usan tres métodos diferentes:

Análisis de Factores (FA)

Análisis de Componentes Principales (PCA)

Rede Neuronal Artificial (ANN)

Aunque el Análisis de Factores (FA) y el Análisis de Componentes Principales (PCA) comparten el mismo objetivo principal, es decir, la reducción del número de variables del sistema encontrando conexiones latentes entre variables reales, y algunas características matemáticas, tienen diferencias que permiten obtener información diferente.

El Análisis de Factores (FA) se basa en la correlación entre variables reales, y el número de variables consideradas descriptores del sistema se selecciona de acuerdo con el valor eigen asociado. Se han sugerido varios criterios diferentes para decidir cuántos factores son descriptivos para el sistema, y cada caso tiene su propia solución, puesto que no hay reglas generales que encajen en todos los casos. La regla de Kaiser, que indica que sólo los factores con un valor eigen asociado superior a 1 son representativos para el sistema, se ha aplicado en este estudio. Todos los demás factores representan combinaciones lineales de variables reales; por lo tanto, no describen ningún componente nuevo del sistema.

Por otro lado, el Análisis de Componentes Principales (PCA) se basa en la varianza de los datos. Por lo tanto, el componente principal clave para el sistema permite la dirección en la que los datos tienen una varianza mayor.

Debido a estas propiedades, el Análisis de Factores (FA) se usa para comprobar cómo pueden distinguirse muchos componentes diferentes en todas las muestras, mientras que el Análisis de Componentes Principales (PCA) es útil para la selección de variables.

Respecto a las Redes Neuronales Artificiales (ANN), se consideran una herramienta informática sofisticada y potente, que resuelve problemas analíticos difíciles aprendiendo de casos reales. A pesar de las muchas estructuras diferentes que pueden adoptar las Redes Neuronales Artificiales (ANN), la estructura usada en este estudio siempre tenía tres capas: de entrada, capa oculta y de salida. El algoritmo seleccionado para el proceso de aprendizaje es la retropropagación. La optimización de la Redes Neuronales Artificiales (ANN) se lleva a cabo minimizando el error RMS, cuando se modifica el número de nodos en la capa oculta. El Análisis de Factores (FA) (así como el Análisis de Componentes

Principales y Redes Neuronales) se realiza a través de un software. Los datos usados para este análisis son los espectros correspondientes a los diferentes grupos de componentes que representan la variedad total de sustancias estudiadas. El peso del valor eigen asociado a cada factor disminuye para factores menos importantes. El análisis de Factores (FA) distingue las especies principales que forman los cálculos renales. De este modo, se propone un Análisis de Componentes Principales (PCA) para crear un modelo capaz de clasificar los diferentes tipos de piedras renales estudiados.

El Análisis de Componentes Principales (PCA) se realiza, mediante software, sobre cada grupo separado de piedras renales para determinar la existencia de valores atípicos dentro de los datos sin procesar. La eliminación de cualquier punto de muestras originales es una etapa crucial, puesto que al suprimir información disminuye la variabilidad del sistema. Además, no hay forma de estar completamente seguro de si una muestra está correctamente considerada como valor atípico. Por lo tanto, los criterios para la determinación de los valores atípicos se basaban en la variabilidad que muestran los espectros de las muestras. Los datos se han limpiado para tener una base de datos más fiable. Debido a la naturaleza biológica de las muestras, la estructura de los cristales que forman la piedra renal podría contener materia orgánica, que puede mantenerse en la estructura de la piedra durante su proceso de crecimiento. Además, atendiendo a la naturaleza de las muestras, la superficie medida puede no ser completamente regular, teniendo por lo tanto un valor de reflectancia que difiere del promedio del grupo.

Cada Región de Interés (ROI) se considera una muestra diferente en los términos del software. Se tienen en cuenta el intervalo completo de variables para los cálculos, pudiendo comprobar de este modo si cualquiera de las regiones de una muestra o una muestra completa es realmente diferente del resto.

Se representan los Componentes Principales (PC) del sistema, haciendo posible la detección de valores atípicos dentro de los datos sin procesar.

Después de que se hubieran limpiado los datos, se realizó un Análisis de Componentes Principales (PCA) sobre los diferentes grupos principales de cálculos renales para crear un modelo capaz de clasificar correctamente las piedras renales estudiadas. Se comprueba la eficacia mediante la validación cruzada, y todos los datos se centraron en la media.

Para obtener una distribución más amplia de la varianza de los datos, se realizó la primera derivada de los datos sin procesar. Esta etapa requiere un suavizado previo de los datos. Los resultados para predecir muestras son mejores que los datos no derivados, por tanto, la primera derivada aumenta las ligeras diferencias existentes entre los grupos de cálculos renales. Se ha observado, cuando se trabaja con Análisis de Componentes Principales (PCA), que los mejores resultados de clasificación se obtienen si los espectros de reflectancia medidos se suavizan y después se calcula la primera derivada.

El Modelo de Redes Neuronales Artificiales (ANN) se aplica para reducir el número de variables en el sistema. El uso de estas Redes Neuronales Artificiales (ANN) para el tratamiento de datos hiperespectrales muestra resultados similares a los obtenidos con técnicas convencionales. Sin embargo, es importante comentar que la metodología convencional requiere operarios entrenados mientras que las ANN realizan la clasificación independientemente de los conocimientos del operario. Además consigue un diagnóstico más rápido, aumentando la calidad de vida del paciente.

Descripción de los dibujos

Para completar la descripción que se está realizando y con objeto de ayudar a una mejor comprensión de las características del invento, de acuerdo con un ejemplo preferente de la realización práctica del mismo, se acompaña como parte integrante de dicha descripción, un juego de dibujos en donde con carácter ilustrativo y no limitativo, se ha representado lo siguiente: La Figura 1 .- muestra los valores Eigen para los siete grupos principales de cálculos renales del estudio experimental.

La Figura 2.- muestra las puntuaciones para PC1 frente a PC2 para 27 muestras de Ácido Úrico Anhidro.

La Figura 3.- muestra la varianza del modelo para cada Componente Principal (PC). La Figura 4.- muestra, dentro de la parte experimental, las cargas de cada variable para cada uno de los 7 primeros Componentes Principales. La Figura 5.- muestra, dentro de la parte experimental, las puntuaciones de los 7 grupos principales de piedras renales para PC1 frente a PC2.

La Figura 6.- muestra, dentro de la parte experimental, la representación 3D de puntuaciones para PC1 , PC2 y PC3.

La Figura 7 - muestra las puntuaciones para PC1 frente a PC3.

La Figura 8.- muestra un ejemplo para la optimización de la Red Neuronal Artificial (ANN)

Realización preferente de la invención La invención propuesta trata de un nuevo procedimiento de caracterización y clasificación de cálculos renales, que utiliza la técnica de Formación de Imágenes Hiperespectrales combinada con Redes Neuronales Artificiales. Comprende las siguientes etapas de manera general: (a) se toman una pluralidad de muestras de cálculos renales y se cortan para observar su interior, obteniendo una superficie lo más plana posible,

(b) se aplica la técnica de Formación de Imágenes Hiperespectrales (HSI) obteniendo los espectros de los cálculos renales anteriormente cortados, seleccionando una pluralidad de Regiones de Interés (ROI) y analizando la imagen a través de Análisis de Componentes Principales (PCA) (c) se identifican las especies principales mediante Análisis de Factores (FA)

(d) se identifican valores atípicos a través de Análisis de Componentes Principales (PCA)

(e) se analizan los diferentes tipos de cálculos renales a través de un

Análisis de Componentes Principales (PCA)

(f) a los datos obtenidos del Análisis de Componentes Principales (PCA) se aplica la técnica de Redes Neuronales Artificiales (ANN) para su clasificación.

Ejemplo de realización preferente

Para este estudio, se seleccionaron 215 muestras de una biblioteca de más de 1400 cálculos renales. Se consideraron once tipos de componentes de piedras renales, incluso sus mezclas. Todas estas muestras se recogieron en el servicio de urología del Hospital Universitari de Bellvitge, Barcelona (España). Los criterios de selección se basaban en tener tanta variabilidad como fuera posible, para cualquier tipo de piedra renal.

Las muestras se dividieron en dos grupos diferentes atendiendo a su composición. En primer lugar, se consideran siete tipos principales de piedras renales, puesto que representan los diferentes compuestos que se encuentran habitualmente como cálculos renales: AUA (Ácido Úrico Anhidro), BRU (Brushita), COD (Oxalato Cálcico Dihidrato), COM (Oxalato Cálcico Monohidrato), CYS (Cistina), HAP (Hidroxiapatita) y STR (EStruvita). En segundo lugar, se estudian cuatro grupos más, incluyendo mezclas de los primeros, en concreto: AUD (Ácido Úrico Dihidrato), MXL (Oxalato Cálcico e Hidroxiapatita mezclado, en capas), MXD (Oxalato Cálcico e Hidroxiapatita mezclado) y TRA (Oxalato Cálcico Dihidratado transformado en Oxalato Cálcico Monohidratado). Se analizan un número total de 1 1 tipos diferentes de piedras renales. Todas las muestras se cortaron con un bisturí para observar la parte interior de la piedra y, al mismo tiempo, para obtener una superficie tan plana como fuera posible, que se analizará mediante el equipo de HSI. Las muestras se analizaron en primer lugar por medio de microscopía estereoscópica, para comparar estos resultados con los obtenidos posteriormente con la metodología propuesta. Esta técnica se ha usado ampliamente para la caracterización de piedras renales. Para aquellas muestras no bien caracterizadas mediante este método, se realizó un análisis de Microscopía Electrónica de Barrido (SEM). En esos casos, una pequeña parte de la muestra se metalizó con una capa de grafito (el pico Au podía solaparse con el de P en el análisis de EDS) y se llevó al microscopio electrónico. Para este fin, se usaron dos equipos de SEM diferentes: Microscopio Electrónico de Barrido JEOL JSM-6300 (Japón) acoplado a un Espectrómetro de Rayos X de Energía Dispersiva Oxford Instruments Link ISIS-200 (Reino Unido) (laboratono de la Universitat Autónoma de Barcelona) y un Microscopio Electrónico de Barrido HITACHI S2500 (Japón) acoplado a un Espectrómetro de Rayos X de Energía Dispersiva Kevex 8000 (Estados Unidos) (laboratorio de la Universitá di Roma). La estructura de las muestras se analizó y se realizó el análisis de EDS en algunas partes de la piedra para confirmar la composición elemental de la muestra. En cuanto a la medición mediante la Formación de Imágenes

Hiperespectrales, se realizaron usando una cámara espectral en el NIR que consistía en un espectrógrafo de formación de imágenes ImSpector N17E para la región de longitud de onda de 1000-1700 nm y una cámara Ingaes termoestabilizada (Specim, Finlandia). Funciona como una cámara de exploración en línea de tipo escoba que proporciona información espectral contigua completa para cada píxel en la línea. La cámara espectral está alojada en una plataforma de laboratorio desarrollada por DV srl (Italia) para realizar la inspección de diferentes muestras. La plataforma está equipada con una cinta transportadora que permite el movimiento de partículas para que se adquieran los espectros, con un marco para sostener el sensor espectral y la fuente de luz, con una consola de control usada también como mesa de trabajo y un lugar para un ordenador digital y un monitor. El dispositivo está totalmente controlado por una unidad de PC equipada con el software de adquisición/preprocesamiento Spectral Scanner™ v.2.3.

La resolución de los espectros era de 7 nm; por lo tanto, se midió una cantidad total de 121 longitudes de onda. El espectrómetro estaba acoplado una lente de 50 mm. La resolución de la anchura de la imagen era de 320 píxeles, mientras que el número de cuadros, es decir, la resolución de la imagen en los ejes Y, vanaba de 200 a 350, dependiendo del número de muestras medidas en un momento.

Los espectros de las muestras se midieron fijándolos a un soporte de plástico con el lado interior hacia arriba, de modo que el núcleo fuera visible para el detector, para minimizar el error en las mediciones que podrían causar las vibraciones que venían de la cinta transportadora.

Las mediciones espectrales se calcularon como reflectancia relativa (R), de acuerdo con la ecuación siguiente: donde r s es la reflectancia medida, r b es la reflectancia medida para el negro (interferencia de fondo) y r w es la reflectancia para un blanco patrón (reflectancia del 100%).

El análisis de las piedras se realizó seleccionando algunas Regiones de Interés (ROI) en la superficie de la muestra. Se recogieron aleatoriamente cinco Regiones de Interés (ROI) para cada muestra, para tener datos representativos de toda la superficie. Aunque este análisis de Regiones de Interés (ROI) pierde la información para cada píxel individual, tiene dos ventajas principales. En primer lugar, al seleccionar algunas áreas en lugar de pixeles individuales, se está alisando la superficie de la muestra, ya que algunos pixeles podrían ser ligeramente diferentes del resto de la muestra. Esta diferencia puede explicarse atendiendo a la naturaleza de la muestra, ya que podría haberse mantenido algo de materia orgánica dentro de la estructura de la piedra durante el proceso de cristalización. En segundo lugar, la cantidad de información que se va a gestionar es mucho más pequeña que en el análisis de píxel por píxel.

Además, se realiza un análisis de la imagen por Análisis de Componentes Principales (PCA) sobre cada píxel individual, mostrando las capacidades de esta técnica para la clasificación de imágenes completas.

Por etapas, se usaron tres métodos diferentes para analizar los datos: Análisis de Factores (FA), Análisis de Componentes Principales (PCA) y Redes Neuronales Artificiales (ANN). Aunque el Análisis de Factores (FA) y el Análisis de Componentes

Principales (PCA) comparten el mismo objetivo principal, es decir, la reducción del número de variables del sistema encontrando conexiones latentes entre variables reales, y algunas características matemáticas, tienen diferencias que permiten obtener información diferente.

El Análisis de Factores (FA) se basa en la correlación entre variables reales, y el número de variables consideradas descriptores del sistema se selecciona de acuerdo con el valor eigen asociado. Se han sugerido varios criterios diferentes para decidir cuántos factores son descriptivos para el sistema, y cada caso tiene su propia solución, puesto que no hay reglas generales que encajen en todos los casos. La regla de Kaiser, que indica que sólo los factores con un valor eigen asociado superior a 1 son representativos para el sistema, se ha aplicado en este estudio. Todos los demás factores representan combinaciones lineales de variables reales; por lo tanto, no describen ningún componente nuevo del sistema. Por otro lado, el Análisis de Componentes Principales (PCA) se basa en la varianza de los datos. Por lo tanto, el componente principal clave para el sistema permite la dirección en la que los datos tienen una varianza mayor. Debido a estas propiedades, el Análisis de Factores (FA) se usó para comprobar cómo pueden distinguirse muchos componentes diferentes en todas las muestras, mientras que el Análisis de Componentes Principales (PCA) era útil para la selección de variables. Respecto a las Redes Neuronales de Artificiales (ANN), se consideran una herramienta informática sofisticada y potente, que resuelve problemas analíticos difíciles aprendiendo de casos reales. A pesar de las muchas estructuras diferentes que pueden adoptar las Redes Neuronales Artificiales (ANN), la estructura usada en este estudio siempre tenía tres capas: de entrada, capa oculta y de salida.

El algoritmo seleccionado para el proceso de aprendizaje es la retropropagación. La optimización de la Redes Neuronales Artificiales (ANN) se lleva a cabo minimizando el error RMS, cuando se modifica el número de nodos en la capa oculta.

Los datos de Formación de Imágenes Hiperespectrales se han tratado usando el software siguiente: para el FA, STATISTICA, Tulsa, OK, Estados Unidos; para el Análisis de Componentes Principales (PCA), The Unscrambler v 9.1 , Camo Process, Oslo, Noruega; para el tratamiento de imágenes, MATLAB v 7.0, MA, Estados Unidos (PLS Toolbox por Eigenvector Research, Inc.) y para las ANN TRAJAN v 3.0, Horncastle, Reino Unido.

Se usó el software STATISTICA para realizar el Análisis de Factores (FA) sobre los datos. Los datos usados para este análisis eran los espectros correspondientes a los siete grupos de componentes diferentes, puesto que representan la variedad total de sustancias estudiadas.

La Figura 1 muestra cómo el peso del valor eigen asociado a cada factor disminuye para factores menos importantes, siendo el séptimo factor el último que tiene un valor superior a 1 . Este podría ser el último factor que describe el sistema, siguiendo la regla de Kaiser. En consecuencia, puede observarse que el Análisis de Factores (FA) distingue las especies principales que forman los cálculos renales. Teniendo en cuenta estos resultados, se propone un análisis de Análisis de Componentes Principales (PCA) para crear un modelo capaz de clasificar los diferentes tipos de piedras renales estudiados.

En primer lugar, se realizó un Análisis de Componentes Principales (PCA) sobre cada grupo separado de piedras renales, teniendo cada una de ellas una composición química diferente, para determinar la existencia de valores atípicos dentro de los datos sin procesar. Esos grupos de muestras incluyen los siete grupos principales de piedras renales.

La eliminación de cualquier punto de las muestras originales es una etapa crucial, puesto que al suprimir información disminuye la variabilidad del sistema. Además, no hay forma de estar completamente seguro de si una muestra está correctamente considerada como valor atípico. Por lo tanto, los criterios para la determinación de los valores atípicos se basaban en la variabilidad que muestran los espectros de las muestras. Los datos se han limpiado para tener una base de datos más fiable. Debido a la naturaleza biológica de las muestras, la estructura de los cristales que forman la piedra renal podría contener materia orgánica, que puede mantenerse en la estructura de la piedra durante su proceso de crecimiento. Además, atendiendo a la naturaleza de las muestras, la superficie medida puede no ser completamente regular, teniendo por lo tanto un valor de reflectancia que difiere del promedio del grupo.

El análisis de las muestras de Acido Úrico Anhidro (AUA) se mostrará como ejemplo, considerando que el resto de grupos se han analizado de la misma forma. Se usó el software The Unscrambler para realizar el Análisis de

Componentes Principales (PCA) sobre 5 Regiones de Interés (ROI) para cada muestra de Ácido Úrico Anhidro (AUA). Por lo tanto, cada Región de Interés (ROI) se consideraba una muestra diferente en los términos del software. En esta primera etapa, se tuvo en cuenta el intervalo completo de variables para los cálculos, es decir, 97 variables. Al organizar los datos de este modo, es posible comprobar si cualquiera de las regiones de una muestra o una muestra completa es realmente diferente del resto.

Al representar los Componentes Principales (PC) del sistema, es posible la detección de valores atípicos dentro de los datos sin procesar. La distribución de los valores de las puntuaciones para PC1 y PC2 para todas las Regiones de Interés (ROI) de Ácido Úrico Anhidro (AUA) se muestra en la Figura 2. Esta representación incluye la elipse T 2 de Hotelling, que muestra la distancia de cada punto desde el centro del modelo. En nuestro caso, esta elipse representa el 95% de la varianza del modelo.

Si se analiza atentamente la Figura 2, parece claro que cuatro Regiones de Interés (ROI) están fuera de la elipse de Hotelling para valores de PC1 negativos. Puesto que todas estas Regiones de Interés (ROI) corresponden a la misma muestra, se considera que éste es un valor atípico.

Por otro lado, hay dos Regiones de Interés (ROI) fuera de la elipse con valores de PC1 positivos que representan muestras diferentes. Sin embargo, estas Regiones de Interés (ROI) no se suprimen de la colección completa de datos para no sobreajustar el sistema. Después de aplicar este tratamiento a todos los grupos de piedras renales diferentes, está claro que sólo una muestra de Ácido Úrico anhidro (AUA) y otra de Oxalato Cálcico Monohidrato (COM) es probable que sean valores atípicos. Después de que se hubieran limpiado los datos, se realizó un Análisis de Componentes Principales (PCA) sobre los siete grupos de cálculos renales para crear un modelo capaz de clasificar correctamente las piedras renales estudiadas. Este modelo se realizó tomando para el cálculo las 97 variables. La eficacia se comprobó por medio de validación cruzada, y todos los datos se centraron en la media.

En primer lugar, el modelo se calculó directamente a partir de los datos de reflectancia adquiridos. La Figura 3 Modelo A muestra que, en este caso, los dos primeros Componentes Principales (PC) representan el 95% de la varianza del modelo, teniendo por lo tanto el resto de Componentes Principales (PC) un valor relativamente bajo. Para obtener una distribución más amplia de la varianza de los datos, se realizó la primera derivada de los datos sin procesar. Esta etapa requiere un suavizado previo de los datos, que se realizó por medio del algoritmo de Savitzky-Golay, usando una ventana de 5 puntos. En este caso, se observa una explicación de la varianza muy distribuida; en concreto, son necesarios hasta 7 Componentes Principales (PC) para explicar el 96% de la varianza para el modelo (Figura 3 Modelo B). No obstante, como puede observarse en la sección siguiente, sus resultados para predecir muestras son mejores que los de datos no derivados. Por consiguiente, puede concluirse que la primera derivada aumenta las ligeras diferencias existentes entre los siete grupos de cálculos renales. Por esta razón, se usó la primera derivada de los espectros para el tratamiento adicional de los datos.

Los métodos multivariable pueden dar una cantidad de información mucho mayor que los univariables, aunque muchas variables del intervalo medido podrían no proporcionar datos valiosos sino interferencia. En este sentido, se puede aprovechar el hecho de que uno de los enunciados básicos del Análisis de Componentes Principales (PCA) es la reducción del número de variables, tomando sólo la información contenida en las variables reales. En realidad, no todas las regiones del espectro NIR proporcionan información relevante al modelo. Entonces, seleccionando aquellas longitudes de onda con las mayores capacidades de clasificación se reducen las interferencias del sistema, aumentando su precisión y simplificando los cálculos para el modelo. Las longitudes de onda que se llevarán a los cálculos pueden ser aquellas que tengan un valor superior para la carga para cada Componente Principal (PC). La representación de las cargas de cada longitud de onda para cada Componente Principal (PC) (Figura 4) es una forma clara de ver cuáles son las longitudes de onda más importantes.

A partir de la información de la Figura 4 y de la representación de los valores de las puntuaciones para dos Componentes Principales (PC), también es posible definir las variables que definen cada compuesto. La representación de puntuaciones para PC1 frente a PC2 (Figura 5) se proporciona como ejemplo. Muestra que tanto el Ácido Úrico Anhidro (AUA) como la Cistina (CYS) tienen valores negativos para PC1 pero de signo opuesto para PC2, lo que significa que PC2 está diferenciando claramente estos dos componentes.

A partir de la Figura 5 puede observarse que PC2 está bien definido con valores de carga positivos para las longitudes de ondas de los intervalos de 1 188-1230 nm y 1440-1542 nm. Todas estas energías se asocian a vibraciones de enlaces C-H. Esta asociación se concuerda perfectamente con la estructura de Cistina, puesto que éste es el único componente del conjunto estudiado que tiene enlaces C-H. Por otro lado, las longitudes de onda de 971 -978 nm y 1083-1 167 nm tienen valores de carga negativos para PC2. En este caso, las vibraciones de enlaces asociadas son las de Ar-OH, que pueden estar relacionadas solamente con Ácido Úrico anhidro (AUA), por equilibrio tautomérico con la estructura de la Cistina.

Además de la información respecto a Cistina (CYS) y Ácido Úrico anhidro (AUA), pueden obtenerse algunos otros datos que definan el resto de compuestos de la Tabla 1 , que se muestra a continuación. Claramente, la vibración que diferencia a Oxalato Cálcico Monohidrato (COM) y Oxalato Cálcico Dihidrato (COD) es la banda para el agua.

La Tabla 1 siguiente muestra la información principal extraída de las puntuaciones y cargas para cada grupo de piedras renales:

Tipo de piedra PC λ con mayor carga Vibraciones de NIR renal característicos (nm) asociadas

CYS PCK0 PC2>0 1188-1230, 1440-1542 CH, CH 2 , CH 3 AUA PCK0 PC2>0 971-978, 1083-1167 Ar-OH COD PC3>0 PC2<0

1426-1475 H 2 0

COM PC3<0 PC4>0 BRU PC3<0 PC4<0 1223-1244

HAP

No bien definidas

STR

Puede apreciarse que las bandas de NIR que definen Brushita (BRU) están comprendidas en el intervalo en el que aparecen vibraciones de C-H. Este hecho podría explicarse debido a la cantidad especialmente elevada de materia orgánica contenida en los cálculos de Brushita (BRU), puesto que no se encuentran enlaces de C-H en la estructura de la brushita.

El inconveniente principal que ha demostrado el Análisis de Componentes Principales (PCA) es el de ser incapaz de separar la Hidroxiapatita (HAP) y la Estruvita (STR), resultados que pueden observarse claramente en la Figura 6, donde estos dos compuestos aparecen como dos grupos superpuestos. Estos resultados pueden entenderse si se tiene en cuenta su composición muy similar. Los cálculos de Estruvita son básicamente piedras de Hidroxiapatita con una cantidad variable de cristales de Estruvita esparcidos en el interior de toda la piedra. Significa que la mayor parte de la muestra es similar a una piedra renal de Hidroxiapatita (HAP) pura. A pesar de la única excepción de los cálculos renales de

Hidroxiapatita (HAP) y Estruvita (STR), el Análisis de Componentes Principales (PCA) ha demostrado ser útil para la clasificación de los componentes principales para piedras renales, como se observa en la Figura 6.

Se realizó también un Análisis Componentes Principales (PCA) diferente sobre los siete grupos de piedras renales, tomando directamente el cubo hiperespectral y usando esta vez el software MATLAB.

Se analizó una muestra de cada tipo de piedra renal, obteniendo una clasificación de píxel por píxel. Como el Análisis de Componentes Principales (PCA) previo, los datos usados eran la primera derivada de los espectros y los datos se centraron en la media.

Algunas muestras consideradas compuestos puros (según se clasificaron por medio de Microscopía Estereoscópica y Microscopía Electrónica de Barrido (SEM)) se usaron para crear un modelo para la clasificación posterior de muestras desconocidas. Los criterios para la clasificación se escogieron seleccionando qué grupo corresponde a cada compuesto en una representación de las puntuaciones. La identificación de los diferentes compuestos se realizó por interpretación de los colores obtenidos al crear imágenes de RGB reconstruidas a partir del cubo hiperespectral. Cuando se usa esta clase de representación, los tres Componentes Principales (PC) usados para la imagen determinarán el color de cada clase de cálculo renal.

Los diferentes colores para cada clase de piedra renal, hace que cada tipo de piedra renal pueda distinguirse entre los demás, excepto por la Estruvita y la Hidroxiapatita. De hecho, los resultados obtenidos analizando el cubo hiperespectral coinciden totalmente con los obtenidos tomando Regiones de Interés (ROI) de las muestras. De hecho, el método y las condiciones usadas para el análisis son similares en ambos casos.

Además, el software permite la selección de un grupo de píxeles de la representación de puntuaciones. Por lo tanto, es posible identificar qué área de una muestra o grupo de muestras contiene un compuesto dado, cuando se conocen los valores de las puntuaciones de cada una de ellas. La Figura 7 muestra los valores de las puntuaciones para PC1 y PC3 en una muestra que contienen principalmente Oxalato Cálcico Monohidratado (COM) y Oxalato Cálcico Dihidratado (COD). Entre la aglomeración de pixeles observados en la Figura 7 es posible identificar áreas diferenciadas para Oxalato Cálcico Dihidrato (COD), que corresponde al círculo indicado con la letra A y Oxalato Cálcico Monohidrato (COM) (indicado con la letra B), así como un área intermedia de pixeles.

Se ha observado, cuando se trabaja con Análisis de Componentes Principales (PCA), que los mejores resultados de clasificación se obtienen si los espectros de reflectancia medidos se suavizan y después se calcula la primera derivada. Por lo tanto, estos datos se procesarán con el software TRAJAN para crear el modelo de Redes Neuronales Artificiales (ANN) con el software TRAJAN.

Los datos sin procesar de los espectros consisten en hasta 97 longitudes de onda, de modo que para disminuir el número de variables en el sistema se seleccionan 50 longitudes de onda. Los criterios para la selección se basan en los valores de las cargas para cada longitud de onda, de acuerdo con los datos de la Figura 4. De este modo, se usa una matriz de 140 muestras (7 tipos principales de piedras renales) y 50 variables para el análisis.

La Red Neuronal Artificial (ANN) a optimizar se define como: entradas-número de nodos en la capa oculta-salidas, donde las entradas representan el número de muestras para crear el modelo y las salidas el número de tipos de piedras renales, es decir (140, n, 7). El valor para las salidas es una sola variable, que puede adoptar 7 valores nominales diferentes.

Después de la optimización de la Red Neuronal Artificial (ANN), se observó (Figura 8) que el número óptimo de nodos en la capa ocultar era de 4, ya que de ese punto en adelante no se detectó disminución alguna en el error RMS.

El modelo se aplicó a los siete grupos de compuestos principales de piedras renales usando las condiciones previas. Los resultados, comprobados con validación cruzada dejando uno fuera, muestran hasta el 100% de exactitud para la clasificación.

Teniendo en cuenta estos prometedores resultados, la siguiente etapa era reducir adicionalmente el número de variables en el sistema, de modo que las ventajas predichas de la reducción de variables se hicieran más claras. En este caso, aunque se seleccionaron 30 longitudes de onda, la exactitud de la clasificación continuó siendo del 100%. Cuando se toman todavía menos variables para los cálculos, el porcentaje de clasificación correcta caía hasta el 95% como mucho. Por consiguiente, la elección final era el modelo que usaba 30 longitudes de onda. Sin embargo, debido a la importancia de una clasificación exacta respecto al diagnóstico para el paciente, el objetivo realmente interesante es la clasificación de 1 1 grupos de tipos diferentes de piedras renales, es decir, los siete compuestos principales y las mezclas. Por lo tanto, es necesaria una optimización de una nueva Red

Neuronal Artificial (ANN) para crear un modelo diferente capaz de la clasificación de estos datos muchos más complejos. Con este fin, se introdujeron 50 longitudes de onda como variables, siendo la estructura de la ANN (215, 13, 1 1 ). El número de nodos de la capa oculta se averiguó siguiendo el mismo procedimiento que en el modelo previo.

En este caso, el índice de muestras bien clasificadas alcanzaba el 93%. Aunque el índice de clasificación correcta para el modelo de 1 1 compuestos era inferior que el de 7, vale la pena decir que la complejidad de las muestras introducida en el nuevo modelo representa los resultados ligeramente diferentes. En cualquier caso, estos resultados pueden considerarse bastante aceptables, teniendo en cuenta la simplicidad de las mediciones que requieren.

De este modo, se demuestra la idoneidad de la técnica de Formación de Imágenes Hiperespecrales (HIS) junto con el uso de Redes Neuronales Artificiales (ANN) para la caracterización de piedras renales. Se han identificado las regiones de los espectros de reflectancia en el NIR que tienen la mayor potencia para la clasificación de los diferentes componentes.