Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SEQUENCING PANEL FOR LIQUID BIOPSY OF PATIENTS WITH BREAST CANCER
Document Type and Number:
WIPO Patent Application WO/2024/089314
Kind Code:
A1
Abstract:
Massive sequencing panel composed of 37 genes for liquid biopsy that allows the early diagnosis of breast cancer and methods for obtaining useful data for the diagnosis and follow-up of the disease.

Inventors:
COMINO MÉNDEZ IÑAKI (ES)
ALBA CONEJO EMILIO (ES)
PASCUAL LÓPEZ FRANCISCO JAVIER (ES)
ALBA BERNAL ALFONSO (ES)
JIMÉNEZ RODRÍGUEZ BEGOÑA (ES)
QUIRÓS ORTEGA MARÍA ELENA (ES)
Application Number:
PCT/ES2023/070633
Publication Date:
May 02, 2024
Filing Date:
October 27, 2023
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SERVICIO ANDALUZ DE SALUD (ES)
ROCHE FARMA S A (ES)
UNIV MALAGA (ES)
CONSORCIO CENTRO DE INVESTIG BIOMEDICA EN RED (ES)
International Classes:
C12Q1/6886
Domestic Patent References:
WO2017181146A12017-10-19
WO2022225933A12022-10-27
WO2017181146A12017-10-19
Foreign References:
US20210343372A12021-11-04
US20210343372A12021-11-04
Other References:
YOSHINAMI TETSUHIRO ET AL: "Detection of ctDNA with Personalized Molecular Barcode NGS and Its Clinical Significance in Patients with Early Breast Cancer", TRANSLATIONAL ONCOLOGY, vol. 13, no. 100787, 1 August 2020 (2020-08-01), United States, XP093114697, ISSN: 1936-5233, Retrieved from the Internet DOI: 10.1016/j.tranon.2020.100787
KEUP CORINNA ET AL: "Targeted deep sequencing revealed variants in cell-free DNA of hormone receptor-positive metastatic breast cancer patients", CMLS CELLULAR AND MOLECULAR LIFE SCIENCES, BIRKHAUSER VERLAG, HEIDELBERG, DE, vol. 77, no. 3, 28 June 2019 (2019-06-28), pages 497 - 509, XP037016699, ISSN: 1420-682X, [retrieved on 20190628], DOI: 10.1007/S00018-019-03189-Z
PRISKIN KATALIN ET AL: "BC-Monitor: Towards a Routinely Accessible Circulating Tumor DNA-Based Tool for Real-Time Monitoring Breast Cancer Progression and Treatment Effectiveness", CANCERS, vol. 13, no. 14, 12 July 2021 (2021-07-12), CH, pages 3489, XP093114698, ISSN: 2072-6694, Retrieved from the Internet DOI: 10.3390/cancers13143489
SUN MIN-YING ET AL: "Targeted Next-Generation Sequencing of Circulating Tumor DNA Mutations among Metastatic Breast Cancer Patients", CURRENT ONCOLOGY, vol. 28, no. 4, 24 June 2021 (2021-06-24), pages 2326 - 2336, XP093093730, Retrieved from the Internet DOI: 10.3390/curroncol28040214
PENG ZIZHEN ET AL: "Role of FAT1 in health and disease (Review)", ONCOLOGY LETTERS, vol. 21, no. 5, 18 March 2021 (2021-03-18), GR, XP093132228, ISSN: 1792-1074, DOI: 10.3892/ol.2021.12659
ALFONSO, ALBA-BERNAL ET AL.: "Challenges and achievements of liquid biopsy technologies employed in early breast cáncer", EBIOMEDICINE, vol. 62, pages 103100, Retrieved from the Internet
SUN, M.-Y. ET AL.: "Targeted Next-Generation Sequencing of Circulating Tumor DNA Mutations among Metastatic Breast Cancer Patients", CURR. ONCOL., vol. 28, 2021, pages 2326 - 2336, XP093093730, Retrieved from the Internet DOI: 10.3390/curroncol28040214
PRISKIN, K. ET AL.: "BC-Monitor: Towards a Routinely Accessible Circulating Tumor DNA-Based Tool for Real-Time Monitoring Breast Cancer Progression and Treatment Effectiveness", CANCERS, vol. 13, 2021, pages 3489, Retrieved from the Internet
KEUP, C., BENYAA ET AL.: "Targeted deep sequencing revealed variants in cell-free DNA of hormone receptor-positive metastatic breast cáncer patients", CELL. MOL. LIFE SCI., vol. 77, pages 497 - 509, XP037016699, DOI: 10.1007/s00018-019-03189-z
JIMENEZ RODRIGUEZ, B. ET AL.: "Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis", J. CLIN. MED., vol. 8, 2019, pages 1183, Retrieved from the Internet
PEREIRA, B.: "The somatic mutation profiles of 2,433 breast cancers refine their genomic and transcriptomic landscapes", NAT COMMUN, vol. 7, 2016, pages 11479, Retrieved from the Internet
COHEN JD ET AL.: "Detection and localization of surgically resectable cancers with a multi-analyte blood test", SCIENCE, vol. 359, no. 6378, 23 February 2018 (2018-02-23), pages 926 - 930, XP055687252, DOI: 10.1126/science.aar3247
PAGE K ET AL.: "Prevalence of ctDNA in early screen-detected breast cancers using highly sensitive and specific dual molecular barcoded personalised mutation assays", ANN ONCOL, vol. 32, no. 8, 29 April 2021 (2021-04-29), pages 1057 - 1060
GARCIA-MURILLAS, I. ET AL.: "Mutation tracking in circulating tumor DNA predicts relapse in early breast cáncer", SCI TRANSL MED, vol. 7, 2015, pages 302ra133, XP055440860, DOI: 10.1126/scitranslmed.aab0021
Attorney, Agent or Firm:
SAN MARTIN ALARCIA, Esther (ES)
Download PDF:
Claims:
REIVINDICACIONES

1. Uso del panel de secuenciación de la Tabla 1 para el diagnóstico o pronóstico del cáncer de mama.

2. Uso del panel de secuenciación según la reivindicación anterior en biopsias líquidas.

3. Un método in vitro de obtención de datos útiles para diagnosticar, predecir o pronosticar la evolución del cáncer de mama, a partir de una muestra biológica previamente aislada de un individuo, que comprende identificar posibles mutaciones en los genes de la Tabla 1.

4. Un método in vitro para diagnosticar o diagnosticar precozmente el cáncer de mama que comprende el método de obtención de datos útiles de la reivindicación 3 y que además comprende asignar al individuo que presenta mutaciones en alguno de los genes de la Tabla 1 al grupo de pacientes que padece cáncer de mama.

5. Un método in vitro para diagnosticar el cáncer de mama según la reivindicación anterior que además comprende asignar al individuo que presenta una mediana de frecuencia alélica de las mutaciones de los genes de la Tabla 1 más alta, al grupo de pacientes con un grado tumoral más alto.

6. Un método in vitro para predecir o pronosticar la evolución del cáncer de mama que comprende el método de obtención de datos útiles de la reivindicación 3 y que además comprende asignar al individuo que presenta más de una mutación en los genes de la Tabla 1 , al grupo de pacientes con probabilidad de recaída clínica.

7. Un método in vitro para predecir o pronosticar la evolución del cáncer de mama que comprende el método de obtención de datos útiles de la reivindicación 3 y que además comprende asignar al individuo que presenta mutaciones en TP53 al grupo de pacientes con tumor negativo a la expresión de receptores hormonales.

8. El método según cualquiera de las reivindicaciones 3 a 7 donde la muestra biológica es plasma.

9. El método según cualquiera de las reivindicaciones 3 a 8, en el que las mutaciones en los genes de la Tabla 1 se detectan mediante tecnologías de secuenciación de última generación o next generation sequencing.

10. El método según la reivindicación anterior donde la tecnología de secuenciación de última generación utilizada son sondas de enriquecimiento tipo Agilent Sure Select.

11. Un kit que comprende los elementos necesarios para la detección simultánea de mutaciones en cualquiera de los genes de la Tabla 1.

12. Uso del kit según la reivindicación 11 para diagnosticar o pronosticar la evolución del cáncer de mama. 13. Un programa de ordenador adaptado para que cualquier medio de procesamiento pueda llevar a la práctica el método según cualquiera las reivindicaciones 3 a 10.

14. Un medio de almacenamiento legible por un ordenador que comprende instrucciones de programa capaces de hacer que un ordenador lleve a cabo los pasos del método según cualquiera las reivindicaciones 3 a 10. 15. Una señal transmisible que comprende instrucciones de programa capaces de hacer que un ordenador lleve a cabo los pasos del método según cualquiera las reivindicaciones 3 a

Description:
DESCRIPCIÓN

Panel de secuenciación para biopsia líquida de pacientes con cáncer de mama

CAMPO DE LA INVENCIÓN

La presente invención se encuentra dentro del campo de la medicina y la oncología, y se refiere a un panel de secuenciación para tejidos tumorales y biopsia líquida de pacientes con cáncer de mama.

ESTADO DEL ARTE

Denominamos cáncer de mama a los tumores que se desarrollan en los tejidos mamarios. Existen dos tipos principales de cáncer de mama: el carcinoma ductal que comienza en los conductos que llevan leche desde la mama hasta el pezón y que es el mayoritario, y el carcinoma lobular, que comienza en los lóbulos que producen leche. Para detectar el cáncer de mama, se utilizan diferentes pruebas como la mamografía, ultrasonido mamario con transductores de alta resolución (ecografías) o imágenes por resonancia magnética. Hasta la fecha, el diagnóstico de cáncer de mama solo se podía confirmar por medio de una biopsia del tumor.

La biopsia líquida es una estrategia con un gran potencial en el manejo del cáncer, incluyendo el diagnóstico, la detección de recaídas de forma temprana o permitiendo la monitorización del estado de la enfermedad a lo largo del tratamiento para ver su evolución. Se trata de una prueba que se realiza empleando biofluidos corporales, más comúnmente sangre, aunque también se pueden analizar en otros líquidos del organismo como son el que recubre las meninges, el que recubre el pulmón, la saliva o incluso la orina, con el fin de buscar células cancerosas de un tumor o fragmentos de ADN de células tumorales, el llamado ADN tumoral circulante (ctDNA). A diferencia de la biopsia de tejido, permite realizar el análisis molecular de una forma mucho más sencilla y rápida, ya que se puede hacer una analítica de sangre en cualquier momento, y además se puede repetir para monitorizar la evolución del tumor.

Lo que se pretende identificar en las muestras son las diferentes mutaciones propias del tumor, ya que estas mutaciones no están presentes en el resto de células normales que hay en la sangre.

Los paneles de secuenciación son tests genéticos que engloban genes implicados en una misma patología, en este caso, orientados al cáncer de mama.

La detección y caracterización de los materiales tumorales circulantes presenta dificultades en un escenario temprano debido a sus bajas cantidades en los biofluidos de los pacientes. Sin embargo, el avance en las técnicas de detección actualmente utilizadas, muy sensibles, permiten que, por muy poca cantidad de ctDNA que exista en la sangre o en otros biofluidos, se puede detectar y analizar pudiendo caracterizar la genética de los tumores.

La utilización del ctDNA junto con tecnologías NGS (next generation sequencing) ultrasensibles de última generación, también empleando paneles específicos de paciente, han servido para caracterizar los tumores, evaluar las respuestas a las quimioterapias neoadyuvantes y detectar la MRD (minimal residual disease) después de la cirugía.

NGS dirigidos como SafeSEQ - Safe-sequencing system o sistema de secuenciación segura han surgido recientemente como una nueva herramienta para aumentar la sensibilidad de los instrumentos del sistema de secuenciación paralela masiva para la identificación de vahantes raras en el ADN plasmático. Esta estrategia de secuenciación utiliza códigos de barras de una sola molécula antes de la amplificación por PCR para reducir el error de secuenciación y aumentar la precisión. El sistema SafeSEQ, o de secuenciación segura, se puede usar para distinguir entre mutaciones raras y errores técnicos y es capaz de detectar mutaciones que otras tecnologías pasarían por alto. SafeSEQ se ha aplicado hasta ahora a muestras de plasma de cáncer colorrectal metastásico y a pacientes con tumores del estroma gastrointestinal.

Otras tecnologías NGS son las sondas de enriquecimiento de regiones génicas concretas como son las de Agilent SureSelect, que se pueden utilizar para diseñar paneles de captura híbridos personalizados y secuenciar masivamente cualquier región codificante o no codificante del genoma o del transchptoma.

Todo ello ha contribuido al desarrollo de las técnicas de biopsia líquida. Actualmente se utilizan procedimientos de secuenciación masiva (NGS) y diferentes tecnologías para detectar ctDNA en dilución muy baja (1). Sin embargo, aún no está claro si las alteraciones moleculares en ctDNA pueden detectarse mediante ensayos basados en NGS de ctDNA en plasma en pacientes con cáncer de mama primario en el cribado y cómo se relacionan con la mutación del tejido tumoral encontrada en el mismo paciente.

Las ventajas que presenta este tipo de biopsia líquida en el seguimiento y la predicción del cáncer de mama metastásico (CMM) han sido comprobadas por diversos estudios (2), resaltando la importancia del ctDNA como potencial biomarcador para la evaluación, predicción y manejo clínico en los pacientes con CMM tratados con quimioterapia. En este sentido, la monitohzación de ctDNA durante el tratamiento puede mejorar significativamente los resultados al predecir la progresión de la enfermedad entre cuatro y seis meses antes que los métodos convencionales (3). Se han llevado a cabo vahos estudios que tratan de desarrollar un método para la monitohzacion de cáncer de mama utilizando la secuenciación de moléculas de ctDNA derivadas de una muestra obtenida del paciente y posterior análisis de dichas secuencias de ctDNA para identificar sus mutaciones. Un ejemplo de estos paneles de secuenciación lo tenemos en WO2017181146A1 donde se incluyen los siguientes genes: AKT1, ALK, APC, ATM, BRAF, CTNNB1, EGFR, ERBB2, ESR1, FGFR2, GATA3, GNAS, IDH1, IDH2, KIT, KRAS, MET, NRAS, PDGFRA, PIK3CA, PTEN, RB1, SMAD4, STK11 y TP53 y que permite detectar mutaciones en una frecuencia alélica de hasta 0,025 %. Otro ejemplo en este mismo sentido se describe en el documento US2021343372A1 donde en una muestra de biopsia líquida en pacientes con cáncer de mama se identifican mutaciones en TP53 para el 51,1% de los pacientes, y con menor incidencia, en PIK3CA, ESR1, BRCA2, NF1, ATM y APC. Las frecuencias alélicas detectadas son del orden de 0,1 %, 0,25 % y 0,5 %.

Otros paneles de genes para el análisis de ctDNA y la identificación de cáncer de mama metastásico (CMM) incluyen los siguientes genes: AKT1, AR, BRCA1, BRCA2, EGFR, ERCC4, ERBB2, ERBB3, ESR1, FGFR1, KRAS, MUC16, PIK3CA, PIK3R1, PTEN, PTGFR y TGFB1 (4).

También se ha valorado la idoneidad del análisis de ctDNA en el diagnóstico precoz de cáncer de mama, comparando mutaciones en PIK3CA y TP53 entre biopsias tumorales y DNA plasmático pretratamiento (5), revelando cuatro mutaciones adicionales, tres en TP53 y una en PIK3CA, no identificadas previamente en la biopsia de tejido de tres pacientes.

Teniendo en consideración los documentos citados en el estado de la técnica queda claro el gran interés que existe en el desarrollo de las técnicas de biopsia líquida y el análisis del ctDNA, con el fin de construir paneles de secuenciación personalizados para el diagnóstico precoz del cáncer de mama y que resulten útiles en la evaluación y seguimiento de la enfermedad, incluyendo la posibilidad de obtener predicciones sobre la progresión de la enfermedad y tomar decisiones terapéuticas personalizadas.

DESCRIPCIÓN DE LA INVENCIÓN

En la presente invención se propone un panel de secuenciación masiva para el diagnóstico precoz del cáncer de mama, útiles en la evaluación y seguimiento de la enfermedad, compuesto por 37 genes (ver Tabla 1).

Estos genes han sido seleccionados siguiendo los criterios que se exponen a continuación:

1. Genes con mutaciones en >=1% de las muestras de tumores de mama incluidas en la base de datos TCGA (https://www.cbioportal.org). 2. Genes secuenciados en un artículo seminal en tumores de mama y que presentaron mutaciones en este tipo tumoral (6).

3. Genes con relevancia biológica en el cáncer de mama y/o cánceres en general y no basados en su frecuencia mutacional. Tabla 1 : Genes incluidos en el panel se secuenciación masiva customizado empleando la tecnología de Agilent SureSelect XT HS.

Todos los genes de la tabla tienen secuencias conocidas, las cuales son públicas y accesibles a través de bases de datos públicas, por lo que no requieren mayor caracterización en la presente memoria para que un experto medio en la materia pueda reproducir la invención.

Las coordenadas genómicas de las regiones que han sido incluidas en el panel son las que se muestran en la siguiente Tabla 2.

Tabla 2: Coordenadas genómicas (versión del genoma humano=hg38):

Gracias al empleo de códigos de barras moleculares, este panel permite la caracterización ultrasensible de aberraciones genéticas tumorales, por lo que puede ser empleado para la detección de mutaciones en frecuencias alélicas por debajo del 0,15%.

Esta alta sensibilidad permite la detección de mutaciones en biofluidos (biopsia líquida) de pacientes con tumores localizados/tempranos o aquellos cánceres con poca liberación de material tumoral. Este panel ha sido optimizado y validado usando cuatro muestras de tumores de mama con mutaciones conocidas (ver ejemplo 1) y sus resultados han sido comparados con otros paneles de secuenciación para este mismo tipo de cáncer, cáncer de mama, mostrando una mayor capacidad de detección de mutaciones (ver ejemplo 2). Su uso en biopsias líquidas ha sido respaldado en estudios comparativos con muestras tumorales, donde se demuestra la alta sensibilidad, especificidad y capacidad de valor predictivo del método de diagnostico de cáncer de mama basado en este panel de secuenciación (ver ejemplo 3). También se han comprobado, mediante su correlación con variables clínico-patológicas, su utilidad como marcador de pronóstico o progresión de la enfermedad (ver ejemplo 4).

Por tanto, un primer aspecto de la invención se refiere al panel de secuenciación que comprende los genes de la Tabla 1. En concreto y más preferiblemente, a su uso como biomarcadores para diagnosticar, diagnosticar de forma temprana, predecir o pronosticar la evolución el cáncer de mama. Y aún más preferiblemente, para su uso en biopsia líquida.

Métodos de la invención

Otro aspecto de la invención se refiere a un método in vitro de obtención de datos útiles para diagnosticar, diagnosticar de forma temprana, predecir o pronosticar la evolución del cáncer de mama en un individuo, de ahora en adelante primer método de la invención, que comprende: a) obtener una muestra biológica aislada del individuo, b) identificar posibles mutaciones en los genes de la Tabla 1.

Otro aspecto de la invención se refiere a un método in vitro para diagnosticar o diagnosticar de forma temprana, el cáncer de mama, de ahora en adelante segundo método de la invención, que comprende los pasos (a) - (b) según el primer método de la invención, y además comprende: c) asignar al individuo que presenta mutaciones en alguno de los genes de la Tabla 1 al grupo de pacientes que padece cáncer de mama.

En una realización preferida del segundo método de la invención además comprende asignar al individuo que presenta una mediana de frecuencia alélica de las mutaciones más alta, al grupo de pacientes con un grado tumoral más alto.

Otro aspecto de la invención se refiere a un método in vitro para predecir o pronosticar la evolución del cáncer de mama, que comprende el método de obtención de datos útiles de la invención, y que además comprende asignar al individuo que presenta más de una mutación, al grupo de pacientes con probabilidad de recaída clínica.

Otro aspecto de la invención refiere al método in vitro para predecir o pronosticar la evolución del cáncer de mama, que comprende el método de obtención de datos útiles de la invención y que además comprende asignar al individuo que presenta mutaciones en TP53 al grupo de pacientes con tumor negativo a la expresión de receptores hormonales.

Una "muestra biológica" tal como se define aquí, es una pequeña parte de un sujeto, representativa del conjunto y puede estar constituida por una biopsia o una muestra de fluido corporal.

Preferiblemente, la muestra biológica es plasma, proveniente de la separación física de la muestra de sangre tomada del paciente. La detección las mutaciones en los genes de la Tabla 1 puede realizarse por cualquier medio conocido en el estado de la técnica.

Preferiblemente se lleva a cabo mediante tecnologías de secuenciación de próxima generación o “next-generation sequencing” (NGS). Más preferiblemente la tecnología NGS utilizada son sondas de enriquecimiento tipo Agilent SureSelect.

El método de la presente invención se puede aplicar con muestras de individuos de cualquier sexo, es decir, hombres o mujeres, y a cualquier edad. Preferiblemente se aplica a muestras obtenidas de mujeres.

En la presente invención se entiende por "pronóstico" la evolución esperada de una enfermedad y se refiere a la valoración de la probabilidad según la cual un sujeto padece una enfermedad, así como a la valoración de su inicio, estado de desarrollo, evolución, o de su regresión, y/o el pronóstico del curso de la enfermedad en el futuro. Como entenderán los expertos en la materia, tal valoración, aunque se prefiere que sea, normalmente puede no ser correcta para el 100% de los sujetos que se van a diagnosticar. El término, sin embargo, requiere que una parte estadísticamente significativa de los sujetos se pueda identificar como que padecen la enfermedad o que tienen predisposición a la misma. Si una parte es estadísticamente significativa se puede determinar sin más por el experto en la materia usando vahas herramientas de evaluación estadística bien conocidas, por ejemplo, determinación de intervalos de confianza, determinación de valores p, prueba de la t de Student, prueba de Mann-Whitney, etc. Los intervalos de confianza preferidos son al menos el 50%, al menos el 60%, al menos el 70%, al menos el 80%, al menos el 90%, al menos el 95%. Los valores de p son, preferiblemente, 0,2, 0,1 , 0,05. A su vez, atendiendo al método de la presente invención, se podrían establecer otras subclasificaciones dentro de esta principal, facilitando, por tanto, la elección y el establecimiento de regímenes terapéuticos o tratamiento adecuados. Esta discriminación tal y como es entendida por un experto en la materia no pretende ser correcta en un 100% de las muestras analizadas. Sin embargo, requiere que una cantidad estadísticamente significativa de las muestras analizadas sean clasificadas correctamente. La cantidad que es estadísticamente significativa puede ser establecida por un experto en la materia mediante el uso de diferentes herramientas estadísticas, por ejemplo, pero sin limitarse, mediante la determinación de intervalos de confianza, determinación del valor significación P, test de Student o funciones discriminantes de Fisher, medidas no paraméthcas de Mann Whitney, correlación de Spearman, regresión logística, regresión lineal, área bajo la curva de ROC (AUC). Preferiblemente, los intervalos de confianza son al menos del 90%, al menos del 95%, al menos del 97%, al menos del 98% o al menos del 99%. Preferiblemente, el valor de p es menor de 0,1 , de 0,05, de 0,01, de 0,005 o de 0,0001. Preferiblemente, la presente invención permite detectar correctamente la enfermedad de forma diferencial en al menos el 60%, más preferiblemente en al menos el 70%, mucho más preferiblemente en al menos el 80%, o aún mucho más preferiblemente en al menos el 90% de los sujetos de un determinado grupo o población analizada.

Kit y usos

Otro aspecto de la invención se refiere a un kit o dispositivo, de ahora en adelante kit o dispositivo de la invención, que comprende los elementos necesarios para detectar mutaciones en los genes de la Tabla 1 simultáneamente.

Automatización del método de la invención implementándolo en un programa de ordenador

Otro aspecto de la invención se refiere a un programa de ordenador que comprende instrucciones para realizar el procedimiento de acuerdo con cualquiera de los métodos de la invención.

En particular, la invención abarca programas de ordenador dispuestos sobre o dentro de una portadora. La portadora puede ser cualquier entidad o dispositivo capaz de soportar el programa. Como vanante, la portadora podría ser un circuito integrado en el que va incluido el programa y que se haya adaptado para ejecutar, o para ser utilizado en la ejecución de los procesos correspondientes.

Por ejemplo, los programas podrían estar incorporados en un medio de almacenamiento, como una memoria ROM, una memoria CD ROM o una memoria ROM de semiconductor, una memoria USB, o un soporte de grabación magnética, por ejemplo, un disco flexible o un disco duro. Alternativamente, los programas podrían estar soportados en una señal portadora transmisible; por ejemplo, podría tratarse de una señal eléctrica u óptica que podría transportarse a través de cable eléctrico u óptico, por radio o por cualesquiera otros medios.

La invención se extiende también a programas de ordenador adaptados para que cualquier medio de procesamiento pueda llevar a la práctica los métodos de la invención. Los programas de ordenador también abarcan aplicaciones en la nube basadas en dicho procedimiento.

Otros aspectos de la invención se refieren al medio de almacenamiento legible y a la señal transmisible que comprende instrucciones de programa necesarias para la ejecución del método de invención por un ordenador.

A lo largo de la descripción y las reivindicaciones la palabra "comprende" y sus vahantes no pretenden excluir otras características técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la descripción y en parte de la práctica de la invención. Los siguientes ejemplos y dibujos se proporcionan a modo de ilustración, y no se pretende que sean limitativos de la presente invención.

DESCRIPCIÓN DE LAS FIGURAS

Figura 1. Mutaciones encontradas en las muestras de plasma de pacientes con cáncer de mama localizado. A: mutaciones identificadas en las muestras de plasma tanto en los subestudios informado y no informado por la genética del tumor. B: características clínico- patológicas de los pacientes mostrando el estado clínico actual (recaída clínica).

Figura 2. Mutaciones identificadas en la secuenciación del ADN tumoral de las muestras incluidas en el estudio. Oncoplot. A: mutaciones observadas en las muestras tumorales indicando si se encontraron en plasma. B: características clínico-patológicas del paciente.

EJEMPLOS DE LA INVENCIÓN

1 : Optimización v validación del panel de de la Tabla 1

El panel de 37 genes implicados en cáncer de mama de la Tabla 1 fue evaluado generando librerías de secuenciación con el ADN obtenido de 4 tumores de mama y comparando los resultados con otro panel, que emplea una tecnología diferente.

Se utilizó para su secuenciación tecnologías ultrasensibles de última generación (NGS - next generation sequencing), en concreto SureSelect XT HS. Se comprobó que la cobertura de las zonas genómicas fue correcta y se detectaron mutaciones conocidas en estos tumores, que habían sido secuenciados previamente con otra tecnología, llamada TruSeq de Illumina.

Tabla 3 Mutaciones observadas en los cuatro tumores testados usando el panel personalizado de 37 genes (Sure Select XT HS) y un panel validado que emplea una tecnología y set de genes diferente (Illumina sequencing Truseq), en concreto TP53, CDH1 y PIK3CA.

ND, No detectado; NT, No testado, el panel no incluye el gen, VAF- Variant allele frequency frecuencia alélica de una vahante.

Comparando las mutaciones encontradas usando ambos paneles en los 4 tumores de prueba, se observaron frecuencias alélicas totalmente comparables para las mutaciones que fueron detectadas por ambos paneles, validando, por lo tanto, el panel de la invención.

Además, se detectó una mutación con baja frecuencia alélica y patogénica en el gen CDH1 que no fue detectada en la secuenciación previa.

Hay que destacar que usando el panel de la invención se detectaron nuevas mutaciones debido a que este panel incluye la secuenciación de muchos más genes.

Ejemplo 2: Sensibilidad del panel de genes de la Tabla 1 para su uso como biomarcadores de cáncer de mama en biopsia líquida.

Diseño del estudio y población de pacientes

El estudio incluyó a 29 pacientes con hallazgos de mamografía BI-RADS 4C/5 y posterior diagnóstico de cáncer de mama primario en el Hospital Virgen de la Victoria de Málaga y el

Hospital Clínico Universitario de Valencia. Estos pacientes fueron los mismos que los objeto de estudio en Jimenez Rodríguez, B. et al en “Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis" (5) Las muestras de sangre se recolectaron inmediatamente (menos de una hora) antes de la biopsia de tejido y antes de recibir cualquier tipo de tratamiento. Los tejidos tumorales coincidentes se recogieron a través de biopsias con aguja gruesa de tumores de mama, que posteriormente se congelaron en fresco.

Se realizó un análisis inmunohistoquímico (IHC) para cuantificar la expresión del receptor 2 del factor de crecimiento epidérmico humano (HER2), los receptores hormonales (HR) y K¡67.

El receptor de estrógeno (ER) y el receptor de progesterona (PR) se consideraron positivos si los tumores tenían más del 1 % de células con tinción nuclear.

La tinción de HER2 se calificó en una escala de 0 a 3+, de acuerdo con las pautas de HercepTest. El estado de HER2 se consideró positivo cuando se calificó como 3+, mientras que 0 a 1+ fue negativo y 2+ fue un resultado no concluyente y en esos casos se realizó hibridación in situ con plata (SISH) para confirmar la positividad.

El tumor con receptores hormonales positivos más un índice K¡ 67 de <14 % se consideró un tumor luminal A, mientras que >14 % se consideró un tumor luminal B.

Los subtipos de cáncer de mama IHC se definieron mediante una combinación de estos marcadores IHC de la siguiente manera: luminal A (PR positivo, HER2 negativo y Ki-67 < 14 %), luminal B (ER positivo y/o PR positivo, HER2 negativo y Ki-67 > 14 %), HER2 positivo (ER negativo, PR negativo, HER2 positivo) y triple negativo (ER, PR y HER2 negativo).

El estudio fue aprobado por los comités de ética de investigación del Hospital Virgen de la Victoria y del Hospital Clínico de Valencia, todos los pacientes dieron su consentimiento informado por escrito. La investigación se llevó a cabo de acuerdo con las Buenas Prácticas Clínicas y la Declaración de Helsinki.

Las características clínico-patológicas de los tumores de las pacientes con cáncer de mama inscritas se muestran en la Tabla 4. La edad promedio de las pacientes fue de 64 años (rango 44-92 años). Los 29 tumores de mama primarios examinados incluyeron 24 carcinoma ductal invasivo (GDI) (82,7 %), dos carcinomas lobulares invasivos (CLI) (6,9 %), dos carcinomas papilares (6,9 %) y un carcinoma tubular (3,4 %). catorce tumores presentaron diámetros menores a 2 cm (48,3%), mientras que 15 presentaron diámetros mayores a 2 cm (51,7%). Se detectó metástasis en los ganglios linfáticos axilares mediante biopsia con aguja gruesa en nueve pacientes (31,0 %).

Diez pacientes sin metástasis en los ganglios linfáticos tenían tumores con diámetros de más de 2 cm (34,5%). Se utilizó inmunohistoquímica para determinar los subtipos de tumores IHC de la siguiente manera, 14 tumores luminales A (48,3 %), 11 tumores luminales B (37,9 %), tres tumores triple negativos (10,3 %) y uno tumor HER2 positivo (3,4 %). Con respecto al estado de los receptores hormonales, 25 de 29 pacientes con BC tenían receptores de estrógeno (ER) positivos (86,2 %) y 17 de 29 pacientes tenían receptores de progesterona (PR) negativos (58,6 %). En cuanto al grado tumoral, la mayoría de los pacientes presentaron tumores de grado 2 (16 pacientes, 55%) mientras que siete pacientes tenían tumores de grado 3 (24,5%) y cinco pacientes tenían tumores de grado 1 (17%). Se desconocía el grado tumoral en un paciente (3,5%).

Tabla 4: Características clínico-patológicas de los pacientes.

GDI: Carcinoma ductal invasivo; CLI: carcinoma lobulillar invasivo; HER2: receptor 2 del factor de crecimiento epidérmico humano; IHC: Inmunohistoquímica; BIRADS: Sistema de datos e informes de imágenes mamarias.

Extracción de ADN

El ADN tumoral se aisló de muestras de tejido fresco congelado utilizando el kit de sangre y tejido DNeasy (Qiagen, Valencia, CA, EE. Ull.) siguiendo las instrucciones del fabricante.

Las muestras de ADN plasmático se recogieron a partir de muestras de plasma sanguíneo de 10 mi en tubos STRECK inmediatamente antes de la biopsia de tejido. Dentro de las 2h posteriores a la recolección, el plasma se separó de las muestras de sangre completa mediante centrifugación durante 10 min a 3000 rpm a temperatura ambiente y se almacenó a -80°C hasta su uso posterior. Las muestras de plasma se descongelaron y se centrifugaron nuevamente durante 10 minutos a 13.000 rpm a temperatura ambiente antes de la extracción de ADN para eliminar los desechos. El aislamiento de ADN de 2 mi de plasma se realizó con el kit de ácido nucleico circulante QIAamp (Qiagen) de acuerdo con las instrucciones del fabricante y se eluyó en 140 pL de tampón AVE (Qiagen). La cantidad total de ADN genómico humano amplificadle aislado de muestras de plasma se cuantificó utilizando una versión modificada del ensayo de PCR en tiempo real del elemento 1 intercalado largo humano (LINE- 1) y se notificó como equivalentes del genoma (GE).

Secuenciación dirigida en muestras de tejido y del ADN plasmático

El estudio NGS (next generation sequencing) de las muestras se realizó con un diseño personalizado de última generación (NGS - next generation sequencing), en concreto SureSelect XT HS) para los 37 genes de la Tabla 1.

La preparación de la librería de secuenciación y el procesamiento de datos de secuenciación se llevo a cabo siguiendo la metodología que se describe en los respectivos epígrafes del ejemplo 3.

Análisis estadístico

El análisis estadístico se realizó con SPSS (19.0, SPSS Inc., Chicago, IL, EE. UU.). Para los análisis de asociación entre variables clínico-patológicas y mutaciones derivadas de los genes de la Tabla 1 en sangre, se utilizaron la correlación de Spearmen y la prueba exacta de Fisher (para variables categóricas). El umbral de significación estadística se fijó en p < 0,05.

Los resultados usando el panel de 37 genes tanto para biopsias tumorales como para muestras de plasma se muestran en la Tabla 5. Se presenta a su vez una comparativa con los resultados obtenidos para estos mismos 29 pacientes incluidos en el artículo de Jimenez

Rodríguez, B. et al “Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis J. Clin Med. 2019 (5), donde se utilizó otra técnica de NGS, Plasma SafeSEQ (Sysmex Inostics S.A.). Tabla 5: Resultados comparativos de las mutaciones detectadas en biopsia tumoral y en muestras de plasma utilizando el panel de genes de la Tabla 1 ; y comparación con las mutaciones en plasma localizadas por otros métodos del estado de la técnica.

La columna “VAF (%)” expresa las frecuencias alélicas observadas usando el panel de la Tabla 1 , tanto en tumor sólido como en plasma, donde se llega a detectar frecuencias alélicas de

0,1% en biopsias líquidas. El método de la invención es capaz de detectar las vanantes o mutaciones concordantes entre plasma y tumor que se describen la referencia 5.

Además, gracias al panel de genes de la Tabla 1 , es posible detectar 7 vanantes en 7 muestras de plasma diferentes, en los genes PIK3CA y TP53 (que son los testados con ambos paneles) y que no se detectaban en la referencia 5. Se señalan estos resultados en negrita, indicándose SI en testado/ NO en detectado en plasma.

Al incluir muchas más regiones genéticas en el panel de la Tabla 1, es posible detectar 3 mutaciones más en 3 muestras de plasma diferentes (015MS, 016MS, 044MS).

Ejemplo 3: Sensibilidad y capacidad de detección y capacidad de diagnóstico del panel de secuenciación personalizado.

Para analizar la sensibilidad del panel de secuenciación de la invención se ha realizado una comparativa entre muestras de pacientes sanos (control) y pacientes que desarrollaron cáncer de mama.

El estudio fue aprobado por el comité de ética local y se realizó de acuerdo con las directrices de Buenas Prácticas Clínicas y la Declaración de Helsinki. Se obtuvo el consentimiento informado de todas las mujeres que fueron reclutadas en el Hospital Virgen de la Victoria de Málaga y en el Hospital Clínico Universitario de Valencia antes de realizar cualquier evaluación requerida según el protocolo.

Se han utilizado las siguientes muestras:

75 muestras de plasma de pacientes con cáncer de mama, de las que analizables fueron 74. Estas muestras se obtuvieron de pacientes con hallazgos de mamografía BIRADS 4C/5 justo antes de la biopsia de tejido, antes del diagnóstico y de ser sometidas a tratamiento para el cáncer.

71 biopsias sólidas pre-tratamiento de los pacientes antes citados.

22 muestras de plasma de mujeres que fueron incluidas en el estudio por mostrar mamografía sospechosa pero que finalmente el diagnóstico fueron negativas para la presencia cáncer de mama, y que aquí servirán como control negativo.

Tabla 6: Características clínico-patológicas de las 74 pacientes de las que se extrajeron las muestras de plasma.

Características clínicas Total n

Edad de diagnóstico (años) 30-50 13

>50 61

Tipo de tumor

GDI 59

GDIS 5

CLI 3

CP 1

TC 3

MC 3

Tamaño de tumor <2cm 32

2-5cm 37

>5cm 5

Grado del Tumor

Nodulo linfático auxiliar

Positivo 28

Negativo 38

Desconocido 8

Receptor estrógeno Positivo 66

Negativo 7

Desconocido 1

Receptor progesterona Positivo 56

Negativo 17

Desconocido 1

Estatus HER2

Positivo 6

Negativo 66

Desconocido 1

Categoría BIRADS 4/B/C 40

5B/C 33

Desconocido 1

Recaída clínica

Yes 8

No 64

Desconocido 2 k¡67 <20 36

>=20 36

GDI: carcinoma ductal invasivo; CLI: carcinoma lobulillar invasivo; GDIS: carcinoma ductal ¡n sitw, CP: carcinoma papilar; TC: carcinoma tubular; MC: carcinoma mucinoso; HER2: receptor 2 del factor de crecimiento epidérmico humano; IHC: Inmunohistoquímica; BIRADS: Sistema de datos e informes de imágenes mamarias.

Las biopsias tumorales se extrajeron utilizando agujas gruesas de biopsia y posteriormente se congelaron. Se realizó un análisis inmunohistoquímico para cuantificar la expresión del receptor 2 del factor de crecimiento epidérmico humano (HER2), los receptores hormonales (HR) y K¡67. El receptor de estrógeno (RE) y el receptor de progesterona (PR) se consideraron positivos en tumores que presentaban más del 1% de células teñidas con núcleo. La tinción de HER2 se calificó en una escala de 0 a 3+, de acuerdo con las pautas de HercepTest17. El estado de HER2 se consideró positivo cuando se calificó como 3+, mientras que 0 a 1+ fue negativo y 2+ fue un resultado no concluyente y en esos casos se realizó hibridación in situ con plata (SISH) para confirmar la positividad. El tumor con receptores hormonales positivos más un índice K¡67 de <14 % se consideró un tumor luminal A, mientras que >14 % se consideró un tumor luminal B. Los subtipos IHC BC se definieron mediante una combinación de marcadores inmunohistoquímicos de la siguiente manera: Luminal A (PR positivo, HER2 negativo y K¡67 < 14 %), luminal B (ER positivo y/o PR positivo, HER2 negativo y K¡67 > 14 %), HER2 positivo

(ER positivo/negativo, PR positivo/negativo, HER2 positivo) y triple negativo (ER, PR y HER2 negativo).

Procesamiento de muestras de sangre

Se obtuvieron 10 mi de plasma de cada individuo en tubos STRECK. Dentro de las 2 h posteriores a la recolección, el plasma se aisló de la sangre mediante centrifugación durante 10 min a 3000 rpm a temperatura ambiente y se almacenó a -80 °C hasta la extracción del ADN libre circulante (cfDNA).

Extracción y cuantificación de ADN a partir de plasma y biopsias sólidas

El cfDNA se extrajo de muestras de plasma utilizando el kit de ácido nucleico circulante QIAamp (Qiagen) de acuerdo con las instrucciones del fabricante. El ADN tumoral se aisló de muestras de tejido fresco congelado utilizando el kit de sangre y tejido DNeasy (Qiagen) siguiendo las instrucciones del fabricante. El cfDNA y el ADN de tumores sólidos se cuantificaron mediante PCR digital en gota (ddPCR) y el ensayo RNAseP (Life Technologies) como se indica en Garcia-Murillas I. et al. (9).

Diseño del panel de secuenciación para cáncer de mama

El panel NGS personalizado para cáncer de mama se diseñó utilizando el software SureDesign (Agilent) con la siguiente configuración: 5x para “tiling", menos estricto para enmascarar, XTHSBoosting para potenciar y un valor de 30 para extensión en repeticiones. El panel incluyó las regiones codificantes de la lista de genes en la Tabla 1.

Preparación de la librería de secuenciación

Se empleó la metodología SureSelectXTHS (Agilent) para generar librerías de secuenciación. Se realizaron librerías utilizando una mediana de entrada de ADN plasmático de 39,78 ng (máx. 173,91 ng - mín. 5,01 ng) de pacientes con cáncer de mama y 21 ,78 ng (máx. 113,52 ng - mín. 1,71 ng) de individuos sanos y una mediana de ADN tisular de 199,5 ng (máx. 200 ng - mín. 6,95 ng) de tumores. El ADN del tejido se fragmentó con el kit de fragmentación enzimática SureSelect (Agilent) y las librerías se prepararon con los kits del sistema de enriquecimiento de diana SureSelectXT (Agilent) siguiendo las indicaciones del fabricante. Todos los pasos de la PCR se llevaron a cabo en el Termociclador C1000 Touch (Bio-Rad).

Los intervalos de fragmentos de las librerías se analizaron con chips de ADN de alta sensibilidad Bioanalyzer (Agilent) y se cuantificaron con el KAPA Library Quantification Kit (Roche). Para la secuenciación del ADN del tejido tumoral, se prepararon y secuenciaron 8 grupos que contenían de 8 a 9 muestras de librería por grupo. Para el ADN de plasma de pacientes con cáncer de mama, también se prepararon y secuenciaron 8 grupos que contenían de 9 a 10 muestras de librería por grupo y 3 grupos que contenían de 7 a 8 muestras de librería por grupo de ADN de plasma de controles sanos. Se emplearon 19 carriles (1 carril por grupo) para secuenciar las librerías con el objetivo de obtener una secuenciación ultra profunda de alrededor de 20,000X antes de la de-duplicación en la plataforma DNBseq-G400 (MGI) en 100 lecturas pareadas siguiendo las instrucciones del fabricante para la secuenciación de códigos de barras moleculares, también llamados identificadores moleculares únicos (UMI).

Procesamiento de datos de secuenciación

Se creó un método personalizado para el procesamiento de los datos de secuenciación de SureSelectXTHS (Agilent). Inicialmente se realizó el control de calidad de los datos de secuenciación utilizando fastQC vO.11.9. A continuación, se recortaron las lecturas de los adaptadores y el filtrado de calidad mediante trim-galore vO.6.7. Para realizar los pasos de procesamiento que involucran datos con código de barras, se uso un subconjunto de herramientas fgbio v1.5.1. Se asignaron los datos al genoma de referencia GRCh38 utilizando bwa vO.7.17. Luego se usó fgbio GroupReadsByUmi para agrupar por código de barras usando la opción Identidad para tener en cuenta que los códigos de barras SureselectXT-HS están degenerados. A continuación, se generaron lecturas de consenso mediante fgbio CallMolecularConsensusReads. Las lecturas de consenso generadas se mapearon nuevamente con bwa vO.7.17. Luego, se filtraron estas lecturas de consenso alineadas usando fgbio FilterConsensusReads requiriendo una calidad de base mínima de 30 y manteniendo las lecturas de consenso respaldadas por al menos un número mínimo de lecturas. Entonces, se uso fgbio ClipBam para eliminar las regiones superpuestas de lecturas hacia adelante y hacia atrás.

Finalmente, se llevó a cabo la identificación de vanantes con MuTect2 (gatk v4.2.2.0-1), incluido un panel de ADN no tumoral y un archivo de anotación de vanantes de línea germinal para el genoma GRCh38, obtenido del paquete de recursos gatk, que se utiliza para anotar vahantes para filtrar y solo considerar las regiones incluidas en el panel SureSelect. Se anotaron las vanantes con AN NOVA v20200608 con información acerca de su presencia en las bases de datos públicas COSMIC versión 95 y “The Cancer Genome Atlas” (TCGA).

Filtración y análisis de variantes

Para el tumor, se utilizó un enfoque más estricto con el fin de generar una referencia sólida para comparar con los hallazgos de ctDNA. Se generaron lecturas de consenso que requirieron un mínimo de 3 lecturas por familia de código de barra molecular. Se aceptaron como llamadas válidas solo vanantes con VAF > 0,05 que también estaban presentes en COSMIC o TCGA (aumentando el umbral de VAF a VAF > 0,2 para tejidos embebidos en parafina fijados con formalina (FFPE)).

En el caso de ctDNA, se identificaron mutaciones utilizando dos métodos: i) Estricto; usando el mismo enfoque que se describió anteriormente, pero filtrando para un mínimo de 1 lectura por código de barra molecular, sin aplicar un umbral de VAF. Para considerar las mutaciones no encontradas en el tumor como detectadas en el plasma, se requirió que tuvieran una configuración dúplex, con al menos dos fragmentos mapeados en diferentes coordenadas y que estuvieran presentes tanto en COSMIC como en TCGA-BC. Se aplicó el mismo enfoque de procesamiento a las muestras de control, ¡i) Exploratorio; visualization de las alineaciones en el navegador del genoma IGV (Robinson, Thorvaldsdottir, Wenger, Zehir y Mesirov, 2017) para identificar mutaciones encontradas en los tumores correspondientes pero que los códigos de barras moleculares automatizados no detectaron. Para estas mutaciones identificadas de manera manual, se contó el número de lecturas que portaban la mutación en dicha muestra y el número de lecturas que no portaban la mutación. Luego, se compararon con las mismas proporciones de lectura en controles y muestras de plasma de cáncer de mama sin la mutación correspondiente mediante una prueba de Fisher.

Análisis estadísticos y visualization de datos

Se realizó el análisis estadístico y los gráficos de los datos con R (https://www.R-project.org/) Se aplicó la prueba exacta de Fisher o la prueba de Chi-cuadrado cuando fue apropiado, tanto para probar la asociación entre las variables clínico-patológicas y los datos de secuenciación de plasma como también en los análisis de datos de secuenciación. También se aplicó la prueba de Wilcoxon para probar las diferencias en la cobertura de secuenciación entre casos y controles. El umbral de significación estadística se estableció en p<0,05.

Los valores de sensibilidad, especificidad y valor predictivo positivo (VPP) se calcularon utilizando el paquete caret v6.0.93. Se utilizó la función oncoplot del paquete maftools (Mayakonda, Lin, Assenov, Plass, & Koeffler, 2018) v2.12.0 para trazar mutaciones y datos clínico-patológicos.

Resultados

En primer lugar, se secuenció el ADN del tumor utilizando la tecnología Agilent SureSelect XT HS, siguiendo las recomendaciones del protocolo, como se indicó anteriormente. La secuenciación del tumor se realizó con una mediana de cobertura de 15,483X. El procesamiento bioinformático posterior que utiliza códigos de barras moleculares para minimizar los errores de secuenciación proporcionó una cobertura mediana final de 1,698X. Entre las regiones capturadas, solo 3 presentaron menos de 100X en más del 10% de las bases secuenciadas. Además, todos los genes presentaron una cobertura homogénea en todas las muestras. A continuación, se realizó un filtrado personalizado utilizando información de bases de datos genómicas públicas para identificar mutaciones somáticas.

Se identificaron 61 mutaciones en 40/71 (56,33%) de las muestras de tumores. Entre ellos, 33 se ubicaron en el gen PIK3CA (54,09%), 12 en TP53 (19,67%) y 4 en GATA3 (6,55%) (Figura 2, Tabla 7), que representan los genes mutados con mayor frecuencia en nuestro conjunto de tumores

Para estudiar la relación entre las mutaciones observadas en los tumores y las detectadas también en el plasma, se aplicó el panel de secuenciación personalizado de la Tabla 1 junto con una secuenciación de alta profundidad con una mediana de cobertura de 17.704X utilizando el ADN plasmático de los pacientes correspondientes. En total se secuenciaron 74 muestras de plasma de los pacientes. Después del procesamiento de los códigos de barras moleculares, la cobertura mediana fue de 2,525X. Entre las regiones de genes secuenciados, 3 presentaron una cobertura baja y todos los genes mostraron una cobertura homogénea. Después de los análisis bioinformáticos utilizando el identificador de mutaciones establecido, se encontraron 13/61 (21,31%) mutaciones en plasma que también estaban presentes en los tumores correspondientes, 7 mutaciones en el gen TP53 (53,84%) y 3 en PIK3CA ( 27,27%) como los genes mutados con mayor frecuencia.

Además, todas las mutaciones observadas en los tumores se inspeccionaron manualmente en los datos sin procesar de secuenciación de plasma. Los datos alineados se usaron para identificar lecturas de apoyo para los alelos alternativos usando el software IGV. Las mutaciones que se encontraron en al menos 2 lecturas con diferentes coordenadas genómicas pasaron al siguiente paso de análisis.

Para considerar las vanantes como válidas, se aplicó una prueba exacta de Fisher utilizando datos de secuenciación de 22 controles sanos de plasma y pacientes que no portaban dicha mutación en sus tumores. En total, se rescataron 5 mutaciones de 4 pacientes diferentes de la secuenciación de plasma mediante inspección manual. Entre ellas, 3 mutaciones se localizaron en el gen TP53 y 2 en GATA3. Curiosamente, las 2 vanantes estructurales en GATA3 con estadísticas de secuenciación robustas se recuperaron mediante inspección manual.

Teniendo en cuenta el total de las variantes detectadas, 18 (13 + 5) en plasma y 61 en tumor, el 29,50% de las variantes encontradas en el tejido tumoral también se localizaron en las muestras de plasma. Por tanto, la sensibilidad de este método sería de alrededor de un 30%.

Tabla 7: Mutaciones detectadas en muestras de tumor y plasma. El método de la invención presenta una sensibilidad (30%) que supera con creces otros métodos conocidos hasta la fecha, sobre todo si lo comparamos con los dos principales estudios donde se han desarrollado tecnologías/metodologías en las que emplean paneles NGS (amplificación y captura) en el screening del cáncer de mama, esto es, como método diagnóstico. Por un lado, se han realizado estudios utilizando paneles PAN-cáncer como método de diagnóstico, donde se ha llegado a alcanzar una sensibilidad en cáncer de mama de un 33%, similar a la de la presente invención, pero para ello ha sido necesario incluir además otros analitos en circulación sanguínea, tales como proteínas, a modo de biomarcadores adicionales (7).

Por otro lado, cuando se han empleado únicamente paneles paciente-específicos ultrasensibles y de amplificación, la sensibilidad obtenida ha sido solamente del 14,3%, siendo además necesaria la secuenciación previa del tumor para poder diseñarlos, lo cual no es necesario según el método de la presente invención. Cabe destacar que esta baja sensibilidad se da a pesar de que se utiliza una de las tecnologías más novedosas en el campo, Ampliseq HD (ThermoFisher).

Por tanto, podemos concluir que es la selección especifica de los genes de la Tabla 1 la que permite obtener una método de diagnóstico de cáncer de mama que supera las limitaciones en cuanto a sensibilidad que presentaban las metodologías conocidas hasta la fecha, basadas también en paneles de secuenciación. Capacidad del panel de secuenciación de próxima generación (NGS) para detectar pacientes con cáncer de mama después de mamografías sospechosas usando biopsia líquida

Para investigar la capacidad del panel de secuenciación de próxima generación (NGS) para detectar de forma no invasiva cáncer de mama después de mamografías sospechosas se desarrolló un análisis bioinformático a partir de los datos obtenidos en las muestras del ejemplo 3. En esta ocasión el análisis está orientado a localizar todas las posibles mutaciones que se puedan presentar en plasma, a diferencia del ejemplo anterior donde se hace un análisis informado por la genética del tumor, es decir, donde únicamente se buscan en plasma las mutaciones que aparecen en el tumor.

Se empleó Mutect2 para detectar mutaciones en muestras de plasma usando 2 familias de códigos de barras moleculares y sin filtros en frecuencias alélicas vahantes (VAF). Las vahantes se consideraron asociadas al tumor si i) afectaban las regiones exónicas, ¡i) estaban anotadas en las bases de datos COSMIC, TCGA BC y TCGA que incluyen todos los tipos de cáncer, y si iii) presentaban lecturas alineadas en 2 o más coordenadas genómicas diferentes visualizadas manualmente utilizando el software IGV. En total, 25/74 (33,78 %) de las pacientes presentaron mutaciones tumorales detectadas en plasma (Tabla 8, Figura 1), 16 de las mutaciones no se observaron en el análisis anterior informado por la genética del tumor. Los genes más frecuentemente afectados por las 25 mutaciones diferentes detectadas fueron TP53 (14 mutaciones, 48,27%), PIK3CA (4 mutaciones, 13,79%) y GATA3 (3 mutaciones, 10,34%). Además, se observaron mutaciones de ctDNA en 8 muestras de plasma en cuyas biopsias tumorales correspondientes no se detectaron mutaciones. Además, se observó una mutación en una muestra de plasma sin tejido tumoral disponible.

Tabla 8: Resultados en muestras de plasma de 74 pacientes que han desarrollado cáncer de mama, utilizando el panel de genes de la Tabla 1.

En total, se han encontrado mutaciones en 25 de las 74 muestras, lo que supone un 33.78% del total.

En cuanto a los controles, se han localizado las siguientes mutaciones.

Tabla 9: Resultados en muestras de plasma de 22 sujetos sanos, utilizando el panel de genes de la Tabla 1.

Únicamente se han encontrado mutaciones en 3 de las 22 muestras control analizadas, es decir en un 13.63% de las muestras. Se trata de una mutación del gen MAP3K1 (p.N1125D) descrito en la base de datos COSMIC en una muestra de tumor de cáncer de mama, una mutación en el gen ERBB2 (p.V842l) que se ha observado con una frecuencia sustancialmente mayor en cánceres de colon y endometrio y otra mutación localizada en el gen SMAD4 (p.R361 H) también frecuente en adenocarcinoma de colon; y por otro lado, que el método de la invención tiene una capacidad de detección de frecuencias alélicas de hasta 0,03%, lo cual ¡guala, cuando no supera, otros estudio previos anteriormente citados en los antecedentes de la invención.

Con estos mismos datos se ha estudiado la capacidad de diagnóstico del panel de secuenciación de la Tabla 1 utilizando un análisis estadístico, en concreto: MedCalc Software Ltd. Diagnostic test evaluation calculator, https://www.medcalc.org/calc/diagnostic_test.php.

Los resultados de dicho análisis se muestran a continuación.

Tabla 10: Resultados.

(*) Valores dependientes de la prevalencia de la enfermedad.

Sensibilidad: probabilidad de que el resultado de una prueba sea positivo cuando la enfermedad está presente (tasa de verdaderos positivos).

Especificidad: probabilidad de que el resultado de una prueba sea negativo cuando la enfermedad no está presente (tasa de verdaderos negativos).

Razón de verosimilitud positiva: relación entre la probabilidad de un resultado positivo de la prueba dada la presencia de la enfermedad y la probabilidad de un resultado positivo de la prueba dada la ausencia de la enfermedad.

Razón de verosimilitud negativa: relación entre la probabilidad de un resultado negativo de la prueba dada la presencia de la enfermedad y la probabilidad de un resultado negativo de la prueba dada la ausencia de la enfermedad.

Valor predictivo positivo: probabilidad de que la enfermedad esté presente cuando la prueba es positiva.

Valor predictivo negativo: probabilidad de que la enfermedad no esté presente cuando la prueba es negativa.

Precisión: probabilidad global de que un paciente esté correctamente clasificado.

Tal y como se desprende de este análisis, el empleo del panel personalizado junto con una secuenciación ultra profunda y un análisis bioinformático personalizado no informado por el tumor condujo a una sensibilidad del 31 ,08 %, el método de la invención presenta una muy alta especificidad, de un 86,36% y un valor predictivo positivo de un 88,46%, por lo que, en caso de presentarse alguna mutación en alguno de los genes del panel de la tabla 1, existe una probabilidad de casi un 90% de presentar un cáncer de mama.

Con todo esto podemos concluir que la presente invención aporta, gracias al panel de secuenciación seleccionado, una metodología que permite el diagnóstico de cáncer de mama, incluso a partir de biopsias líquidas, con una sensibilidad, capacidad de detección de frecuencias alélicas bajas y una especificidad y valor predictivo positivo, que supera las limitaciones de otros métodos similares conocidos hasta la fecha. También se investigó la asociación de variables clínico-patológicas con la detección de mutaciones en plasma. En concreto, se estudió la positividad de ctDNA en plasma, la frecuencia alélica mediana (FA) de las mutaciones, el número de mutaciones por muestra y las muestras con mutaciones en TP53 para determinar su asociación con las características clínicas (Tablas 11 y 12). En general, una mediana de FA más alta se asoció con un grado tumoral más alto (p= 0,04639), la presencia de más de 1 mutación en plasma con probabilidad de recaída clínica (p= 0,02372) y las mutaciones en TP53 se observaron más frecuentemente en tumores negativos a la expresión de receptores hormonales (HR), en concreto receptor estrógeno (ER) negativos (p= 0,0316) y receptor progesterona (PR) negativos (P=0,0257). Además, la asociación de la recaída clínica y las mutaciones en plasma con una mediana de frecuencia alélica (FA) alta, definida como mutaciones con > 0,05 % en la FA, fue interesantemente cercana a la significación (p = 0,059).

Cabe destacar que el 38,35% de los pacientes incluidos en este estudio eran asintomáticos y fueron diagnosticados por el programa de detección precoz de cáncer de mama. De ellos, el 28,57% presentaba mutaciones plasmáticas, porcentaje similar al 33,33% de mujeres sintomáticas con mutaciones.

Tabla 11 : Relación entre características clínicas y ctDNA positivos y frecuencia alélica mediana (FA) en plasma.

Tabla 12: Relación entre características clínicas y 2 mutaciones en plasma y TP53 Mutado.

En conclusión, observamos una concordancia de mutaciones entre tumor y plasma del 29,50% con una sensibilidad por debajo del 0,075% en la frecuencia de alelos mutantes. En el enfoque no informado por el tumor, detectamos mutaciones en el 33,78% de las muestras de plasma observando 8 pacientes con mutaciones solo en plasma. Determinamos una especificidad del 86,36% y un valor predictivo positivo del 88,46%. Además, demostramos una asociación entre una mediana de FA más alta y un grado tumoral más alto, la presencia de múltiples mutaciones en plasma con probabilidad de recaída clínica y mutaciones en TP53 con positividad del receptor de estrógeno. Se trata por tanto de un panel de secuenciación único con una tecnología que no se había empleado anteriormente en el cáncer de mama temprano, demostrando una sensibilidad ultra alta y allanando el camino para su uso en la detección del cáncer de mama.

Teniendo en cuenta lo anterior, el panel de secuenciación de la invención para plasma mostró capacidades mejoradas para detectar ctDNA en pacientes con cáncer de mama localizados en las primeras etapas de diagnóstico, mejorando la sensibilidad de detección de investigaciones anteriores y agregando evidencia de que ctDNA podría ayudar en el proceso de diagnóstico de la población asintomática. Esto también está respaldado por los porcentajes similares en la identificación de mutaciones plasmáticas entre mujeres sintomáticas y asintomáticas de 33,33% y 28,57% respectivamente. En este sentido, desarrollamos una metodología bioinformática personalizada para identificar mutaciones plasmáticas sin información tumoral, demostrando un alto VPP y sugiriendo que enfoques similares podrían constituir una herramienta de detección para el cáncer de mama. También queda demostrado que mediante la secuenciación temprana del ADN plasmático de los pacientes con cáncer de mama, es factible obtener información importante sobre la enfermedad, así como predecir la evolución clínica en estas pacientes.

Referencias

1. Alfonso, Alba-Bernal et al.; Challenges and achievements of liquid biopsy technologies employed in early breast cáncer. eBioMedicine - Volumen 62, 103100. https://doi.Org/10.1016/i.ebiom.2020.103100. 2. Sun, M.-Y.; et al,. Targeted Next-Generation Sequencing of Circulating Tumor DNA Mutations among Metastatic Breast Cancer Patients. Curr. Oncol. 2021 , 28, 2326-2336. https://doi.org/10.3390/curroncol28040214.

3. Priskin, K.; et al., BC-Monitor: Towards a Routinely Accessible Circulating Tumor DNA-Based Tool for Real-Time Monitoring Breast Cancer Progression and Treatment Effectiveness. Cancers 2021 , 13, 3489. https://doi.org/10.3390/cancers13143489.

4. Keup, C., Benyaa et al. Targeted deep sequencing revealed variants in cell-free DNA of hormone receptor-positive metastatic breast cancer patients. Cell. Mol. Life Sci. 77, 497-509 (2020). https://doi.org/10.1007/s00018-019-03189-z.

5- Jimenez Rodríguez, B.; et al., Detection of TP53 and PIK3CA Mutations in Circulating Tumor DNA Using Next-Generation Sequencing in the Screening Process for Early Breast Cancer Diagnosis. . Clin. Med. 2019, 8, 1183. https://doi.Org/10.3390/jcm8081183 identificadores moleculares únicos 6. Pereira, B.,et al., The somatic mutation profiles of 2,433 breast cancers refine their genomic and transcriptomic landscapes. Nat Commun 7, 11479 (2016). https://doi.org/10.1038/ncomms11479.

7. Cohen JD et al., Detection and localization of surgically resectable cancers with a multianalyte blood test. Science. 2018 Feb 23;359(6378):926-930. doi: 10.1126/science.aar3247.

8. Page K, et al., Prevalence of ctDNA in early screen-detected breast cancers using highly sensitive and specific dual molecular barcoded personalised mutation assays. Ann Oncol. 2021 Aug;32(8):1057-1060. doi: 10.1016/j.annonc.2021.04.018. Epub 2021 Apr 29. PMID: 33932505.

9. Garcia-Murillas, I. et al. Mutation tracking in circulating tumor DNA predicts relapse in early breast cancer. Sel Transí Med 7, 302ra133 (2015).