Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND DEVICE FOR THE IN VITRO ANALYSIS OF MRNA OF GENES INVOLVED IN HAEMATOLOGICAL NEOPLASIAS
Document Type and Number:
WIPO Patent Application WO/2007/048866
Kind Code:
A1
Abstract:
The invention relates to a method and device for the in vitro analysis of mRNA of genes involved in haematological neoplasias. The inventive device, which comprises probes which specifically hybridise with genes involved in haematological neoplasias and which are designed such as to perform in a similar manner in the hybridisation, can be used to evaluate the level of mRNA in biological samples taken from subjects suspected of having a haematological neoplasia and to facilitate the comparison of different samples and the grouping of said samples according to similarity in the gene expression patterns, especially when the probes are disposed in the form of a microarray. The inventive method can be used to obtain and process data from the device relating to differences in gene expression such as to identify significant genes in order to distinguish samples that are associated with haematological neoplasias. In addition, the method facilitates the diagnosis of neoplasias such as LLC and the prognosis of the development of same.

Inventors:
GIRALDO CASTELLANO PILAR (ES)
ALVAREZ CABEZA PATRICIA (ES)
SAENZ JIMENEZ PILAR (ES)
MARTINEZ MARTINEZ ANTONIO (ES)
POCOVI MIERAS MIGUEL (ES)
SIMON BUELA LAUREANO (ES)
Application Number:
PCT/ES2006/070054
Publication Date:
May 03, 2007
Filing Date:
May 08, 2006
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
FUNDACION PARA EL ESTUDIO DE L (ES)
GIRALDO CASTELLANO PILAR (ES)
ALVAREZ CABEZA PATRICIA (ES)
SAENZ JIMENEZ PILAR (ES)
MARTINEZ MARTINEZ ANTONIO (ES)
POCOVI MIERAS MIGUEL (ES)
SIMON BUELA LAUREANO (ES)
International Classes:
C12Q1/68
Domestic Patent References:
WO2003062401A22003-07-31
WO2005024043A22005-03-17
WO2005080601A22005-09-01
WO2003008552A22003-01-30
WO2005024043A22005-03-17
Other References:
See also references of EP 1947194A4
ES JAFFE ET AL.: "Pathology and genetics of tumours of Haematopoietic and lymphoid tissues", 2001, IARC PRESS
ALIZADEH A; EISEN M; DAVIS RE ET AL.: "The lymphochip: a specialized cDNA microarray for the genomic-scale analysis of gene expression in normal and malignant lymphocytes", COLD SPRING HARB SYMP QUANT BIOL., vol. 64, 1999, pages 71 - 8, XP001099007, DOI: doi:10.1101/sqb.1999.64.71
ALIZADEH AA; EISEN MB; DAVIS RE ET AL.: "Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling", NATURE, vol. 403, 2000, pages 503 - 11, XP008127002, DOI: doi:10.1038/35000501
ARICO M ET AL.: "Outcome of treatment in children with Philadelphia chromosome-positive acute lymphoblastic leukemia", N ENGL J MED., vol. 342, 2000, pages 998 - 1006
BEA S; ZETTL A; WRIGHT G: "Diffuse Large B-Cell Lymphoma Subgroups Have Distinct Genetic Profiles that Influence Tumor Biology and Improve Gene Expression-Based Survival Prediction", BLOOD, vol. 04, 2005, pages 1399
BENE MC; BERNIER M; CASASNOVAS RO ET AL.: "Acute myeloid leukaemia M0: Haematological, immunophenotypic and cytogenetic characteristics and their prognostic significance: An analysis in 241 patients", BR J HAEMAT, vol. 113, 2001, pages 737
BENES V; MUCKENTHALER M.: "Standardization of protocols in cDNA microarray analysis", TRENDS BIOCHEM SCI., vol. 28, 2003, pages 244 - 9, XP027107014
BENNETT JM; CATOVSKY D; DANIEL MT ET AL.: "Myelodysplastic syndromes: is another classification necessary?", BR J HAEMATOL., vol. 56, 1984, pages 515 - 7
BENNETT JM; CATOVSKY D; DANIEL MT ET AL.: "Proposals for the classification of the acute leukaemias. French-American-British (FAB) co-operative group", BR J HAEMATOL., vol. 33, 1976, pages 451 - 8
BERGH G ET AL.: "Involvement of the retinoblastoma protein in monocytic and neutrophilic lineage commitment of human bone marrow progenitor cells", BLOOD, vol. 94, 1999, pages 1971 - 8
BERNARD J; LEVY JP; VARET B., HEMATOLOGIE. COLLECTION MEDICO CHIRURGICALE, 1976, pages 5 - 22
BINET JL; AUQUIER A; DIGHIERO G ET AL.: "A new prognostic classification of chronic lymphocytic leukemia derived from a multivariate survival analysis", CANCER, vol. 48, 1981, pages 198 - 206
BOULTWOOD J; LEWIS S; WAINSCOAT JS, THE 5Q-SYNDROME. BLOOD, vol. 84, 1994, pages 3253 - 60
BRAZIEL RM; SHIPP MA; FELDMAN AL, MOLECULAR DIAGNOSTICS. HEMATOLOGY, 2003, pages 279 - 93
BULLINGER, DOHNER ET AL.: "Use of gene-expression profiling to identify prognostic subclasses in adult acute myeloid leukemia", N ENGL MED, vol. 350, 2005, pages 1605 - 16
CHAN WC.: "Gene expression profiling in lymphoma diagnosis and research", CROAT MED J., vol. 46, 2005, pages 349 - 59
CHEN CC; ANDRICH MP; METCALFE DD: "A retrospective analysis of bone scan abnormalities in mastocytosis: Correlation with disease category and prognosis", J NUCL MED, vol. 35, 1994, pages 1471
COSSMAN J: "Gene expression analysis of single neoplastic cells and the pathogenesis of Hodgkin's lymphoma", J HISTOCHEM CYTOCHEM, vol. 49, 2001, pages 799 - 800, XP008010063
CRESPO M; BOSCH F; VILLAMOR N ET AL.: "ZAP-70 expression as a surrogate for immunoglobulin-variable-region mutations in chronic lymphocytic leukemia", N ENGL J MED., vol. 348, 2003, pages 1764 - 75
DATTA SR; BRUNET A; GREENBERG ME.: "Cellular survival: A play in three acts", GENES DEV, vol. 13, 1999, pages 2905 - 2927
DEVILARD E; BERTUCCI F; TREMAT P ET AL.: "Gene expression profiling defines molecular subtypes of classical Hodgkin's lymphoma", ONCOGENE, vol. 21, 2002, pages 3095 - 3102, XP002220275, DOI: doi:10.1038/sj.onc.1205418
DOHNER K ET AL.: "Prognostic significance of partial tandem duplications of the MLL gene in adult patients 16 to 60 years old with acute myeloid leukemia and normal cytogenetics: a study of the Acute Myeloid Leukemia Study Group Ulm", J CLIN ONCOL., vol. 20, 2002, pages 3254 - 61
DOMEN J; WEISSMAN IL.: "Self-renewal, differentiation or death: regulation and manipulation of hematopoietic stem cell fate", MOL MED TODAY, vol. 5, 1999, pages 201 - 8, XP002267319, DOI: doi:10.1016/S1357-4310(99)01464-1
DURIG J ET AL.: "CD38 expression is an important prognostic marker in chronic lymphocytic leukaemia", LEUKEMIA, vol. 16, 2002, pages 30 - 5
FERRANDO AA: "Hoffman R Hematology Basic Principles and practice", CHURCHILL LIVINGSTONE, article "Look AT Pathobiology of acute lymphoblastic leukemia"
GALTON DA., THE PATHOGENESIS OF CHRONIC LYMPHOCYTIC LEUKEMIA CAN MED ASSOC J., vol. 94, 1966, pages 1005 - 10
GILES FJ ET AL.: "Kantagian HM Acute myeloid leukemia", HEMATOLOGY, 2002, pages 73 - 110
GOLUB TR; SLONIM DK; TAMAYO P ET AL.: "Molecular classification of cancer: class discovery and class prediction by gene expression monitoring", SCIENCE, vol. 286, 1999, pages 531 - 7
GONG JZ ET AL.: "Value of CD23 determination by flow cytometry in differentiating mantle cell lymphoma from chronic lymphocytic leukemia/small lymphocytic lymphoma", AM J CLIN PATHOL., vol. 116, 2001, pages 893 - 7
GREINER TC.: "mRNA microarray analysis in lymphoma and leukemia", CANCER TREAT RES., vol. 121, 2004, pages 1 - 12
GUTTMACHER AE; COLLINS FS., WELCOME TO THE GENOMIC ERA N ENGL J MED., vol. 349, 2003, pages 996 - 8
HAMBLIN TJ ET AL.: "Unmutated Ig V(H) genes are associated with a more aggressive form of chronic lymphocytic leukemia", BLOOD, vol. 94, 1999, pages 1848 - 54
HANAHAN D; WEINBERG RA, THE HALLMARKS OF CANCER. CELL, vol. 100, 2000, pages 57 - 70
HARRIS NL; JAFFE ES; DIEBOLD J ET AL.: "The World Health Organization classification of neoplastic diseases of the hematopoietic and lymphoid tissues. Report of the Clinical Advisory Committee meeting", ANN ONCOL., vol. 10, November 1997 (1997-11-01), pages 1419 - 32
HARRIS NL; JAFFE ES; DIEBOLD J ET AL.: "World Health Organization classification of neoplastic diseases of the hematopoietic and lymphoid tissues: report of the Clinical Advisory Committee meeting", J CLIN ONCOL., vol. 17, November 1997 (1997-11-01), pages 3835 - 49, XP055259248
HARRIS NL; JAFFE ES; STEIN H ET AL.: "A revised European-American classification of lymphoid neoplasms: a proposal from the International Lymphoma Study Group", BLOOD, vol. 84, 1994, pages 1361 - 92
HARRIS NL ET AL.: "New approaches to lymphoma diagnosis", HEMATOLOGY, 2001, pages 194 - 220, XP002246868, DOI: doi:10.1182/asheducation-2001.1.194
HEANEY ML, GOLDE DW MYELODYSPLASIA. N ENGL J MED., vol. 340, 1999, pages 1649 - 60
JAFFE ES ET AL.: "Pathology and Genetics of tumours of Haematopoietic and lymphoid tissues", 2001, IARC PRESS, article "WHO Classification Tumours of Heamotopoietic and lymphoid tissues"
JEMAL A; MURRAY T; SAMUELS A ET AL., CANCER STATISTICS, 2003
CA CANCER J CLIN, vol. 53, 2003, pages 5
KOTTARIDIS PD; GALE RE; FREW ME ET AL.: "The presence of a FLT3 internal tandem duplication in patients with ..... United Kingdom Medical Research Council AML 10 and 12 trials", BLOOD, vol. 98, 2001, pages 1752 - 9, XP002744756, DOI: doi:10.1182/blood.V98.6.1752
KUPPERS R ET AL.: "Cellular origin of human B-cell lymphomas", N ENGL J MED., vol. 341, 1999, pages 1520 - 9
KUPPERS R: "Molecular biology of Hodgkin's lymphoma", ADV CANCER RES, vol. 84, 2002, pages 277 - 312
KYLE RA: "Monoclonal gammopathy of undetermined significance and solitary plasmacytoma: Implications for progression to overt multiple myeloma", HEMATOL ONCOL CLIN NORTH AM, vol. 11, 1997, pages 71
LEE MF; DANG CV: "In Hoffman R Hematology Basic Principles and practice", 2005, CHURCHILL LIVINGSTONE, article "Control of cell division", pages: 69 - 81
LEUNG AYH; VERFAILLIE CM: "In Hoffman R Hematology Basic Principles and practice", 2005, CHURCHILL LIVINGSTONE, article "Stem cell model of hematopoyesis", pages: 200 - 214
MAGLI MC; LARGMAN C; LAWRENCE HJ: "Effects of HOX homeobox genes in blood cell differentiation", J CELL PHYSIOL., vol. 173, 1997, pages 168 - 77
MITELMAN F; MERTENS F; JOHANSSON B A: "breakpoint map of recurrent chromosomal rearrangements in human neoplasia", NAT GENET., vol. 15, 1997, pages 417 - 74
MONTOTO S; LOPEZ-GUILLERMO A; COLOMER D ET AL.: "Incidence and clinical significance of bcl-2/IgH rearrangements in follicular lymphoma", LEUK LYMPHOMA, vol. 44, 2003, pages 71 - 6
NICHOGIANNOPOULOU A ET AL.: "Ikaros in hemopoietic lineage determination and homeostasis", SEMIN IMMUNOL., vol. 10, 1998, pages 119 - 25
NUTT SL ET AL.: "Commitment to the B-lymphoid lineage depends on the transcription factor Pax5", NATURE, vol. 401, 1999, pages 556 - 62, XP009157706, DOI: doi:10.1038/44076
O'GORMAN DM; COTTER TG: "Molecular signals in anti-apoptotic survival pathways", LEUKEMIA, vol. 15, 2001, pages 21 - 34
PANE F ET AL.: "BCR/ABL genes and leukemic phenotype: from molecular mechanisms to clinical correlations", ONCOGENE, vol. 21, 2002, pages 8652 - 67
"R Development Core Team. R: A language and environment for statistical computing", R FOUNDATION FOR STATISTICAL COMPUTING, 2004
RAI KR ET AL.: "Clinical staging of chronic lymphocytic leukemia", BLOOD, vol. 46, 1975, pages 219 - 34
ROUMIER C; ECLACHE V; IMBERT M ET AL.: "MO AML, clinical and biologic features of the disease, including AML1 gene mutations: A report of 59 cases by the Groupe Francais d'Hematologie Cellulaire (GFHC) and the Groupe Francais de Bytogenetique Hematologique (GFCH", BLOOD, vol. 101, 2003, pages 1277
SHAFFER AL; ROSENWALD A; STAUDT LM: "Lymphoid malignancies: the dark side of B-cell differentiation", NAT REV IMMUNOL., vol. 2, 2002, pages 920 - 32
TENEN DG ET AL.: "Transcription factors, normal myeloid development, and leucemia", BLOOD, vol. 90, 1997, pages 489 - 519, XP000872043
TIBSHIRANI R ET AL.: "Diagnosis of multiple cancer types by shrunken centroids of gene expression", PROC. NATL. ACAD. SCI., vol. 99, 2002, pages 6567 - 72, XP002988576, DOI: doi:10.1073/pnas.082099299
VARDIMAN JW; HARRIS NL; BRUNNING RD: "The World Health Organization (WHO) classification of the myeloid neoplasms", BLOOD, vol. 100, 2002, pages 2292 - 302
VENABLES, SMITH ET AL., AN INTRODUCTION TO R, NOTES ON R: A PROGRAMMING ENVIRONMENT FOR DATA ANALYSIS, 2004
WEISSMAN IL: "Stem cells: Units of regeneration and units in evolution", CELL, vol. 100, 2000, pages 157 - 168, XP000882482, DOI: doi:10.1016/S0092-8674(00)81692-X
WESTBROOK CA: "In Hoffman R Hematology Basic Principles and practice", 2005, CHURCHILL LIVINGSTONE, article "The molecular basis of neoplasia", pages: 941 - 945
ZHAN F; HARDIN J; KORDSMEIER B ET AL.: "Global gene expression profiling of multiple myeloma, monoclonal gammopathy of undetermined significance, and normal bone marrow plasma cells", BLOOD, vol. 99, 2002, pages 1745, XP003024165, DOI: doi:10.1182/blood.V99.5.1745
Attorney, Agent or Firm:
ELZABURU, Alberto de (S.A. Miguel Ange, 21 Madrid, ES)
Download PDF:
Claims:

REIVINDICACIONES

1. Una composición que comprende al menos un oligonucleótido del grupo compuesto por:

SGl, SG2, SG3, SG4, SG5, SG6, SG7, SG8, SG9, SGlO, SGI l, SG12, SG13, SG14, SG15, SG16, SG17, SG18, SG19, SG20, SG21, SG22, SG23, SG24, SG25, SG26, SG27, SG28, SG29, SG30, SG31, SG32, SG33, SG34, SG35, SG36, SG37, SG38, SG39, SG40, SG41, SG42, SG43, SG44, SG45, SG46, SG47, SG48, SG49, SG50, SG51, SG52, SG53, SG54, SG55, SG56, SG57, SG58, SG59, SG60, SG61, SG62, SG63, SG64, SG65, SG66, SG67, SG68, SG69, SG70, SG71, SG72, SG73, SG74, SG75, SG76, SG77, SG78, SG79, SG80, SG81, SG82, SG83, SG84, SG85, SG86, SG87, SG88, SG89, SG90, SG91, SG92, SG93, SG94, SG95, SG96, SG97, SG98, SG99, SG100, SG101, SG102, SG103, SG104, SG105, SG106, SG107, SG108, SG109, SG110, SGl I l, SGl 12, SGl 13, SGl 14, SGl 15, SGl 16, SGl 17, SGl 18, SGl 19, SG120, SG121, SG122, SG123, SG124, SG125, SG126, SG127, SG128, SG129, SG130, SG131, SG132, SG133, SG134, SG135, SG136, SG137, SG138, SG139, SG140, SG141, SG142, SG143, SG144, SG145, SG146, SG147, SG148, SG149, SG150, SG151, SG152, SG153, SG154, SG155, SG156, SG157, SG158, SGl 59, SGl 60, SGl 61, SGl 62, SGl 63, SGl 64, SGl 65, SGl 66, SGl 67, SGl 68, SG169, SG170, SG171, SG172, SG173, SG174, SG175, SG176, SG177, SG178, SG179, SG180, SG181, SG182, SG183, SG184, SG185, SG186, SG187, SG188, SG189, SG190, SG191, SG192, SG193, SG194, SG195, SG196, SG197, SG198, SG199, SG200, SG201, SG202, SG203, SG204, SG205, SG206, SG207, SG208, SG209, SG210, SG211, SG212, SG213, SG214, SG215, SG216, SG217, SG218, SG219, SG220, SG221, SG222, SG223, SG224, SG225, SG226, SG227, SG228, SG229, SG230, SG231, SG232, SG233, SG234, SG235, SG236, SG237, SG238, SG239, SG240, SG241, SG242, SG243, SG244, SG245, SG246, SG247, SG248, SG249, SG250, SG251, SG252, SG253, SG254, SG255, SG256, SG257, SG258, SG259, SG260, SG261, SG262, SG263, SG264, SG265, SG266, SG267, SG268, SG269, SG270, SG271, SG272, SG273, SG274, SG275, SG276, SG277, SG278, SG279, SG280, SG281, SG282, SG283, SG284, SG285, SG286, SG287, SG288, SG289, SG290, SG291, SG292, SG293, SG294, SG295, SG296, SG297, SG298, SG299, SG300, SG301, SG302, SG3O3, SG304, SG305, SG306, SG307, SG308,

SG309, SG310, SG311, SG312, SG313, SG314, SG315, SG316, SG317, SG318,

SG319, SG320, SG321, SG322, SG323, SG324, SG325, SG326, SG327, SG328,

SG329, SG33O, SG331, SG332, SG333, SG334, SG335, SG336, SG337, SG338,

SG339, SG340, SG341, SG342, SG343, SG344, SG345, SG346, SG347, SG348,

SG349, SG350, SG351, SG352, SG353, SG354, SG355, SG356, SG357, SG358,

SG359, SG360, SG361, SG362, SG363, SG364, SG365, SG366, SG367, SG368,

SG369, SG370, SG371, SG372, SG373, SG374, SG375, SG376, SG377, SG378,

SG379, SG380, SG381, SG382, SG383, SG384, SG385, SG386, SG387, SG388,

SG389, SG390, SG391, SG392, SG393, SG394, SG395, SG396, SG397, SG398,

SG399, SG400, SG401, SG402, SG403, SG404, SG405, SG406, SG407, SG408,

SG409, SG410, SG411, SG412, SG413, SG414, SG415, SG416, SG417, SG418,

SG419, SG420, SG421, SG422, SG423, SG424, SG425, SG426, SG427, SG428,

SG429, SG430, SG431, SG432, SG433, SG434, SG435, SG436, SG437, SG438,

SG439, SG440, SG441, SG442, SG443, SG444, SG445, SG446, SG447, SG448,

SG449, SG450, SG451, SG452, SG453, SG454, SG455, SG456, SG457, SG458,

SG459, SG460, SG461, SG462, SG465, SG468, SG469, SG470, SG471, SG472,

SG473, SG474, SG475, SG476, SG477, SG478, SG479, SG480, SG481, SG482,

SG483, SG484, SG485, SG486, SG487, SG488, SG489, SG490, SG491, SG492,

SG493, SG494, SG495, SG496, SG497, SG498, SG499, SG500, SG501, SG502,

SG503, SG504, SG505, SG506, SG507, SG508, SG509, SG510, SG511, SG512,

SG513, SG514, SG515, SG516, SG517, SG518, SG519, SG520, SG521, SG522,

SG523, SG524, SG525, SG526, SG527, SG428, SG529, SG530, SG531, SG532,

SG533, SG534, SG535, SG536, SG537, SG538, SG539, SG540, SG541, SG542,

SG543, SG544, SG545, SG546, SG547, SG548, SG549, SG550, SG551, SG552,

SG553, SG554, SG555, SG556, SG557, SG558, SG559, SG560, SG561, SG562, SG563, o combinaciones de los mismos, para ser utilizado como sonda en la determinación del nivel de expresión de un gen que posee una secuencia complementaria a dicho oligonucleótido mediante la valoración del nivel de mRNA correspondiente a ese gen, de aplicación en el diagnóstico in vitro de neoplasias originadas a partir de células hematopoyéticas y/o en el pronóstico in vitro de la evolución de dicha enfermedad.

2. Una composición según la reivindicación 1, que comprende al menos los oligonucleótidos SGl 17, SG428, SG459, SG507, SG508.

3. Una composición según la reivindicación 2, que comprende adicionalmente al menos los oligonucleótidos SG461 y SG493.

4. Una composición según la reivindicación 2, que comprende adicionalmente al menos el oligonucleótido SG237.

5. Una composición según la reivindicación 4, que comprende adicionalmente al menos un oligonucleótido seleccionado del grupo de SG2, SG4, SG8, SGlO, SG13, SG15, SG16, SG19, SG20, SG23, SG26, SG28, SG31, SG34, SG36, SG39, SG48, SG58, SG60, SG65, SG76, SG77, SG84, SG89, SG94, SG9, SG97, SG99, SG102, SG106, SG107, SG463, SGl 15, SGl 16, SG120, SG129, SG134, SG135, SG138, SG139, SG141, SG145, SG158, SG161, SG163, SG176, SG178, SG185, SG207, SG208, SG210, SG217, SG227, SG231, SG237, SG264, SG272, SG277, SG281, SG283, SG286, SG294, SG298, SG299, SG307, SG308, SG319, SG328, SG33O, SG333, SG336, SG342, SG344, SG345, SG347, SG361, SG384, SG389, SG395, SG404, SG407, SG416, SG423, SG430, SG432, SG434, SG444, SG446, SG453, SG458, SG464, SG465, SG466, SG467, SG471, SG473, SG474, SG475, SG481, SG485, SG487, SG491, SG498, SG511, SG517, SG518, SG522, SG526, SG530, SG533, SG538, SG541, SG554, SG558, SG561 o combinaciones de los mismos.

6. Una composición según cualquiera de las reivindicaciones 2 a 5, para ser utilizada en el diagnóstico in vitro de leucemia linfática crónica.

7. Una composición según la reivindicación 1, que comprende al menos los oligonucleótidos SG26, SG216, SG366.

8. Una composición según la reivindicación 7, que comprende adicionalmente al menos un oligonucleótido seleccionado del grupo de SG31, SG 177, SGl 94 ;

SG195, SG197 ? SG213, SG293, SG301, SG309, SG333, SG343, SG357, SG439 ? SG452, SG555, SG556.

9. Una composición según cualquiera de las reivindicaciones 7 u 8, para ser utilizada en el pronóstico in vitro de la futura evolución de la enfermedad en un paciente que padece leucemia linfática crónica.

los nucleótidos del grupo compuesto por:

SGl, SG2, SG3, SG4, SG5, SG6, SG7, SG8, SG9, SGlO, SGI l, SG12, SG13, SG14, SG15, SG16, SG17, SG18, SG19, SG20, SG21, SG22, SG23, SG24, SG25, SG26, SG27, SG28, SG29, SG30, SG31, SG32, SG33, SG34, SG35, SG36, SG37, SG38, SG39, SG40, SG41, SG42, SG43, SG44, SG45, SG46, SG47, SG48, SG49, SG50, SG51, SG52, SG53, SG54, SG55, SG56, SG57, SG58, SG59, SG60, SG61, SG62, SG63, SG64, SG65, SG66, SG67, SG68, SG69, SG70, SG71, SG72, SG73, SG74, SG75, SG76, SG77, SG78, SG79, SG80, SG81, SG82, SG83, SG84, SG85, SG86, SG87, SG88, SG89, SG90, SG91, SG92, SG93, SG94, SG95, SG96, SG97, SG98, SG99, SG100, SG101, SG102, SG103, SG104, SG105, SG106, SG107, SG108, SG109, SG110, SGl I l, SGl 12, SGl 13, SGl 14, SGl 15, SGl 16, SGl 17, SGl 18, SGl 19, SG120, SG121, SG122, SG123, SG124, SG125, SG126, SG127, SG128, SG129, SG130, SG131, SG132, SG133, SG134, SG135, SG136, SG137, SG138, SG139, SG140, SG141, SG142, SG143, SG144, SG145, SG146, SG147, SG148, SG149, SG150, SG151, SG152, SG153, SG154, SG155, SG156, SG157, SG158, SGl 59, SGl 60, SGl 61, SGl 62, SGl 63, SGl 64, SGl 65, SGl 66, SGl 67, SGl 68, SG169, SG170, SG171, SG172, SG173, SG174, SG175, SG176, SG177, SG178, SG179, SG180, SG181, SG182, SG183, SG184, SG185, SG186, SG187, SG188, SG189, SG190, SG191, SG192, SG193, SG194, SG195, SG196, SG197, SG198, SG199, SG200, SG201, SG202, SG203, SG204, SG205, SG206, SG207, SG208, SG209, SG210, SG211, SG212, SG213, SG214, SG215, SG216, SG217, SG218, SG219, SG220, SG221, SG222, SG223, SG224, SG225, SG226, SG227, SG228, SG229, SG230, SG231, SG232, SG233, SG234, SG235, SG236, SG237, SG238, SG239, SG240, SG241, SG242, SG243, SG244, SG245, SG246, SG247, SG248,

SG249, SG250, SG251, SG252, SG253, SG254, SG255, SG256, SG257, SG258,

SG259, SG260, SG261, SG262, SG263, SG264, SG265, SG266, SG267, SG268,

SG269, SG270, SG271, SG272, SG273, SG274, SG275, SG276, SG277, SG278,

SG279, SG280, SG281, SG282, SG283, SG284, SG285, SG286, SG287, SG288,

SG289, SG290, SG291, SG292, SG293, SG294, SG295, SG296, SG297, SG298,

SG299, SG300, SG301, SG302, SG3O3, SG304, SG305, SG306, SG307, SG308,

SG309, SG310, SG311, SG312, SG313, SG314, SG315, SG316, SG317, SG318,

SG319, SG320, SG321, SG322, SG323, SG324, SG325, SG326, SG327, SG328,

SG329, SG33O, SG331, SG332, SG333, SG334, SG335, SG336, SG337, SG338,

SG339, SG340, SG341, SG342, SG343, SG344, SG345, SG346, SG347, SG348,

SG349, SG350, SG351, SG352, SG353, SG354, SG355, SG356, SG357, SG358,

SG359, SG360, SG361, SG362, SG363, SG364, SG365, SG366, SG367, SG368,

SG369, SG370, SG371, SG372, SG373, SG374, SG375, SG376, SG377, SG378,

SG379, SG380, SG381, SG382, SG383, SG384, SG385, SG386, SG387, SG388,

SG389, SG390, SG391, SG392, SG393, SG394, SG395, SG396, SG397, SG398,

SG399, SG400, SG401, SG402, SG403, SG404, SG405, SG406, SG407, SG408,

SG409, SG410, SG411, SG412, SG413, SG414, SG415, SG416, SG417, SG418,

SG419, SG420, SG421, SG422, SG423, SG424, SG425, SG426, SG427, SG428,

SG429, SG430, SG431, SG432, SG433, SG434, SG435, SG436, SG437, SG438,

SG439, SG440, SG441, SG442, SG443, SG444, SG445, SG446, SG447, SG448,

SG449, SG450, SG451, SG452, SG453, SG454, SG455, SG456, SG457, SG458,

SG459, SG460, SG461, SG462, SG465, SG468, SG469, SG470, SG471, SG472,

SG473, SG474, SG475, SG476, SG477, SG478, SG479, SG480, SG481, SG482,

SG483, SG484, SG485, SG486, SG487, SG488, SG489, SG490, SG491, SG492,

SG493, SG494, SG495, SG496, SG497, SG498, SG499, SG500, SG501, SG502,

SG503, SG504, SG505, SG506, SG507, SG508, SG509, SG510, SG511, SG512,

SG513, SG514, SG515, SG516, SG517, SG518, SG519, SG520, SG521, SG522,

SG523, SG524, SG525, SG526, SG527, SG428, SG529, SG530, SG531, SG532,

SG533, SG534, SG535, SG536, SG537, SG538, SG539, SG540, SG541, SG542,

SG543, SG544, SG545, SG546, SG547, SG548, SG549, SG550, SG551, SG552,

SG553, SG554, SG555, SG556, SG557, SG558, SG559, SG560, SG561, SG562, SG563.

1 1. Una composición según cualquiera de las reivindicaciones i a 1O 5 caracterizada porque adicionalmente comprende al menos un oligonucleótido seleccionado del grupo compuesto por SG463, SG464, SG466, SG467, SSPCl, SSPC2, SSPC3, SSPC4, SSPC5, SSPC6, SSPC7, SCNl, SCN2, SCN3, SCN5, SCN6, SCN7, SCN8, SCN10, SCNI l, SCN12, SCN13, SCl, SC2, SC3, SC4, SC5, SC6 y SC7.

12. Una composición según la reivindicación 11, que comprende todos los oligonucleótidos del grupo compuesto por SG463, SG464, SG466, SG467, SSPCl, SSPC2, SSPC3, SSPC4, SSPC5, SSPC6, SSPC7, SCNl, SCN2, SCN3, SCN5, SCN6, SCN7, SCN8, SCN10, SCNI l, SCN12, SCN13, SCl, SC2, SC3, SC4, SC5, SC6 y SC7.

13. Una composición según cualquiera de las reivindicaciones 1 a 10, en la que los oligonucleótidos se encuentran dispuestos sobre un soporte sólido.

14. Una composición según la reivindicación 13, en la que los oligonucleótidos se encuentran dispuestos de forma ordenada sobre un soporte sólido que es un vidrio similar a un portaobjetos al que los oligonucleótidos se encuentran unidos mediante enlaces covalentes, formando un microarray.

15. Una composición en forma de microarray según la reivindicación 14, que comprende la totalidad de los oligonucleótidos del grupo compuesto por

SGl, SG2, SG3, SG4, SG5, SG6, SG7, SG8, SG9, SGlO, SGI l, SG12, SG13, SG14, SG15, SG16, SG17, SG18, SG19, SG20, SG21, SG22, SG23, SG24, SG25, SG26, SG27, SG28, SG29, SG30, SG31, SG32, SG33, SG34, SG35, SG36, SG37, SG38, SG39, SG40, SG41, SG42, SG43, SG44, SG45, SG46, SG47, SG48, SG49, SG50, SG51, SG52, SG53, SG54, SG55, SG56, SG57, SG58, SG59, SG60, SG61, SG62, SG63, SG64, SG65, SG66, SG67, SG68, SG69, SG70, SG71, SG72, SG73, SG74, SG75, SG76, SG77, SG78, SG79, SG80, SG81, SG82, SG83, SG84, SG85, SG86, SG87, SG88, SG89, SG90, SG91, SG92, SG93, SG94, SG95, SG96, SG97, SG98,

SG99, SG100, SGlOl, SG102, SG103, SG104, SG105, SG106, SG107, SG108,

SG109, SG110, SGl I l, SGl 12, SGl 13, SGl 14, SGl 15, SGl 16, SGl 17, SGl 18,

SGl 19, SG120, SG121, SG122, SG123, SG124, SG125, SG126, SG127, SG128,

SG129, SG130, SG131, SG132, SG133, SG134, SG135, SG136, SG137, SG138,

SG139, SG140, SG141, SG142, SG143, SG144, SG145, SG146, SG147, SG148,

SG149, SG150, SG151, SG152, SG153, SG154, SG155, SG156, SG157, SG158,

SGl 59, SGl 60, SGl 61, SGl 62, SGl 63, SGl 64, SGl 65, SGl 66, SGl 67, SGl 68,

SG169, SG170, SG171, SG172, SG173, SG174, SG175, SG176, SG177, SG178,

SG179, SG180, SG181, SG182, SG183, SG184, SG185, SG186, SG187, SG188,

SG189, SG190, SG191, SG192, SG193, SG194, SG195, SG196, SG197, SG198,

SG199, SG200, SG201, SG202, SG203, SG204, SG205, SG206, SG207, SG208,

SG209, SG210, SG211, SG212, SG213, SG214, SG215, SG216, SG217, SG218,

SG219, SG220, SG221, SG222, SG223, SG224, SG225, SG226, SG227, SG228,

SG229, SG230, SG231, SG232, SG233, SG234, SG235, SG236, SG237, SG238,

SG239, SG240, SG241, SG242, SG243, SG244, SG245, SG246, SG247, SG248,

SG249, SG250, SG251, SG252, SG253, SG254, SG255, SG256, SG257, SG258,

SG259, SG260, SG261, SG262, SG263, SG264, SG265, SG266, SG267, SG268,

SG269, SG270, SG271, SG272, SG273, SG274, SG275, SG276, SG277, SG278,

SG279, SG280, SG281, SG282, SG283, SG284, SG285, SG286, SG287, SG288,

SG289, SG290, SG291, SG292, SG293, SG294, SG295, SG296, SG297, SG298,

SG299, SG300, SG301, SG302, SG3O3, SG304, SG305, SG306, SG307, SG308,

SG309, SG310, SG311, SG312, SG313, SG314, SG315, SG316, SG317, SG318,

SG319, SG320, SG321, SG322, SG323, SG324, SG325, SG326, SG327, SG328,

SG329, SG33O, SG331, SG332, SG333, SG334, SG335, SG336, SG337, SG338,

SG339, SG340, SG341, SG342, SG343, SG344, SG345, SG346, SG347, SG348,

SG349, SG350, SG351, SG352, SG353, SG354, SG355, SG356, SG357, SG358,

SG359, SG360, SG361, SG362, SG363, SG364, SG365, SG366, SG367, SG368,

SG369, SG370, SG371, SG372, SG373, SG374, SG375, SG376, SG377, SG378,

SG379, SG380, SG381, SG382, SG383, SG384, SG385, SG386, SG387, SG388,

SG389, SG390, SG391, SG392, SG393, SG394, SG395, SG396, SG397, SG398,

SG399, SG400, SG401, SG402, SG403, SG404, SG405, SG406, SG407, SG408,

SG409, SG410, SG411, SG412, SG413, SG414, SG415, SG416, SG417, SG418,

SG419, SG420, SG421, SG422, SG423, SG424, SG425, SG426, SG427, SG428,

SG429, SG430, SG431, SG432, SG433, SG434, SG435, SG436, SG437, SG438,

SG439, SG440, SG441, SG442, SG443, SG444, SG445, SG446, SG447, SG448,

SG449, SG450, SG451, SG452, SG453, SG454, SG455, SG456, SG457, SG458,

SG459, SG460, SG461, SG462, SG465, SG468, SG469, SG470, SG471, SG472,

SG473, SG474, SG475, SG476, SG477, SG478, SG479, SG480, SG481, SG482,

SG483, SG484, SG485, SG486, SG487, SG488, SG489, SG490, SG491, SG492,

SG493, SG494, SG495, SG496, SG497, SG498, SG499, SG500, SG501, SG502,

SG503, SG504, SG505, SG506, SG507, SG508, SG509, SG510, SG511, SG512,

SG513, SG514, SG515, SG516, SG517, SG518, SG519, SG520, SG521, SG522,

SG523, SG524, SG525, SG526, SG527, SG428, SG529, SG530, SG531, SG532,

SG533, SG534, SG535, SG536, SG537, SG538, SG539, SG540, SG541, SG542,

SG543, SG544, SG545, SG546, SG547, SG548, SG549, SG550, SG551, SG552,

SG553, SG554, SG555, SG556, SG557, SG558, SG559, SG560, SG561, SG562, SG563.

16. Una composición en forma de microarray según la reivindicación 15, que comprende adicionalmente al menos una pareja de oligonucleótidos seleccionada entre la compuesta por los oligonucleótidos SG463 y SG464 y la compuesta por los oligonucleótidos SG466 y SG467, al menos un oligonucleótido del grupo compuesto por SSPCl, SSPC2, SSPC3, SSPC4, SSPC5, SSPC6 y SSPC7, al menos un oligonucleótido del grupo compuesto por SCN2, SCN3, SCN6, SCN8, SCNI l, SCN12 y SCN13 y al menos un oligonucleótido del grupo compuesto por SCl, SC2, SC3, SC4, SC5, SC6, SC7, SCNl, SCN5, SCN7 y SCNlO.

17. Una composición en forma de microarray según la reivindicación 16, que comprende la totalidad de los oligonucleótidos del grupo compuesto por SG463, SG464, SG466, SG467, SSPCl, SSPC2, SSPC3, SSPC4, SSPC5, SSPC6, SSPC7, SCN2, SCN3, SCN6, SCN8, SCNI l, SCN12, SCN13, SCl, SC2, SC3, SC4, SC5, SC6, SC7, SCNl, SCN5, SCN7 y SCN10.

18. Una composición en forma de microarray según la reivindicación 17, que comprende adicionalmente puntos carentes de oligonucleótidos en los que está unido al vidrio el disolvente en el que se encontraban los oligonucleótidos al ser depositados sobre dicho vidrio.

19. Una composición en forma de microarray según la reivindicación 18, que comprende al menos doce copias de cada uno de los diferentes oligonucleótidos presentes en ella, así como al menos doce puntos carentes de oligonucleótidos en los que está unido al vidrio el disolvente en el que se encontraban los oligonucleótidos al ser depositados sobre dicho vidrio.

20. Una composición en forma de microarray según una cualquiera de las reivindicaciones 18 a 19, en la que en los puntos carentes de oligonucleótidos se encuentra unido al vidrio el disolvente DMSO.

21. Una composición en forma de microarray según cualquiera de las reivindicaciones 15 a 20 para ser utilizada en el diagnóstico in vitro de leucemia linfática crónica y/o para el pronóstico in vitro de la evolución de dicha enfermedad.

22. Un dispositivo para el diagnóstico in vitro de una neoplasia originada a partir de células hematopoyéticas y/o para el pronóstico in vitro de la evolución de la misma, que comprende una composición según una cualquiera de las reivindicaciones l a 20.

23. Un dispositivo para el diagnóstico in vitro de una neoplasia originada a partir de células hematopoyéticas y/o para el pronóstico in vitro de la evolución de la misma según la reivindicación 22, que comprende una composición en forma de microarray de cualquiera de las reivindicaciones 14 a 20.

24. Un dispositivo para el diagnóstico in vitro de una neoplasia originada a partir de células hematopoyéticas y/o para el pronóstico in vitro de la evolución de la

misma según la reivindicación 22, que comprende una composición en forma de microarray de cualquiera de las reivindicaciones 19 ó 20.

25. Un dispositivo para el diagnóstico in vitro de una neoplasia originada a partir de células hematopoyéticas y/o para el pronóstico in vitro de la evolución de la misma según cualquiera de las reivindicaciones 23 ó 24, en el que la neoplasia que se diagnostica o cuya evolución se pronostica es la leucemia linfática crónica.

26. Un método para diagnosticar in vitro una neoplasia originada a partir de células hematopoyéticas y/o pronosticar in vitro la evolución de la misma que comprende la detección in vitro a partir de una muestra biológica y el análisis estadístico del nivel de expresión de al menos un gen significativo para clasificar la muestra como asociada o no a dicha neoplasia, gen que se selecciona del grupo compuesto por GABARAP, NPM3, ABCBl, ABCB4, ABCC3, ABCC5, ABCC6, ABHDl, ABLl, ACTNl, AFIq, AKRlAl, ALDHlAl, ALK, ANK2, ANPEP, ANXA6, ANXA7, APAFl, APEX, ARHGEF2, ARS2, ASNS, ATIC, ATM, ATP5O, BAX, BCL10, BCL2, BCL2A1, BCL2L1, BCL2LAA, BCL3, BCL6, BCL7A, BCL7b, BCR, BECNl, BIK, BIRC3, BIRC5, BLMH, BLRl, BLVRB, BMIl, BMP6, BRMSl, BST2, BTGl, BUBl, C21orf33, C5orfl3, CA12, CALDl, CANP2, CASC3, CASPl, CASP3, CASP4, CASP5, CASP6, CASP7, CASP8, CASP9, CAST, CATSD, CBFA2T1, CBFB, CCNAl, CCNBl, CCNDl, CCND2, CCND3, CCNEl, CCR6, CCR7, CCT6A, CD14, CD19, CD2, CD22, CD24, CD28, CD33, CD34, CD36, CD38, CD3E, CD4, CD44, CD47, CD48, CD5, CD58, CD59, CD6, CD7, CD79A, CD79B, CD8, CD81, CD83, CD86, CD9, CDA, CDC25A, CDC25B, CDK2, CDK4, CDK5R1, CDKNlA, CDKNlB, CDKNlC, CDKN2A, CDKN2B, CDKN2C, CDKN3, CDW52, CEBPA, CEBPB, CEBPD, CFLl, CKMTl, CKS2, CML66, COL3A1, COL4A6, CR2, CREBl, CREBBP, CRYAB, CSF2, CSF3, CSRP2, CTGF, CTSB, CUZDl, CXADR, CXCL9, CXCR3, CXCR4, CYCl, CYPlAl, CYP2A6, DAD-I, DAPKl, DCK, DDX6, DEK, DHFR, DLAD, DNAJAl, DNMT3B, DNTT, DOKl, DPF2, DPP4, DRGl, DRP2, E2F1, EB-I, EBI2, EDFl, EEFlAl, EEF1B2, EEFlD, EEFlG, EFNBl, EGFR, EGRl, EIF2B2, EIF3S2, EIF4B, EIF4E, EIF5A, ELFl, ELF4, ENPPl, EphA3, EPOR, ERBB2, ERBB4,

ERCCl, ERCC2, ERCC3, ERCC5, ERCC6, ETSl, ETS2, ETV6, ETV7, EZH2, FABP5, FADD, FAIM3, FAM38A, FARPl, FAT, FCER2, FCGR3A, FCGR3B, FGFRl, FGFR3, FGR, FHIT, FKBP9, FLIl, FLJ22169, FLT3, FNl, FNTB, FOS, FUS, G1P2, GABPB2, GATAl, GATA2, GATA3, GCET2, GDI2, GGA3, GJAl, GLUDl, GNL3, GOTl, GRB2, GRIA3, GRK4, GSTPl, GSTTl, GUSB, GZMA, H2AFX, H3F3A, HCK, HELLS, HIFlA, HIST1H2BN, HLA-A, HLA-DPAl, HLA- DQAl, HLA-DRA, HLA-DRB3, HLF, HMMR, HNRPH3, HNRPL, HOXAlO, HOXA9, HOXD8, HOXD9, HRAS, HSD17B1, HSPBl, IBSP, ICAMl, ICAM3, ID2, IER3, IFRDl, IGFBP2, IGFBP3, IGFIR, IGLV6-57, ILlO, IL15, ILlB, IL2, IL2RA, IL3, IL32, IL3RA, IL4R, IL6, IL6R, IL8, ILF2, IRFl, IRF2, IRF4, IRF8, ITGA2, ITGA3, ITGA4, ITGA5, ITGA6, ITGAL, ITGAM, ITGAX, ITGBl, ITGB2, JAKl, JAK2, JUNB, KAIl, KIAA0247, KIAA0864, KIT, KLFl, KLFl 3, KRAS2, KRTl 8, LADH, LAG3, LASPl, LCK, LCPl, LEPR, LGALS3, LGALS7, LIF, LIMSl, LMO2, LOC285148, LRP, LSPl, LYLl, LYN, LYZ, MAFB, MAFK, MAGEAl, MAL, MAP3K12, MAP4K1, MAPKlO, MAZ, MBPl, MCLl, MCM3, MCM7, MDM2, MEISl, MENl, MERTK, MKI67, MLFl, MLF2, MLL, MLLTlO, MME, MMP2, MMP7, MMP8, MMP9, MNDA, MPL, MPO, MRPL37, MS4A1, MTCPl, MUC-I, MXl, MYB, MYBLl, MYC, MYODl, NCALD, NCAMl, NCL, NDP52, NDRGl, NDUFAl, NDUFB, NFl, NFATCl, NFIC, NFKBl, NFKBlA, NINJl, NPMl, NR3C1, NUMAl, NXFl, ODCl, OGGI, OLIG2, OPRDl, pl4ARF, P55CDC, PABPCl, PAX5, PAX6, PAX8, PBXl, PBX3, PCAl, PCD, PCNA, PDCDl, PDGFA, PDGFRB, PDHAl, PGF, PGRMCl, PICALM, PLA2G6, PLAU, PLKl, PLP, PLS3, PLZF, PML, PMMl, POLR2C, POU2F2, PPPlCC, PRAME, PRKCI, PRKCQ, PRKDC, PRL, PRTN3, PSMA5, PSMB4, PSMC5, PSMD7, PTEN, PTGSl, PTHLH, PTK2, PTK2B, PTN, PTPRCCD, PYGB, RAD51, RAFl, RAGl, RARA, RARB, RBl, RBBP4, RBBP6, RBBP8, RBP4, RET, RGSl, RGSl, RISl, RORA, RPL17, RPL23A, RPL24, RPL36A, RPL37A, RPL41, RPS3, RPS5, RPS9, RUNXl, RXRA, S100A2, S100A8, SDCl, SDHD, SELE, SELL, SEPWl, SERPINA9, SERPINB5, SERPNINA9, SFTPB, SIAT4A, SLC7A5, SNRPB, SOSTDCl, SPl, SPIl, SPN, SPRRlA, SREBFl, SSBPl, STATl, STAT3, STAT5B, SUMOl, TACSTD2, TAGLN2, TALl, TBP, TCEBl, TCFl, TCF3, TCF7, TCLlA, TCRbeta, TEGT, TERFl, TERT, TFCP2, TFRC, THBSl, THPO, TIA-2, TIAMl,

TKl, TLXl, TMEM4, TNF, TNFRSFlOC, TNFRSFlA, TNFRSF25, TNFRSF5, TNFRSF6, TNFRSF8, TNFSFlO, TNFSF5, TNFSF6, TOP2A, TOPORS, TP73, TRA@, TRADD, TRAF3, TRAP1,TRIB2, TXNRDl, UBE2C, UHRFl, UVRAG, VCAMl, VEGF, VPREBl, WBSCR20C, WNT16, WTl, XBPl, XPO6, XRCC3, XRCC5, ZAP70, ZFPLl, ZNF42, ZNFNlAl, ZYX, 18S rRNA, 28S rRNA y cuyo nivel de expresión se determina mediante la evaluación de la concentración de su correspondiente mRNA mediante el uso de al menos una sonda que posee una secuencia complementaria a un fragmento de una hebra de dicho gen, sonda que se selecciona del grupo de oligonucleótidos compuesto por:

SGl, SG2, SG3, SG4, SG5, SG6, SG7, SG8, SG9, SGlO, SGI l, SG12, SG13, SG14, SG15, SG16, SG17, SG18, SG19, SG20, SG21, SG22, SG23, SG24, SG25, SG26, SG27, SG28, SG29, SG30, SG31, SG32, SG33, SG34, SG35, SG36, SG37, SG38, SG39, SG40, SG41, SG42, SG43, SG44, SG45, SG46, SG47, SG48, SG49, SG50, SG51, SG52, SG53, SG54, SG55, SG56, SG57, SG58, SG59, SG60, SG61, SG62, SG63, SG64, SG65, SG66, SG67, SG68, SG69, SG70, SG71, SG72, SG73, SG74, SG75, SG76, SG77, SG78, SG79, SG80, SG81, SG82, SG83, SG84, SG85, SG86, SG87, SG88, SG89, SG90, SG91, SG92, SG93, SG94, SG95, SG96, SG97, SG98, SG99, SGlOO, SGlOl, SG102, SG103, SG104, SG105, SG106, SG107, SG108, SG109, SGI lO, SGl I l, SGl 12, SGl 13, SGl 14, SGl 15, SGl 16, SGl 17, SGl 18, SGl 19, SG120, SG121, SG122, SG123, SG124, SG125, SG126, SG127, SG128, SG129, SG130, SG131, SG132, SG133, SG134, SG135, SG136, SG137, SG138, SG139, SG140, SG141, SG142, SG143, SG144, SG145, SG146, SG147, SG148, SG149, SG150, SG151, SG152, SG153, SG154, SG155, SG156, SG157, SG158, SGl 59, SGl 60, SGl 61, SGl 62, SGl 63, SGl 64, SGl 65, SGl 66, SGl 67, SGl 68, SG169, SG170, SG171, SG172, SG173, SG174, SG175, SG176, SG177, SG178, SG179, SG180, SG181, SG182, SG183, SG184, SG185, SG186, SG187, SG188, SG189, SG190, SG191, SG192, SG193, SG194, SG195, SG196, SG197, SG198, SG199, SG200, SG201, SG202, SG203, SG204, SG205, SG206, SG207, SG208, SG209, SG210, SG211, SG212, SG213, SG214, SG215, SG216, SG217, SG218, SG219, SG220, SG221, SG222, SG223, SG224, SG225, SG226, SG227, SG228, SG229, SG230, SG231, SG232, SG233, SG234, SG235, SG236, SG237, SG238, SG239, SG240, SG241, SG242, SG243, SG244, SG245, SG246, SG247, SG248,

SG249, SG250, SG251, SG252, SG253, SG254, SG255, SG256, SG257, SG258,

SG259, SG260, SG261, SG262, SG263, SG264, SG265, SG266, SG267, SG268,

SG269, SG270, SG271, SG272, SG273, SG274, SG275, SG276, SG277, SG278,

SG279, SG280, SG281, SG282, SG283, SG284, SG285, SG286, SG287, SG288,

SG289, SG290, SG291, SG292, SG293, SG294, SG295, SG296, SG297, SG298,

SG299, SG300, SG301, SG302, SG3O3, SG304, SG305, SG306, SG307, SG308,

SG309, SG310, SG311, SG312, SG313, SG314, SG315, SG316, SG317, SG318,

SG319, SG320, SG321, SG322, SG323, SG324, SG325, SG326, SG327, SG328,

SG329, SG33O, SG331, SG332, SG333, SG334, SG335, SG336, SG337, SG338,

SG339, SG340, SG341, SG342, SG343, SG344, SG345, SG346, SG347, SG348,

SG349, SG350, SG351, SG352, SG353, SG354, SG355, SG356, SG357, SG358,

SG359, SG360, SG361, SG362, SG363, SG364, SG365, SG366, SG367, SG368,

SG369, SG370, SG371, SG372, SG373, SG374, SG375, SG376, SG377, SG378,

SG379, SG380, SG381, SG382, SG383, SG384, SG385, SG386, SG387, SG388,

SG389, SG390, SG391, SG392, SG393, SG394, SG395, SG396, SG397, SG398,

SG399, SG400, SG401, SG402, SG403, SG404, SG405, SG406, SG407, SG408,

SG409, SG410, SG411, SG412, SG413, SG414, SG415, SG416, SG417, SG418,

SG419, SG420, SG421, SG422, SG423, SG424, SG425, SG426, SG427, SG428,

SG429, SG430, SG431, SG432, SG433, SG434, SG435, SG436, SG437, SG438,

SG439, SG440, SG441, SG442, SG443, SG444, SG445, SG446, SG447, SG448,

SG449, SG450, SG451, SG452, SG453, SG454, SG455, SG456, SG457, SG458,

SG459, SG460, SG461, SG462, SG465, SG468, SG469, SG470, SG471, SG472,

SG473, SG474, SG475, SG476, SG477, SG478, SG479, SG480, SG481, SG482,

SG483, SG484, SG485, SG486, SG487, SG488, SG489, SG490, SG491, SG492,

SG493, SG494, SG495, SG496, SG497, SG498, SG499, SG500, SG501, SG502,

SG503, SG504, SG505, SG506, SG507, SG508, SG509, SG510, SG511, SG512,

SG513, SG514, SG515, SG516, SG517, SG518, SG519, SG520, SG521, SG522,

SG523, SG524, SG525, SG526, SG527, SG428, SG529, SG530, SG531, SG532,

SG533, SG534, SG535, SG536, SG537, SG538, SG539, SG540, SG541, SG542,

SG543, SG544, SG545, SG546, SG547, SG548, SG549, SG550, SG551, SG552,

SG553, SG554, SG555, SG556, SG557, SG558, SG559, SG560, SG561, SG562,

SG563, o combinaciones de los mismos.

27. Método para diagnosticar in vitro una neoplasia originada a partir de células hematopoyéticas y/o pronosticar in vitro la evolución de la misma según la reivindicación 26, que comprende adicionalmente una etapa previa opcional de identificación de genes significativos para la clasificación de una muestra como asociada o no a un tipo concreto de neoplasia originada a partir de células hematopoyéticas, etapa previa que comprende las subetapas de: a) decidir las posibles categorías en las que puede clasificarse la muestra; b) obtener muestras biológicas de individuos que se han adscrito previamente por un método diferente al reivindicado a alguna de las posibles categorías de clasificación, de manera que se tengan muestras de cada una de las posibles categorías; c) obtener el mRNA total de cada una de las muestras; d) obtener el correspondiente cRNA total, marcado mediante un método que permita su posterior detección, de al menos una alícuota de cada una de las muestras de mRNA, alícuota a la que se le añade antes de la obtención del cRNA al menos una secuencia de nucleótidos poliadenilada de baja homología con genes humanos para que actúe como control positivo interno del proceso; e) añadir a cada una de las alícuotas de cRNA que se vaya a utilizar en la etapa f) al menos un oligonucleótido de baja homología con genes humanos distinto de y no complementario a cualquier posible secuencia de nucleótidos que se haya añadido en la etapa d), para que actúe como control positivo de hibridación; f) hibridar, en condiciones estrictas, al menos una alícuota de cRNA total de cada una de las muestras con al menos un microarray que comprende al menos dos copias de cada uno de los oligonucleótidos del grupo compuesto por:

SGl, SG2, SG3, SG4, SG5, SG6, SG7, SG8, SG9, SGlO, SGI l, SG12, SG13, SG14, SG15, SG16, SG17, SG18, SG19, SG20, SG21, SG22, SG23, SG24, SG25, SG26, SG27, SG28, SG29, SG30, SG31, SG32, SG33, SG34, SG35, SG36, SG37, SG38, SG39, SG40, SG41, SG42, SG43, SG44, SG45, SG46, SG47, SG48, SG49, SG50,

SG51, SG52, SG53, SG54, SG55, SG56, SG57, SG58, SG59, SG60, SG61, SG62, SG63, SG64, SG65, SG66, SG67, SG68, SG69, SG70, SG71, SG72, SG73, SG74, SG75, SG76, SG77, SG78, SG79, SG80, SG81, SG82, SG83, SG84, SG85, SG86, SG87, SG88, SG89, SG90, SG91, SG92, SG93, SG94, SG95, SG96, SG97, SG98,

SG99, SG100, SGlOl, SG102, SG103, SG104, SG105, SG106, SG107, SG108,

SG109, SG110, SGl I l, SGl 12, SGl 13, SGl 14, SGl 15, SGl 16, SGl 17, SGl 18,

SGl 19, SG120, SG121, SG122, SG123, SG124, SG125, SG126, SG127, SG128,

SG129, SG130, SG131, SG132, SG133, SG134, SG135, SG136, SG137, SG138,

SG139, SG140, SG141, SG142, SG143, SG144, SG145, SG146, SG147, SG148,

SG149, SG150, SG151, SG152, SG153, SG154, SG155, SG156, SG157, SG158,

SGl 59, SGl 60, SGl 61, SGl 62, SGl 63, SGl 64, SGl 65, SGl 66, SGl 67, SGl 68,

SG169, SG170, SG171, SG172, SG173, SG174, SG175, SG176, SG177, SG178,

SG179, SG180, SG181, SG182, SG183, SG184, SG185, SG186, SG187, SG188,

SG189, SG190, SG191, SG192, SG193, SG194, SG195, SG196, SG197, SG198,

SG199, SG200, SG201, SG202, SG203, SG204, SG205, SG206, SG207, SG208,

SG209, SG210, SG211, SG212, SG213, SG214, SG215, SG216, SG217, SG218,

SG219, SG220, SG221, SG222, SG223, SG224, SG225, SG226, SG227, SG228,

SG229, SG230, SG231, SG232, SG233, SG234, SG235, SG236, SG237, SG238,

SG239, SG240, SG241, SG242, SG243, SG244, SG245, SG246, SG247, SG248,

SG249, SG250, SG251, SG252, SG253, SG254, SG255, SG256, SG257, SG258,

SG259, SG260, SG261, SG262, SG263, SG264, SG265, SG266, SG267, SG268,

SG269, SG270, SG271, SG272, SG273, SG274, SG275, SG276, SG277, SG278,

SG279, SG280, SG281, SG282, SG283, SG284, SG285, SG286, SG287, SG288,

SG289, SG290, SG291, SG292, SG293, SG294, SG295, SG296, SG297, SG298,

SG299, SG300, SG301, SG302, SG3O3, SG304, SG305, SG306, SG307, SG308,

SG309, SG310, SG311, SG312, SG313, SG314, SG315, SG316, SG317, SG318,

SG319, SG320, SG321, SG322, SG323, SG324, SG325, SG326, SG327, SG328,

SG329, SG33O, SG331, SG332, SG333, SG334, SG335, SG336, SG337, SG338,

SG339, SG340, SG341, SG342, SG343, SG344, SG345, SG346, SG347, SG348,

SG349, SG350, SG351, SG352, SG353, SG354, SG355, SG356, SG357, SG358,

SG359, SG360, SG361, SG362, SG363, SG364, SG365, SG366, SG367, SG368,

SG369, SG370, SG371, SG372, SG373, SG374, SG375, SG376, SG377, SG378,

SG379, SG380, SG381, SG382, SG383, SG384, SG385, SG386, SG387, SG388, SG389, SG390, SG391, SG392, SG393, SG394, SG395, SG396, SG397, SG398, SG399, SG400, SG401, SG402, SG403, SG404, SG405, SG406, SG407, SG408, SG409, SG410, SG411, SG412, SG413, SG414, SG415, SG416, SG417, SG418, SG419, SG420, SG421, SG422, SG423, SG424, SG425, SG426, SG427, SG428, SG429, SG430, SG431, SG432, SG433, SG434, SG435, SG436, SG437, SG438, SG439, SG440, SG441, SG442, SG443, SG444, SG445, SG446, SG447, SG448, SG449, SG450, SG451, SG452, SG453, SG454, SG455, SG456, SG457, SG458, SG459, SG460, SG461, SG462, SG465, SG468, SG469, SG470, SG471, SG472, SG473, SG474, SG475, SG476, SG477, SG478, SG479, SG480, SG481, SG482, SG483, SG484, SG485, SG486, SG487, SG488, SG489, SG490, SG491, SG492, SG493, SG494, SG495, SG496, SG497, SG498, SG499, SG500, SG501, SG502, SG503, SG504, SG505, SG506, SG507, SG508, SG509, SG510, SG511, SG512, SG513, SG514, SG515, SG516, SG517, SG518, SG519, SG520, SG521, SG522, SG523, SG524, SG525, SG526, SG527, SG428, SG529, SG530, SG531, SG532, SG533, SG534, SG535, SG536, SG537, SG538, SG539, SG540, SG541, SG542, SG543, SG544, SG545, SG546, SG547, SG548, SG549, SG550, SG551, SG552, SG553, SG554, SG555, SG556, SG557, SG558, SG559, SG560, SG561, SG562, SG563, microarray que comprende adicionalmente: a. al menos dos puntos que correspondan a sendas alícuotas del disolvente en el que se encontraban los oligonucleótidos en el momento de su depósito sobre la superficie del microarray, para que sirvan como blanco, b. al menos dos copias de al menos un oligonucleótido por cada una de las secuencias poliadeniladas añadidas en la etapa d), oligonucleótido cuya secuencia se corresponderá con un fragmento, distinto de la zona de poliadenilación, de la secuencia de nucleótidos poliadenilada cuya evolución en el proceso ha de controlar;

c. por cada uno de los oligonucleótidos añadidos en la etapa e), al menos dos copias de un oligonucleótido complementario al mismo; d. al menos dos copias de cada miembro de al menos una pareja de oligonucleótidos en la que la secuencia de uno de los miembros corresponde a una secuencia de la zona 5' y la secuencia del otro corresponde a una secuencia de la zona 3' del mRNA de un gen que se exprese de forma constitutiva en cualquier célula de origen hematopoyético; e. al menos dos copias de al menos un oligonucleótido de baja homología con genes humanos distinto de cualquiera de los oligonucleótidos definidos en el apartado b. y distinto de cualquiera de los oligonucleótidos sintéticos añadidos de forma opcional en la etapa e); g) detectar y cuantificar la señal de cRNA hibridado con cada una de las copias de cada uno de los oligonucleótidos presentes en el microarray, así como la señal correspondiente a los puntos del disolvente; h) calcular el nivel medio de intensidad de hibridación de cada uno de los oligonucleótidos del microarray calculando la media de las intensidades de las copias de cada uno de los oligonucleótidos; i) dar la hibridación por válida si se cumplen las siguientes condiciones: a. la relación entre la intensidad media y el fondo medio de todos los oligonucleótidos del microarray es mayor que 10; b. el valor del coeficiente de variación medio de todas las réplicas de oligonucleótidos debe ser inferior a 0,3; c. el valor medio de control negativo debe ser inferior a 2,5 veces el valor medio de los puntos correspondientes al disolvente; d. existe señal tanto en los controles de hibridación como en los controles positivos internos utilizados como control del proceso; j) normalizar los datos; k) eliminar los oligonucleótidos con valores de intensidad media menos ruido de fondo medio inferiores a aproximadamente 2 veces el valor

medio obtenido con los puntos correspondientes al disolvente, así como los oligonucleótidos con un rango intercuartílico de intensidad normalizada a lo largo de las muestras menor que 0,3;

1) realizar el análisis estadístico para encontrar los oligonucleótidos estadísticamente significativos para diferenciar entre las distintas categorías y poder realizar la clasificación de una muestra que no se haya adscrito previamente a ninguna categoría, eligiendo dichos oligonucleótidos entre aquellos que no hayan sido eliminados en los pasos anteriores, hasta obtener los "n" oligonucleótidos que o bien presenten un valor de p inferior a un límite que se elige del intervalo abierto de 0 a 0,05, utilizando para ello preferiblemente un método con capacidad para reducir los falsos positivos, o bien sean los que mejor definan a las categoría establecidas; m) comprobar que el agrupamiento de las muestras según las diferencias en las intensidades entre las distintas muestras detectadas para los oligonucleótidos estadísticamente significativos da lugar a que las muestras queden clasificadas en las mismas categorías a las que habían sido adscritas previamente por un método diferente.

28. Método según la reivindicación 27, en el que el microarray comprende al menos cuatro copias de cada uno de los oligonucleótidos presentes en él y la media de las intensidades de las copias de cada uno de los oligonucleótidos que se calcula en h) es una media acotada.

29. Método según la reivindicación 28, en el que la normalización se realiza utilizando el método "variance stabilization normalization" disponible en el paquete "vsn" de R.

30. Método según cualquiera de las reivindicaciones 27 a 29, en el que el análisis estadístico para encontrar los oligonucleótidos estadísticamente significativos para diferenciar entre las distintas categorías se realiza utilizando la función mt.maxT del paquete multtest de R.

31. Método según cualquiera de las reivindicaciones 27 a 30, en el que se utiliza un dispositivo diagnóstico según la reivindicación 24.

32. Método según las reivindicaciones 27 a 31, que comprende una etapa opcional de obtención de una función de clasificación para cada muestra mediante la asignación arbitraria del valor 0 a una de las posibles categorías "a" y del valor 1 a la otra posible categoría "b" en las cuales se puede clasificar la muestra y la obtención mediante regresión logística de un coeficiente para cada uno de los oligonucleótidos que permitan calcular un valor x¡ para cada muestra mediante una función del tipo: n

Xi = constante + ∑(coef_oligm * Imni_olig m ) m=l donde coef oligm representa el coeficiente calculado para un oligonucleótido concreto "m"

Imni oligm representa el valor medio de intensidad normalizada obtenido en la hibridación de la muestra i calculado para el oligonucleótido "m" "m" varía desde 1 hasta "n" n es el número total de oligonucleótidos considerados significativos valor "xj" a partir del cual se calcula la probabilidad "pi" de que una muestra "i" pertenezca a una u otra categoría utilizando la fórmula p¡ = l/(l+e "xl ) y clasificando la muestra como perteneciente a la categoría "a" o "b" según su correspondiente valor p¡ esté más próximo a 0 ó 1, respectivamente.

33. Método según cualquiera de las reivindicaciones 27 a 29, en el que el análisis estadístico para encontrar los oligonucleótidos significativos para diferenciar entre las distintas categorías se realiza utilizando el método de "Nearest Shrunken Centroide".

34. Método según cualquiera de las reivindicaciones 27 a 33, en el que las muestras biológicas analizadas in vitro son muestras de sangre periférica.

35. Método según la reivindicación 34, en el que se diagnostica in vitro una leucemia o se pronostica la evolución de la misma.

36. Método según la reivindicación 35, en el que se diagnostica in vitro si un individuo padece leucemia linfática crónica.

37. Método según la reivindicación 35, en el que se pronostica in vitro la evolución de la leucemia linfática crónica en un sujeto clasificando una muestra de sangre extraída del mismo como "asociada a leucemia linfática crónica estable" o como "asociada a leucemia linfática crónica progresiva".

38. Método para diagnosticar in vitro una neoplasia originada a partir de células hematopoyéticas y/o pronosticar in vitro la evolución de la misma que comprende la detección in vitro y el análisis estadístico del nivel de expresión de al menos un gen significativo para clasificar la muestra como perteneciente a un individuo sano o asociarla a algún tipo de neoplasia originada a partir de células hematopoyéticas según la reivindicación 26, en el que la neoplasia que se diagnostica y/o cuya evolución se pronostica es una leucemia.

39. Método según la reivindicación 38, en el que se diagnostica y/o se pronostica la evolución de la leucemia linfática crónica.

40. Método para diagnosticar in vitro leucemia linfática crónica y/o pronosticar in vitro su evolución según la reivindicación 39, en el que la detección in vitro del nivel de expresión de al menos un gen significativo se realiza a partir de muestras de sangre periférica.

41. Método para diagnosticar in vitro leucemia linfática crónica según la reivindicación 40, en el que los sujetos de los que se han extraído las correspondientes muestras de sangre se clasifican o en la categoría de sujeto que no padece LLC o en la categoría de sujeto que padece LLC.

42. Método para diagnosticar in vitro leucemia linfática crónica según la reivindicación 41, en el que la clasificación de los sujetos se realiza tras la detección in vitro y el análisis estadístico del nivel de expresión en las correspondientes muestras de sangre de al menos los genes CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl.

43. Método para diagnosticar in vitro leucemia linfática crónica según la reivindicación 42, en el que la clasificación de los sujetos se realiza tras la detección in vitro y el análisis estadístico del nivel de expresión en las correspondientes muestras de sangre adicionalmente de los genes IRF8 y COL3A1.

44. Método para diagnosticar in vitro leucemia linfática crónica según la reivindicación 43, en el que la detección in vitro y el análisis estadístico del nivel de expresión de los genes CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl, IRF8 y COL3A1 se realiza mediante la evaluación del correspondiente mRNA por hibridación de su correspondiente cRNA utilizando como sondas los oligonucleótidos SGl 17, SG428, SG459, SG507, SG508, SG461 y SG493.

45. Método para diagnosticar in vitro leucemia linfática crónica según la reivindicación 44, en el que los oligonucleótidos forman parte de una composición en forma de microarray.

46. Método para diagnosticar in vitro leucemia linfática crónica según la reivindicación 45, en el que la evaluación del cRNA hibridado se realiza gracias al mareaje previo de cRNA con biotina, la tinción del microarray hibridado con estreptavidina conjugada con un fluoróforo y la detección de la señal emitida por dicho fluoróforo.

47. Método para diagnosticar in vitro leucemia linfática crónica según la reivindicación 46, en el que fluoróforo es Cy3.

48. Método para diagnosticar in vitro leucemia linfática crónica según la reivindicación 47, en el que la clasificación de un sujeto del que se ha extraído la muestra i analizada en la categoría de sujeto que no padece LLC o en la categoría de sujeto que padece LLC se realiza calculando para dicho sujeto un valor de probabilidad p¡ = l/(l+e "xl ) tras obtener su correspondiente valor de x¡ mediante la fórmula

Xi = -719,241486 + (2,44756372 * Imni_CD79A) + (7,38657611 * Imni_FAIM3) + (23,1465464 * ImniJϊLA-DRA) + (43,6287742 * Imni_IRF8) - (19,3978182 * Imni_COL3Al) - (2,80282646 * Imni_HLA-DRB3) + (49,5345672 *Imni_HLA- DQAl) fórmula en la que cada uno de los valores denominados mediante la abreviatura "Imni" seguida de la abreviatura de un gen hace referencia al valor medio de intensidad normalizado obtenido tras detectar la señal de hibridación correspondiente al oligonucleótido que se está utilizando como sonda para evaluar la expresión del dicho gen y clasificando al sujeto como sujeto que no padece LLC si el valor de p¡ es menor de 0,5 y como sujeto que padece LLC si el valor de p¡ es mayor de 0,5.

49. Método para pronosticar in vitro la evolución de la enfermedad en un sujeto que padece leucemia linfática crónica según la reivindicación 40, en el que los sujetos de los que se han extraído las correspondientes muestras de sangre se clasifican o en la categoría de sujeto con LLC estable o en la categoría de sujeto con LLC progresiva.

50. Método para pronosticar in vitro la evolución de la enfermedad en un sujeto que padece leucemia linfática crónica según la reivindicación 49, en el que la clasificación de los sujetos se realiza tras la detección in vitro y el análisis estadístico del nivel de expresión en las correspondientes muestras de sangre de al menos los genes PSMB4, FCER2 y POU2F2.

51. Método para pronosticar in vitro la evolución de la enfermedad en un sujeto que padece leucemia linfática crónica según la reivindicación 50, en el que la

clasificación de los sujetos se realiza tras la detección in vitro y el análisis estadístico del nivel de expresión en las correspondientes muestras de sangre adicionalmente de al menos un gen seleccionado del grupo compuesto por ODCl, CD79A, CD2, CD3E, CD5, MS4A1, EIF4E, FHIT, NR3C1, LCPl, MAPKlO, ABCC5, XRCC3, CML66, PLZF, RBP4.

52. Método para pronosticar in vitro la evolución de la enfermedad en un sujeto que padece leucemia linfática crónica según la reivindicación 51, en el que la clasificación de los sujetos se realiza tras la detección in vitro y el análisis estadístico del nivel de expresión en las correspondientes muestras de sangre de al menos los genes del grupo compuesto por PSMB4, FCER2, POU2F2, ODCl, CD79A, CD2, CD3E, CD5, MS4A1, EIF4E, FHIT, NR3C1, LCPl, MAPKlO, ABCC5, XRCC3, CML66, PLZF, RBP4.

53. Método para pronosticar in vitro la evolución de la enfermedad en un sujeto que padece leucemia linfática crónica según cualquiera de las reivindicaciones 51 ó 52, en el que la detección in vitro y el análisis estadístico del nivel de expresión de los genes examinados se realiza mediante la evaluación del correspondiente mRNA por hibridación de su correspondiente cRNA utilizando como sondas los correspondientes oligonucleótidos seleccionados de grupo compuesto por SG26, SG216, SG366, SG31, SG177, SG194, SG195, SG197, SG213, SG293, SG301, SG309, SG33, SG343, SG357, SG439, SG452, SG555, SG556.

54. Método para pronosticar in vitro la evolución de la enfermedad en un sujeto que padece leucemia linfática crónica según la reivindicación 53, en el que los oligonucleótidos forman parte de una composición en forma de microarray.

55. Método para pronosticar in vitro la evolución de la enfermedad en un sujeto que padece leucemia linfática crónica según la reivindicación 54, en el que la evaluación del correspondiente mRNA de la muestra analizada mediante la detección del correspondiente cRNA hibridado al correspondiente oligonucleótido se realiza gracias al mareaje previo del cRNA con biotina, la tinción del microarray hibridado

con estreptavidina conjugada con un fluoróforo y la detección de la señal emitida por dicho fluoróforo.

56. Método para pronosticar in vitro la evolución de la enfermedad en un individuo que padece leucemia linfática crónica según la reivindicación 55, en el que el fluoróforo es Cy3.

57. Uso de un dispositivo de evaluación del nivel de expresión de al menos un gen del grupo compuesto por PSMB4, FCER2, POU2F2, ODCl, CD79A, CD2, CD3E, CD5, MS4A1, EIF4E, FHIT, NR3C1, LCPl, MAPKlO, ABCC5, XRCC3, CML66, PLZF, RBP4, CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl, IRF8 y COL3A1 para el diagnóstico in vitro de la existencia de leucemia linfática crónica en un sujeto y/o para el pronóstico in vitro de la evolución de la leucemia linfática crónico en un sujeto.

58. Uso de un dispositivo de evaluación del nivel de expresión de genes según la reivindicación 57, en el que se evalúa el nivel de expresión de al menos un gen del grupo compuesto por CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl, IRF8 y COL3A1 para el diagnóstico in vitro de la existencia de leucemia linfática crónica en un sujeto.

59. Uso de un dispositivo de evaluación del nivel de expresión de genes según cualquiera de las reivindicaciones 57 y 58, en el que se evalúa el nivel de expresión de al menos los genes CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl para el diagnóstico in vitro de la existencia de leucemia linfática crónica en un sujeto.

60. Uso de un dispositivo de evaluación del nivel de expresión de genes según la reivindicación 59, en el que se evalúa adicionalmente el nivel de expresión de la menos los genes IRF8 y COL3A1 para el diagnóstico in vitro de la existencia de leucemia linfática crónica en un sujeto.

61. Uso de un dispositivo de evaluación del nivel de expresión de genes según la reivindicación 57, en el que se evalúa el nivel de expresión de al menos un gen del grupo compuesto por PSMB4, FCER2, POU2F2, ODCl, CD79A, CD2, CD3E, CD5, MS4A1, EIF4E, FHIT, NR3C1, LCPl, MAPKlO, ABCC5, XRCC3, CML66, PLZF, RBP4, para pronosticar in vitro la evolución de la enfermedad en un sujeto que padece leucemia linfática crónica.

Description:

PROCEDIMIENTO Y DISPOSITIVO DE ANáLISIS IN VITRO DE mRNA DE GENES IMPLICADOS EN NEOPLASIAS HEMATOLOGICAS

Campo de la invención

La invención se adscribe al sector técnico-industrial del diagnóstico in vitro, extracorpóreo, de muestras biológicas, mediante técnicas de ingeniería genética, aplicado al diagnóstico de tipos concretos de neoplasias a partir de sus patrones de expresión génica y/o al pronóstico de su evolución. Más concretamente, la invención se refiere a la identificación de neoplasias originadas a partir de células hematopoyéticas a partir de la evaluación de los niveles de RNA mensajeros de genes significativos en muestras biológicas como pueden ser las muestras de sangre periférica, preferiblemente mediante el uso de microarrays. Con ello pueden identificarse muestras correspondientes a pacientes que padecen LLC, permitiendo el diagnóstico de la misma y, además, pueden clasificarse muestras de pacientes que padecen LLC en muestras que pertenecen a pacientes en los que la LLC va a permanecer estable o en los que va a progresar, permitiendo el pronóstico de la futura evolución de estos pacientes.

Antecedentes de la invención

Cada día, el cuerpo humano produce billones de nuevas células blancas, rojas y plaquetas que reemplazan a las células hematopoyéticas que se pierden como consecuencia de un proceso normal de renovación, enfermedad o trauma. Al proceso organizado de producción de células hematopoyéticas y homeostasis se le conoce con el nombre de hematopoyesis (Weissman IL et al, 2000; Leung AYH et al, 2005).

En el hombre la hematopoyesis está confinada a la médula ósea (M.O.) de la mayor parte de los huesos, y de forma gradual, con la edad, ésta es sustituida por grasa de manera que, en el adulto, el 70% de la médula ósea se localiza en pelvis, vértebras y esternón (Bernard et al, 1976).

Todas las células maduras de la sangre se generan a partir de un relativo bajo número de células hematopoyéticas conocidas como células hematopoyéticas madre o "stem". La célula madre hematopoyética tiene dos características que son la pluripotencialidad o capacidad de dar origen a las distintas estirpes celulares hematopoyéticas y la autorrenovación o propiedad de perpetuarse generando células

iguales a si misma (Weissman IL et al, 2000). Esta capacidad es esencial para el mantenimiento de la hematopoyesis a lo largo de la vida ya que, sin la autorrenovación, se agotaría rápidamente la reserva de células madre disponible. Las células madre hematopoyéticas son capaces de generar distintos tipos celulares hematopoyéticos maduros a través de una serie de progenitores y precursores intermedios. Estos progenitores y precursores sufren una secuencia ordenada de sucesos que los transforman en células maduras. A este proceso se le conoce con el nombre de diferenciación (Lee MF et al, 2005). La diferenciación de las células hematopoyéticas implica cambios que afectan entre otros al tamaño y forma de la célula, a la expresión de genes, de proteínas, respuesta a señales y localización de las células.

Las células terminalmente diferenciadas han perdido su capacidad de división y sufren apoptosis después de un periodo de tiempo que va desde horas para neutrófilos hasta décadas para algunos linfocitos. Este hecho hace que la M.O. deba asegurar constantemente el recambio celular (Datta SR et al, 1999).

El proceso de hematopoyesis comprende una compleja interacción entre acontecimientos genéticos intrínsecos de las células hematopoyéticas y ambiente en el que se encuentran. Esta interacción es la que determina si los precursores y progenitores hematopoyéticos se deben mantener quiescentes, proliferar, diferenciarse en una u otra línea o entrar en apoptosis (Domen J et al, 1999). Todos los mecanismos genéticos y ambientales que gobiernan la producción de células sanguíneas operan alterando la balanza relativa de estos procesos celulares fundamentales.

Los factores ambientales y genéticos son críticos en hematopoyesis. Así por ejemplo la expresión de genes pertenecientes a las familias Rb (Bergh et al, 1999), ciclinas (Della Ragione F et al, 1997) o Hox (Magli MC et al, 1997) regulan la proliferación de células hematopoyéticas en estadios tempranas de diferenciación. Los genes de la familia de bcl-2 regulan apoptosis en células hematopoyéticas (O 'Gorman DM et al, 2001). Una gran variedad de genes entre los que se encuentran C/EBP (Teñen DG et al, 1997), Pax5 (Nutt SL et al, 1999) e Ecaros (Nichogiannopoulou A. et al, 1998) parecen estar implicados en diferenciación hematopoyética y compromiso de línea.

Neoplasias hematológicas

Las neoplasias hematológicas son procesos malignos que afectan a cualquiera de los tipos celulares implicados en el sistema hematopoyético. Como consecuencia de esta transformación, la célula es bloqueada en un estadio de diferenciación y comienza a acumularse debido a una proliferación incontrolada, a un fallo del mecanismo apoptótico o a un bloqueo de su proceso de diferenciación.

La transformación maligna de las células hematopoyéticas durante los diferentes estadios por los que atraviesan en su diferenciación a células maduras origina un gran número de neoplasias distintas (Guttmacher AE et al., 2003). Este tipo de neoplasias es por tanto un grupo muy heterogéneo de enfermedades que sólo tiene en común el origen hematopoyético del tipo celular transformado.

Clasificación de las neoplasias hematológicas

Genéricamente podrían establecerse dos grandes grupos: las neoplasias linfoides que afectan a los distintos tipos celulares y grados madurativos que conforman la línea linfoide tanto B como T y el otro gran grupo lo constituyen las neoplasias mieloides que afectan a diversos tipos celulares de la línea mieloide. Sin embargo, esta clasificación simplista actualmente está mas desarrollada, tal y como se detalla más abajo.

Desde el punto de vista clínico, clásicamente se han diferenciado de manera arbitraria las leucemias de los linfomas, señalando a las leucemias como aquellas neoplasias que afectan a la médula ósea y tienen expresión periférica, es decir, circulación de células anómalas en sangre, y a los linfomas como aquellas neoplasias que permanecen localizadas en los ganglios linfáticos u otros tejidos linfoides y que carecen, al menos de manera inicial, de comportamiento leucémico. En el caso de las leucemias, se ha diferenciado los procesos agudos de los crónicos inicialmente por las características morfo-citológicas de las células proliferantes (inmaduras y atípicas en el primer caso y más diferenciadas en el segundo) y a las manifestaciones clínicas de la enfermedad. En la actualidad el conocimiento de los marcadores inmunológicos y las alteraciones genéticas que afectan a las células hematopoyéticas ayudan a diferenciar con mas precisión los diferentes procesos.

- A -

Hoy se conoce que las neoplasias hematológicas, al igual que ocurre en otros tipos de cáncer, tienen un origen multigénico. La gran revolución tecnológica producida en los últimos años ha supuesto conocer las bases moleculares de varias neoplasias. La utilización de estas técnicas permite identificar genes relevantes en el cáncer humano, confirmar los resultados obtenidos en investigación básica en modelos animales, establecer patrones de susceptibilidad, clasificar de forma más precisa las neoplasias, mejorar el diagnóstico de la enfermedad, identificar nuevas dianas terapéuticas y mejorar la selección terapéutica para cada paciente.

También la diversidad que existe entre los individuos es importante y tiene su repercusión clínica, basada en las diferencias genéticas: si somos capaces de reconocer estas diferencias genéticas seremos también capaces de avanzar en conocer toxicidad y diferencias en la respuesta al tratamiento. (Westbrook CA et al, 2005).

En 1995, la Organización Mundial de la Salud (OMSAVHO) en colaboración con la Asociación Europea de Hematología y patólogos, clínicos y científicos de todo el mundo, inició un proyecto con el objetivo de obtener una clasificación consensuada de los tumores del tejido hematopoyético y órganos linfoides. Este proyecto condujo al desarrollo de un sistema de definición, clasificación y establecimiento de criterios diagnósticos consenso para las neoplasias mieloides, linfoides e histiocitarias (Jaffe ES et al, 2001). Los criterios de clasificación de la OMS son los mismos que se utilizaron en la clasificación REAL (Clasificación Revisada Europea-Americana de las neoplasias Linfoides) publicada por el International Lymphoma Study Group en 1994 (Harris NL et al, 1994). El sistema de clasificación REAL, a diferencia de otros sistemas de clasificación anteriores, se fundamenta en la definición de entidades "reales" y no en subtipos morfológicos. Para el establecimiento de estas entidades "reales" se utiliza toda la información disponible, es decir, se combinan datos morfológicos, inmunofenotípicos y biológicos con las características genéticas y clínicas (Harris NL et al, 1999a).

La clasificación de la OMS, que se presentó en 1997, estratifica las entidades de acuerdo a la línea celular afectada: mieloide, linfoide, histiocítica/dendrítica y mastocitaria. Dentro de cada categoría, se define la enfermedad de acuerdo a morfología, inmunofenotipo, datos genéticos y clínicos (Harris NL et al, 1999b). En muchas neoplasias, el estadio en el que se encuentra la célula tumoral acumulada no

coincide con el estadio en el que ha ocurrido el evento inicial transformador. Así, muchas neoplasias hematológicas se originan en los precursores iniciales y la alteración genética específica puede determinar que la célula siga avanzando en su diferenciación hasta detenerse y acumularse en estadios de diferenciación más avanzados (Shaffer AL et al, 2002). Por el contrario otras neoplasias pueden desarrollarse en los estadios de diferenciación mas avanzados, tal como ocurre en las células procedentes del centro folicular en las que las translocaciones y reordenamientos genéticos producen activación de genes que contribuyen al desarrollo tumoral. La nomenclatura para cada entidad refleja la mejor estimación para su línea celular y estadio de diferenciación, reconociendo que el conocimiento del que se dispone en la actualidad es imperfecto y que pueden producirse cambios en la asignación a la línea celular y en la nomenclatura según mejore el conocimiento disponible.

Los criterios actuales de diagnóstico y clasificación de estas neoplasias están basados en una combinación de (Braziel RM e al, 2003):

Evaluación morfológica de la célula: Observación al microscopio de las células implicadas. Se obtiene información sobre el tipo de célula y grado de maduración en el que se encuentra.

Estudio del inmunofenotipo: Reconocimiento de antígenos expresados en la superficie de la célula neoplásica. Estos antígenos se expresan de distinto modo y en diferente grado en función del linaje y del estadio en el que se encuentra la célula. Se conoce la expresión de antígenos de superficie característica de la línea y estadio de diferenciación en el que se encuentra la célula, por ejemplo, la expresión de CD 19 y CD20 es típicas de células de línea B, mientras que la expresión de CD3 es típica de línea T. El estudio de CD23 es clave a la hora de diferenciar LNHCM de LLC (Gong JZ et al, 2001).

Desde siempre se ha intentado relacionar los distintos tipos de neoplasias con su correspondiente población de célula normal a través de sus características morfológicas e inmunofenotípicas. Muchas neoplasias parecen por lo tanto "atrapadas" en estadios de desarrollo determinados porque presentan características morfológicas e inmunofenotípicas similares a las que presenta la célula hematopoyética en ese estadio de diferenciación (Shaffer AL, et al, 2002).

Características clínicas: Signos y síntomas que presenta el paciente en el momento del diagnóstico.

Determinación de marcadores moleculares: Medición de algunas moléculas que se asocian a entidades concretas como la presencia de PML/RARA en Leucemia promielocítica o que confieren mejor o peor pronóstico, como por ejemplo, la expresión de CD38 en células LLC marcador de mal pronóstico (Durig J et al, 2002)

Estudios citogenéticos basados en la búsqueda de alteraciones genéticas en el DNA de las células tumorales. En muchos casos, existen reordenamientos específicos característicos de tipos de tumor o estadios (Mitelman F, et al, 1997). En función de las translocaciones cromosómicas pueden establecerse distintos grupos con significado clínico, por ejemplo, en LLA-B, donde es frecuente la presencia de oncoproteínas de fusión, la presencia de t(2;21)/TELl-AMLl y t(l;19)/E2A-PBXl se asocia con respuesta a tratamiento mientras que el pronóstico para pacientes con t(9;22)/BCR-ABL y t(4;l 1)/MLL-AF4 es mucho peor (Arico M et al, 2000). También suelen realizarse búsquedas de mutaciones puntuales, deleciones o inserciones en algún gen que se han relacionado con pronóstico mas favorable como, por ejemplo, los síndromes mielodisplásicos asociados a 5q- (Boultwood J et al, 1994).

Como ya se ha comentado anteriormente, la OMS establece cuatro grandes grupos de neoplasias hematológicas en función de la estirpe implicada (neoplasias mieloides, linfoides, histiocítica/dendrítica y mastocitaria). A continuación se describen con más amplitud las neoplasias pertenecientes a la línea mieloide y linfoide por ser las que se producen con mayor frecuencia. Las correspondientes a las líneas histiocítica/dendrítica y mastocitaria por el momento constituyen entidades muy puntuales.

1. Neoplasias mieloides

Agrupan todas las neoplasias originadas en la línea de diferenciación mieloide, la OMS distingue cuatro grandes grupos (Vardiman JW et al, 2002).

1.1 Síndromes mieloproliferativos (SMP)

Síndromes mieloproliferativos (SMP) son alteraciones clónales de la célula madre hematopoyética caracterizados por hematopoyesis efectiva que conduce a un aumento de los niveles sanguíneos de una o más líneas hematopoyéticas y hepatoesplenomegalia. Constituyen un grupo de entidades en las cuales existe un incremento de los precursores de serie mieloide o fibrosis de la médula ósea (mielofibrosis), en este grupo se incluye también la mastocitosis sistémica. Se destacan:

- Síndromes mieloproliferativos crónicos (SMPC). Alteración clonal de la célula madre hematopoyética. Caracterizados por una hematopoyesis eficaz que produce aumento en sangre periférica de una o mas líneas celulares y frecuentemente hepatoesplenomegalia, hipercelularidad medular con maduración pero sin displasia.

- Leucemia mieloide crónica (LMC). Es un proceso clonal secundario a una alteración genética adquirida de la célula pluripotente. La enfermedad se caracteriza por la superproducción de neutrófilos y de sus precursores. Tiene tres fases: la primera denominada fase crónica de duración no definida, seguida de la fase de aceleración y finalmente de la crisis blástica que realmente es una leucemia aguda secundaria.

La LMC tiene una incidencia baja de aproximadamente un caso por 100.000 habitantes/año y aparece más frecuentemente en la quinta y sexta década de la vida. Puede ser considerada como una enfermedad rara.

Es la leucemia característica por excelencia ya que fue aplicado el término leucemia por primera vez en esta entidad. El 95% de los casos presenta un marcador genético, el cromosoma Philadelphia, originado por la traslocación de un fragmento del cromosoma 22 que se pega al cromosoma 9 o t(9;22) (q34;ql l). Esta translocación origina el gen de fusión bcr-abl. La proteína codificada por este gen quimérico, BCR-ABL tiene una actividad tirosin-quinasa aumentada comparada con la actividad de la proteína normal abl y actúa como factor de crecimiento oncogénico (Pane F et al, 2002), aunque realmente los mecanismos que producen la superproducción de células mieloides no están totalmente aclarados. Es posible que otros protooncogenes como el p-53 intervengan en el proceso y en la transformación de fase crónica a crisis blástica. Los pocos casos en los no se detecta la presencia del

cromosoma Philadelphia representan cuadros mieloproliferativos atípicos y corresponden a la variante de SMD conocida como leucemia mielomonocítica crónica (LMMC).

El diagnóstico se basa en los recuentos celulares elevados para la serie blanca, aparición de células mieloides normales morfológicamente y en todos los estadios de diferenciación, pero con un numero elevado de mielocitos y neutrófilos, generalmente existe basofüia y trombocitosis. En la fase de aceleración se produce un aumento de células inmaduras en sangre periférica y en la crisis blástica la célula predominante es el mieloblasto (65%) o el linfoblasto (35%).

- Policitemia Vera (PV). Es el síndrome mieloproliferativo caracterizado por el incremento de la masa de la serie roja. La policitemia vera es una enfermedad hematológica benigna, cuyo padecimiento no influye en el acortamiento de la supervivencia. Sin embargo, se trata de una enfermedad clonal que puede evolucionar en un 15% de los pacientes a mielofibrosis o leucemia aguda (5%).

- Trombocitemia Esencial (TE). Síndrome mieloproliferativo caracterizado por una producción plaquetaria 15 veces superior a lo normal. Puede asociarse a complicaciones trombóticas o hemorrágicas secundarias a una disfunción plaquetaria. La edad de presentación está entorno a los 60 años, con igual incidencia en ambos sexos.

- Mielofibrosis (MF). Es un trastorno clonal neoplásico de la célula madre pluripotente. Se caracteriza por una gran producción de megacariocitos anormales. Estas células liberan moléculas (factor de crecimiento derivado de las plaquetas, factor 4 plaquetario) que estimulan la proliferación de fibroblastos y construyen fibras de colágeno en la médula ósea. La médula es incapaz de funcionar con normalidad y las células precursoras hematopoyéticas se trasladan al hígado y bazo, dando lugar a hematopoyesis extramedular. Caracterizado por fibrosis de M.O y esplenomegalia. Aparece en mayores de 50 años y no tiene preferencia por sexo.

- Mastocitosis. Grupo de entidades caracterizadas por la proliferación de células mastocitarias en diferentes partes del organismo. La mastocitosis sistémica (MS), es una enfermedad rara que afecta habitualmente a adultos, y presenta alteraciones óseas en el 70% de los pacientes (Chen CC et al, 1994).

1.2. Síndromes mielodisplásicos/mieloproliferativos (SMD/SMP)

La OMS ha establecido una clasificación algo diferente, separando los SMD/SMP como entidades diferenciadas del resto de SMD, ya que comparten características con los SMPC que los hacen diferentes. En este grupo se incluyen tres entidades: leucemia mielomonocítica crónica, leucemia mieloide crónica atípica, leucemia mielomonocítica juvenil y SMD/SMP inclasificables.

Los síndromes mielodisplásicos (SMD) son proliferaciones clónales de la célula madre hematopoyética que comparten en el momento del diagnóstico datos clínicos, morfológicos y analíticos que se superponen entre LAM y SMPC. Se caracterizan por la hipercelularidad de la medula ósea debida a la proliferación de una o más líneas mieloides (Heaney ML, 1999). La presencia de displasia en al menos una línea (mieloide, eritroide o megacariocítica-plaquetar) es una característica de SMD. La incidencia es variable en dependencia de la variedad. Se estima una incidencia de 3 casos x 100.000 habitantes mayores de 60 años/año. La clasificación FAB establece 4 categorías diagnósticas (Bennett JM et al., 1984): anemia refractaria simple (AR), anemia refractaria con sideroblastos en anillo (ARS), anemia refractaria con exceso de blastos (AREB) y anemia refractaria con exceso de blastos en transformación (AREB-T) y leucemia mielomonocítica crónica (LMMC).

En cuanto a los SMD la OMS establece cinco categorías diferenciadas (Harris NL, et al., 1999): anemia refractaria, citopenia refractaria con displasia multilinear, anemia refractaria con exceso de blastos, SMD inclasificable y SMD asociado a defecto aislado en el cromosoma 5 (del 5q) ó síndrome 5q-.

1.3. Leucemia aguda mieloblástica (LAM)

Proliferación clonal de células inmaduras de la línea mieloide. Pueden aparecer de novo o de forma secundaria en pacientes con síndrome mielodisplásico (SMD). La clasificación elaborada por el grupo francés-americano-británico (FAB) considera ocho variedades (M0-M7) basadas en criterios morfológicos y en el inmunofenotipo de las células neoplásicas (Bennett JM, et al., 1976). A pesar de que esta clasificación ha sido aceptada durante muchos años, el descubrimiento de que muchas alteraciones genéticas tienen carácter predictivo y la incorporación del

análisis citogenético al diagnóstico de leucemias agudas (Bene MC et al, 2001) ha permitido sublcasificar la enfermedad y establecer una valoración pronostica, como ocurre con la translocación t(15;17) que caracteriza a la leucemia aguda promielocítica variedad que se caracteriza por la expresión de un receptor para el ácido retinóico (RAR), característica que convierte a este tipo de leucemia en sensible a tratamiento con ácido transretinóico (ATRA) en la mayoría de los casos.

La OMS clasifica las LAM incorporando datos morfológicos, características inmunofenotípicas, genéticas y clínicas para poder definir entidades biológicamente homogéneas y con relevancia clínica. Así la LAM se clasifica en cuatro grandes categorías: 1.- LAM con anomalías genéticas recurrentes. 2.- LAM con displasia multilinear. 3.- LAM relacionada con tratamiento y 4.- LAM no clasificable (ref OMS). Las tres primeras categorías reconocen la importancia de factores biológicos que predicen la evolución del proceso. El análisis citogenético representa el factor pronóstico más poderoso (Roumier C, et al, 2003). Se utiliza para identificar subgrupos de LAM con diferente pronóstico: bajo riesgo con respuesta favorable a tratamiento (t(8;21), t(15;17) o inv(16)), riesgo intermedio (cariotipo normal o t(9;l l) o alto riesgo (inv(3), -5del(5q) o -7del(7q), o más de tres alteraciones). Existe heterogeneidad molecular dentro del grupo de riesgo. En algunos casos de pacientes con cariotipo normal, se ha encontrado la presencia de mutaciones en el gen FLT3 (Kottaridis PD, et al, 2001.) y MLL (Dohner K et al, 2002).

La imagen medular en el examen microscópico del aspirado es generalmente la de una invasión por células semejantes entre sí, de características morfológicas inmaduras que distorsionan la distribución celular normal constituyendo auténticas sábanas celulares. La hiperproducción medular condiciona que zonas de medula ósea inactivas en la edad adulta vuelvan de nuevo a presentar focos de hematopoyesis, en este caso de células anormales.

Aproximadamente el 80-90% de los pacientes jóvenes con LAM, alcanzan remisión completa de la enfermedad tras quimioterapia. Sin embargo la mayoría recae, y la curación se produce en el 30%. El trasplante alogénico de médula ósea ha conseguido aumentar la tasa de curaciones al 50%, pero está limitado por la disponibilidad de donante HLA idéntico. Es por lo tanto un grupo de neoplasias con

diversas anormalidades genéticas y respuesta a tratamiento variable (Giles FJ et al, 2002)

2. Neoplasias linfoides

La clasificación de la OMS es un refinamiento de la clasificación REAL (Harris NL et al. 1994). Se reconocen tres grandes grupos de neoplasias linfoides: 1.- Neoplasias linfoides derivadas de células B. 2.- Neoplasias linfoides derivadas de células T y NK. 3.- Linfoma de Hodgkin. En esta clasificación se incluyen las neoplasias sólidas y las leucemias linfoides porque en muchas de ellas se produce una transformación de una fase a otra y la distinción entre ellas puede ser artificial. Así, la leucemia linfática crónica B y el LNH linfocítico están originados por la misma célula y simplemente representan manifestaciones diferentes de la misma neoplasia, lo mismo ocurre con el linfoma linfoblástico y la leucemia linfoblástica.

2.1. Neoplasias derivadas de células B, T y NK

La clasificación de la OMS divide estas neoplasias en función del estadio de maduración en el que se encuentran las células en neoplasias de células precursoras y neoplasias de células maduras (WHO Classification Tumours of Haematopoietic and lymphoid tissues. In Pathology an genetics of tumours of Haematopoietic and lymphoid tissues. ES Jaffe, NL Harris, H Stein, JW Vardiman. IARC Press. Lyon, 2001). Debido al elevado número de entidades descritas, se destacan entre ellas:

- Leucemia aguda linfoblástica (LAL): Profileración clonal de precursores linfoides. En aproximadamente el 80% de los casos, los precursores pertenecen a la línea linfoide B. El análisis molecular de las alteraciones genéticas de las células leucémicas ha contribuido de forma importante al entendimiento de la patogénesis y pronóstico de LAL (Ferrando AA et al, 2005). A pesar de que la frecuencia de subtipos genéticos difiere en niños y en adultos, los mecanismos generales que llevan a LAL son consecuencia de la expresión anormal de proto-oncogenes debido a translocaciones cromosómicas que crean genes de fusión o a hiperploidía. Este evento oncogénico inicial es probablemente insuficiente para producir leucemia y se cree que son necesarias otras alteraciones que cooperen con esta primera para alterar definitivamente la proliferación y supervivencia de la célula transformada. Todas

estas alteraciones contribuyen a la transformación leucémica de las células hematopoyéticas madre o de sus progenitoras porque afectan a procesos reguladores clave, manteniendo o aumentando su capacidad de autorenovación, escape de los controles normales de proliferación, bloqueo de diferenciación y promoviendo resistencia a señales apoptóticas (Hanahan D, et al, 2000).

El aspecto global de la medula ósea es similar al descrito para la leucemia mieloide. Es importante la investigación de enfermedad mínima residual, factor que condiciona con su presencia la probable recaída de la enfermedad. La clasificación FAB define 3 estadios en función de la morfología (L1-L3).

Es la leucemia más frecuente en la infancia, y en el curso clínico y la respuesta a tratamiento dependen del tipo de alteración genética, por ejemplo, los pacientes con hiperdiploidia tienen pronóstico favorable cuando se tratan con esquemas de tratamiento que incluyen antimetabolitos pero en líneas generales los niños se curan con quimioterapia estándar y profilaxis del SNC y en adultos solamente un 20% tienen supervivencia prolongada con quimioterapia, el trasplante alogénico y autólogo es útil para los casos considerados de alto riesgo.

- Leucemia linfática crónica (LLC). La LLC se caracteriza por la proliferación clonal y acumulo de linfocitos con apariencia madura y resistentes a apoptosis en M.O, sangre y órganos linfoides (Galton DA, 1966). Cuando la linfoadenopatía es dominante, el cuadro clínico se denomina Linfoma linfocítico. Los linfocitos afectados son de línea B en el 95% de los casos y el 5% de los casos se ven implicados linfocitos T.

Es la leucemia más frecuente en el mundo occidental. La media de edad de pacientes al diagnóstico es 65 años, sólo un 10-15% de los casos se dan por debajo de los 50 años (Jemal A et al, 2003). Es la causa de leucemia más común en adultos de los países del mundo occidental y supone alrededor del 25% de todas las leucemias. La incidencia es de 3 casos por cada 100.000 habitantes y año, con un predominio en varones, con una proporción varón/mujer de 1,7:1. En los últimos años, cada vez se diagnostica con más frecuencia en pacientes más jóvenes. La proporción de casos diagnosticados en estadio temprano de la enfermedad (Rai KR, et al, 1975) ha aumentado de 10 a 50%, debido probablemente a un diagnóstico precoz gracias a recuentos linfocitarios rutinarios. La enfermedad afecta más a hombres que a mujeres.

El pronóstico y curso clínico de la enfermedad es extremadamente variable. Algunos pacientes tienen una evolución rápidamente progresiva y fallecen en los 2-3 años después del diagnóstico, mientras que en otros, el curso es indolente y viven durante 10-20 años sin problemas relacionados con la LLC. En la mitad de los pacientes se producen situaciones intermedias.

Aproximadamente el 20% de los pacientes, son asintomáticos en el momento del diagnóstico, realizándose éste como consecuencia de un análisis de sangre rutinario. Cuando existen síntomas, no son específicos e incluyen fatiga, debilidad y malestar.

La clasificación Binet (Binet JL et al, 1981) define 3 estadios de enfermedad en función de la concentración de hemoglobina, número de plaquetas, número de ganglios implicados y la presencia de visceromegalias. La clasificación de Rai (Rai KR et al, 1975) utiliza los mismos indicadores pero clasifica a los pacientes en cinco grupos

Esta neoplasia no se caracteriza por una única y recurrente alteración genómica. Existen algunos marcadores que le imprimen un pronóstico más desfavorable como la presencia de deleciones en los cromosomas 17 y 11 y aquellos pacientes con ausencia de mutaciones en genes IgVh (40% de los casos) y elevada proporción de células expresando CD38 se caracterizan por un curso clínico más agresivo y una peor respuesta a tratamiento (Hamblin TJ et al, 1999; Durig J et al, 2002). Otro marcador descrito recientemente es ZAP-70, marcador pronóstico independiente cuya expresión se relaciona de forma indirecta con el estado mutacional del gen de las cadenas pesadas de inmunoglobulinas (Crespo M et al,

2003;.

- Mieloma múltiple: MM). El MM es una enfermedad maligna en la que un clon de células plasmáticas (elemento terminal de la línea linfoide B) de la médula ósea sufre una proliferación incontrolada. Supone el 10-15% de todas las enfermedades malignas y es característica de edades avanzadas, solamente el 2% de los casos se diagnostica antes de los 40 años. Por razones desconocidas la incidencia de la enfermedad esta aumentando.

Estas células producen y segregan una inmunoglobulina monoclonal o fragmentos de inmunoglobulinas, compuestos por una clase de cadena pesada y ligera

(kappa o lambda). Ocasionalmente el mieloma puede no secretor o no ser detectable la proteína en suero u orina. La célula plasmática neoplásica produce otras moléculas como IL6, factor de necrosis tumoral o factor activador de osteoclastos que contribuyen a producir osteolisis, hipercalcemia e insuficiencia renal, alteraciones características de la enfermedad.

El diagnóstico puede ser casual al realizar una analítica en pacientes sin sintomatología o enfermedad limitada (20% de los casos). La enfermedad en estos pacientes puede permanecer estable durante años y el tratamiento precoz en la fase asintomática no proporciona ninguna ventaja.

Los pacientes con componente monoclonal pero que no cumplen los criterios diagnósticos de MM se consideran portadores de gammapatía monoclonal de significado indeterminado (GMSI). Entre el 10 y el 20% de estos pacientes desarrolla MM en 10 años (KyIe RA, 1997; Zhan F et al, 2002). El componente monoclonal también puede asociarse a otras enfermedades como linfoma, neoplasias no hematológicas y enfermedades del tejido conectivo.

- Linfoma linfoplasmocitoide y Macroglobulinemia de Waldenstrom. Es la expresión clínica de una enfermedad linfoproliferativa de bajo grado, caracterizada por la infiltración de células linfoplasmocitarias anómalas en médula ósea, ganglios linfáticos y bazo, acompañada de la producción monoclonal de inmunoglobulina M, lo que condiciona un aumento de la viscosidad sanguínea y la aparición de manifestaciones vasculares hemorrágicas y por dificultad en la circulación en pequeños vasos.

- Linfoma no Hodgkin (LNH). Los LNH son tumores sólidos del tejido linfoide mucho más heterogéneos que la enfermedad de Hodgkin. La complejidad y diversidad que presentan los LNH en cuanto a morfología, genética, fenotipo y comportamiento clínico ha dado lugar a la existencia de múltiples clasificaciones, ninguna de ellas completamente satisfactoria.

Es la enfermedad hematológica más frecuente y, en términos de años de vida perdidos, es la cuarta neoplasia más importante del mundo occidental y parece que su incidencia va en aumento.

Puede aparecer en todas las edades, pero la mediana de aparición es a los 50 años. La causa que motiva la enfermedad no está clara. Se han descrito

translocaciones cromosómicas específicas asociadas a ciertos tipos de linfomas, por lo que son de gran utilidad en el diagnóstico (Montoto S et al, 2003). La mayoría de los linfomas tipo Burkitt presentan la translocación t(8;14), en la cual el oncogén c- MYC del cromosoma 8 se traslada a la región próxima en el cromosoma 14 donde se codifican las cadenas pesadas de inmunoglobulinas. El 90% de los linfomas foliculares se caracterizan por la translocación t(14;18), donde el gen bcl-2 del cromosoma 18 se traslada a la región de las cadenas pesadas de inmunoglobulinas. Es bien conocido que la sobreexpresión de bcl-2 inhibe la apoptosis (muerte celular programada). Es fácil que estos reordenamientos cromosómicos requieran otros estímulos como por ejemplo la coexpresión de un segundo proto-oncogén o un estímulo antigénico para desarrollar la proliferación maligna. Un ejemplo de combinación de múltiples causas combinadas lo constituye el linfoma asociado a SIDA. La aparición de linfomas extranodales agresivos es el resultado de la combinación de inmunosupresión por el VIH, desregulación de un protooncogén (c- MYC) y una infección viral secundaria (virus de Epstein-Barr), lo mismo ocurre en pacientes sometidos a trasplante de órganos (Harris NL et al, 2001).

La presentación clínica de la enfermedad es más irregular que en la enfermedad de Hodgkin. Puede comportarse de forma indolente sin requerir tratamiento de inmediato o, por el contrario, comportarse de forma agresiva rápidamente fatal.

La afectación nodal más frecuente es la cervical. En lo referente a afectación extranodal, los signos y síntomas dependen del órgano afectado. La médula ósea aparece infiltrada con mayor frecuencia en los LNH de bajo grado y puede originar pancitopenia. La presencia de células malignas en sangre periférica es frecuente también en los LNH de bajo grado, pero es de muy mal pronóstico en los de alto grado.

El diagnóstico se realiza mediante el estudio histológico del tejido linfático. La información adicional se obtiene mediante anticuerpos monoclonales dirigidos contra antígenos linfocitarios específicos (inmunofenotipo); esto ayuda a identificar el grado de maduración de la célula maligna y determinar el origen T o B de la misma. La presencia de mutación en genes que codifican Ig en los LNH de estirpe B suele utilizarse para la identificación de algunos subtipos de LNH (Kuppers R et al, 1999).

2.2. Linfoma de Hodgkin íLH)

Es una enfermedad poco frecuente y tiene predilección por el sexo masculino en una proporción 2/1. Se caracteriza por la presencia de unas células grandes, bi o multinucleadas llamadas de Reed-Sternberg (RS) y otras más pequeñas y mononucleadas que aparecen en pequeña cantidad en el tumor, el resto de las células son linfocitos, granulocitos, fibroblastos y células plasmáticas. Este infiltrado inflamatorio probablemente refleja la respuesta inmune del huésped con las células malignas. La naturaleza de las células RS y de Hodgkin ha sido muy estudiada pero sigue siendo controvertida. Pueden derivarse de un estadio inicial de las células linfoides.

En algunos casos se ha detectado la existencia de DNA del virus de Epstein- Barr en el tumor. Una hipótesis es que la distribución bimodal de la enfermedad se debería a la infección en los sujetos jóvenes y el otro pico estaría provocado por causas medio ambientales.

El diagnóstico se obtiene por biopsia de un nodulo linfático. Para planificar el tratamiento es necesario determinar la extensión de la enfermedad. (Küppers R, 2002; Cossman J, 2001; Devilard E et al, 2002).

Problemas en la clasificación

La gran cantidad de células hematopoyéticas y los muchos estadios de diferenciación por los que atraviesan complica todavía más la clasificación de las neoplasias originadas a partir de este tipo de células. A pesar de los esfuerzos por establecer una clasificación basada en entidades "reales", algunas de las categorías establecidas son ambiguas y en muchos casos contienen grupos muy heterogéneos en cuanto a respuesta a terapia o curso clínico. Esta heterogeneidad es la responsable, por un lado, de la incesante búsqueda de marcadores capaces de diferenciar unos comportamientos de otros y, por otro lado, de que la controvertida clasificación de este tipo de neoplasias esté sometida a continuas revisiones.

Un sistema de clasificación ideal debe ser preciso, reproducible, fácil de usar y sobre todo debe tener significado biológico y clínico (Chan WC, et al, 2005). Los sistemas actuales de diagnóstico y la clasificación de las neoplasias hematológicas se

basan en el reconocimiento de características histológicas y morfológicas, inmunofenotípicas, citogenética y estudio de algún marcador molecular con valor pronóstico. Una combinación de clasificación patológica y criterios clínicos se utilizan para diferenciar distintos tipos con diferencias pronosticas. Sin embargo, en algunas de las categorías diagnósticas definidas de esta manera se observa:

- Una respuesta a terapia marcadamente heterogénea. Dentro de la misma enfermedad se encuentran pacientes que alcanzan remisión completa, remisión parcial, no responden, que recaen tras una determinada terapia. La capacidad para predecir respuesta es especialmente importante en este tipo de neoplasias ya que el transplante de células "stem" es una alternativa terapéutica efectiva pero tóxica. La capacidad para determinar qué pacientes responderán a terapia convencional antes de darla puede ser beneficiosa para aplicar a cada paciente el tratamiento más efectivo.

- Un comportamiento clínico variable. Dentro de la misma categoría se encuentran pacientes cuya enfermedad se va a mantener estable durante largo periodo de tiempo y que no van a requerir terapia y otros cuya enfermedad va a progresar rápidamente requiriendo una terapia agresiva.

Estas variaciones apuntan a la existencia de heterogeneidad molecular dentro de las categorías diagnósticas, diferencias que los métodos convencionales de diagnóstico no son capaces de determinar y de ahí, la búsqueda de nuevas formas de análisis que proporcionen una mayor resolución en la caracterización de este tipo de neoplasias.

En esta línea, el uso de "arrays" de expresión ha demostrado ser efectivo no sólo en el desciframiento de la diversidad biológica y clínica que se encuentra en muchos tumores, sino en el entendimiento de los procesos biológicos y patológicos que afectan a muchos sistemas y en particular al sistema hematopoyético. Los "arrays" de expresión son conjuntos ordenados de secuencias asociadas a un soporte sólido, complementarias a mRNA o a sus correspondientes cDNA o cRNA, que permiten el análisis de la expresión diferencial de cientos o miles de genes simultáneamente. Uno de los soportes a los que se unen con frecuencia estas secuencias es a fragmentos rectangulares de vidrio similares a los portaobjetos, formato al que es frecuente aludir mediante los términos "microarray", "biochip" o, simplemente, "chip". Su uso se está volviendo cada vez más frecuente para el

diagnóstico de diversas enfermedades o para la evaluación de la susceptibilidad a padecerlas.

Primeros trabajos de "arrays" y neoplasias hematológicas

En el año 1999, el grupo de Golub publicó uno de los primeros artículos en el que se hace referencia al papel de los "arrays" en la clasificación de neoplasias hematológicas (Golub TR et al, 1999). Se utilizó un "array" con 6817 genes representados para el estudio de perfiles de expresión en las leucemias LAM y LAL. Se seleccionaron un grupo de 50 genes con capacidad de predecir el tipo de leucemia ("class predictor") y se utilizaron para clasificar un grupo de muestras desconocidas en las categorías correctas. El estudio de la expresión de estos 50 genes es suficiente para la clasificación de una muestra de leucemia aguda en LAM o LAL. A pesar de que la distinción entre LAM y LAL está bien establecida con los métodos actuales de diagnóstico, el estudio reveló la existencia de patrones de expresión específicos asociados con cada tipo de leucemia aguda y evidenció el uso de perfiles de expresión en la clasificación de cáncer.

En el año 2000, el grupo de Alizadeh publicó un artículo en el que utilizando un "array" especializado, el "lymphochip" que contiene genes expresados de forma preferencial en células linfoides o de los que se conoce alguna importancia inmunológica u oncológica con 17.856 secuencias (Alizadeh AA et al, 1999). Este grupo utilizó el "lymphochip" para el estudio de patrones de expresión génica asociados con diferencias en comportamiento clínico en un Linfoma difuso de células grandes B (LDCGB) (Alizadeh AA, et al. 2000). El LDCGB es un LNH con un comportamiento muy heterogéneo e imposible de distinguir por los métodos convencionales de diagnóstico: el 40% de los pacientes responden bien a terapia y tienen supervivencia prolongada mientras que el 60% muere por la enfermedad. Los autores encontraron que la expresión de genes podía relacionarse con el comportamiento clínico de los tumores. Este fue uno de los primeros artículos en el que se habla del papel de los "arrays" para la "subclasificación" de neoplasias hematológicas, es decir, el uso de perfiles de expresión para la identificación de dos grupos de LDCGB diferentes desde el punto de vista transcripcional, subtipos de

LDCGB con comportamiento clínico imposible de predecir con los criterios convencionales de diagnóstico.

En la actualidad hay múltiples publicaciones en los que de forma directa o indirecta aparecen los "arrays" aplicados no sólo a clasificación y subclasificación, sino también al estudio, diagnóstico, pronóstico, identificación de nuevos marcadores en enfermedades hematológicas (Greiner TC, 2004; Alizadeh AA et al, 2000; Bea S et al, 2005; Dave SS et al, 2004), así como solicitudes de patente en las que se describe la utilización de este tipo de dispositivos para la diferenciación entre distintos tipos de neoplasias hematológicas. Así, por ejemplo, la solicitud de patente WO2003/008552 describe la utilización con fines diagnósticos de diferencias en el patrón de expresión de genes para diferenciar entre la leucemia de linaje mixto (MLL), la leucemia linfoblástica aguda (ALL) y la leucemia mielógena aguda (AML), defendiendo la posibilidad de realizar este diagnóstico diferencial con los datos obtenidos tras el análisis de muestras de pacientes aquejados de cada uno de estos tipos de leucemia mediante la utilización de "chips" comerciales de Affymetrix. Aunque se indican genes con variaciones en la expresión entre los tres tipos de leucemias que permitirían la diferenciación entre ellas, no se mencionan secuencias específicas diferentes de las presentes en el chip de Affymetrix que se pudieran utilizar para detectar estos genes mediante dispositivos diferentes de los de dicha casa comercial, ni se considera el diseño de dispositivos o métodos que permitieran el diagnóstico de otros tipos de leucemias o, en general, neoplasias derivadas de células hematopoy éticas .

La solicitud de patente WO2005/024043, por su parte, se enmarca también en el campo del análisis de la expresión de genes para profundizar en el conocimiento de las diferencias existentes a nivel molecular entre las distintas neoplasias derivadas de células hematopoyéticas, centrándose específicamente en el caso de los linfomas, para extraer datos que ayuden en su diagnóstico o en el pronóstico de su evolución. En concreto, se describe un método para obtener funciones útiles para predecir la evolución de individuos afectados por distintos tipos de linfomas evaluando en biopsias de ganglios en qué grado contribuye en cada uno de ellos lo que denominan patrones o huellas génicas, grupos de genes que se expresan de forma coordinada y que están relacionados con el origen celular de la neoplasia, los distintos tipos de

células no malignas presentes en la biopsia y los mecanismos oncogénicos responsables del cáncer. Los distintos patrones o huellas génicas se deducen también en este caso a partir de los datos obtenidos con chips comerciales de Affymetrix. Además, la solicitud WO2005/024043 dice proporcionar un microarray alternativo, compuesto por un número menor de secuencias que los microarrays de Affymetrix, que permitiría igualmente el análisis de diferencias en la expresión génica entre linfomas y su aplicación para la deducción de funciones de predicción de supervivencia y para la diferenciación entre distintos tipos de linfomas. Aunque se indican los genes cuyo análisis se vería posibilitado por ese microarray, la memoria de la solicitud WO2005/024043 no indica la secuencia de las sondas que compondrían el microarray, mencionando sólo que serían tipo cDNA y dejando dudas de si ese cDNA aparecería completo o el análisis de la expresión del gen correspondiente se realizaría utilizando como sonda sólo un fragmento de dicho cDNA, que quedaría por determinar.

Sería interesante disponer de composiciones y métodos que permitieran la diferenciación entre neoplasias de origen hematopoyético en base a sus diferencias a nivel molecular, diseñadas específicamente para este grupo de neoplasias, en las que se evaluara la expresión de un número de genes más reducido que en los microarrays comerciales utilizados en los estudios descritos en las solicitudes de patente antes comentadas y que facilitaran tanto el diagnóstico de determinadas neoplasias como la predicción de su futura evolución, ayudando de esta manera en la prescripción de un tratamiento adecuado para cada paciente, característica particularmente interesante en aquellas neoplasias, como es el caso de la LLC, en las que el pronóstico de la futura evolución del paciente es difícil con los conocimientos y ensayos de los que se dispone hasta ahora. Además, sería especialmente conveniente que las sondas utilizadas para evaluar la expresión de los genes seleccionados hubieran sido diseñadas específicamente para que, además de ser específicas y con una secuencia perfectamente definida, tuvieran todas ellas un comportamiento parecido, lo que las haría apropiadas, en general, para ser utilizadas de forma combinada en un mismo ensayo y, en particular, para formar parte de un mismo array o conjunto ordenado asociado a un soporte sólido, como pueden ser los denominados "chips" o

"microarrays". Las composiciones y métodos de la presente invención responden a esta necesidad.

En lugar de partir de microarrays comerciales para detectar genes significativos para distinguir entre neoplasias o crear funciones que predigan la supervivencia del individuo que las padezca, la invención proporciona nuevos oligonucleótidos, de secuencia perfectamente definida, capaces de detectar de forma específica genes que se han seleccionado por ser conocidos por ser significativos para la biología de células sanguíneas o para la patología de distintas neoplasias, oligonucleótidos que tienen además la particularidad de haber sido diseñados de manera que comparten unas características comunes que hacen que presenten un comportamiento parecido al ser utilizados como sondas en ensayos de hibridación, lo que les hace adecuados para ser utilizados en composiciones que comprendan combinaciones de los mismos. Dichas composiciones, y en especial aquellas en las que estos oligonucleótidos se encuentran dispuestos de forma ordenada sobre un soporte sólido de fácil manejo como los vidrios similares a portaobjetos, son adecuadas para realizar ensayos con los que detectar genes estadísticamente significativos para diferenciar muestras extraídas de individuos que padecen determinados tipos de neoplasias originadas a partir células hematopoyéticas de muestras extraídas de individuos que no padecen dichas neoplasias, al tratarse de composiciones que contienen un número de oligonucleótidos inferior a los microarrays comerciales diseñados con propósito más general, estar diseñadas específicamente para el análisis de muestras procedentes de individuos que padecen neoplasias y componerse de sondas de secuencia conocida, perfectamente reproducible, que además están especialmente diseñadas para ser utilizadas conjuntamente en un mismo ensayo por ser de comportamiento parecido. La inclusión adicional en los microarrays de la invención de oligonucleótidos de baja homología con genes humanos, pero elegidos para que el resto de sus características sean similares a las de los oligonucleótidos de la invención diseñados para actuar como sondas capaces de reconocer genes humanos con alta especificidad, permite la utilización de dichos microarrays para la identificación de genes estadísticamente significativos en la identificación de muestras asociadas a determinadas neoplasias de origen hematopoyético mediante la utilización de ensayos en los que es factible el

establecimiento de controles en todas sus fases. Tal como se demuestra en los ejemplos que aparecen más adelante en la presente memoria, la utilización de estos microarrays en combinación con diversas técnicas estadísticas permite la correcta clasificación de distintas muestras biológicas mediante un método, preciso, reproducible, fácil de usar y con significado biológico y clínico, al estar basado en diferencias de expresión de genes con significado para los procesos biológicos que se están analizando. En particular, el uso de un microarray de la invención en combinación con el método de la invención permite la identificación de muestras sanguíneas de pacientes que padecen leucemia linfática crónica (alteración no considerada en las solicitudes WO2003/008552 y WO2005/024043 y cuyo diagnóstico no ha sido descrito mediante la utilización de microarrays comerciales), distinguiéndolas tanto de muestras obtenidas de individuos sanos como de muestras relacionadas con otros tipos de leucemias, como son las correspondientes a células Jurkat o U937, facilitando el diagnóstico de la LLC mediante el análisis de niveles de expresión de genes estadísticamente significativos para ello y permitiendo incluso la obtención de funciones que posibilitan el cálculo matemático de la probabilidad de que una muestra desconocida pertenezca a un individuo aquejado de LLC. Además, la invención permite diferenciar muestras pertenecientes a individuos aquejados de leucemia linfática crónica estable de muestras pertenecientes a individuos aquejados de leucemia linfática crónica progresiva, distinción que ahora mismo es difícil realizar apriori mediante las técnicas disponibles, por lo que supone una herramienta útil y novedosa para el pronóstico de la futura evolución de individuos aquejados de esta enfermedad, individuos cuyo diagnóstico puede haberse realizado también mediante composiciones y métodos de la invención o puede haberse conocido gracias a la aplicación de un procedimiento diferente, pero para los que, al disponerse de una herramienta que permita pronosticar cómo va a evolucionar posteriormente la LLC que padecen, será más fácil decidir si es adecuado someterlos a un tratamiento agresivo inmediato o simplemente mantenerlos en observación periódica para verificar que sus datos de expresión de genes siguen indicando que la enfermedad va a mantenerse estable durante un largo período de tiempo.

Sumario de la invención

La invención proporciona composiciones que incluyen al menos un oligonucleótido del grupo compuesto por:

SGl, SG2, SG3, SG4, SG5, SG6, SG7, SG8, SG9, SGlO, SGI l, SG12, SG13, SG14, SG15, SG16, SG17, SG18, SG19, SG20, SG21, SG22, SG23, SG24, SG25, SG26, SG27, SG28, SG29, SG30, SG31, SG32, SG33, SG34, SG35, SG36, SG37, SG38, SG39, SG40, SG41, SG42, SG43, SG44, SG45, SG46, SG47, SG48, SG49, SG50, SG51, SG52, SG53, SG54, SG55, SG56, SG57, SG58, SG59, SG60, SG61, SG62, SG63, SG64, SG65, SG66, SG67, SG68, SG69, SG70, SG71, SG72, SG73, SG74, SG75, SG76, SG77, SG78, SG79, SG80, SG81, SG82, SG83, SG84, SG85, SG86, SG87, SG88, SG89, SG90, SG91, SG92, SG93, SG94, SG95, SG96, SG97, SG98, SG99, SGlOO, SG101, SG102, SG103, SG104, SG105, SG106, SG107, SG108, SG109, SG110, SGl I l, SGl 12, SGl 13, SGl 14, SGl 15, SGl 16, SGl 17, SGl 18, SGl 19, SG120, SG121, SG122, SG123, SG124, SG125, SG126, SG127, SG128, SG129, SG130, SG131, SG132, SG133, SG134, SG135, SG136, SG137, SG138, SG139, SG140, SG141, SG142, SG143, SG144, SG145, SG146, SG147, SG148, SG149, SG150, SG151, SG152, SG153, SG154, SG155, SG156, SG157, SG158, SGl 59, SGl 60, SGl 61, SGl 62, SGl 63, SGl 64, SGl 65, SGl 66, SGl 67, SGl 68, SG169, SG170, SG171, SG172, SG173, SG174, SG175, SG176, SG177, SG178, SG179, SG180, SG181, SG182, SG183, SG184, SG185, SG186, SG187, SG188, SG189, SG190, SG191, SG192, SG193, SG194, SG195, SG196, SG197, SG198, SG199, SG200, SG201, SG202, SG203, SG204, SG205, SG206, SG207, SG208, SG209, SG210, SG211, SG212, SG213, SG214, SG215, SG216, SG217, SG218, SG219, SG220, SG221, SG222, SG223, SG224, SG225, SG226, SG227, SG228, SG229, SG230, SG231, SG232, SG233, SG234, SG235, SG236, SG237, SG238, SG239, SG240, SG241, SG242, SG243, SG244, SG245, SG246, SG247, SG248, SG249, SG250, SG251, SG252, SG253, SG254, SG255, SG256, SG257, SG258, SG259, SG260, SG261, SG262, SG263, SG264, SG265, SG266, SG267, SG268, SG269, SG270, SG271, SG272, SG273, SG274, SG275, SG276, SG277, SG278, SG279, SG280, SG281, SG282, SG283, SG284, SG285, SG286, SG287, SG288, SG289, SG290, SG291, SG292, SG293, SG294, SG295, SG296, SG297, SG298, SG299, SG300, SG301, SG302, SG3O3, SG304, SG305, SG306, SG307, SG308,

SG309, SG310, SG311, SG312, SG313, SG314, SG315, SG316, SG317, SG318, SG319, SG320, SG321, SG322, SG323, SG324, SG325, SG326, SG327, SG328, SG329, SG33O, SG331, SG332, SG333, SG334, SG335, SG336, SG337, SG338, SG339, SG340, SG341, SG342, SG343, SG344, SG345, SG346, SG347, SG348, SG349, SG350, SG351, SG352, SG353, SG354, SG355, SG356, SG357, SG358, SG359, SG360, SG361, SG362, SG363, SG364, SG365, SG366, SG367, SG368, SG369, SG370, SG371, SG372, SG373, SG374, SG375, SG376, SG377, SG378, SG379, SG380, SG381, SG382, SG383, SG384, SG385, SG386, SG387, SG388, SG389, SG390, SG391, SG392, SG393, SG394, SG395, SG396, SG397, SG398, SG399, SG400, SG401, SG402, SG403, SG404, SG405, SG406, SG407, SG408, SG409, SG410, SG411, SG412, SG413, SG414, SG415, SG416, SG417, SG418, SG419, SG420, SG421, SG422, SG423, SG424, SG425, SG426, SG427, SG428, SG429, SG430, SG431, SG432, SG433, SG434, SG435, SG436, SG437, SG438, SG439, SG440, SG441, SG442, SG443, SG444, SG445, SG446, SG447, SG448, SG449, SG450, SG451, SG452, SG453, SG454, SG455, SG456, SG457, SG458, SG459, SG460, SG461, SG462, SG465, SG468, SG469, SG470, SG471, SG472, SG473, SG474, SG475, SG476, SG477, SG478, SG479, SG480, SG481, SG482, SG483, SG484, SG485, SG486, SG487, SG488, SG489, SG490, SG491, SG492, SG493, SG494, SG495, SG496, SG497, SG498, SG499, SG500, SG501, SG502, SG503, SG504, SG505, SG506, SG507, SG508, SG509, SG510, SG511, SG512, SG513, SG514, SG515, SG516, SG517, SG518, SG519, SG520, SG521, SG522, SG523, SG524, SG525, SG526, SG527, SG428, SG529, SG530, SG531, SG532, SG533, SG534, SG535, SG536, SG537, SG538, SG539, SG540, SG541, SG542, SG543, SG544, SG545, SG546, SG547, SG548, SG549, SG550, SG551, SG552, SG553, SG554, SG555, SG556, SG557, SG558, SG559, SG560, SG561, SG562, SG563, o combinaciones de los mismos.

Dichos oligonucleótidos han sido diseñados de manera que, además de ser específicos para los correspondientes genes cuya expresión se quiere evaluar, tengan un comportamiento parecido, por ser de longitudes similares y presentar todos ellos contenidos de GC comprendidos en el intervalo de 40% a 60%, además de corresponder a zonas situadas a menos de 3000 nucleótidos del extremo 3' (poli(A)) del mRNA que se desea detectar y evaluar y de estar constituidos por secuencias que

coinciden en su sentido con la de los correspondientes mRNA. Por ello, son adecuados para ser utilizados en un mismo ensayo o formar parte de una composición que comprenda combinaciones de los mismos. Una realización particular de la invención lo constituyen las composiciones que comprendan mezclas de varios de dichos oligonucleótidos. Se prefieren especialmente aquellas composiciones que comprendan mezclas de oligonucleótidos que correspondan a genes significativos para clasificar a una muestra como asociada a una determinada neoplasia y/o para determinar la evolución futura de la misma. Son también realizaciones especialmente preferidas de la invención aquellas composiciones que comprendan la totalidad de los oligonucleótidos del grupo compuesto por:

SGl, SG2, SG3, SG4, SG5, SG6, SG7, SG8, SG9, SGlO, SGI l, SG12, SG13, SG14, SG15, SG16, SG17, SG18, SG19, SG20, SG21, SG22, SG23, SG24, SG25, SG26, SG27, SG28, SG29, SG30, SG31, SG32, SG33, SG34, SG35, SG36, SG37, SG38, SG39, SG40, SG41, SG42, SG43, SG44, SG45, SG46, SG47, SG48, SG49, SG50, SG51, SG52, SG53, SG54, SG55, SG56, SG57, SG58, SG59, SG60, SG61, SG62, SG63, SG64, SG65, SG66, SG67, SG68, SG69, SG70, SG71, SG72, SG73, SG74, SG75, SG76, SG77, SG78, SG79, SG80, SG81, SG82, SG83, SG84, SG85, SG86, SG87, SG88, SG89, SG90, SG91, SG92, SG93, SG94, SG95, SG96, SG97, SG98, SG99, SG100, SG101, SG102, SG103, SG104, SG105, SG106, SG107, SG108, SG109, SG110, SGl I l, SGl 12, SGl 13, SGl 14, SGl 15, SGl 16, SGl 17, SGl 18, SGl 19, SG120, SG121, SG122, SG123, SG124, SG125, SG126, SG127, SG128, SG129, SG130, SG131, SG132, SG133, SG134, SG135, SG136, SG137, SG138, SG139, SG140, SG141, SG142, SG143, SG144, SG145, SG146, SG147, SG148, SG149, SG150, SG151, SG152, SG153, SG154, SG155, SG156, SG157, SG158, SGl 59, SGl 60, SGl 61, SGl 62, SGl 63, SGl 64, SGl 65, SGl 66, SGl 67, SGl 68, SG169, SG170, SG171, SG172, SG173, SG174, SG175, SG176, SG177, SG178, SG179, SG180, SG181, SG182, SG183, SG184, SG185, SG186, SG187, SG188, SG189, SG190, SG191, SG192, SG193, SG194, SG195, SG196, SG197, SG198, SG199, SG200, SG201, SG202, SG203, SG204, SG205, SG206, SG207, SG208, SG209, SG210, SG211, SG212, SG213, SG214, SG215, SG216, SG217, SG218, SG219, SG220, SG221, SG222, SG223, SG224, SG225, SG226, SG227, SG228, SG229, SG230, SG231, SG232, SG233, SG234, SG235, SG236, SG237, SG238,

SG239, SG240, SG241, SG242, SG243, SG244, SG245, SG246, SG247, SG248,

SG249, SG250, SG251, SG252, SG253, SG254, SG255, SG256, SG257, SG258,

SG259, SG260, SG261, SG262, SG263, SG264, SG265, SG266, SG267, SG268,

SG269, SG270, SG271, SG272, SG273, SG274, SG275, SG276, SG277, SG278,

SG279, SG280, SG281, SG282, SG283, SG284, SG285, SG286, SG287, SG288,

SG289, SG290, SG291, SG292, SG293, SG294, SG295, SG296, SG297, SG298,

SG299, SG300, SG301, SG302, SG3O3, SG304, SG305, SG306, SG307, SG308,

SG309, SG310, SG311, SG312, SG313, SG314, SG315, SG316, SG317, SG318,

SG319, SG320, SG321, SG322, SG323, SG324, SG325, SG326, SG327, SG328,

SG329, SG33O, SG331, SG332, SG333, SG334, SG335, SG336, SG337, SG338,

SG339, SG340, SG341, SG342, SG343, SG344, SG345, SG346, SG347, SG348,

SG349, SG350, SG351, SG352, SG353, SG354, SG355, SG356, SG357, SG358,

SG359, SG360, SG361, SG362, SG363, SG364, SG365, SG366, SG367, SG368,

SG369, SG370, SG371, SG372, SG373, SG374, SG375, SG376, SG377, SG378,

SG379, SG380, SG381, SG382, SG383, SG384, SG385, SG386, SG387, SG388,

SG389, SG390, SG391, SG392, SG393, SG394, SG395, SG396, SG397, SG398,

SG399, SG400, SG401, SG402, SG403, SG404, SG405, SG406, SG407, SG408,

SG409, SG410, SG411, SG412, SG413, SG414, SG415, SG416, SG417, SG418,

SG419, SG420, SG421, SG422, SG423, SG424, SG425, SG426, SG427, SG428,

SG429, SG430, SG431, SG432, SG433, SG434, SG435, SG436, SG437, SG438,

SG439, SG440, SG441, SG442, SG443, SG444, SG445, SG446, SG447, SG448,

SG449, SG450, SG451, SG452, SG453, SG454, SG455, SG456, SG457, SG458,

SG459, SG460, SG461, SG462, SG465, SG468, SG470, SG472, SG473, SG474,

SG475, SG476, SG477, SG478, SG479, SG480, SG481, SG482, SG483, SG484,

SG485, SG486, SG487, SG488, SG489, SG490, SG491, SG492, SG493, SG494,

SG495, SG496, SG497, SG498, SG499, SG500, SG501, SG502, SG503, SG504,

SG505, SG506, SG507, SG508, SG509, SG510, SG511, SG512, SG513, SG514,

SG515, SG516, SG517, SG518, SG519, SG520, SG521, SG522, SG523, SG524,

SG525, SG526, SG527, SG428, SG529, SG530, SG531, SG532, SG533, SG534,

SG535, SG536, SG537, SG538, SG539, SG540, SG541, SG542, SG543, SG544,

SG545, SG546, SG547, SG548, SG549, SG550, SG551, SG552, SG553, SG554,

SG555, SG556, SG557, SG558, SG559, SG560, SG561, SG562, SG563.

Adicionalmente, la invención proporciona oligonucleótidos útiles para ser utilizados como controles en el método de la invención. Por una parte, como controles de integridad, se proporcionan las parejas de oligonucleótidos SG463 y SG464 (complementarias, respectivamente a los extremos 5' y 3' del gen de β-actina) y SG466 y SG467 (complementarias, respectivamente, a los extremos 5' y 3' del gen GAPD). Adicionalmente, se proporcionan los oligonucleótidos SSPCl, SSPC2, SSPC3, SSPC4, SSPC5, SSPC6 y SSPC7, que pueden ser utilizados como controles positivos internos exógenos de la calidad del proceso tras añadirse a la muestra que contiene el mRNA de partida moléculas de ácidos nucleicos poliadenilados que contengan fragmentos que se correspondan en su secuencia con la de estos oligonucleótidos (como pueden ser los transcritos correspondientes a los genes de los que dichos oligonucleótidos derivan) y que sean sometidas al mismo procesamiento que el mRNA de partida, así como los oligonucleótidos SCN2, SCN3, SCN6, SCN8, SCNI l, SCNl 2 y SCNl 3, diseñados para ser utilizados como controles positivos de hibridación, y los oligonucleótidos SCNl, SCN5, SCN7, SCNlO, SCl, SC2, SC3, SC4, SC5, SC6 y SC7, diseñados para ser utilizados como controles negativos; todos ellos cumplen las condiciones de presentar baja homología con genes humanos, además de cumplir las mismas condiciones de los oligonucleótidos complementarios a genes humanos de ser de longitudes similares y presentar todos ellos contenidos de GC comprendidos en el intervalo de 40% a 60%, corresponder a zonas situadas a menos de 3000 nucleótidos del extremo 3' (poli(A)) del mRNA no humano que serían capaces de detectar y de estar constituidos por secuencias que coinciden en su sentido con la de los correspondientes mRNA. Cualquier composición que contenga al menos uno de los oligonucleótidos SG463, SG464, SG466, SG467, SSPCl, SSPC2, SSPC3-, SSPC4, SSPC5, SSPC6, SSPC7, SCN2, SCN3, SCN6, SCN8, SCNI l, SCN12, SCN13, SCNl, SCN5, SCN7, SCN10, SCl, SC2, SC3, SC4, SC5, SC6 y SC7, en combinación con al menos uno de los oligonucleótidos complementarios a genes humanos de la invención antes citados es también una composición incluida dentro del alcance de la presente invención.

Se prefiere especialmente que los oligonucleótidos que formen parte de una composición de la invención estén unidos a un soporte sólido. En particular, se prefieren aquellas de tales composiciones en las que la distribución de los

oligonucleótidos sobre el soporte sólido sea de forma ordenada, que el soporte sólido utilizado sea un vidrio rectangular similar a los portaobjetos de microscopio y que los oligonucleótidos estén unidos al vidrio mediante enlaces covalentes; a las composiciones que cumplen tales características se hace referencia en el resto de la memoria con las palabras "microarray", "chip" o "microchip". Entre estas composiciones en forma de microarray, se tiene una especial preferencia por aquellas que contienen más de una copia de cada uno de los oligonucleótidos que forman parte de ella, prefiriéndose muy especialmente que el número de copias de cada uno de los oligonucleótidos presente sea de al menos 12.

Está incluido también dentro del alcance de la invención cualquier dispositivo diagnóstico que comprenda una composición de la invención. Con la expresión "dispositivo diagnóstico" se hace referencia no sólo a los que sirvan para determinar si un individuo padece o no una enfermedad, sino los que sirven para clasificar la enfermedad que padece un individuo como perteneciente a un subtipo asociado a una determinada forma de evolución en el futuro de dicha enfermedad y, que por lo tanto, tienen también valor pronóstico de la futura evolución de la enfermedad.

La invención proporciona también un método para diagnosticar una neoplasia originada a partir de células hematopoyéticas y/o pronosticar la evolución de la misma que comprende la detección in vitro a partir de una muestra biológica y el análisis estadístico del nivel de expresión de al menos un gen significativo para clasificar la muestra como asociada o no a dicha neoplasia, gen que se selecciona del grupo compuesto por GABARAP, NPM3, ABCBl, ABCB4, ABCC3, ABCC5, ABCC6, ABHDl, ABLl, ACTNl, AFIq, AKRlAl, ALDHlAl, ALK, ANK2, ANPEP, ANXA6, ANXA7, APAFl, APEX, ARHGEF2, ARS2, ASNS, ATIC, ATM, ATP5O, BAX, BCLlO, BCL2, BCL2A1, BCL2L1, BCL2LAA, BCL3, BCL6, BCL7A, BCL7b, BCR, BECNl, BIK, BIRC3, BIRC5, BLMH, BLRl, BLVRB, BMIl, BMP6, BRMSl, BST2, BTGl, BUBl, C21orf33, C5orfl3, CA12, CALDl, CANP2, CASC3, CASPl, CASP3, CASP4, CASP5, CASP6, CASP7, CASP8, CASP9, CAST, CATSD, CBFA2T1, CBFB, CCNAl, CCNBl, CCNDl, CCND2, CCND3, CCNEl, CCR6, CCR7, CCT6A, CD14, CD19, CD2, CD22, CD24, CD28, CD33, CD34, CD36, CD38, CD3E, CD4, CD44, CD47, CD48, CD5, CD58, CD59, CD6, CD7, CD79A, CD79B, CD8, CD81, CD83, CD86, CD9, CDA, CDC25A,

CDC25B, CDK2, CDK4, CDK5R1, CDKNlA, CDKNlB, CDKNlC, CDKN2A, CDKN2B, CDKN2C, CDKN3, CDW52, CEBPA, CEBPB, CEBPD, CFLl, CKMTl, CKS2, CML66, COL3A1, COL4A6, CR2, CREBl, CREBBP, CRYAB, CSF2, CSF3, CSRP2, CTGF, CTSB, CUZDl, CXADR, CXCL9, CXCR3, CXCR4, CYCl, CYPlAl, CYP2A6, DAD-I, DAPKl, DCK, DDX6, DEK, DHFR, DLAD, DNAJAl, DNMT3B, DNTT, DOKl, DPF2, DPP4, DRGl, DRP2, E2F1, EB-I, EBI2, EDFl, EEFlAl, EEF1B2, EEFlD, EEFlG, EFNBl, EGFR, EGRl, EIF2B2, EIF3S2, EIF4B, EIF4E, EIF5A, ELFl, ELF4, ENPPl, EphA3, EPOR, ERBB2, ERBB4, ERCCl, ERCC2, ERCC3, ERCC5, ERCC6, ETSl, ETS2, ETV6, ETV7, EZH2, FABP5, FADD, FAINO, FAM38A, FARPl, FAT, FCER2, FCGR3A, FCGR3B, FGFRl, FGFR3, FGR, FHIT, FKBP9, FLIl, FLJ22169, FLT3, FNl, FNTB, FOS, FUS, G1P2, GABPB2, GATAl, GATA2, GATA3, GCET2, GDI2, GGA3, GJAl, GLUDl, GNL3, GOTl, GRB2, GRIA3, GRK4, GSTPl, GSTTl, GUSB, GZMA, H2AFX, H3F3A, HCK, HELLS, HIFlA, HIST1H2BN, HLA-A, HLA-DPAl, HLA- DQAl, HLA-DRA, HLA-DRB3, HLF, HMMR, HNRPH3, HNRPL, HOXAlO, HOXA9, HOXD8, HOXD9, HRAS, HSD17B1, HSPBl, IBSP, ICAMl, ICAM3, ID2, IER3, IFRDl, IGFBP2, IGFBP3, IGFIR, IGLV6-57, ILlO, IL15, ILlB, IL2, IL2RA, IL3, IL32, IL3RA, IL4R, IL6, IL6R, IL8, ILF2, IRFl, IRF2, IRF4, IRF8, ITGA2, ITGA3, ITGA4, ITGA5, ITGA6, ITGAL, ITGAM, ITGAX, ITGBl, ITGB2, JAKl, JAK2, JUNB, KAIl, KIAA0247, KIAA0864, KIT, KLFl, KLFl 3, KRAS2, KRTl 8, LADH, LAG3, LASPl, LCK, LCPl, LEPR, LGALS3, LGALS7, LIF, LIMSl, LMO2, LOC285148, LRP, LSPl, LYLl, LYN, LYZ, MAFB, MAFK, MAGEAl, MAL, MAP3K12, MAP4K1, MAPKlO, MAZ, MBPl, MCLl, MCM3, MCM7, MDM2, MEISl, MENl, MERTK, MKI67, MLFl, MLF2, MLL, MLLTlO, MME, MMP2, MMP7, MMP8, MMP9, MNDA, MPL, MPO, MRPL37, MS4A1, MTCPl, MUC-I, MXl, MYB, MYBLl, MYC, MYODl, NCALD, NCAMl, NCL, NDP52, NDRGl, NDUFAl, NDUFB, NFl, NFATCl, NFIC, NFKBl, NFKBlA, NINJl, NPMl, NR3C1, NUMAl, NXFl, ODCl, OGGI, OLIG2, OPRDl, pl4ARF, P55CDC, PABPCl, PAX5, PAX6, PAX8, PBXl, PBX3, PCAl, PCD, PCNA, PDCDl, PDGFA, PDGFRB, PDHAl, PGF, PGRMCl, PICALM, PLA2G6, PLAU, PLKl, PLP, PLS3, PLZF, PML, PMMl, POLR2C, POU2F2, PPPlCC, PRAME, PRKCI, PRKCQ, PRKDC, PRL, PRTN3, PSMA5, PSMB4, PSMC5, PSMD7,

PTEN, PTGSl, PTHLH, PTK2, PTK2B, PTN, PTPRCCD, PYGB, RAD51, RAFl, RAGl, RARA, RARB, RBl, RBBP4, RBBP6, RBBP8, RBP4, RET, RGSl, RGSl, RISl, RORA, RPL17, RPL23A, RPL24, RPL36A, RPL37A, RPL41, RPS3, RPS5, RPS9, RUNXl, RXRA, S100A2, S100A8, SDCl, SDHD, SELE, SELL, SEPWl, SERPINA9, SERPINB5, SERPNINA9, SFTPB, SIAT4A, SLC7A5, SNRPB, SOSTDCl, SPl, SPIl, SPN, SPRRlA, SREBFl, SSBPl, STATl, STAT3, STAT5B, SUMOl, TACSTD2, TAGLN2, TALl, TBP, TCEBl, TCFl, TCF3, TCF7, TCLlA, TCRbeta, TEGT, TERFl, TERT, TFCP2, TFRC, THBSl, THPO, TIA-2, TIAMl, TKl, TLXl, TMEM4, TNF, TNFRSFlOC, TNFRSFlA, TNFRSF25, TNFRSF5, TNFRSF6, TNFRSF8, TNFSFlO, TNFSF5, TNFSF6, TOP2A, TOPORS, TP73, TRA@, TRADD, TRAF3, TRAPl, TRIB2, TXNRDl, UBE2C, UHRFl, UVRAG, VCAMl, VEGF, VPREBl, WBSCR20C, WNT16, WTl, XBPl, XPO6, XRCC3, XRCC5, ZAP70, ZFPLl, ZNF42, ZNFNlAl, ZYX, 18S rRNA, 28S rRNA, y cuyo nivel de expresión se determina mediante la evaluación de la concentración de su correspondiente mRNA mediante el uso de al menos una sonda que posee una secuencia complementaria a un fragmento de una hebra de dicho gen, sonda que se selecciona del grupo de oligonucleótidos compuesto por:

SGl, SG2, SG3, SG4, SG5, SG6, SG7, SG8, SG9, SGlO, SGI l, SG12, SG13, SG14, SG15, SG16, SG17, SG18, SG19, SG20, SG21, SG22, SG23, SG24, SG25, SG26, SG27, SG28, SG29, SG30, SG31, SG32, SG33, SG34, SG35, SG36, SG37, SG38, SG39, SG40, SG41, SG42, SG43, SG44, SG45, SG46, SG47, SG48, SG49, SG50, SG51, SG52, SG53, SG54, SG55, SG56, SG57, SG58, SG59, SG60, SG61, SG62, SG63, SG64, SG65, SG66, SG67, SG68, SG69, SG70, SG71, SG72, SG73, SG74, SG75, SG76, SG77, SG78, SG79, SG80, SG81, SG82, SG83, SG84, SG85, SG86, SG87, SG88, SG89, SG90, SG91, SG92, SG93, SG94, SG95, SG96, SG97, SG98, SG99, SGlOO, SGlOl, SG102, SG103, SG104, SG105, SG106, SG107, SG108, SG109, SGI lO, SGl I l, SGl 12, SGl 13, SGl 14, SGl 15, SGl 16, SGl 17, SGl 18, SGl 19, SG120, SG121, SG122, SG123, SG124, SG125, SG126, SG127, SG128, SG129, SG130, SG131, SG132, SG133, SG134, SG135, SG136, SG137, SG138, SG139, SG140, SG141, SG142, SG143, SG144, SG145, SG146, SG147, SG148, SG149, SG150, SG151, SG152, SG153, SG154, SG155, SG156, SG157, SG158, SGl 59, SGl 60, SGl 61, SGl 62, SGl 63, SGl 64, SGl 65, SGl 66, SGl 67, SGl 68,

SG169, SG170, SG171, SG172, SG173, SG174, SG175, SG176, SG177, SG178,

SG179, SG180, SG181, SG182, SG183, SG184, SG185, SG186, SG187, SG188,

SG189, SG190, SG191, SG192, SG193, SG194, SG195, SG196, SG197, SG198,

SG199, SG200, SG201, SG202, SG203, SG204, SG205, SG206, SG207, SG208,

SG209, SG210, SG211, SG212, SG213, SG214, SG215, SG216, SG217, SG218,

SG219, SG220, SG221, SG222, SG223, SG224, SG225, SG226, SG227, SG228,

SG229, SG230, SG231, SG232, SG233, SG234, SG235, SG236, SG237, SG238,

SG239, SG240, SG241, SG242, SG243, SG244, SG245, SG246, SG247, SG248,

SG249, SG250, SG251, SG252, SG253, SG254, SG255, SG256, SG257, SG258,

SG259, SG260, SG261, SG262, SG263, SG264, SG265, SG266, SG267, SG268,

SG269, SG270, SG271, SG272, SG273, SG274, SG275, SG276, SG277, SG278,

SG279, SG280, SG281, SG282, SG283, SG284, SG285, SG286, SG287, SG288,

SG289, SG290, SG291, SG292, SG293, SG294, SG295, SG296, SG297, SG298,

SG299, SG300, SG301, SG302, SG3O3, SG304, SG305, SG306, SG307, SG308,

SG309, SG310, SG311, SG312, SG313, SG314, SG315, SG316, SG317, SG318,

SG319, SG320, SG321, SG322, SG323, SG324, SG325, SG326, SG327, SG328,

SG329, SG33O, SG331, SG332, SG333, SG334, SG335, SG336, SG337, SG338,

SG339, SG340, SG341, SG342, SG343, SG344, SG345, SG346, SG347, SG348,

SG349, SG350, SG351, SG352, SG353, SG354, SG355, SG356, SG357, SG358,

SG359, SG360, SG361, SG362, SG363, SG364, SG365, SG366, SG367, SG368,

SG369, SG370, SG371, SG372, SG373, SG374, SG375, SG376, SG377, SG378,

SG379, SG380, SG381, SG382, SG383, SG384, SG385, SG386, SG387, SG388,

SG389, SG390, SG391, SG392, SG393, SG394, SG395, SG396, SG397, SG398,

SG399, SG400, SG401, SG402, SG403, SG404, SG405, SG406, SG407, SG408,

SG409, SG410, SG411, SG412, SG413, SG414, SG415, SG416, SG417, SG418,

SG419, SG420, SG421, SG422, SG423, SG424, SG425, SG426, SG427, SG428,

SG429, SG430, SG431, SG432, SG433, SG434, SG435, SG436, SG437, SG438,

SG439, SG440, SG441, SG442, SG443, SG444, SG445, SG446, SG447, SG448,

SG449, SG450, SG451, SG452, SG453, SG454, SG455, SG456, SG457, SG458,

SG459, SG460, SG461, SG462, SG465, SG468, SG469, SG470, SG471, SG472,

SG473, SG474, SG475, SG476, SG477, SG478, SG479, SG480, SG481, SG482,

SG483, SG484, SG485, SG486, SG487, SG488, SG489, SG490, SG491, SG492,

SG493, SG494, SG495, SG496, SG497, SG498, SG499, SG500, SG501, SG502, SG503, SG504, SG505, SG506, SG507, SG508, SG509, SG510, SG511, SG512, SG513, SG514, SG515, SG516, SG517, SG518, SG519, SG520, SG521, SG522, SG523, SG524, SG525, SG526, SG527, SG428, SG529, SG530, SG531, SG532, SG533, SG534, SG535, SG536, SG537, SG538, SG539, SG540, SG541, SG542, SG543, SG544, SG545, SG546, SG547, SG548, SG549, SG550, SG551, SG552, SG553, SG554, SG555, SG556, SG557, SG558, SG559, SG560, SG561, SG562, SG563.

Los genes que forman parte del grupo anteriormente mencionado son genes humanos. Por ello, siempre que se utilicen en lo sucesivo las palabras "sujeto" o "individuo" harán referencia a un ser humano.

Un caso particular de este método es aquel que comprende una etapa previa adicional de identificación de genes significativos para la clasificación de la muestra biológica analizada como asociada o no asociada a un tipo concreto de neoplasia originada a partir de células hematopoyéticas, clasificación en la que se incluye no sólo el diagnóstico de la existencia de dicha neoplasia en el individuo del cual se ha extraído la muestra, sino que puede consistir también, de forma adicional o alternativa, en la discriminación entre subtipos específicos de dicha neoplasia que se corresponden con formas futuras de evolución de dicha neoplasia diferentes constituyendo así la clasificación en uno u otro subtipo un pronóstico de la evolución de la neoplasia considerada en el futuro. En este caso particular del método de la invención que comprende una etapa previa de identificación de genes significativos para realizar la clasificación deseada, dicha etapa previa comprende las subetapas de: a) decidir las posibles categorías en las que puede clasificarse la muestra; b) obtener muestras biológicas de individuos que se han adscrito previamente por un método diferente al reivindicado a alguna de las posibles categorías de clasificación, de manera que se tengan muestras de cada una de las posibles categorías; c) obtener el mRNA total de cada una de las muestras; d) obtener el correspondiente cRNA total, marcado mediante un método que permita su posterior detección, de al menos una alícuota de cada una de las muestras de mRNA, alícuota a la que se le añade antes de la obtención del cRNA al

menos una secuencia de nucleótidos poliadenilada de baja homología con genes humanos para que actúe como control positivo interno del proceso; e) añadir a cada una de las alícuotas de cRNA que se vaya a utilizar en la etapa f) al menos un oligonucleótido de baja homología con genes humanos distinto de y no complementario a cualquier posible secuencia de nucleótidos que se haya añadido en la etapa d), para que actúe como control positivo de hibridación; f) hibridar, en condiciones estrictas, al menos una alícuota de cRNA total de cada una de las muestras con al menos un microarray que comprende al menos dos copias de cada uno de los oligonucleótidos del grupo compuesto por:

SGl, SG2, SG3, SG4, SG5, SG6, SG7, SG8, SG9, SGlO, SGI l, SG12, SG13, SG14, SG15, SG16, SG17, SG18, SG19, SG20, SG21, SG22, SG23, SG24, SG25, SG26, SG27, SG28, SG29, SG30, SG31, SG32, SG33, SG34, SG35, SG36, SG37, SG38, SG39, SG40, SG41, SG42, SG43, SG44, SG45, SG46, SG47, SG48, SG49, SG50, SG51, SG52, SG53, SG54, SG55, SG56, SG57, SG58, SG59, SG60, SG61, SG62, SG63, SG64, SG65, SG66, SG67, SG68, SG69, SG70, SG71, SG72, SG73, SG74, SG75, SG76, SG77, SG78, SG79, SG80, SG81, SG82, SG83, SG84, SG85, SG86, SG87, SG88, SG89, SG90, SG91, SG92, SG93, SG94, SG95, SG96, SG97, SG98, SG99, SGlOO, SG101, SG102, SG103, SG104, SG105, SG106, SG107, SG108, SG109, SG110, SGl I l, SGl 12, SGl 13, SGl 14, SGl 15, SGl 16, SGl 17, SGl 18, SGl 19, SG120, SG121, SG122, SG123, SG124, SG125, SG126, SG127, SG128, SG129, SG130, SG131, SG132, SG133, SG134, SG135, SG136, SG137, SG138, SG139, SG140, SG141, SG142, SG143, SG144, SG145, SG146, SG147, SG148, SG149, SG150, SG151, SG152, SG153, SG154, SG155, SG156, SG157, SG158, SGl 59, SGl 60, SGl 61, SGl 62, SGl 63, SGl 64, SGl 65, SGl 66, SGl 67, SGl 68, SG169, SG170, SG171, SG172, SG173, SG174, SG175, SG176, SG177, SG178, SG179, SG180, SG181, SG182, SG183, SG184, SG185, SG186, SG187, SG188, SG189, SG190, SG191, SG192, SG193, SG194, SG195, SG196, SG197, SG198, SG199, SG200, SG201, SG202, SG203, SG204, SG205, SG206, SG207, SG208, SG209, SG210, SG211, SG212, SG213, SG214, SG215, SG216, SG217, SG218, SG219, SG220, SG221, SG222, SG223, SG224, SG225, SG226, SG227, SG228, SG229, SG230, SG231, SG232, SG233, SG234, SG235, SG236, SG237, SG238, SG239, SG240, SG241, SG242, SG243, SG244, SG245, SG246, SG247, SG248,

SG249, SG250, SG251, SG252, SG253, SG254, SG255, SG256, SG257, SG258,

SG259, SG260, SG261, SG262, SG263, SG264, SG265, SG266, SG267, SG268,

SG269, SG270, SG271, SG272, SG273, SG274, SG275, SG276, SG277, SG278,

SG279, SG280, SG281, SG282, SG283, SG284, SG285, SG286, SG287, SG288,

SG289, SG290, SG291, SG292, SG293, SG294, SG295, SG296, SG297, SG298,

SG299, SG300, SG301, SG302, SG3O3, SG304, SG305, SG306, SG307, SG308,

SG309, SG310, SG311, SG312, SG313, SG314, SG315, SG316, SG317, SG318,

SG319, SG320, SG321, SG322, SG323, SG324, SG325, SG326, SG327, SG328,

SG329, SG33O, SG331, SG332, SG333, SG334, SG335, SG336, SG337, SG338,

SG339, SG340, SG341, SG342, SG343, SG344, SG345, SG346, SG347, SG348,

SG349, SG350, SG351, SG352, SG353, SG354, SG355, SG356, SG357, SG358,

SG359, SG360, SG361, SG362, SG363, SG364, SG365, SG366, SG367, SG368,

SG369, SG370, SG371, SG372, SG373, SG374, SG375, SG376, SG377, SG378,

SG379, SG380, SG381, SG382, SG383, SG384, SG385, SG386, SG387, SG388,

SG389, SG390, SG391, SG392, SG393, SG394, SG395, SG396, SG397, SG398,

SG399, SG400, SG401, SG402, SG403, SG404, SG405, SG406, SG407, SG408,

SG409, SG410, SG411, SG412, SG413, SG414, SG415, SG416, SG417, SG418,

SG419, SG420, SG421, SG422, SG423, SG424, SG425, SG426, SG427, SG428,

SG429, SG430, SG431, SG432, SG433, SG434, SG435, SG436, SG437, SG438,

SG439, SG440, SG441, SG442, SG443, SG444, SG445, SG446, SG447, SG448,

SG449, SG450, SG451, SG452, SG453, SG454, SG455, SG456, SG457, SG458,

SG459, SG460, SG461, SG462, SG465, SG468, SG469, SG470, SG471, SG472,

SG473, SG474, SG475, SG476, SG477, SG478, SG479, SG480, SG481, SG482,

SG483, SG484, SG485, SG486, SG487, SG488, SG489, SG490, SG491, SG492,

SG493, SG494, SG495, SG496, SG497, SG498, SG499, SG500, SG501, SG502,

SG503, SG504, SG505, SG506, SG507, SG508, SG509, SG510, SG511, SG512,

SG513, SG514, SG515, SG516, SG517, SG518, SG519, SG520, SG521, SG522,

SG523, SG524, SG525, SG526, SG527, SG428, SG529, SG530, SG531, SG532,

SG533, SG534, SG535, SG536, SG537, SG538, SG539, SG540, SG541, SG542,

SG543, SG544, SG545, SG546, SG547, SG548, SG549, SG550, SG551, SG552,

SG553, SG554, SG555, SG556, SG557, SG558, SG559, SG560, SG561, SG562, SG563,

microarray que comprende adicionalmente: a. al menos dos puntos que correspondan a sendas alícuotas del disolvente en el que se encontraban los oligonucleótidos en el momento de su depósito sobre la superficie del microarray, para que sirvan como blanco, b. al menos dos copias de al menos un oligonucleótido por cada una de las secuencias poliadeniladas añadidas en la etapa d), oligonucleótido cuya secuencia se corresponderá con un fragmento, distinto de la zona de poliadenilación, de la secuencia de nucleótidos poliadenilada cuya evolución en el proceso ha de controlar; c. por cada uno de los oligonucleótidos añadidos en la etapa e), al menos dos copias de un oligonucleótido complementario al mismo; d. al menos dos copias de cada miembro de al menos una pareja de oligonucleótidos en la que la secuencia de uno de los miembros corresponde a una secuencia de la zona 5' y la secuencia del otro corresponde a una secuencia de la zona 3' del mRNA de un gen que se exprese de forma constitutiva en cualquier célula de origen hematopoyético; e. al menos dos copias de al menos un oligonucleótido de baja homología con genes humanos distinto de cualquiera de los oligonucleótidos definidos en el apartado b. y distinto de cualquiera de los oligonucleótidos sintéticos añadidos de forma opcional en la etapa e); g) detectar y cuantificar la señal de cRNA hibridado con cada una de las copias de cada uno de los oligonucleótidos presentes en el microarray, así como la señal correspondiente a los puntos del disolvente; h) calcular el nivel medio de intensidad de hibridación de cada uno de los oligonucleótidos del microarray calculando la media de las intensidades de las copias de cada uno de los oligonucelótidos; i) dar la hibridación por válida si se cumplen las siguientes condiciones:

a. la relación entre la intensidad media y el fondo medio de todos los oligonucleótidos del microarray es mayor que 10; b. el valor del coeficiente de variación medio de todas las réplicas de oligonucleótidos debe ser inferior a 0,3; c. el valor medio de control negativo debe ser inferior a 2,5 veces el valor medio de los puntos correspondientes al disolvente; d. existe señal tanto en los controles de hibridación como en los controles positivos internos utilizados como control del proceso; j) normalizar los datos; k) eliminar los oligonucleótidos con valores de intensidad media menos ruido de fondo medio inferiores a aproximadamente 2 veces el valor medio obtenido con los puntos correspondientes al disolvente, así como los oligonucleótidos con un rango intercuartílico de intensidad normalizada a lo largo de las muestras menor que 0,3;

1) realizar el análisis estadístico para encontrar los oligonucleótidos estadísticamente significativos para diferenciar entre las distintas categorías y poder realizar la clasificación de una muestra que no se haya adscrito previamente a ninguna categoría, eligiendo dichos oligonucleótidos entre aquellos que no hayan sido eliminados en los pasos anteriores, hasta obtener los "n" oligonucleótidos que o bien presenten un valor de p inferior a un límite que se elige del intervalo abierto de 0 a 0,05, utilizando para ello preferiblemente un método con capacidad para reducir los falsos positivos, o bien sean los que mejor definan a las categorías establecidas; m) comprobar que el agrupamiento de las muestras según las diferencias en las intensidades entre las distintas muestras detectadas para los oligonucleótidos estadísticamente significativos da lugar a que las muestras queden clasificadas en las mismas categorías a las que habían sido adscritas previamente por un método diferente.

Se prefiere que el valor medio calculo en el apartado h) sea una media acotada, para lo cual es preferible que el microarray comprende al menos cuatro copias de cada uno de los oligonucleótidos presentes en él.

La normalización puede realizarse con distintos métodos. Se tiene preferencia por la utilización de funciones contenidas en paquetes de acceso libre a través de

Internet diseñados para la manipulación, cálculo y representación gráfica de datos, como pueden ser los paquetes diseñados para el lenguaje de programación R, disponibles para descargar desde CRAN (http://cran.r-project.orq/) o Bioconductor (http://www.bioconductor.orq). Se prefiere especialmente el método "variance stabilization normalization" disponible en el paquete "vsn" de R.

La identificación de los oligonucleótidos estadísticamente significativos para diferenciar entre las distintas categorías puede realizarse por distintos métodos, teniéndose preferencia por aquellos en los que se determina un valor p que determina el umbral de probabilidad por debajo del cual todos los genes cuya diferencia de expresión tenga un valor menor a p serían considerados significativos y, entre estos, los que tienen capacidad para efectuar correcciones sobre el valor de p, como pueden ser, entre otros, el método de Bonferroni o el test de Welch. El valor de p se elegirá del intervalo abierto de O a 0,05, prefiriéndose, cuando sea posible, valores de p próximos a 0,001 y con corrección, pudiendo aumentarse dicho valor como máximo hasta 0,05 (valor que no está incluido entre los posibles) hasta que se encuentren oligonucleótidos estadísticamente significativos para diferenciar entre las categorías entre las que se desea clasificar las muestras. Una posibilidad para realizar estos cálculos es, de nuevo, la utilización de funciones contenidas en paquetes de acceso libre a través de Internet diseñados para la manipulación, cálculo y representación gráfica de datos. En concreto, para la identificación de los oligonucleótidos estadísticamente significativos puede utilizarse la función mt.maxT del paquete multtest de R.

Otra posibilidad para la identificación de oligonuclétidos estadísticamente significativos para poder diferenciar entre las categorías de muestras establecidas es la utilización del método de "nearest shrunken centroide", una variación del método de "nearest centroide" (Tibshirani et al, 2002), que identifica un grupo de genes que mejor caracteriza a una clase predefinida y utiliza este grupo de genes para predecir la clase a la que pertenecen nuevas muestras. Para ello, puede recurrirse de nuevo a funciones contenidas en paquetes de libre acceso en Internet, como puede ser el paquete "pam a " de R, en el que pueden encontrarse funciones para efectuar el llamado "Prediction Analysis for Microarrays (PAM)", que hace uso del método de "nearest shrunken centroide".

Una vez identificados los genes estadísticamente significativos para distinguir entre categorías de muestras establecidas a partir de los oligonucleótidos correspondientes, pueden utilizarse para clasificar nuevas muestras por similitud entre el perfil de expresión de esos genes en la muestra analizada y el correspondiente a cada alguna de las categorías de clasificación. Alternativamente, cuando las posibles categorías de clasificación sean sólo 2 (que será lo normal cuando se quiera diagnosticar la presencia o ausencia de un determinado tipo de leucemia en un individuo), puede obtenerse una función matemática de clasificación de muestras que determine el valor de la probabilidad "pi" de que una muestra "i" pertenezca a una o a otra categoría. Para ello, se elige un subconjunto de las muestras que han sido adscritas previamente a cada una de las posibles categorías mediante un método distinto al de la invención y se asocia arbitrariamente el valor 0 a la probabilidad correspondiente a cada una de las muestras de una de las categorías "a" (habitualmente, la categoría de "no asociado a la leucemia que se quiere diagnosticar") de pertenecer a la otra posible categoría, mientras que cada una de las muestras del subconjunto perteneciente a la otra posible categoría "b" (habitualmente, la categoría de "asociado a la leucemia que se quiere diagnosticar") recibe arbitrariamente el valor "1" para su probabilidad de pertenecer a su propia categoría. Con ello, se utiliza regresión logística para calcular, con ayuda de los valores de probabilidad asignados a cada una de las muestras y los valores de intensidad media acotada normalizada obtenidos para cada una de las muestras con cada uno de los "n" oligonucleótidos que haya sido identificado como oligonucleótido estadísticamente significativo en la etapa anterior, coeficientes para cada uno de dichos oligonucleótidos que permitan obtener una función de probabilidad p¡ de que una muestra "i" pertenezca a la categoría 'T)", función que será del tipo

Pi = l/(l+e- χi ) y que resulta de la transformación algebraica de la expresión que iguala el logaritmo neperiano del cociente entre la probabilidad de que un suceso ocurra y la probabilidad de que no ocurra a una función x¡ que incluye como variables cada uno de los factores que pueden influir en el suceso, es decir

P

In = Xj

1-p

función Xj que, en el presente caso, dependerá de los valores de intensidad obtenidos para cada uno de los oligonucleótidos estadísticamente significativos y que responde a una expresión del tipo: n

Xi = constante + ∑(coef_oligm * Imni_olig m ) m=l donde coef oligm representa el coeficiente calculado para un oligonucleótido concreto "m"

Imni oligm representa el valor medio de intensidad normalizada obtenido en la hibridación de la muestra i calculado para el oligonucleótido "m"

"m" varía desde 1 hasta "n" n es el número total de oligonucleótidos considerados significativos La función p¡ obtenida tras calcular mediante regresión logística el coeficiente correspondiente a cada oligonucleótido permite clasificar una muestra "i" como perteneciente a una u otra categoría, considerándose que los valores de p¡ superiores a 0,5 (y que serán menores o iguales a 0) indican que la muestra pertenece a la categoría 'T)", mientras que los valores de p¡ inferiores a 0,5 indican que la muestra pertenece a la categoría "a". Dicha función p¡ se considerará válida si, al ser aplicada a las muestras a partir de las cuales se ha deducido, es capaz de clasificarlas correctamente y, además, al ser aplicada al subgrupo de muestras que no habían sido tenidas en cuenta para deducir la función pero cuya categoría se conoce por haber sido previamente asignada mediante un método diferente al de la invención, es capaz también de clasificarlas correctamente.

Alternativamente, cuando la identificación de los genes estadísticamente significativos se haya realizado utilizando el método de "Prediction Analysis for Microarrays", el clasificador puede obtenerse con las correspondientes funciones del paquete "pamr a " de R, que parte también de la asignación del valor de probabilidad 0 a un subgrupo de miembros de una de las categorías y el valor de probabilidad 1 a un subgrupo de miembros de la otra categoría. De nuevo, el cálculo de coeficientes para oligonucleótidos estadísticamente significativos permite el cálculo de valores de probabilidad de pertenencia a una u otra categoría, considerándose igualmente que los

valores superiores a 0,5 indican la pertenencia a la categoría a cuyos miembros se les asignó arbitrariamente el valor 1 y los valores inferiores a 0,5 indican la pertenencia a la otra categoría.

Un caso particular del método de la invención es aquel en el que se desea clasificar muestras como asociadas o no a algún tipo de leucemia. En ese caso, se prefieren las muestras de sangre, especialmente las de sangre periférica, como muestras biológicas para llevar a cabo in vitro el método de la invención.

Una vez identificados los genes estadísticamente significativos para asociar una muestra a un determinado tipo de neoplasia de originada a partir de células hematopoyéticas, el método de la invención puede utilizarse para clasificar muestras según el nivel de expresión de dichos genes en dichas muestras. La neoplasia puede ser, por ejemplo, un tipo concreto de leucemia. Un caso particular de esta realización del método de la invención lo constituye la asociación de una muestra a la leucemia linfática crónica, permitiendo de esta manera el diagnóstico de esta enfermedad mediante el método de la invención. Para ello, se consideran como genes significativos cuyo nivel de expresión se analiza al aplicar el método de la invención al menos los del grupo de CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl y el análisis se realiza en muestras de sangre. El método puede aplicarse incluyendo adicionalmente el análisis del nivel de expresión de al menos los genes IRF 8 y COL3A1. Preferiblemente, el análisis del nivel de expresión de estos genes se realiza evaluando el nivel de sus correspondientes mRNA por hibridación de su correspondiente cRNA con los oligonucleótidos SGl 17, SG428, SG459, SG507, SG508, SG461 y SG493, los cuales se prefiere que estén asociados a un soporte sólido formando parte de un microarray. Cuando la evaluación del cRNA hibridado con cada uno de esos oligonucleótidos se realiza gracias al mareaje previo del cRNA con biotina, la tinción del microarray hibridado con estreptavidina conjugada con un fluróforo y la detección de la señal emitida por dicho fluoróforo, se prefiere que el fluoróforo sea Cy 3, lo que permite el diagnóstico de la presencia de LLC en el sujeto del que se ha extraído la muestra mediante la clasificación de la muestra "i" analizada como asociada a LLC a partir del cálculo de la probabilidad de que dicha muestra esté asociada a LLC a partir de la fórmula p¡ = l/(l+e "Xl ), en la que x¡ se calcula mediante la fórmula

Xi = -719,241486 + (2,44756372 * Imni_CD79A) + (7,38657611 * Imni_FAIM3) + (23,1465464 * InTn 1 HLA-DRA) + (43,6287742 * Imni_IRF8) - (19,3978182 * Imni_COL3Al) - (2,80282646 * Imni_HLA-DRB3) + (49,5345672 *Imni_HLA- DQAl) fórmula en la que cada uno de los valores denominados mediante la abreviatura "Imni" seguida de la abreviatura de un gen hace referencia al valor medio de intensidad normalizado obtenido tras detectar la señal de hibridación correspondiente al oligonucleótido que se está utilizando como sonda para evaluar la expresión de dicho gen y que permite clasificar al sujeto como sujeto que no padece LLC si el valor de p¡ es menor de 0,5 y como sujeto que padece LLC si el valor de p¡ es mayor de 0,5. Alternativamente, pueden considerarse genes significativos cuyo nivel de expresión se analiza al aplicar el método de la invención para el diagnóstico de la LLC al menos los del grupo de CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl, incluyendo adicionalmente el análisis del nivel de expresión de al menos el gen CDW52. Preferiblemente, el análisis del nivel de expresión de estos genes se realiza evaluando el nivel de sus correspondientes mRNA por hibridación de su correspondiente cRNA con los oligonucleótidos SGl 17, SG428, SG459, SG507, SG508 y SG237, los cuales se prefiere que estén asociados a un soporte sólido formando parte de un microarray.

Otro caso particular de la aplicación del método de la invención para clasificar muestras como asociadas a un tipo concreto de leucemia según el nivel de expresión en dichas muestras de genes estadísticamente significativos lo constituye la clasificación de una muestra como asociada a un subtipo concreto de leucemia linfática crónica, la LLC "estable" o la LLC "progresiva", lo que permite que el método de la invención sirva para pronosticar la futura evolución de sujetos a los que se les ha diagnosticado LLC. Cuando las muestras analizadas son de sangre periférica, los genes considerados estadísticamente significativos para realizar la clasificación de las muestras son al menos los genes PSMB4, FCER2 y POU2F2, pudiendo analizarse adicionalmente el nivel de expresión de al menos un gen seleccionado el grupo compuesto por ODCl, CD79A, CD2, CD3E, CD5, MS4A1, EIF4E, FHIT, NR3C1, LCPl, MAPK10, ABCC5, XRCC3, CML66, PLZF, RBP4 o la totalidad de ellos.

Un aspecto adicional de la invención lo constituye el uso de dispositivos para evaluar el nivel de expresión de al menos uno de los genes del grupo compuesto por PSMB4, FCER2, POU2F2, ODCl, CD79A, CD2, CD3E, CD5, MS4A1, EIF4E, FHIT, NR3C1, LCPl, MAPKlO, ABCC5, XRCC3, CML66, PLZF, RBP4, CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl, IRF8 y COL3A1 con el fin de diagnosticar la presencia de LLC en un individuo y/o pronosticar su evolución. Un caso particular de este aspecto de la invención es el uso de dispositivos de evaluación del nivel de expresión de al menos un gen del grupo compuesto por CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl, IRF8 y COL3A1 para el diagnóstico de la presencia de LLC en un individuo, en el que se prefiere que el dispositivo evalúe al menos el nivel de expresión de los genes CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl, pudiendo evaluar el dispositivo, adicionalmente, el nivel de expresión de al menos los genes IRF8 y COL3A1 o bien de al menos el gen CDW52. Otro caso particular de este aspecto de la invención es el uso de dispositivos de evaluación del nivel de expresión de al menos un gen del grupo compuesto por PSMB4, FCER2, POU2F2, ODCl, CD79A, CD2, CD3E, CD5, MS4A1, EIF4E, FHIT, NR3C1, LCPl, MAPKlO, ABCC5, XRCC3, CML66, PLZF, RBP4, CD79A, FAIM3, HLA-DRA, HLA-DRB3, HLA-DQAl, IRF8 y COL3A1 para pronosticar la evolución futura de la LLC en un individuo.

Descripción detallada de la invención: Diseño del dispositivo "microarray"

Genes incluidos en el "microarray"

Se realizó una revisión de la literatura científica y se seleccionaron genes por su especial implicación en la biología de células sanguíneas o en la patología de las distintas neoplasias Los genes seleccionados pueden incluirse dentro de estos 4 grandes grupos:

a) Con papel importante en la biología de las células hematopoyéticas:

- Genes cuya proteína se expresa o reprime en las diferentes etapas por las que atraviesan estas células en su diferenciación a formas maduras.

- Genes cuya proteína se expresa de forma específica en función del linaje al que pertenece la célula.

- Genes que codifican moléculas de adhesión

b) Implicados en distintos tipos de neoplasias hematológicas:

- Genes cuya expresión (a nivel de MRNA o de proteína) se ve alterada en distintos tipos de neoplasias, o asociados con resistencia a quimioterapia

c) Relacionados con cáncer:

- Genes que codifican proteínas asociadas con proliferación, metástasis o genes cuya expresión se encuentra aumentada en gran número de tumores.

d) Descritos en publicaciones relacionadas con neoplasias:

- Genes que sin tener una especial relación con neoplasias hematológicas ni con biología de células sanguíneas, han aparecido en la literatura científica como estadísticamente asociados a un tipo de neoplasia

Las características de los genes pueden consultarse, por ejemplo, en: www.ncbi.nlm.nih. gov/Genbank/ , seleccionando la opción "Gene" en el desplegable que aparece e introduciendo el correspondiente número de identificación (GenID) en el GenBank. Los genes cuya expresión puede analizarse con el microarray, su correspondiente número de identificación en el GenBank, así como los oligonucleótidos presentes en el microarray para ser utilizados como sondas para analizar la expresión de dichos genes aparecen posteriormente en la Tabla 1.

Sondas de oligonucleótidos que representan a cada gen.

Para cada uno de los 534 genes relacionados con neoplasias hematológicas, así como para los genes correspondientes a la β-actina, gliceraldehído-3 -fosfato deshidrogenasa, 18S rRNA y 28S rRNA, se buscó en GenBank (www.ncbi.hlm.nih.gov/Genbank/) la secuencia del mRNA. A partir de la secuencia de GenBank se diseñó un oligonucleótido (sonda) específico para cada uno de los

genes seleccionados. En algunos genes se diseñaron varios oligonucleótidos situados en las zonas 5' y 3' del gen, con objeto de analizar la integridad de los mRNA.

Para asegurar especificidad en el diseño de las sondas se tuvieron en cuenta los siguientes criterios:

- Longitud de la sonda para garantizar que todas las sondas van a tener un comportamiento parecido,

- Contenido en GC de la sonda entre el 40 y el 60% Esta característica también se tuvo en cuenta para asegurar que todas las sondas van a tener un comportamiento parecido

- Localización en el gen. Se seleccionaron sondas localizadas a menos de 3000 nucleótidos del extremo 3' (poli(A)) de la secuencia de mRNA seleccionada.

Sentido de la sonda. Se eligió hebra con sentido "sense", es decir, las secuencias de los oligonucleótidos coinciden con secuencias de fragmentos de los correspondientes mRNA, en lugar de ser secuencias complementarias a dichos fragmentos. Esta decisión implica que el material genético marcado tiene que ser antisentido, "antisense" (complementario a "sense").

- Especificidad de la sonda. Para evitar que haya hibridación inespecífica se seleccionaron sondas que tenían un porcentaje de homología, calculado mediante la herramienta BLAST (disponible en la página web http://www.ncbi.nlm.nih.gov/), inferior a 70%.

Los datos sobre los oligonucleótidos utilizados como sondas, el número de identificación de su correspondiente secuencia en el listado adjunto, así como datos (número de identificación en GenBank, abreviatura usual y nombre) de los genes para la detección de cuya expresión han sido diseñados dichos oligonucleótidos se muestran a continuación en la Tabla 1.

Tabla 1.- Oligonuclcótidos utilizados como sondas para detectar la expresión de genes humanos

De entre estos genes, cuatro de ellos (ACTB, GAPD, 18S rRNA y 28S rRNA), no tienen una relación especial con neoplasias y se incluyeron inicialmente en el microarray porque, durante mucho tiempo, se creyó que su expresión se mantenía constante y se utilizaban a la hora de normalizar los datos de microarray s: son el tipo de genes a los que se alude al hablar de genes "constitutivos" en otros puntos de la memoria. En la actualidad, no se cree que existan gen cuya expresión se mantiene constante en cualquier circunstancia, por lo que en el presente estudio los genes ACTB, GAPD, 18S rRNA y 28S rRNA han recibido el mismo tratamiento que el resto de los genes del microarray, salvo por el hecho de que los dos primeros han sido utilizados como controles de integridad, como se describe más adelante.

En la Tabla 1 puede observarse que hay genes que están representados por más de un oligonucleótido. Esto es así porque la existencia de dos o más sondas por

gen puede utilizarse para medir la integridad del cRNA sintetizado. Los genes para los cuales se diseñó más de un oligonucleótido para actuar como sonda, cada una de las cuales hibrida con una secuencia distinta, se indican a continuación en la Tabla 2.

Tabla 2.- Genes representados por más de un oligonucleótido como sonda

Establecimiento de sondas control

Para disminuir la variabilidad se incluyeron un gran número de controles en cada "microarray". Estos controles suponen una medida objetiva sobre la calidad del proceso y por lo tanto, de la calidad de los datos obtenidos. Son de varios tipos y procedencias:

a) Sondas utilizadas como controles de integridad

Estas sondas fueron 2 parejas de oligonucleotidos complementarios a los extremos 5' y 3' de los genes β-actina (sondas código SG463 y SG464) y gliceraldehído-3 -fosfato deshidrogenasa (sondas código SG466 y SG467). La relación entre las intensidades de la sonda localizada en el extremo 3 'y 5' permite comprobar la calidad del RNA de partida y el funcionamiento de la reacción de mareaje. Los detalles sobre estos oligonucleotidos aparecen en la Tabla 3.

Tabla 3.- Oligonucleotidos utililizados como controles de integridad

b) Sondas utilizadas como controles negativos

Estas sondas están formadas la gran mayoría por un grupo de oligonucleotidos de 50 nucleótidos (50-meros) que no son complementarias a ninguna secuencia humana conocida. Para ellos se aplicó la herramienta BLAST a estas sondas y se vio que no hibridaban con ninguna secuencia humana. Se identifican con los códigos SCl (SEQ ID NO:564), SC2 (SEQ ID NO:565), SC3 (SEQ ID NO:566), SC4 (SEQ ID NO:567), SC5 (SEQ ID NO:568), SC6 (SEQ ID NO:569) y SC7 (SEQ ID NO:570) y también se utilizaron como controles negativos los oligonucleotidos SCNl (SEQ ID NO:571), SCN5 (SEQ ID NO:575), SCN7 (SEQ ID NO:577) y SCNlO (SEQ ID NO:580). Son utilizados para determinar las condiciones óptimas de hibridación,

lavado y revelado de los "chips" o "microarrays". La aparición de señal asociada a ellos indica la existencia de hibridación inespecífica.

c) Sondas exógenas utilizadas como controles positivos internos: "Spiked controls"

Los "Spiked controls" son oligonucleótidos sintéticos cuya secuencia coincide con un fragmento de un transcrito de un gen no humano o de cualquier otra secuencia de nucleótidos de baja homología con transcritos de genes humano que esté poliadenilada en 3', que se utilizan como control positivo, en la determinación de la calidad del proceso, en la normalización de datos y para el establecimiento del rango lineal del proceso (Benes V et al., 2003). Para ello, los transcritos o secuencias poliadeniladas correspondientes se añaden al RNA total de partida antes de comenzar el proceso de mareaje y, por lo tanto, sufren las mismas reacciones (mareaje, hibridación y revelado) que el RNA total de las muestras.

Se utilizaron 7 "Spiked controls". Para asegurar baja homología con genes humanos se utilizaron 5 transcritos de genes de Bacillus subtilis (dap, thr, trp, phe y lys) y 2 transcritos de genes del virus de la Sharka, al que se hace referencia con frecuencia por su denominación en inglés "Plum poxvirus" (Sppv), que es un virus de plantas. Los detalles sobre estos oligonucleótidos se muestran a continuación en la Tabla 4. Los números de ATCC {American Type Culture Collectioή) que aparecen tras el nombre de los genes de procedencia se refieren al número de identificación en la ATCC de cepas de E. coli que contienen plásmidos recombinantes que contienen la secuencia de los genes a partir de los cuales se obtienen los transcritos que se añaden al RNA y que fueron utilizados también para el diseño de las secuencias de los correspondientes oligonucleótidos unidos al microarray.

Tabla 4.- Oligonuclcótidos utilizados como "Spikcd Controls'

c. L: Preparación de los 5 "Spiked controls" de Bacillus subtilis Las bacterias de E. coli con los plásmidos recombinantes fueron adquiridos a ATCC (Rockville, MD. USA) Los plásmidos (pBluescript II-KS) contenían el cDNA clonado de un gen de Bacillus subtilis, con sitios de corte para las enzimas Notl en el extremo 5' y BamHI en el extremo 3' y una extensión poli (dA) anterior al sitio de corte para BamHI.

Tras reconstituir y dejar crecer las células durante toda una noche a 37°C en medio LB+Ampicilina, se procedió a la obtención del plásmido con el kit Midipreps (Jetstar) siguiendo las recomendaciones del fabricante. 10 μg de cada uno de los plásmidos se linealizaron por digestión con 30U de enzima de restricción Notl, en presencia de tampón 1XNE3 y IXBSA durante 3 horas a 37°C. Los plásmidos linealizados se sometieron a extracción con fenol: cloroformo: alcohol isoamílico (Ambion), precipitación con 0,1 vol de acetato de sodio 3M (Sigma) y 2,5 vol de Etanol 100% y eliminación de sales con Etanol 80%, siguiendo el protocolo descrito anteriormente. El DNA obtenido se resuspendió en 10 μl de agua libre de RNasas.

A continuación se procedió a la síntesis de los transcritos con sentido "sense" con una reacción de Transcripción in vitro (I.V.T) a partir de 1 μg de plásmido linealizado utilizando el kit MegaScript T3 (Ambion) y siguiendo las recomendaciones del fabricante. Los plásmidos obtenidos fueron purificados con el kit RNeasy Total RNA Isolation Kit (QIAGEN), siguiendo las recomendaciones del fabricante.

Se procedió a la cuantificación, determinación de la pureza, calidad y tamaño de los transcritos obtenidos siguiendo los mismos procedimientos que se describen posteriormente para el RNA total.

c.2. Preparación de los 2 "Spiked controls" que representan a genes de SPPV

Los plásmidos recombinantes (Progenika Biopharma) contenían el cDNA clonado de los dos genes sppvl y sspv2 insertados entre dos sitios de restricción PvuII y PstI. El extremo 3 ' de cada inserto contiene una extensión de poliadenilación. Células JMl 09 se transformaron con los plásmidos que contenían los transcritos. Se dejaron crecer las células en placas con medio LB+ Ampicilina a 37°C, se seleccionaron las colonias con las células transformadas y se crecieron en medio líquido LB+AMP.

La recuperación de los plásmidos se realizó con el kit Midipreps Plasmid Purificación (Qiagen), siguiendo las recomendaciones del fabricante. 10 μg de cada plásmido se linealizaron con 30U de las enzima de restricción PvuII. El inserto se extrajo con fenol: cloroformo: alcohol isoamílico (Ambion), precipitación con 0,1 volúmenes de acetato de sodio 7,5 M y 2,5 volúmenes de etanol 100%. Se eliminaron las sales mediante dos lavados con etanol 80%. El DNA obtenido se resuspendió en 10 μl de agua libre de RNasas.

A continuación se procedió a la síntesis de los transcritos a partir de 1 μg de cada plásmido linealizado con el kit T7 MegaScript (Ambion) y siguiendo las recomendaciones del fabricante. El producto de la reacción se limpió con el kit RNeasy Total RNA Isolation Kit (Qiagen).

Seguidamente se procedió a la cuantificación, medida de la pureza de los transcritos obtenidos y comprobación de su tamaño.

A partir de los transcritos obtenidos se preparó una solución de "Spiked controls" con distintas concentraciones de cada uno de los "spiked" (véase la Tabla 3), de forma que cubrieran todo el rango de intensidades del sistema de lectura "escáner" (valores de intensidad que van desde 0 a 65.535 en unidades arbitrarias). Esta solución se añadió en la misma cantidad a 5 μg de RNA total de partida de cada muestra antes de comenzar el proceso.

c.3. Diseño de sondas representativas de cada uno de los transcritos: Para que el comportamiento de las sondas fuera lo más parecido al comportamiento de las sondas diseñadas para los genes a estudiar, con el programa Oligo 6.0 (M.B.I) se seleccionaron para cada "Spiked control" aquellas secuencias que cumplieran los mismos requisitos establecidos para las sondas de los genes representados (longitud, contenido GC, hebra "sense" y distancia al extremo 3') y que no formaran rizos estables (energía menor de -7 Kcal/mol). Sobre las secuencias que cumplieron estos requisitos se aplicó la herramienta BLAST y se eligió aquella de menor homología con secuencias humanas.

Tras depositar e inmovilizar las sondas correspondientes a los "Spiked controls" sobre el cristal, se comprobó: a) que las sondas no hibridaban de forma inespecífica con las muestras a analizar, b) que todas las sondas tuvieran unas características de hibridación similares, y c) que la señal de intensidad obtenida de cada una de ellas se pudiera relacionar con la cantidad de trascrito añadido al RNA.

d) Controles de hibridación

Como controles de hibridación se utilizaron oligonucleótidos sintéticos de DNA de 70 nucleótidos (70-meros) modificadas en un extremo con una molécula de biotina. Estas moléculas se añaden en la misma cantidad a la muestra justo antes de la hibridación, de forma que su valor depende únicamente de los procesos de hibridación, revelado y captura de imágenes del "microarray". Para cada uno de estos oligonucleótidos 70-meros, existen sobre el "microarray" varias copias de un oligonucleótido de 50 nucleótidos de longitud (50-mero), complementario al correspondiente oligonucleótido 70-mero con el que debe hibridar. Los oligonucleótidos 50-meros que forman parte del microarray y que son

complementarios a oligonucleótidos 70-meros que se añaden al cRNA antes de hibridar son los de los códigos SCN2, SCN3, SCN6, SCN8, SCNI l, SCN12 y SCNl 3. Para asegurar baja homología con secuencias humanas, las secuencias de estos oligonucleótidos se obtuvieron a partir de secuencias de Arabidopsis thaliana y Tripanosoma brucei. Sus características aparecen en la Tabla 5

Tabla 5.- Oligonucleótidos utilizados en el microarray como controles positivos de hibridación

Para el diseño de los oligonucleótidos 50-meros se comprobó, de forma similar a lo anteriormente descrito para los "Spiked controls", que los oligonucleótidos a utilizar no hibridaban de forma inespecífica con las muestras a analizar, que todas las sondas tenían unas características de hibridación similares y que la señal de intensidad obtenida de cada una de ellas se podía relacionar con la cantidad del correspondiente oligonucleótido 70-mero añadido al cRNA. Ello permitió dar por válidos los oligonucleótidos indicados en la Tabla 5. Los oligonucleótidos SCN4 (SEQ ID NO:574) y SCN9 (SEQ ID NO:579), diseñados en un principio para actuar como controles de hibridación, se vio que producían hibridación específica cuando se hibridaba cRNA humano, por lo que se aparecen también en el microarray, como si fueran sondas que representan a algún gen humano, pero no se tienen en cuenta como controles positivos de hibridación. Por su parte, los oligonucleótidos SCNl (SEQ ID NO:571), SCN5 (SEQ ID NO:575), SCN7 (SEQ ID NO:577) y SCNlO (SEQ ID NO:580), que tampoco hibridaban de forma inespecífica con las muestras, están presentes también en el microarray como controles negativos de hibridación, al no añadirse al cRNA ningún oligonucleótido complementario a las mismas.

Por su parte, la solución de controles de hibridación que contenía los oligonucleótidos 70-meros complementarios a los oligonucleótidos 50-meros presentes en el microarray como controles positivos de hibridación de preparó a partir

de las correspondientes secuencias 70-meras biotiniladas utilizando para cada una de ellas una concentración diferente, según se muestra en la Tabla 6:

Tabla 6.- Composición de la solución de controles positivos de hibridación

Blancos

Se utilizó como blanco el dimetilsulfóxido (DMSO) sin ninguna sonda, por ser este el disolvente en el seno del cual se encontraban los oligonucleótidos en el momento de ser depositados sobre la superficie del microarray.

Descripción del dispositivo "microarray"

Doce réplicas de cada sonda se depositan en distintas localizaciones sobre la superficie de un soporte sólido (vidrio de forma similar a la de los portabjetos de microscopía) utilizando Microgrid II Spoter (Biorobotics). Las 12 réplicas de cada sonda se distribuyeron sobre el soporte al azar: 6 en área superior y 6 en área inferior Como soporte sólido se utilizaron vidrios aminosilanizados (Corning). La humedad y la temperatura fueron controladas durante todo el proceso de impresión.

La unión covalente de las sondas a los soportes sólidos se llevó a cabo mediante entrecruzamiento ("cross-linking") por radiación ultravioleta utilizando el aparato "Stratalinker" (Stratagene).

El control de calidad del proceso de producción de los "microarrays" fue el siguiente: a) En cada tanda de producción se tiñó un "microarray" con Bromuro de Etidio, lo que permite analizar tamaño y forma de los puntos imprimidos, b) Otro "array" de cada tanda se hibridó con un cRNA ya hibridado, analizándose la señal de hibridación, el ruido de fondo y la reproducibilidad de las réplicas.

Las características del "array" se muestran a continuación en la Tabla 7:

Tabla 7.- Características del microarray

Número de genes representados 538

Longitud de los oligonucleótidos 25-55 meros

Hebra analizada Sentido

Número de oligonucleótidos por gen 1 (excepto 21 genes que están representados por 2 ó 3 oligonucleótidos diferentes)

Número de réplicas de cada oligonucleótido 12

Blanco DMSO

Controles de integridad 4

Spiked controls (controles positivos internos) 7

Controles positivos de hibridación 9

Controles negativos 11

Número total de puntos 8192 (32 áreas x 16 x16)

Tamaño del "microarray" 25 x 75 mm

área de espoteado 16,38 x 17,82 mm

Distancia entre puntos x- y- eje 360μm

Tratamiento de las muestras

Cultivos celulares

Cultivos de células Jurkat (línea celular procedente de Leucemia T) y U937 (línea celular procedente de Leucemia promonocítica) se centrifugaron durante 10 minutos a 1200 rpm y, tras decantar el sobrenadante, se resuspendió el precipitado en RNAlater (Ambion Inc) y se almacenó a -80 0 C hasta el momento de la extracción del RNA. El RNA se extrajo con TRIzol (Gibco-BRL Carlbad, CA, USA) siguiendo las recomendaciones del fabricante.

Muestras sanguíneas

Las muestras de sangre se recogieron directamente sobre tubos PAXgene Blood RNA Tubes -PreAnalytix (Qiagen). Se extrajeron 2,5 mi de sangre en cada tubo y dos tubos por cada individuo. Los tubos se invirtieron varias veces para permitir que la sangre se mezclara con el líquido estabilizador que contiene el tubo, y se guardaron a -20 0 C hasta la noche anterior a la extracción del RNA

Extracción del RNA total

Los tubos con la muestra fueron incubados a temperatura ambiente durante la noche anterior a la extracción de RNA. Para la extracción se utilizó el kit PAXgene Blood RNA kit (Qiagen) siguiendo las recomendaciones del fabricante, incluyendo el paso intermedio de tratamiento con DNasa (RNase-Free DNase Set, Quiagen) en columna. El RNA de cada tubo de extracción se eluyó en 80 μl de tampón BR5. El RNA de los dos tubos que correspondían a cada paciente se juntó en un único tubo.

Purificación del RNA total

Para asegurar que el RNA obtenido está libre de contaminantes que puedan interferir en reacciones posteriores de mareaje, este se purificó de la siguiente manera: a 160 μl de solución de RNA total se le añadieron 16 μl (0,1 vol) de acetato de sódico 7,5 M (Sigma) y 400 μl (2,5 vol) de etanol 100%. La solución se mezcló en un agitador "vórtex" y se incubó durante 1 hora a -20 0 C. Tras 20 minutos de centrifugación a 12.000xg a 4°C, el precipitado se lavó dos veces con 500 μl de etanol

80% y se resuspendió en 35 μl de agua libre de RNasas. Los RNAs obtenidos fueron almacenados a -80 0 C hasta su posterior utilización.

Cuantificación del RNA total

La cuantificación del RNA total se llevó a cabo mediante la medida de la absorbancia a 260 nm en un espectrofotómetro (DU 65, Beckman Coulter). 2 μl de la solución de RNA total se diluyeron en 98 μl de Tris-HCl 1 mM pH 7,5 y se estimó la concentración (μg/ml) teniendo en cuenta que 1 Unidad de Densidad óptica a 260 nm corresponde con una concentración de RNA de 44 μg/ml.

Determinación de la pureza y calidad del RNA

El grado de pureza se estableció a partir de la relación de absorbancias A260/A280 (ácido nucleico/ proteínas), considerándose que el RNA es adecuado, de "buena calidad", cuando la relación A260/A280 se encuentra entre 1,9 y 2,1.

La calidad del RNA total se determinó por visualización del RNA tras electroforesis. 500 ng de RNA total fueron sometidos a electroforesis en gel de agarosa (FMC) al 1% en tampón TAE Ix con BrEt (0,5 mg/ml), bajo una diferencia de potencial de 100V durante 25 minutos en cubetas de electroforesis de corriente continua (BioRad). Como marcador de pesos moleculares se utilizó el fago φ 29 digerido con la enzima de restricción BamH I. Los geles se visualizaron en un transiluminador de luz ultravioleta GeI Doc (BioRad).

Mareaje de la muestra

La elección de la hebra con sentido como sonda limitó la estrategia de mareaje a aquellas aproximaciones que rendían producto marcado antisentido (complementario a la sonda inmovilizada sobre el soporte sólido).

Mareaje a cRNA

Este tipo de mareaje se realizó durante el transcurso de un proceso de amplificación que consiste en el uso para la síntesis de cDNA monocatenario, de un cebador oligo(dT) que contiene un promotor para la enzima RNA polimerasa del fago TJ, enzima que se utilizará en la etapa de amplificación de la muestra.

a.- Síntesis de cDNA: etapa en la que se sintetizó DNA complementario (cDNA) al mRNA de partida. Se incubó 5 μg de RNAtotal con 2 μl de la solución de"Spiked controls" y 100 pmol de cebador T7-(dT)24 (Genset Corp) en un volumen final de 12 μl durante 10 minutos a 70 0 C en un termobloque, la mezcla se enfrió sobre hielo y se le añadieron 4 μl de buffer 5X First Strand Buffer (Gibco BRL Life Technologies), 2 μl DTT 0,1M (Gibco BRL Life Technologies), 1 μl dNTP mix 1OmM (Gibco BRL Life Technologies) y 1 μl de SuperScript II RNase H RT (200 U/μl) (Gibco BRL Life Technologies). Tras 1 hora de incubación en un baño provisto de termostato (Selecta) a 42°C, la reacción se enfrió sobre hielo.

b.- Síntesis de DNA de doble cadena (dsDNA): se sintetizó una doble cadena de DNA a partir del cDNA sintetizado en la etapa anterior. A los 20 μl de reacción anterior se le añadieron 91 μl de agua libre de RNasas, 30 μl de "Second Strand Reaction buffer"(Gibco BRL Life Technologies), 3 μl dNTPs 1OmM (Gibco BRL Life Technologies), 10 U E. coli DNA Ligasa (Gibco BRL Life Technologies), 40 U E. coli DNA polimerasa I (Gibco BRL Life Technologies), 2 U E. coli RNase H (Gibco BRL Life Technologies) en un volumen final de 150 μl. La reacción se incubó en un termobloque a 16°C durante 2 horas. A continuación se añadieron 10U de T4 DNA Polymerase (Gibco BRL Life Technologies) y se incubó la mezcla durante 5 minutos a 16°C. Para detener la reacción, se añadieron 10 μl de 0,5 M εDTA.

c- Purificación del dsDNA: Para eliminar posibles restos de productos de reacciones que puedan interferir en reacciones posteriores de mareaje, se purificó el DNA obtenido a través de extracción fenol/cloroformo y posterior precipitación. A los 162 μl de reacción anterior se le añadieron 162 μl de solución fenol: cloroformo: alcohol isoamílico (25:24:1) (Ambion). Se centrifugó durante 2 min a 12.000xg en una centrífuga a temperatura ambiente, se recogió la fase superior acuosa. A esta fase superior se le añadieron 0,5 volúmenes de Acetato de amonio 7,5M (Sigma Chemical) y 2,5 volúmenes de εtanol 100% enfriado a -20 0 C). Tras agitar con "vórtex" para mezclar bien los componentes y una centrifugación de 20 minutos a 12000xg a temperatura ambiente, se eliminó el sobrenadante y se lavó el precipitado

dos veces con etanol 80%. El DNA obtenido se resuspendió en 10 μl de agua libre de RNasas y se concentró en un concentrador "Speed-Vac" hasta un volumen de 2 μl. Este DNAse guardó a -20 0 C hasta su posterior uso.

d.- Síntesis y mareaje del cRNA: Esta reacción se llevó a cabo en un volumen de 20 μl y utilizando el kit T7 Megascript (Ambion), siguiendo las instrucciones del fabricante e incorporando nucleótidos modificados con biotina, Bio-11-CTP y Bio-11 UTP (Perkin Elmer) en una relación nucleótido sin modificar/nucleótido modificado 1:3. La reacción se incubó durante 5 h y 15 minutos en un baño con termostato (Selecta) a 37°C, agitando la reacción cada 45 minutos. Tras esta incubación se añadió 1 μl de DN Asa y se incubó 30 min a 37°C.

e.-Purificación del cRNA biotinilado: El cRNA biotinilado se purificó con el kit RNeasy Total RNA Isolation Kit (Qiagen) siguiendo las instrucciones del fabricante. Los cRNAs biotinilados obtenidos se eluyeron en un volumen de 80 μl y se almacenaron a -80 0 C hasta su posterior uso.

La cantidad, pureza y calidad del cRNA obtenido se determinaron siguiendo los mismos procedimientos que se han descrito para el RNA total. El cRNA se almacenó a -80 0 C hasta su posterior uso.

Fragmentación del cRNA biotinilado

10 μg de cRNA biotinilado se fragmentaron en presencia de tampón de fragmentación 5x (200 mM Tris-acetato, pH 8,1, 500 mM HOAC, 15OmM MgOAc) durante 35 minutos a 94°C en un termobloque. Se comprobó que la reacción de fragmentación se había llevado a cabo de forma correcta a mediante la visualización de 1 μl de solución de fragmentación en electroforesis sobre gel de agarosa al 1%.

Hibridación del cRNA marcado con las sondas del "microarray"

En esta etapa se puso en contacto el material genético marcado con las sondas inmovilizadas sobre el soporte sólido.

A la solución de cRNA biotilinado y fragmentado se le añadieron 10 μl de la solución de controles de hibridación y la mezcla se incubó 3 min a 95°C para desnaturalizar las posibles estructuras secundarias. Tras la incubación se llevó inmediatamente la mezcla a hielo para prevenir una posible renaturalización de la muestra.

La hibridación se llevó a cabo durante 6 horas a 42°C en la estación automática de hibridación Ventana Disco very (Ventana Medical Systems). Los tampones de hibridación y de lavado fueron suministrados por Ventana Medical System. Los "microarrays" fueron teñidos automáticamente en la propia estación de hibridación con estreptavidina conjugada con Cy3 (Amersham Biosciences) utilizando las recomendaciones del fabricante.

Captura de imágenes y cuantificación de los "microarrays"

Tras la hibridación y revelado, las imágenes de los "microarrays" fueron identificadas y analizadas mediante el "escáner" fluorescente confocal ScanArray 4000 (Perkin Elmer) equipado con un láser para el verde (543 nm para excitar al fluoróforo Cy3). El "software" utilizado fue ScanArray 3.1. El uso del programa informático QuantArray 3.0 (Perkin Elmer) proporcionó los valores absolutos de la intensidad de hibridación y ruido de fondo en función de la luz emitida por el Cy3 en cada sonda en un formato Excel.

Análisis de datos: Procesamiento preliminar

En primer lugar, a los valores absolutos de intensidad de todos los oligonucleótidos se les restó el valor del ruido de fondo. Para ello, se utilizaron los valores de intensidad absolutos y los valores de ruido de fondo que el programa utilizado para convertir las señales del fluoróforo devuelve, de forma automática, para cada uno de los puntos de microarray: el correspondiente valor de intensidad se obtiene de la zona que se ha definido como punto y el valor del ruido de fondo se obtiene de la zona situada alrededor del punto.

A continuación se calculó el nivel medio de intensidad de hibridación de cada uno de los oligonucleótidos del microarray a partir de la media acotada de las intensidades de las 12 réplicas de cada uno de los oligonucleótidos. Para ello, se han

de eliminar, antes de calcular la media, los valores superiores y los valores inferiores de la distribución de puntos de valores de señal de hibridación obtenidos con cada una de las réplicas de un mismo oligonucleótido. El cálculo se realizó utilizando el programa Excel de Microsoft y, concretamente, la función MEDIA.ACOTADA del mismo, en la que el parámetro "porcentaje" se fijó en 0,2, lo que supone fijar el porcentaje de valores eliminado en el 20% de los valores superiores y el 20% de los valores inferiores; la función redondea el número de puntos de datos excluidos al múltiple de 2 más próximo.

En último lugar y para poder determinar la validez de una hibridación, es necesario que se cumplan una serie de criterios establecidos: 1) la relación entre la intensidad media y el fondo medio de todos los oligonucleótidos del chip sea mayor de 10; 2) el valor del coeficiente de variación medio (desviación estándar de las réplicas frente a la media de las réplicas) de todas las réplicas de oligonucleótidos del chip debe ser inferior a 0,3; 3) el valor medio del control negativo debe ser inferior a 2,5 veces el valor del DMSO medio; 4) se debe obtener señal tanto en los controles de hibridación como en los controles positivos internos exógenos (Spiked controls).

El análisis de los datos se realizó en R, versión 1.9.1. R es un lenguaje de programación en el que se pueden aplicar técnicas estadísticas tanto clásicas como modernas (R Developmental Core Team, 2004; http://www.R-project.org), que dispone de una serie de funciones almacenadas en paquetes para la manipulación, cálculo y representación gráfica de datos (Venables et al, 2004). Existen cientos de paquetes escritos por diferentes autores para R, con funciones estadísticas especiales o que permiten el acceso y manipulación de datos y están disponibles para descargar desde las páginas web de CRAN (http://cran.r-project.org/) o Bioconductor (http://www.bioconductor.org). En algunos casos concretos, se utilizó también el software comercial de análisis estadístico SPSS (Chicago, EE.UU.).

Ejcmplos

EJEMPLO L- RESULTADOS OBTENIDOS AL UTILIZAR EL DISPOSITIVO "MICROARRAY" CON MUESTRAS DE CéLULAS U937 VS CéLULAS JURKAT

Con objeto de saber si el dispositivo permite diferenciar dos líneas celulares se hibridaron en 10 microchips: 5 muestras de cRNAs biotinilados sintetizados siguiendo el protocolo de trabajo optimizado, obtenidos a partir de RNA de células U937 (línea celular procedente de Leucemia promonocítica) y 5 muestras de cRNAs biotinilados obtenidos a partir de RNA de células Jurkat (línea celular procedente de Leucemia T).

Se realizaron los pasos iniciales de procesamiento preliminar de los datos y validación de la hibridación mencionados anteriormente en el apartado de "Análisis de datos: Procesamiento preliminar" y, a continuación se procedió la normalización y filtrado de datos :

- Normalización de datos. Se utilizó el método "variance stabilization normalization", disponible en el paquete "vsn" de R. Existen diferentes de paquetes disponibles en Internet para R, con funciones estadísticas especiales o que permiten el acceso y manipulación de datos y están disponibles para descargar desde CRAN (http ://cran.r-proj ect. or g/) o Bioconductor (http://www.bioconductor.org)

- Filtrado de datos. Se han realizado dos operaciones de filtrado con la función "Filterfun" del paquete "Genefilter" de R. Los genes que no superaron alguno de los dos filtros no fueron utilizados en el análisis de datos. Los filtros llevados a cabo fueron:

- Filtrado para excluir genes con un valor de intensidad próximo al DMSO. Este filtro permitió trabajar con genes con valor de intensidad menos ruido de fondo media mayor de 550 unidades arbitrarias (aproximadamente 2 veces el valor del DMSO).

- Filtrado para excluir genes con mínima variación de intensidad a lo largo de las muestras. Se trabajó con genes con rango intercuartílico de intensidad normalizada a lo largo de las muestras mayor de 0,3.

El filtrado de datos dejó 83 sondas que constituyeron la lista de trabajo. Con ellas se llevó a cabo un agrupamiento de las muestras no supervisado, que son aquellos agrupamientos en los que no se conoce la estructura de los datos de antemano, aprendiendo el sistema cómo están distribuidos los datos entre clases basándose en una función de distancia. Con el agrupamiento se obtuvo un árbol o agrupamiento jerárquico, en el que las muestras quedan agrupadas en función de su similitud en la expresión de unos genes determinados, los correspondientes a los oligonucleótidos de la lista de trabajo, de forma que las muestras más próximas son las que tienen un perfil de expresión parecido. El agrupamiento se realizó con la función hclust del paquete stats de R. El análisis no supervisado de las 10 muestras produjo su separación en dos grupos o ramas principales en función del tipo celular al que pertenecen las muestras: un grupo contiene las 5 hibridaciones realizadas a partir de células U937 y el otro grupo contiene las 5 hibridaciones realizadas a partir de células Jurkat. El árbol resultante de este agrupamiento no supervisado se muestra en la parte A de la Figura 1.

A continuación, para conocer si existían diferencias estadísticamente significativas entre los dos grupos de muestras, se utilizó el método "Step-down maxT múltiple testing procedures" (maxT), que es una aplicación de la función mt.maxT del paquete multtest del software R de Bioconductor, que aplica un test estadístico y realiza un fuerte control sobre la tasa de falsos positivos. A esta función hay que proporcionarle: a) Valores sobre los que se quiere aplicar el test estadístico, en este caso, sobre los valores normalizados de los 83 oligonucleótidos que superaron los filtros b) Grupos de los que se quiere buscar diferencias, en este caso las 5 muestras de células Jurkat frente a las 5 muestras de células U937 c) Número de permutaciones que se quiere realizar. En este caso se realizaron 100.000 permutaciones. d) Por defecto, se eligió el test de Welch para especificar la herramienta estadística a utilizar para probar la hipótesis de no asociación entre las variables y las etiquetas de clase

La aplicación de este análisis con un valor de p<0,001 proporcionó una lista de 69 sondas estadísticamente significativas entre los dos grupos, que son las siguientes:

SG12, SG20, SG23, SG24, SG38, SG39, SG45, SG49, SG53, SG59, SG60, SG62, SG76, SG78, SG89, SG92, SG94 , SG102, SG474, SG478, SG487, SGl 14, SG120, SG140, SG142, SG145, SG150, SG154, SG158, SG174, SG175, SG194, SG195, SG211, SG230, SG231, SG235 , SG260, SG264, SG266, SG268, SG270, SG272, SG282, SG294 , SG308, SG311, SG33O, SG332, SG333, SG339, SG344, SG364, SG403, SG423, SG434, SG456, SG506, SG513, SG514, SG515, SG524, SG533, SG538, SG541, SG559

Una vez conocidos los genes estadísticamente significativos para distinguir entre los dos grupos de muestras (que serían los genes correspondientes a las sondas identificadas como estadísticamente significativas) se efectuó el agrupamiento supervisado de las muestras en función de la intensidad de la señal de las 69 sondas estadísticamente significativas obtenidas. El término "supervisado", aplicado a un agrupamiento, hace referencia al hecho de que la estructura de los datos se conoce de antemano, lo que permite utilizar la información previa; con ello, tras un proceso de entrenamiento que permite al sistema aprender a distinguir entre clases, puede utilizarse la red para asignar nuevos miembros a las clases predefinidas. En este caso, el agrupamiento supervisado de las muestras en función de la intensidad de la señal obtenida con las 69 sondas estadísticamente significativas obtenidas, vuelve a ser un árbol que se divide en dos ramas principales en función del tipo celular al que pertenecen las muestras. El árbol obtenido con el agrupamiento supervisado se muestra en la parte B de la Figura 1.

EJEMPLO 2.- RESULTADOS OBTENIDOS AL UTILIZAR EL DISPOSITIVO "ARRAY" CON MUESTRAS DE SUJETOS SANOS VS CéLULAS U937 Y JURKAT

Se comparó la expresión de 5 muestras de células U937 y de 5 muestras de células Jurkat frente a la expresión de 10 muestras provenientes de sangre total de

sujetos sanos. De forma similar a la descrita en el Ejemplo 1, se llevaron a cabo los pasos de procesamiento inicial de los datos, validación de las hibridaciones, normalización y filtrado. Un total de 180 genes superaron los procesos de filtrado. El agrupamiento no supervisado de las muestras (realizado con la función hclust del paquete stats de R aplicando correlación de Pearson) en íunción de la expresión de los 180 genes proporcionó un árbol con dos ramas principales: una rama contiene todas las muestras procedentes de cultivos celulares y la otra rama contiene todas las muestras procedentes de sangre total de sujetos sanos, por lo que se demuestra que la herramienta es capaz de encontrar diferencias de expresión. El árbol obtenido tras realizar este agrupamiento no supervisado se muestra en la parte A de la Figura 2.

Se realizó la prueba maxT (p<0,001) para buscar genes con diferencias estadísticamente significativas entre las muestras procedentes de cultivos celulares U937y Jurkart y las 10 muestras procedentes de sangre total de sujetos sanos. El análisis estadístico proporcionó una lista de 131 sondas con diferencias estadísticamente significativas entre ambos grupos de muestras. Son los siguientes: SGl, SG4, SG7, SG8, SGlO, SG13, SG15, SG16, SG17, SG18, SG19, SG20, SG26, SG29, SG30, SG34, SG36, SG39, SG42, SG44, SG49, SG51, SG52, SG58, SG64, SG65 , SG67, SG76, SG77, SG80, SG84, SG86, SG89, SG92, SG93, SG94, SG98, SG99, SG101, SG102, SG107, SG463, SG464 , SG474, SG475, SG485, SG487, SG466, SG467, SG471, SG472, SG473, SG120, SG129, SG138, SG141, SG144, SG145, SG147, SG158, SG163, SG164 , SG176, SG185, SG186, SG197, SG207, SG208, SG217, SG227, SG231, SG265, SG266, SG277, SG278, SG283, SG285, SG299, SG307, SG308, SG311,SG313, SG318, SG319, SG328, SG333, SG336, SG342, SG344, SG357, SG361, SG376, SG384, SG389, SG395, SG398, SG403, SG404, SG407, SG416, SG420, SG423, SG430, SG436, SG446, SG455, SG461, SG489, SG491, SG492, SG493, SG498, SG500, SG504, SG505, SG506, SG514, SG516, SG517, SG520, SG526, SG530, SG533, SG538, SG545, SG547, SG554, SG555, SG558.

El agrupamiento de las 20 muestras en función de la expresión de las sondas estadísticamente significativas encontradas dio lugar de nuevo a un árbol con dos ramas principales, una correspondiente a los muestras procedentes de cultivos

celulares y otra correspondiente a las muestras procedentes de individuos sanos. Dicho agrupamiento aparece en la parte B de la Figura 2.

EJEMPLO 3.- RESULTADOS OBTENIDOS CON MUESTRAS DE PACIENTES CON LEUCEMIA LINFáTICA CRóNICA TLLQ VS CéLULAS U937 Y JURKAT

Se compararon los perfiles de expresión de muestras procedentes de cultivos celulares U937 y Jurkats con 26 muestras procedentes de sangre total de sujetos con LLC.

Las muestras se sometieron a un procesamiento preliminar de los datos, se normalizaron y filtraron de forma análoga a la utilizada en los Ejemplos 1 y 2 y un total de 236 sondas superaron los filtros. El agrupamiento no supervisado de las muestras en función de la expresión de las sondas que superaron los filtros mostró un árbol con dos ramas principales: una que contenía las muestras de cultivos celulares y la otra las muestras LLC. Dicho árbol se muestra en la parte A de la Figura 3.

Se aplicó la prueba maxT (p<0,001) para buscar genes con diferencias estadísticamente significativas entre los dos grupos de muestras. Este análisis proporcionó una lista de 120 sondas. Son las siguientes:

SG2, SG4, SG8, SGlO, SG13, SG15, SG16, SG19, SG20, SG23, SG26, SG28, SG31, SG34, SG36, SG39, SG48, SG58, SG60, SG65, SG76, SG77, SG84, SG89, SG94, SG9, SG97, SG99, SG102, SG106, SG107, SG463, SG464, SG474, SG475, SG481, SG465, SG485, SG487, SG466, SG467, SG471, SG473, SGl 15, SGl 16, SGl 17, SG120, SG129, SG134, SG135, SG138, SG139, SG141, SG145, SG158, SG161, SG163, SG176, SG178, SG185, SG207, SG208, SG210, SG217, SG227, SG231, SG237, SG264, SG272, SG277, SG281, SG283, SG286, SG294, SG298, SG299, SG307, SG308, SG319, SG328, SG33O, SG333, SG336, SG342, SG344, SG345, SG347, SG361, SG384, SG389, SG395, SG404, SG407, SG416, SG423, SG428, SG430, SG432, SG434, SG444, SG446, SG453, SG458, SG459, SG491, SG498, SG507, SG508, SG511, SG517, SG518, SG522, SG526, SG530, SG533, SG538, SG541, SG554, SG558, SG561.

El agrupamiento de las 30 muestras en función de la expresión de las 120 sondas estadísticamente significativas dio lugar de nuevo a un árbol con dos ramas principales, una correspondiente a las muestras de cultivos celulares y la otra correspondiente a las muestras extraídas de sujetos que padecen LLC. Este árbol se muestra en la parte B de la Figura 3.

- EJEMPLO 4: RESULTADOS OBTENIDOS CON MUESTRAS DE SUJETOS SANOS VS PACIENTES CON LEUCEMIA LINFáTICA CRóNICA

68 hibridaciones que cumplieron los criterios de calidad provenientes de 68 muestras de diferentes sujetos sanos y con diagnóstico clínico de LLC se dividieron en 2 grupos: Grupo de Entrenamiento utilizado para obtener las funciones del clasificador y Grupo de Prueba, utilizado para probar el clasificador obtenido. El Grupo de Entrenamiento estaba compuesto por 30 muestras (10 de sujetos sanos y 20 de sujetos LLC) y el Grupo de Prueba estaba compuesto por 38 muestras (5 muestras de sujetos sanos y 33 muestras de sujetos con LLC).

Para obtener la función de clasificación se trabajó con los resultados obtenidos de las hibridaciones del Grupo de Entrenamiento. Los pasos realizados para obtener la función de clasificación fueron:

- Normalización de datos. Se utilizó el método "variance stabilization normalization", disponible en el paquete "vsn" de R.

- Filtrado de datos. Se han realizado dos operaciones de filtrado con la función "Filterfun" del paquete "Genefilter" de R. Los genes que no superaron alguno de los dos filtros no fueron utilizados en el análisis de datos. De los 588 oligonucleótidos del chip, 224 superaron los 2 filtros y constituyeron la lista de trabajo.

2. Filtrado para excluir genes con un valor de intensidad próximo al DMSO. Este filtro permitió trabajar con genes con valor de intensidad menos ruido de fondo medio mayor de 550 unidades arbitrarias (aproximadamente 2

veces el valor del DMSO) en más del 25% de las 30 muestras (7 muestras) que componen el Grupo de Entrenamiento.

3. Filtrado para excluir genes con mínima variación de intensidad a lo largo de las muestras. Se trabajó con genes con rango intercuartílico de intensidad normalizada a lo largo de las muestras mayor de 0,3.

Se utilizaron dos sistemas de clasificación:

4.1. - Construcción de un sistema de clasificación con PAM.

Para identificar grupos de genes que mejor caracterizan cada tipo de muestra y comprobar la tasa de clasificación de estos grupos de genes se utilizó Prediction Analysis for Microarrays (PAM) disponible como paquete "pamr 11 " de R. Es una técnica estadística que identifica un grupo de genes que mejor caracteriza a una clase predefinida y utiliza este grupo de genes para predecir la clase a la que pertenecen nuevas muestras. PAM utiliza una versión modificada del método de clasificación "nearest centroide" (Tibshirani et al, 2002) denominada "Nearest Shrunken Centroide". Se realizó una validación denominada "10 fold cross validation" que consiste en construir el modelo con el 90% de las muestras y se intenta predecir la clase del 10% de las muestras que no han intervenido en la construcción del modelo. Este procedimiento se repite 10 veces y el error de clasificación del 10% de las muestras se junta para calcular el error global. Este error refleja el número de muestras mal clasificadas (Bullinger et al, 2005).

4.1.1. Construcción del modelo. A partir de los datos filtrados y normalizados de las 30 muestras que componen el Grupo de Entrenamiento, atribuyendo de forma arbitraria el Grupo de Sanos a grupo 0 y el Grupo de LLC a grupo 1, realizando las 10 validaciones cruzadas y con un valor de umbral de Delta 3,1. El modelo obtenido lo formaron los siguientes oligonucleótidos: SG459, SG428, SG507, SG508, SGl 17, SG237. Los coeficientes del clasificador correspondientes a cada uno de estos oligonucleótidos se muestran a continuación en la Tabla 8:

Tabla 8.- Coeficientes del clasificador PAM

4.1.2. Validación del clasificador PAM. La validación cruzada de las muestras que componen el Grupo de Entrenamiento clasificó correctamente 28 de las 30 muestras.

A partir de los datos filtrados y normalizados de las 38 muestras que componen el Grupo de Prueba, se obtuvieron valores de probabilidad p de pertenencia al grupo 0 (grupo sano) o grupo 1 (grupo LLC). Cuanto mayor sea el valor de p, mayor probabilidad de pertenecer a ese grupo. Se ha considerado que los valores mayores de 0,5 indican pertenencia a ese grupo. Los valores de p obtenidos para cada muestra se indican en la Tabla 9.

Tabla 9.- Valores de probabilidad obtenidos con el clasificador PAM para el grupo de Prueba

—rúnica muestra mal clasificada

Con este modelo se clasifican correctamente 37 de las 38 muestras del Grupo de Prueba: todas las muestras correspondientes a individuos sanos (aquellas cuya denominación va encabezada por la letra "S") presentan una probabilidad mayor de 0,5 de pertenecer al grupo 0, mientras que todas las muestras correspondientes a individuos que padecen LLC (que son las muestras cuya denominación comienza por las letras "LLC") menos una presentan una probabilidad mayor de 0,5 de pertenecer al grupo 1.

4.2.- Construcción de un sistema de clasificación con regresión logística. 4.2.1.- Selección de senes con diferencias estadísticamente significativas entre sanos y LLC (Grupo de Entrenamiento). A partir de datos normalizados y filtrados como se ha descrito anteriormente, para la selección de genes con diferencias significativas se utilizó el método "Step-down maxT múltiple testing procedures" (maxT), que es una aplicación de la función mt.maxT del paquete multtest del software R de Bioconductor, que aplica un test estadístico y realiza un fuerte control sobre la tasa de falsos positivos. La aplicación de este test estadístico, con un valor de p<0,001, a los 224 oligonucleótidos que superaron los filtros, produjo una lista de 7 oligonucleótidos: SGl 17, SG428, SG459, SG461, SG493, SG507, SG508.

Los pasos utilizados para obtener la lista de 7 genes significativos entre sanos y LLC fueron:

Método que hace permutaciones y va ajustando los valores de p resT<-mt.maxT(exprs(224 oligonucleótidos que hay superado los filtros y normalizados del grupo de entrenemiento),Tipos de muestras en el grupo de entrenamiento, test="t", B= 100000): función mt.maxT que a través de permutaciones va ajustando los valores de probabilidad (significación), lo que supone un fuerte control de la tasa de falsos positivos. A esta función hay que proporcionarle

1.- Genes sobre los que se quiere aplicar el test estadístico, en este caso, sobre los valores normalizados de los 224 oligonucleótidos que han superado los filtros de todas las muestras incluidas en el Grupo de Entrenamiento

2.- Grupos de los que se quiere buscar diferencias, en este caso 10 muestras de sanos y 20 muestras de LLC. Se quieren encontrar diferencias entre sanos y LLC

3.- Número de permutaciones que se quieren realizar. En este caso se realizaron 100.000 permutaciones.

4.- Por defecto se eligió el, test de Welch como test estadístico

Los genes estadísticamente significativos a nivel de p<0,001 se seleccionaron mediante este test y se obtuvo un numero de 7

4.2.2.- Obtención de la función de clasificación con SPSS. Por regresión logística a partir de los valores normalizados de los 7 oligonucleótidos estadísticamente significativos obtenidos de las 30 muestras que componen el Grupo de Entrenamiento y asignando de forma arbitraria grupo 0 a las muestras sanas y grupo 1 a las muestras LLC, se obtuvieron los valores de la función de clasificación. Los coeficientes correspondientes a cada oligonucléotido fueron los que se muestran a continuación en la Tabla 10:

Tabla 10.- Coeficientes de la función de clasificación calculada por regresión logística

A partir de estos coeficientes, para cada muestra i se calcula un valor x¡ de la siguiente forma:

Xi= Constante+ (Coef ohle0009*Imni SGl 17)+ (Coef SG428* Imni SG428)+ (Coef SG459* Irruii SG459)+ (Coef SG461* Iimii SG461)+ (Coef SG493* Iirnii SG493)+ (Coef SG507* Iimii SG507)+ (Coef SG508* Iirun SG508). donde Imnj es el valor medio de intensidad normalizada de la muestra i.

A partir del valor x¡ se calcula un valor de probabilidad (pi). Cuanto más cercano sea el valor de p a 0, mayor probabilidad de que la muestra pertenezca al grupo de sujetos sanos (asignados como grupo 0) y cuanto más cercano sea el valor de p a 1, mayor probabilidad de que la muestra pertenezca al grupo de sujetos LLC (asignados como grupo 1). La fórmula utilizada para determinar el valor de p es:

Pi = l/(l+e- χi ).

Como se muestra en la Tabla 11, la función obtenida clasificó de forma correcta las 30 muestras pertenecientes al grupo de entrenamiento. Cuanto mas cerca de 0 mayor probabilidad de que sea sano y cuanto mas cercano sea a 1 mayor probabilidad LLC.

Tabla 11.:

4.2.3. Validación del sistema clasificador.- A partir los valores filtrados y normalizados tal y como se ha detallado anteriormente se obtuvieron los valores Imni de los 7 oligonucleótidos que componen el clasificador de cada una de las 38 muestras que componen el grupo de prueba.

Resultados de la validación del sistema clasificador. A continuación se muestran unas tablas en donde se detalla el valor Imni de cada uno de los 7 oligonucleótidos incluidos en el clasificador y los valores de x¡ y p¡ calculados según las fórmulas descritas anteriormente, obtenidos para cada una de las 38 muestras del grupo de prueba. Las muestras que comienzan por S corresponden a sujetos sanos y las muestras que comienzan con LLC son provenientes de sujetos LLC. 37 de 38 muestras se clasifican de forma correcta. Sólo la muestra LLC175, para la que se obtiene un valor de pi =0, se clasifica de forma incorrecta.

Tabla 12.- Resultados obtenidos con el grupo de prueba mediante la función de clasificación obtenida por regresión logística

Se formó un tercer grupo de 40 muestras. Para ello se utilizaron réplicas de hibridación o de mareaje (las muestras cuya denominación comienza por S y Strans son muestras de personas consideradas sanas y las que comienzan por LLC muestras procedentes de pacientes con leucemia linfática crónica). Ester grupo de muestras se utilizó para la validación del sistema de clasificación. Los datos se normalizaron como se ha descrito anteriormente. Los resultados de la clasificación se muestran en la Tabla 13. 40 de las 40 muestras se clasifican correctamente.

Tabla 13.- Resultados obtenidos en la validación de la función de clasificación obtenida mediante regresión logística

EJEMPLO 5: RESULTADOS OBTENIDOS CON MUESTRAS LLC "ESTABLES" FRENTE A MUESTRAS LLC "PROGRESIVAS"

Se consideraron muestras "LLC-estables tipo" (E) aquellas muestras de pacientes que llevan más de 5 años con LLC estable y muestras "LLC-progresivas tipo" (P) "progresivas tipo" a las muestras de pacientes clasificadas de estables en el momento del diagnóstico y cuya enfermedad ha progresad en menos de un año.

En total se analizaron 6 muestras E y 6 muestras P. Las 12 muestras fueron recogidas en momento diagnóstico, no había diferencias clínicas entre ellas, pero al cabo de un año, 6 de esos pacientes habían progresado. Las 12 hibridaciones han pasado los criterios de calidad detallados anteriormente.

Muestras Estables: E142R, E148, E156, E163, E164, E193

Muestras Progresivas: Pi l i, P105, P177, P158, P157 y P197.

Todo el análisis de datos se realizó en R versión 1.9.1.

Normalización de datos. En este caso, y para evitar que los genes significativos obtenidos sean debidos a una verdadera diferencia entre muestras y no a un efecto de normalización, los datos se normalizaron de dos formas diferentes ("variance stabilization normalization" (vsn) y por cuantiles robustos) y con cada una de las normalizaciones se realizó el mismo análisis estadístico.

- Análisis estadístico con datos normalizados por "variance stabilization normalization". La lista de genes estadísticamente significativos se obtuvo a partir de un test de Welch con la función mt.maxT del paquete multtest de R, con un valor de p<0,05 sin ajustar, es decir, sin realizar ningún control sobre los falsos positivos, y produjo una lista de 29 genes con diferencias estadísticamente significativas entre el grupo LLC-estables tipo y LLC-progresivos tipo.

Los oligonucleótidos estadísticamente significativos obtenidos fueron: SG26, SG31, SG70, SG98, SG177, SG194, SG195, SG208, SG213, SG216, SG272, SG293, SG301, SG309, SG321, SG333, SG343, SG352, SG357, SG366, SG368, SG405, SG426, SG439, SG447, SG452, SG521, SG555, SG556.

Se llevó entonces a cabo el agrupamiento de las muestras, que se realizó con la función hclust del paquete stats de R aplicando correlaciones de Pearson. El árbol obtenido se muestra en la parte A de la Figura 4.

El agrupamiento jerárquico de las 12 muestras en función de la expresión de los 29 genes estadísticamente significativos obtenidos agrupaba las muestras de forma correcta: el árbol contiene dos grandes ramas, de las cuales la rama de la derecha contiene las 6 muestras estables y la rama de la izquierda contiene las 6 muestras progresivas.

- Análisis estadístico con datos normalizados por cuantiles robustos La lista de genes estadísticamente significativos se obtuvo a partir de un test de Welch con la función mt.maxT del paquete multtest de R con los valores de p sin ajustar, es decir, sin ejercer ningún control sobre la tasa de falsos positivos, con un valor de p<0,05, y produjo una lista de 19 genes con diferencias estadísticamente significativas entre el grupo LLC-estables tipo y LLC-progresivos tipo:

SG26, SG31, SG177, SG194, SG195, SG197, SG213, SG216, SG293, SG301, SG309, SG333, SG343, SG357, SG366, SG439, SG452, SG555, SG556.

El agrupamiento supervisado de las 12 muestras en función de la expresión de los 19 genes estadísticamente significativos obtenidos dio lugar al árbol que aparece en la parte B de la Figura 4, en el que las muestras aparecen agrupadas igualmente de forma correcta.

Se seleccionaron 18 oligonucleótidos comunes a ambas listas de genes estadísticamente significativos y se calculó la media de intensidad de cada uno de ellos en el grupo de muestras estables y en el grupo de muestras progresivos, así como la variación de intensidad media entre el grupo de estables y progresivos. Los valores obtenidos se muestran en la Tabla 14.

Tabla 14.- Valores correspondientes a la intensidad de 18 oligonucleótidos significativos para distinguir entre LLC-estable y LLC-progresiva

Grupo LLC Grupo LLC

Cambio

Significación estables progresivos

Sonda estable/ (p datos vsn) Media Media progresivo Intensidad SD Intensidad SD

SG177 0,001 14 1,71 21 4,84 0,7

SG366 0,001 18 2,33 14 1,80 1,3

SG309 0,004 20 2,76 15 3,58 1,4

SG26 0,005 97 19,20 70, 13,24 1,4

SG452 0,010 16 2,19 12 3,08 1,3

SG216 0,012 46 14,64 31 7,13 1,5

SG333 0,013 36 7,28 53 16,25 0,7

SG357 0,014 134 6,50 175 38,67 0,8

SG213 0,014 26 5,51 41 17,20 0,6

SG31 0,014 69 32,50 30 10,57 1,8

SG301 0,014 21 5,02 16 3,10 1,4

SGl 94 0,019 37 9,52 50 9,95 0,7

SG456 0,022 11 2,06 14 2,08 0,8

SG293 0,029 17 1,88 21 3,72 0,8

SG343 0,033 27 7,43 21 1,61 1,3

SG439 0,038 18 2,00 20 1,74 0,9

SG195 0,041 21 3,56 25, 4,60 0,8

SG555 0,049 163 23,55 137 20,69 1,2

Para validar los resultados obtenidos con el microarray, se seleccionaron 5 de las sondas estadísticamente significativas comunes obtenidas al comparar datos de expresión de sujetos LLC estables frente a sujetos LLC progresivos y se procedió al estudio de la expresión con RT-PCR de los genes representados por esas sondas. Los criterios utilizados para la selección de las 5 sondas fueron: intensidad de hibridación, cambio de intensidad entre grupo de estables y progresivos y valor de significación estadística. De esta forma se seleccionaron 5 sondas que representan a los genes PSMB4, CD23A, LCPl, ABCC5 y POU2F2. Se determinó la expresión de estos 5 genes en 11 de las 12 muestras LLC tipo, ya que no se disponía de RNA total de la muestra 105. Con los valores de expresión de los genes en cada muestra, se determinó la tasa de cambio entre el grupo de estables y progresivos y el valor de significación de esa variación y se comparó con los resultados obtenidos con los microarray s.

La técnica utilizada para la validación fue RT-PCR o PCR a tiempo real utilizando un LightCycler. Esta técnica es la técnica de elección para validar datos de chips y al igual que los microarrays, mide nivel de mRNA.

Se diseñaron cebadores para cada uno de los 5 genes cuyo oligonucleótido representativo fue seleccionado. Los detalles de los mismos se muestran a continuación en la Tabla 15.

Tabla 15.- Cebadores y productos de amplificación de los genes seleccionados para su validación por RT-PCR

La Figura 5 muestra la distribución de los datos de expresión obtenidos mediante RT-PCR (gráficos de la parte izquierda) y mediante el microarray (gráficos de la parte derecha). La parte A corresponde al gen PSMB4, la parte B al gen CD23A y la parte C al gen POU2F2.

A continuación, en la Tabla 16, se detallan los resultados obtenidos con el microarray y con RT-PCR de los valores de cambio de los 5 genes seleccionados en el grupo de muestras estables frente al grupo de muestras progresivas obtenidos como la significación del cambio. En 3 de los 5 genes seleccionados (PSMB4, CD23A y POU2F2) los valores de cambio, el sentido del cambio y los valores de significación obtenidos con RT-PCR concuerdan con los obtenidos con el microarray, por lo que esos 3 genes se consideran validados, es decir, que los resultados obtenidos para esos 3 genes con el microarray coinciden con los resultados obtenidos por otra técnica que también mide nivel de mRNA.

Tabla 16.- Valores de cambio y significación del cambio obtenidos con el microarray y mediante RT-PCR

REFERENCIAS BIBLIOGRáFICAS

Alizadeh A, Eisen M, Davis RE, et al The lymphochip: a specialized cDNA microarray for the genomic-scale analysis of gene expression in normal and malignant lymphocytes. CoId Spring Harb Symp Quant Biol. 1999;64:71-8.

Alizadeh AA, Eisen MB, Davis RE, et al Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature. 2000;403: 503-11.

Arico M, Valsecchi MG, Camitta B, Schrappe M, Chessells J, Baruchel A, Gaynon P, Silverman L, Janka-Schaub G, Kamps W, Pui CH, Masera G. Outcome of treatment in children with Philadelphia chromosome-positive acute lymphoblastic leukemia N Engl J Med. 2000;342:998-1006.).

Bea S, Zettl A, Wright G,et al. Diffuse Large B-CeIl Lymphoma Subgroups Have Distinct Genetic Profiles that Influence Tumor Biology and Improve Gene Expression-Based Survival Prediction. Blood. 2005 04:-1399

Bene MC, Bernier M, Casasnovas RO, et al: Acute myeloid leukaemia MO: Haematological, immunophenotypic and cytogenetic characteristics and their prognostic significance: An analysis in 241 patients. Br J Haemat 113:737, 2001.

Benes V, Muckenthaler M. Standardization of protocols in cDNA microarray analysis. Trends Biochem Sci. 2003;28:244-9

Bennett JM, Catovsky D, Daniel MT, et al. Myelodysplastic syndromes: is another classification necessary? Br J Haematol. 1984;56:515-7.

Bennett JM, Catovsky D, Daniel MT, et al. Proposals for the classification of the acute leukaemias. French-American-British (FAB) co-operative group. Br J Haematol. 1976 ;33:451-8.

Bergh G, Ehinger M, Olsson I, Jacobsen SE, Gullberg U. Involvement of the retinoblastoma protein in monocytic and neutrophilic lineage commitment of human bone marrow progenitor cells Blood. 1999;94:1971-8

Bernard J, Levy JP, Varet B. Hematologie. Collection Medico Chirurgicale. París: Flammarion, 1976; 5-22

Binet JL, Auquier A, Dighiero G, et al.. A new prognostic classification of chronic lymphocytic leukemia derived from a multivariate survival analysis. Cáncer. 1981;48:198-206

Boultwood J, Lewis S, Wainscoat JS The 5q-syndrome. Blood. 1994 ;84:3253-60

Braziel RM, Shipp MA, Feldman AL,et al. Molecular diagnostics. Hematology (Am Soc Hematol Educ Program). 2003;279-93

Bullinger, Dδhner et al. Use of gene-expression profiling to identify prognostic subclasses in adult acute myeloid leukemia N Engl Med 2005;350: 1605-16

Chan WC.Gene expression profiling in lymphoma diagnosis and research. Croat Med J. 2005; 46:349-59

Chen CC, Andrich MP, Metcalfe DD: A retrospective analysis of bone sean abnormalities in mastocytosis: Correlation with disease category and prognosis. J Nucí Med 35:1471, 1994

Cossman J: Gene expression analysis of single neoplastic cells and the pathogenesis of Hodgkin's lymphoma. J Histochem Cytochem 2001; 49:799-800

Crespo M, Bosch F, Villamor N, et al. ZAP-70 expression as a surrogate for immunoglobulin-variable-region mutations in chronic lymphocytic leukemia. N Engl J Med. 2003;348: 1764-75

Datta SR, Brunet A, Greenberg ME. Cellular survival: A play in three acts. Genes Dev 1999; 13: 2905-2927

Devilard E, Bertucci F, Tremat P, et al: Gene expression profiling defines molecular subtypes of classical Hodgkin's lymphoma. Oncogene 2002; 21:3095-3102

Dohner K, Tobis K, Ulrich R, Frohling S, Benner A, Schlenk RF, Dohner H. Prognostic significance of partial tándem duplications of the MLL gene in adult patients 16 to 60 years oíd with acute myeloid leukemia and normal cytogenetics: a study of the Acute Myeloid Leukemia Study Group UIm. J Clin Oncol. 2002;20:3254-61

Domen J, Weissman IL. Self-renewal, differentiation or death: regulation and manipulation of hematopoietic stem cell fate. Mol Med Today. 1999;5:201-8

Durig J, Naschar M, Schmucker U, Renzing-Kohler K, Holter T, Huttmann A, Duhrsen U. CD38 expression is an important prognostic marker in chronic lymphocytic leukaemia. Leukemia. 2002 ; 16:30-5

Ferrando AA, Look AT Pathobiology of acute lymphoblastic leukemia. In Hoffman R Hematology Basic Principies and practice. 4 ed. Churchill Livingstone New York 2005; 1135-1147

Galton DA. The pathogenesis of chronic lymphocytic leukemia Can Med Assoc J. 1966 ;94: 1005- 10

Giles FJ, Keating A, Goldstone AH, Avivi I, Willman CL, Kantarjian HM Acute myeloid leukemia. Hematology (Am Soc Hematol Educ Program). 2002;73-l 10.).

Golub TR, Slonim DK, Tamayo P, et al. Molecular classification of cáncer: class discovery and class prediction by gene expression monitoring. Science. 1999;286:531-7

Gong JZ, Lagoo AS, Peters D, Horvatinovich J, Benz P, Buckley PJ. Valué of CD23 determination by flow cytometry in differentiating mantle cell lymphoma from chronic lymphocytic leukemia/small lymphocytic lymphoma Am J Clin Pathol. 2001;l 16:893-7

Greiner TCmRNA microarray analysis in lymphoma and leukemia. Cáncer Treat Res. 2004;121:l-12

Guttmacher AE, Collins FS. Welcome to the genomic era N Engl J Med. 2003;349:996-8

Hamblin TJ, Davis Z, Gardiner A, Oscier DG, Stevenson FK Unmutated Ig V(H) genes are associated with a more aggressive form of chronic lymphocytic leukemia. Blood. 1999;94: 1848-54

Hanahan D, Weinberg RA: The hallmarks of cáncer. Cell 100:57-70, 2000

Harris NL, Jaffe ES, Diebold J, et al. The World Health Organization classification of neoplastic diseases of the hematopoietic and lymphoid tissues. Report of the Clinical Advisory Committee meeting, Airlie House, Virginia, November, 1997 Ann Oncol. 1999;10:1419-32

Harris NL, Jaffe ES, Diebold J, et al. World Health Organization classification of neoplastic diseases of the hematopoietic and lymphoid tissues: report of the Clinical Advisory Committee meeting, Airlie House, Virginia, November 1997 J Clin Oncol. 1999;17:3835-49

Harris NL, Jaffe ES, Stein H, et al A revised European-American classification of lymphoid neoplasms: a proposal from the International Lymphoma Study Group Blood. 1994;84:1361-92

Harris NL, Stein H, Coupland SE, Hummel M, Favera RD, Pasqualucci L, Chan WC New approaches to lymphoma diagnosis. Hematology (Am Soc Hematol Educ Program). 2001;194-220.

Heaney ML, Golde DW Myelodysplasia. N Engl J Med. 1999;340: 1649-60

Jaffe ES, Harris NL, Stein H, Vardiman JW. WHO Classification Tumours of Heamotopoietic and lymphoid tissues. En Pathology and Genetics of tumours of Haematopoietic and lymphoid tissues. IARC Press. Lyon, 2001.

Jemal A, Murray T, Samuels A, et al: Cáncer statistics, 2003. CA Cáncer J Clin 53:5, 2003

Kottaridis PD, GaIe RE, Frew ME, et al. The presence of a FLT3 internal tándem duplication in patients with acute myeloid leukemia (AML) adds important prognostic information to cytogenetic risk group and response to the first cycle of chemotherapy: analysis of 854 patients from the United Kingdom Medical Research Council AML 10 and 12 triáis. Blood. 2001 ;98: 1752-9

Kuppers R, Klein U, Hansmann ML, Rajewsky K. Cellular origin of human B-cell lymphomas. N Engl J Med. 1999;341:1520-9

Küppers R: Molecular biology of Hodgkin's lymphoma. Adv Cáncer Res 2002;84:277-312

KyIe RA: Monoclonal gammopathy of undetermined significance and solitary plasmacytoma: Implications for progression to overt múltiple myeloma. Hematol Oncol Clin North Am 11 :71, 1997

Lee MF, Dang CV Control of cell división. In Hoffman R Hematology Basic Principies and practice. 4 ed. Churchill Livingstone New York 2005; 69-81

Leung AYH, Verfaillie CM Stem cell model of hematopoyesis. In Hoffman R Hematology Basic Principies and practice. 4 ed. Churchill Livingstone New York 2005; 200-214

Magli MC, Largman C, Lawrence HJ Effects of HOX homeobox genes in blood cell differentiation J Cell Physiol. 1997; 173: 168-77

Mitelman F, Mertens F, Johansson B A breakpoint map of recurrent chromosomal rearrangements in human neoplasia. Nat Genet. 1997;15 Spec No:417-74

Montoto S, Lopez-Guillermo A, Colomer D, et al. Incidence and clinical significance of bcl-2/IgH rearrangements in follicular lymphoma. Leuk Lymphoma. 2003;44:71-6.

Nichogiannopoulou A, Trevisan M, Friedrich C, Georgopoulos K. Ikaros in hemopoietic lineage determination and homeostasis Semin Immunol. 1998;10:119-

25.

Nutt SL, Heavey B, Rolink AG, Busslinger M. Commitment to the B-lymphoid lineage depends on the transcription factor Pax5. Nature. 1999;401:556-62

O'Gorman DM, Cotter TG Molecular signáis in anti-apoptotic survival pathways. Leukemia. 2001;15:21-34

Pane F, Intrieri M, Quintarelli C, Izzo B, Muccioli GC, Salvatore F BCR/ABL genes and leukemic phenotype: from molecular mechanisms to clinical correlations. Oncogene. 2002; 21:8652-67.

R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2004

Rai KR, Sawitsky A, Cronkite EP, Chanana AD, Levy RN, Pasternack BS. Clinical staging of chronic lymphocytic leukemia. Blood. 1975;46:219-34

Roumier C, Eclache V, Imbert M, et al. MO AML, clinical and biologic features of the disease, including AMLl gene mutations: A report of 59 cases by the Groupe Francais d'Hematologie Cellulaire (GFHC) and the Groupe Francais de Bytogenetique Hematologique (GFCH). Blood 101:1277, 2003

Shaffer AL, Rosenwald A, Staudt LM Lymphoid malignancies: the dark side of B- cell differentiation Nat Rev Immunol. 2002;2:920-32

Teñen DG, Hromas R, Licht JD, Zhang DE Transcription factors, normal myeloid development, and leucemia. Blood. 1997;90:489-519

Tibshirani R, Hastie T, Narasimhan B, Chu G. Diagnosis of múltiple cáncer types by shrunken centroids of gene expression. Proc. Nati. Acad. Sci. 2002;99:6567-72

Vardiman JW, Harris NL, Brunning RD The World Health Organization (WHO) classification of the myeloid neoplasms. Blood. 2002; 100:2292-302

Venables, Smith et al. An Introduction to R, Notes on R: A programming Environment for Data Analysis. 2004

Weissman IL Stem cells: Units of regeneration and units in evolution. CeIl, 2000; 100:157-168.

Westbrook CA. The molecular basis of neoplasia. In Hoffman R Hematology Basic Principies and practice. 4 ed. Churchill Livingstone New York 2005; 941-945

Zhan F, Hardin J, Kordsmeier B, et al: Global gene expression profiling of múltiple myeloma, monoclonal gammopathy of undetermined significance, and normal bone marrow plasma cells. Blood 99:1745, 2002

Breve descripción de las figuras

La Figura 1 muestra el agrupamiento de muestras de células U937 frente a células Jurkat en función de diferencias en la expresión de genes entre las muestras. La parte A corresponde al agrupamiento no supervisado; la parte B corresponde al agrupamiento supervisado.

La Figura 2 muestra el agrupamiento de muestras de sujetos sanos frente a células U937 y células Jurkat en función de diferencias en la expresión de genes entre las muestras. La parte A corresponde al agrupamiento no supervisado; la parte B corresponde al agrupamiento supervisado.

La Figura 3 muestra el agrupamiento de muestras de pacientes con leucemia linfática crónica frente a células U937 y células Jurkat en función de diferencias en la expresión de genes entre las muestras. La parte A corresponde al agrupamiento no supervisado; la parte B corresponde al agrupamiento supervisado.

La Figura 4 muestra el agrupamiento de muestras de pacientes con leucemia linfática crónica "estable" frente a muestras de pacientes con leucemia linfática crónica "progresiva" en función diferencias en la expresión de genes. La parte A corresponde al agrupamiento en función de los genes identificados como

significativos tras normalización con "vsn" y utilización de la función mt.maxT de R; la parte B corresponde al agrupamiento en función de los genes identificados como significativos tras normalización por cuantiles robustos y utilización de la función mt.maxT de R.

La Figura 5 muestra la distribución de los datos de expresión obtenidos mediante RT-PCR (gráficos de la parte izquierda) y a partir de las valores de intensidad obtenidos del microarray (gráficos de la parte derecha) para los genes PSMB4 (parte A: gráficos superiores), CD23A (parte B: gráficos intermedios) y POU2F2 (parte C: gráficos inferiores) en muestras de pacientes con leucemia linfática crónica "estable" (barras marcadas con "E") y en muestras de pacientes con leucemia linfática crónica "progresiva" (barras marcadas con "P").