MODIFIED NUCLEASES - ARTISAN DEV LABS INC

Title:

MODIFIED NUCLEASES

Document Type and Number:

WIPO Patent Application WO/2022/236147

Kind Code:

Abstract:

Provided herein are methods and compositions utilizing modified nucleases and/or other components, such as guide nucleic acids and donor templates, for use in a CRISPR system.

Inventors:

BAUMGARTNER ROLAND (US)
WARNECKE TANYA (US)

Application Number:

PCT/US2022/028208

Publication Date:

November 10, 2022

Filing Date:

May 06, 2022

Export Citation:

Click for automatic bibliography generation Help

Assignee:

ARTISAN DEV LABS INC (US)

International Classes:

C12N9/22; C12N15/11

Domestic Patent References:

WO2021067788A1	2021-04-08
WO2021074191A1	2021-04-22
WO2021158918A1	2021-08-12
WO2021067788A1	2021-04-08

Foreign References:

US9790490B2	2017-10-17
US10113179B2	2018-10-30
US9982279B1	2018-05-29

Other References:

WIERSON WESLEY A. ET AL: "Expanding the CRISPR Toolbox with ErCas12a in Zebrafish and Human Cells", THE CRISPR JOURNAL, vol. 2, no. 6, 1 December 2019 (2019-12-01), pages 417 - 433, XP055786985, ISSN: 2573-1599, Retrieved from the Internet DOI: 10.1089/crispr.2019.0026
ROJEK JOHAN ET AL: "Mad7: An IP friendly CRISPR enzyme", AUTHOREA, INC., 10 August 2021 (2021-08-10), pages 1 - 7, XP055966931, Retrieved from the Internet [retrieved on 20220930], DOI: 10.22541/au.162863226.68733765/v1
LU ET AL., CELL COMMUN SIGNAL, vol. 19, 2021, pages 60, Retrieved from the Internet
MARTOS-MALDONADO ET AL., NAT COMMUN., vol. 9, no. 1, 2018, pages 3307
KLEINSTIVER ET AL., NATURE, vol. 523, no. 7561, 23 July 2015 (2015-07-23), pages 481 - 5
NAKAMURA, Y. ET AL.: "Codon usage tabulated from the international DNA sequence databases: status for the year 2000", NUCL. ACIDS RES., vol. 28, 2000, pages 292, XP002941557, DOI: 10.1093/nar/28.1.292
SHALEK ET AL., NANO LETTERS, 2012
PARDRIDGE ET AL., COLD SPRING HARB PROTOC, 2010

Attorney, Agent or Firm:

WITT, Eric et al. (US)

Download PDF:

View/Download PDF PDF Help

Claims:

CLAIMS

WHAT IS CLAIMED IS:

1. A composition comprising a nucleic acid-guided nuclease comprising a Type V CRISPR nuclease polypeptide comprising at least one nuclear localization signal (NLS) at or near the N-terminus or the C-terminus of the polypeptide.

2. The composition of claim 1 wherein the nuclease is a Type Va nuclease.

3. The composition of claim 1 or claim 2 wherein the Type V CRISPR nuclease polypeptide has at least 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, or 100% sequence identity, preferably at least 80%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% sequence identity with SEQ ID NO: 1.

4. The composition of any previous claim wherein the Type V CRISPR nuclease polypeptide comprises two NLSs, one or both of which are at or near the N-terminus or the C- terminus of the polypeptide.

5. The composition of any previous claim wherein the Type V CRISPR nuclease polypeptide comprises three NLSs, each of which is at or near the N-terminus or the C-terminus of the polypeptide.

6. The composition of any previous claim wherein the Type V CRISPR nuclease polypeptide comprises four NLSs, each of which is at or near the N-terminus or the C-terminus of the polypeptide.

7. The composition of any previous claim wherein the Type V CRISPR nuclease polypeptide comprises at least five NLSs, each of which is at or near the N-terminus or the C- terminus of the polypeptide.

8. The composition of any one of claims 4 through 7 wherein at least two of the NLSs are at or near the N-terminus of the polypeptide.

9. The composition of any one of claims 5 through 7 wherein at least three of the NLSs are at or near the N-terminus of the polypeptide.

10. The composition of any one of claims 6 through 7 wherein at least four of the NLSs are at or near the N-terminus of the polypeptide.

11. The composition of claim 7 wherein the 5 NLSs are at or near the N-terminus of the polypeptide.

12. The composition of claim 11 comprising a sequence at least 60, 70, 80, 85, 90, 95, 98, 99%, or 100%, identical, preferably at least 80%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% identical to any one of SEQ ID NOs: 109-112.

13. The composition of any one of claims 1 through 3 wherein the Type V CRISPR nuclease polypeptide comprises at least 1-30, 1-20, 1-15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 2-30, 2-20, 2-15, 2-10, 2-9, 2-8, 2-7, 2-6, 2-5, 3-30, 3-20, 3-15, 3-10, 3-9, 3-8, 3-7, 3-6, or 3-5, preferably 1- 10, more preferably 2-10, even more preferably 3-10 NLSs, each of which is at or near the N- terminus or the C-terminus of the polypeptide.

14. The composition of any one of claims 4 through 11 wherein at least two of the NLSs have different nuclear localization mechanisms.

15. The composition of any one of claims 5 through 7 or 9 through 11 wherein at least three of the NLSs have different nuclear localization mechanisms.

16. The composition of any previous claim wherein one or more of the NLSs comprises an NLS of the SV40 virus large T-antigen, an NLS from nucleoplasmin, e.g. a nucleoplasmin bipartite NLS, a c-myc NLS; a hRNPAl M9 NLS; an IBB domain of importin- alpha NLS; a myoma T protein NLS; a sequence from human p53 NLS; a sequence of mouse c- abl IV NLS; a sequence of influenza virus NS1 NLS; a sequence of Hepatitis virus delta antigen NLS; a sequence of mouse Mxl protein NLS; a sequence of human poly(ADP-ribose) polymerase NLS; a sequence of steroid hormone receptors (human) glucocorticoid NLS; and/or a sequence of EGL-13 NLS.

17. The composition of claim 16 wherein one or more of the NLSs comprises an NLS of the SV40 virus large T-antigen.

18. The composition of claim 16 wherein two or more of the NLSs comprises an NLS of the SV40 virus large T-antigen.

19. The composition of claim 17 or claim 18 wherein the NLS or NLSs comprises the sequence of SEQ ID NO: 5.

20. The composition of any one of claims 16 through 19 wherein one or more of the NLSs comprises an NLS from nucleoplasmin.

21. The composition of claim 20 wherein the nucleoplasmin NLS comprises the sequence of SEQ ID NO: 6.

22. The composition of any one of claims 16 through 21 wherein one or more of the NLSs comprises a c-myc NLS.

23. The composition of claim 22 wherein the c-myc NLS comprises the sequence of SEQ ID NO: 7, SEQ ID NO: 8, or SEQ ID NO: 21.

24. The composition of claim 23 wherein the c-myc NLS comprises the sequence of SEQ ID NO: 21.

25. The composition of any one of claims 16 through 24 wherein one or more of the NLSs comprises a sequence of EGL-13 NLS.

26. The composition of claim 25 wherein the EGL-13 NLS comprises the sequence of SEQ ID NO: 107.

27. The composition of any previous claim wherein the Type V CRISPR nuclease polypeptide further comprises a purification tag.

28. The composition of claim 27 wherein the purification tag is at or near the N- terminus of the nuclease polypeptide.

29. The composition of claim 27 or claim 28 wherein the purification tag comprises a poly-his tag, such as a Gly-6x His tag or Gly-8x His tag; short epitope tags, e.g., FLAG, hemagglutinin (HA), c-myc, T7, Glu-Glu; maltose binding protein (mbp); N-terminal glutathione .S'-transfcrasc (GST); or calmodulin binding peptide (CBP)

30. The composition of claim 29 wherein the purification tag comprises a poly-his tag.

31. The composition of claim 30 wherein the purification tag comprises a gly-6x His tag.

32. The composition of claim 30 wherein the purification tag comprises a gly-8x His tag.

33. The composition of any previous claim wherein the Type V CRISPR nuclease polypeptide comprises a cleavage site.

34. The composition of claim 33 wherein the cleavage site is at or near the N- terminus of the nuclease polypeptide.

35. The composition of claim 33 or claim 34 wherein the cleavage site comprises a Tobacco Etch Virus (TEV) cleavage site.

36. The composition of claim 35 wherein the cleavage site comprises the sequence of SEQ ID NO: 108.

37. The composition of claim 36 comprising 5 NLSs at or near the N-terminus of the polypeptide, a purification tag, and the cleavage site, wherein the cleavage site is after the purification tag.

38. The composition of claim 37 comprising a sequence at least 60, 70, 80, 85, 90, 95, 98, 99%, or 100%, identical, preferably at least 8%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% identical to SEQ ID NO: 111 or 112.

39. The composition of claim 37 comprising a sequence at least 60, 70, 80, 85, 90, 95, 98, 99%, or 100%, identical, preferably at least 8%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% identical to SEQ ID NO: 112.

40. The composition of any previous claim further comprising a guide nucleic acid (gNA), e.g., gRNA, comprising a spacer sequence that targets a target nucleotide sequence within a polynucleotide, or a polynuclotide coding for the gNA, e.g., gRNA, wherein the gNA, e.g., gRNA is compatible with the Type V CRISPR nuclease.

41. The composition of claim 40 wherein the target nucleotide is within 50 nucleotides of a protospacer adjacent motif (PAM) sequence specific for the Type V CRISPR nuclease.

42. The composition of claim 41 wherein the PAM comprises a sequence of YTTN, wherein Y is T or C and N is A, T, G, or C.

43. The composition of claim 42 wherein the PAM comprises a sequence of YTTV or TTTV, wherein V is A, G, or C.

44. The composition of claim 40 wherein the gNA is a gRNA.

45. The composition of claim 44 wherein the gRNA is a dual gRNA.

46. The composition of claim 44 or claim 45 wherein the composition comprises the gRNA and the gRNA comprises one or more chemical modifications.

47. The composition of claim 46 wherein the chemical modification comprises a 2’-

O-alkyl, a 2'-0-methyl, a phosphorothioate, a phosphonoacetate, a thiophosphonoacetate, a 2'-0- methyl-3'-phosphorothioate, a 2'-0-methyl-3 '-phosphonoacetate, a 2'-0-methyl-3'- thiophosphonoacetate, a 2'-deoxy-3 '-phosphonoacetate, a 2'-deoxy-3 '-thiophosphonoacetate, a suitable alternative, or a combination thereof.

48. The composition of any one of claims 44 through 47 wherein a ratio of guanine: uracil in the gRNA is at least 51:49, 52:48, 53:47, 54:46, 55:45, 56:44, 57:43, 58:42, 59:42, or 60:40, preferably at least 53:47, more preferably at least 54:46, even more preferably at least 55:45.

49. The composition of any one of claims 40 through 48 wherein the molar ratio of gNA, e.g., gRNA to Type V CRISPR nuclease is at least 1.1: 1, 1.2:1, 1.3: 1, 1.4: 1, 1.5: 1, 1.6: 1, 1.7: 1, 1.8:1, 2: 1, 2.2: 1, 2.5: 1, or 3: 1 and/or not more than 1.2:1, 1.3: 1, 1.4: 1, 1.5: 1, 1.6: 1, 1.7:1, 1.8: 1, 2: 1, 2.2: 1, 2.5: 1, 3: 1, or 4: 1, preferably 1.1: 1 to 2.5: 1, more preferably 1.2: 1 to 2: 1„ even more preferably 1.2: 1 to 1.7: 1.

50. The composition of any one of claims 40 through 49 wherein the molar amount of gNA, e.g., gRNA, is at least 10, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 170, 190 or 200 pmol and/or not more than 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 170, 190 , 200, 250, or 300 pmol, preferably 25-200 pmol, more preferably 50-100 pmol, even more preferably 65 to 85 pmol.

51. The composition of any one of claims 40 through 50 further comprising a donor template.

52. The composition of claim 51 wherein the donor template comprises homology arms.

53. The composition of claim 51 or claim 52 wherein the donor template is present in an amount of at least 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 1.1, 1.2, 1.3, 1.4, 1.5, 1.7, 2, 2.5, 3, 4, or 5 pg pL ¹ and/or not more than 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 1.1, 1.2, 1.3, 1.4,

1.5, 1.7, 2, 2.5, 3, 4, 5, 7, or 10 pg pL ¹, preferably 0.3 to 2 pg pL ¹, more preferably 0.5 to 1.5 pg pL ¹, even more preferably 0.8 to 1.2 pg pL ¹.

54. The composition of any one of claims 40 through 53 further comprising an anionic polymer.

55. The composition of claim 54 wherein the anionic polymer comprises poly glutamic acid (PGA).

56. The composition of claim 54 or claim 55 wherein the anionic polymer is present at a concentration of at least 20, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 170, 200, 250, 300, 400, or 500 pg pL ¹ and/or not more than 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 170, 200, 250, 300, 400, 500, 700, or 1000 pg pL ¹, preferably 20 to 200 pg pL ¹, more preferably 50 to 150 pg pL ¹, even more preferably 80 to 120 pg pL ¹ .

57. A cell containing the composition of any previous claim.

58. The cell of claim 56 wherein the cell is a human cell.

59. The cell of claim 58 wherein the cell is an immune cell or a stem cell.

60. The cell of claim 59 wherein the cell is an immune cell.

61. The cell of claim 60 wherein the cell is a T cell.

62. The cell of claim 59 wherein the cell is a stem cell.

63. The cell of claim 62 wherein the cell is an induced pluripotent stem cell (iPSC).

64. A method comprising inserting a composition of any one of claims 1 through 56 into a cell.

65. The method of claim 64 wherein inserting the composition into the cell comprises electroporation.

66. A method for modifying a target polynucleotide comprising (i) contacting the composition of any one of claims 40 through 56 and (ii) allowing the nuclease and the guide nucleic acid to modify a targeted genomic region.

67. The method of claim 66 wherein the composition is a composition of any one of claims 51 through 56.

68. The method of claim 66 or claim 67 wherein the target polynucleotide is a genome or a portion of a genome within a cell.

69. The method of claim 68 wherein the cell is a human cell.

70. The method of claim 69 wherein the cell is an immune cell or a stem cell.

71. The method of claim 70 wherein the cell is an immune cell.

72. The method of claim 71 wherein the cell is a T cell.

73. The method of claim 70 wherein the cell is a stem cell.

74. The method of claim 73 wherein the stem cell is an iPSC

75. The method of any one of claims 67 through 74 wherein the donor template comprises a mutation in a PAM within 50 nucleotides of the target nucleotide sequence in the target polynucleotide.

76. The method of any one of claims 68 through 74 wherein the composition is a composition of claim 67 and the donor template comprises a polynucleotide coding for a polypeptide to be expressed by the cell.

77. The method of claim 76 wherein the polypeptide to be expressed by the cell comprises a chimeric antigen receptor (CAR) or a portion thereof.

78. The method of claim 77 wherein the cell is a human T cell or a human iPSC.

79. The method of claim 77 wherein the cell is a human T cell.

80. The method of claim 77 wherein the cell is a human iPSC.

81. A composition comprising a first polynucleotide coding for a polypeptide comprising a nucleic acid-guided nuclease comprising a CRISPR Type V nuclease polypeptide, wherein the polynucleotide has less than 75% sequence identity to SEQ ID NO: 22.

82. The composition of claim 81 wherein the nuclease polypeptide comprises at least 1, 2, 3, 4, or 5 NLSs, wherein each of the NLSs is at or near the N-terminus or the C-terminus of the nuclease polypeptide.

83. The composition of claim 82 wherein one or more of the NLSs comprises an NLS of the SV40 virus large T-antigen, an NLS from nucleoplasmin, e.g. a nucleoplasmin bipartite NLS, a c-myc NLS; a hRNPAl M9 NLS; an IBB domain of importin-alpha NLS; a myoma T protein NLS; a sequence from human p53 NLS; a sequence of mouse c-abl IV NLS; a sequence of influenza virus NS 1 NLS; a sequence of Hepatitis virus delta antigen NLS; a sequence of mouse Mxl protein NLS; a sequence of human poly(ADP-ribose) polymerase NLS; a sequence of steroid hormone receptors (human) glucocorticoid NLS; and/or a sequence of EGL-13 NLS.

84. The composition of claim 83 wherein one or more of the NLSs comprises an NLS of the SV40 virus large T-antigen.

85. The composition of claim 84 wherein the NLS or NLSs comprises the sequence of SEQ ID NO: 5.

86. The composition of any one of claims 83 through 85 wherein one or more of the NLSs comprises an NLS from nucleoplasmin.

87. The composition of claim 86 wherein the nucleoplasmin NLS comprises the sequence of SEQ ID NO: 6.

88. The composition of any one of claims 83 through 87 wherein one or more of the NLSs comprises a c-myc NLS.

89. The composition of claim 88 wherein the c-myc NLS comprises the sequence of SEQ ID NO: 7, SEQ ID NO: 8, or SEQ ID NO: 21.

90. The composition of claim 88 wherein the c-myc NLS comprises the sequence SEQ ID NO: 21.

91. The composition of any one of claims 83 through 90 wherein one or more of the NLSs comprises a sequence of EGL-13 NLS.

92. The composition of claim 91 wherein the EGL-13 NLS comprises the sequence of SEQ ID NO: 107.

93. The composition of any one of claims 82 through 92 wherein the NLS or NLSs is at or near the N-terminus of the polypeptide.

94. The composition of any one of claims 81 through 93 wherein the first polynucleotide comprises a polynucleotide coding for a purification tag.

95. The composition of claim 94 wherein the purification tag is at or near the N- terminus of the nuclease polypeptide.

96. The composition of claim 94 or 95 wherein the purification tag comprises a poly- his tag, such as a Gly-6x His tag or Gly-8x His tag; short epitope tags, e.g., FLAG, hemagglutinin (HA), c-myc, T7, Glu-Glu; maltose binding protein (mbp); N-terminal glutathione .S'-transfcrasc (GST); or calmodulin binding peptide (CBP).

97. The composition of claim 96 wherein the purification tag comprises a poly -his tag.

98. The composition of claim 97 wherein the purification tag comprises a gly-6x His tag.

99. The composition of claim 97 wherein the purification tag comprises a gly-8x His tag.

100. The composition of any one of claims 81 through 99 wherein the Type V CRISPR nuclease polypeptide comprises a cleavage site.

101. The composition of claim 100 wherein the cleavage site is at or near the N- terminus of the nuclease polypeptide.

102. The composition of claim 100 or 101 wherein the cleavage site comprises a Tobacco Etch Virus (TEV) cleavage site.

103. The composition of claim 102 wherein the cleavage site comprises the sequence of SEQ ID NO: 108.

104. The composition of claim 103 comprising 5 NLSs at or near the N-terminus of the polypeptide, a purification tag, and the cleavage site, wherein the cleavage site is after the purification tag.

105. The composition of any one of claims 81 through 104 wherein the polynucleotide codes for a polypeptide comprising a sequence at least 60, 70, 80, 85, 90, 95, 98, 99%, or 100%, identical, preferably at least 80%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% identical to any one of SEQ ID NOs: 109-112

106. The composition of any one of claims 81 through 105 wherein the polynucleotide codes for a polypeptide comprising a sequence at least 60, 70, 80, 85, 90, 95, 98, 99%, or 100%, preferably at least 80%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% identical identical to SEQ ID NO: 112.

107. The composition of any one of claims 81 through 105 wherein the first polynucleotide comprises a sequence at least 50, 60, 70, 80, 90, 95, 97, or 99% identical, or 100% identical , preferably at least 80%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% identical to SEQ ID NO: 113.

108. The composition of any one of claims 81 through 107 further comprising a second polynucleotide coding for a gNA or portion thereof, wherein the gNA, e.g., gRNA, comprises a spacer sequence that targets a target nucleotide sequence within a polynucleotide, or a polynuclotide coding for the gNA, e.g., gRNA, wherein the gNA, e.g., gRNA is compatible with the Type V CRISPR nuclease.

109. The composition of claim 108 wherein the first and second polynucleotides are the same.

110. The composition of any one of claims 81 through 109 further comprising third polynucleotide that comprises a donor template.

111. A vector comprising the polynucleotide or polynucleotides of any one of claims 81 through 110.

112. A cell comprising a composition of any one of claims 81 through 110.

113. The composition of claim 112 wherein the cell is a human cell.

114. The composition of claim 113 wherein the cell is an immune cell or a stem cell.

115. The composition of claim 113 wherein the cell is an immune cell.

116. The composition of claim 115 wherein the cell is T cell.

117. The composition of claim 113 wherein the cell is a stem cell.

118. The composition of claim 117 wherein the cell is an iPSC.

119. A method comprising inserting the composition of any one of claims 81 through 111 into a cell.

120. The method of claim 119 wherein inserting the composition into the cell comprises electroporation. 121. A method comprising (i) inserting a composition of any one of claims 81 through

107 into a cell and (ii) inserting a gNA, e.g. a gRNA, compatible with the Type V CRISPR nuclease coded for by the composition, into the cell.

122. The method of claim 121 wherein steps (i) and (ii) comprise electroporation.

Description:

MODIFIED NUCLEASES

CROSS-REFERENCE

[0001] This application claims priority to U.S. Provisional Application No. 63/185,315, filed May 6, 2021, and to U.S. Provisional Application No. 63/315,483, filed March 1, 2022, both of which are incorporated herein by reference.

BACKGROUND

[0002] Nucleic acid-guided nucleases have become important tools for research and genome engineering. The applicability of these tools can be limited by the sequence specificity requirements, expression, or delivery issues. INCORPORATION BY REFERENCE

[0003] All publications, patents, and patent applications mentioned in this specification are herein incorporated by reference to the same extent as if each individual publication, patent, or patent application was specifically and individually indicated to be incorporated by reference.

BRIEF DESCRIPTION OF THE DRAWINGS [0004] The novel features of the invention are set forth with particularity in the appended claims. A better understanding of the features and advantages of the present invention will be obtained by reference to the following detailed description that sets forth illustrative embodiments, in which the principles of the invention are utilized, and the accompanying drawings of which: [0005] Figure 1 shows a diagram of MAD7 comprising one or more nuclear localization signals (NLS).

[0006] Figure 2 shows editing frequency at the DNMT1 locus in and post-transfection cell viability of T-cell leukemic cells following treatment comprising one or more guide nucleic acids complexed with MAD7 comprising one or more NLS. [0007] Figure 3 shows editing frequency at the DNMT1 locus in T-cell leukemic cells using multiple electroporation programs in combination with the SE electroporation buffer.

[0008] Figure 4 shows editing frequency at the DNMT1 locus in T-cell leukemic cells using multiple electroporation programs in combination with the SF electroporation buffer.

[0009] Figure 5 shows editing frequency at the DNMT1 locus in T-cell leukemic cells using multiple electroporation programs in combination with the SG electroporation buffer.

[0010] Figure 6 shows editing frequency at the DNMT1 locus in T-cell leukemic cells using multiple electroporation programs. [0011] Figure 7shows editing frequency by type at eight loci in T-cell leukemic cells using multiple guide nucleic acids complexed with MAD7 comprising one or more NLS.

[0012] Figure 8 shows a comparison of editing efficiency between T-cell leukemic cells treated with MAD7 comprising one or more guide nucleic acids targeting the DNMT 1 locus as compared to a control guide nucleic acid binned by editing frequency.

[0013] Figure 9 shows editing frequency by PAM motif in T-cell leukemic cells using multiple guide nucleic acids complexed with MAD7 comprising one or more NLS.

[0014] Figure 10A shows sequence logo plots for multiple guide nucleic acids binned by editing frequency in T-cell leukemic cells using when complexed with MAD7 comprising one or more NLS.

[0015] Figure 10B shows nucleotide and dinucleotide frequency for multiple guide nucleic acids binned by editing frequency in T-cell leukemic cells using when complexed with MAD7 comprising one or more NLS.

[0016] Figure 11 shows trinucleotide AAA or UUU frequency binned by editing frequency in T-cell leukemic cells following treatment with multiple guide nucleic acids complexed with MAD7 comprising one or more NLS.

[0017] Figure 12 shows editing frequency for both INDELs and frameshift mutations at eight loci in T-cell leukemic cells following treatment with multiple guide nucleic acids complexed with MAD7 comprising one or more NLS. [0018] Figure 13 shows the correlation between INDEL frequency in the gNA validation experiment versus INDEL formation in the gNA screen experiment.

[0019] Figure 14 shows the proportion of frameshift to INDELs at eight loci in T-cell leukemic cells following treatment with multiple guide nucleic acids complexed with MAD7 comprising one or more NLS. [0020] Figure 15 shows INDEL frequency for gNAs comprising representative spacer sequences complexed with MAD7 comprising one or more NLS in T-cell leukemic cells at predicted off-target sites.

[0021] Figure 16 shows INDEL frequency for gNAs comprising representative spacer sequences complexed with MAD7 comprising one or more NLS in T-cell leukemic cells at predicted off-target sites.

[0022] Figure 17 shows INDEL frequency at the AAVS1 locus in T-cell leukemic cells following treatment with a gNA:MAD7 complex.

[0023] Figure 18 shows GFP insertion efficiency at the AAVS 1 locus and cell viability following treatment for multiple primer constructs. [0024] Figure 19 shows GFP insertion efficiency at the AAVS 1 locus with increasing concentrations of donor template (e.g., HDRT) and variable homology arm length.

[0025] Figure 20 shows CAR insertion efficiency at the AAVS 1 locus and cell viability with increasing concentrations of donor template and variable homology arm length.

[0026] Figure 21 shows CAR insertion efficiency (A) at the AAVS 1 locus and cell viability (B) in primary T-cells.

DETAILED DESCRIPTION

[0027] CRISPR is an abbreviation of Clustered Regularly Interspaced Short Palindromic Repeats. In a palindromic repeat, the sequence of nucleotides is the same in both directions.

Each of these palindromic repetitions is followed by short segments of spacer DNA. Small clusters of Cas (CRISPR-associated system) genes are located next to CRISPR sequences. The CRISPR/Cas system is a prokaryotic immune system that can confer resistance to foreign genetic elements such as those present within plasmids and phages providing the prokaryote a form of acquired immunity. RNA harboring a spacer sequence assists Cas (CRISPR-associated) proteins to recognize and cut exogenous DNA. CRISPR sequences are found in approximately 50% of bacterial genomes and nearly 90% of sequenced archaea has selected for efficient and robust metabolic and regulatory networks that prevent unnecessary metabolite biosynthesis and optimally distribute resources to maximize overall cellular fitness. The complexity of these networks with limited approaches to understand their structure and function and the ability to re program cellular networks to modify these systems for a diverse range of applications has complicated advances in this space. Certain approaches to re-program cellular networks are directed to modifying single genes of complex pathways but as a consequence of modifying single genes, unwanted modifications to the genes or other genes can result, getting in the way of identifying changes necessary to achieve a sought-after endpoint as well as complicating the endpoint sought by the modification.

[0028] CRISPR-Cas driven genome editing and engineering has dramatically impacted biology and biotechnology in general. CRISPR-Cas editing systems require a polynucleotide guided nuclease, a guide nucleic acid (gNA) e.g. a guide RNA (gRNA)) that directs the nuclease to cut a specific region of the genome, and, optionally, a donor DNA cassette (also referred to herein as a donor template or editing sequence) that can be used to repair the cut dsDNA and thereby incorporate programmable edits at the site of interest. The earliest demonstrations and applications of CRISPR-Cas editing used Cas9 nucleases and associated gRNA. These systems have been used for gene editing in a broad range of species encompassing bacteria to higher order mammalian systems such as animals and in certain cases, humans. It is well established, however, that important editing parameters such as protospacer adjacent motif (PAM) specificity, editing efficiency, and off-target rates, among others, are species, loci, and nuclease dependent. There is increasing interest in identifying and rapidly characterizing novel nuclease systems that can be exploited to broaden and improve overall editing capabilities.

[0029] One version of the CRISPR/Cas system, CRISPR/Cas9, has been modified to provide useful tools for editing targeted genomes. By delivering the Cas9 nuclease complexed with a synthetic guide RNA (gRNA) into a cell, the cell’s genome can be cut/edited at a predetermined location, allowing existing genes to be removed and/or new ones added. These systems are useful but have some important limitations regarding efficiency and accuracy of targeted editing, imprecise editing complications, as well as impediments when used for commercially relevant situations such as gene replacement. Therefore, a need exists for improved nucleic acid guided nuclease systems for directed and accurate editing with improved efficiency.

[0030] As used herein, the term “modulating” and “manipulating” of genome editing can mean an increase, a decrease, upregulation, downregulation, induction, a change in editing activity, a change in binding, a change cleavage or the like, of one or more of targeted genes or gene clusters of certain embodiments disclosed herein.

[0031] In certain embodiments of the present disclosure, there can be employed conventional molecular biology, microbiology, and recombinant DNA techniques within the skill of the art. Such techniques are explained fully in the literature and understood by those of skill in the art. [0032] In other embodiments, primers used herein for preparation per conventional techniques can include sequencing primers and amplification primers. In some embodiments, plasmids and oligomers used in conventional techniques can include synthesized oligomers and oligomer cassettes.

[0033] In some embodiments disclosed herein, nucleic acid-guided nuclease systems and methods of use are provided. A nuclease system can include transcripts and other elements involved in the expression of an engineered nuclease disclosed herein, which can include sequences encoding a novel engineered nucleic acid-guided nuclease protein and a guide sequence (gRNA) or a novel gRNA as disclosed herein. In some embodiments, nucleic acid- guided nuclease systems can include at least one CRISPR-associated nucleic acid guided nuclease construct, the disclosure of which are provided herein. In other embodiments, nucleic acid-guided nuclease systems can include at least one known guide sequence (gRNA) or at least one novel gRNA, such as a single gRNA or a dual gRNA. In some embodiments, an engineered nucleic acid-guided nuclease of the instant invention can be used in systems for editing a gene of interest in humans or other species. [0034] Bacterial and archaeal targetable nuclease systems have emerged as powerful tools for precision genome editing. However, naturally occurring nucleases have some limitations including expression and delivery challenges due to the nucleic acid sequence and protein size.

In certain embodiments, novel engineered nucleic acid-guided nuclease constructs disclosed herein can be created for targeting of a targeted gene and/or increased efficiency and/or accuracy of targeted gene editing in a subject.

[0035] In accordance with these embodiments, it is known that Casl2a is a single RNA- guided CRISPR/Cas endonuclease capable of genome editing having differing features when compared to Cas9. In certain embodiments, a Casl2a-based system allow fast and reliable introduction of donor DNA into a genome. In addition, Casl2a broadens genome editing. CRISPR/Casl2a genome editing has been evaluated in human cells as well as other organisms including plants. Several features of the CRISPR/Cas 12a system are different when compared to CRISPR/Cas9.

[0036] It is known that Casl2a nuclease recognizes T-rich protospacer adjacent motif (PAM) sequences (e.g. 5’-TTTN-3’ (AsCasl2a, LbCasl2a) and 5’-TTN-3’ (FnCasl2a); whereas, the comparable sequence for SpCas9 is NGG. The PAM sequence of Casl2a is located at the 5’ end of the target DNA sequence, where it is at the 3’ end for Cas9. In addition, Casl2a is capable of cleaving DNA distal to its PAM around the +18/+23 position of the protospacer. This cleavage creates a staggered DNA overhang (e.g. sticky ends), whereas Cas9 cleaves close to its PAM after the 3’ position of the protospacer at both strands and creates blunt ends. In certain methods, creating altered recognition of nucleases can provide an improvement over Cas9 or Casl2a to improve accuracy. Further, Casl2a is guided by a single crRNA and does not require a tracrRNA, resulting in a shorter gRNA sequence than the sgRNA used by Cas9. Surprisingly, it has been found that the modified Casl2a nucleases provided herein can also function with a dual gRNA.

[0037] It is also known that Casl2a displays additional ribonuclease activity that functions in crRNA processing. Casl2a is used as an editing tool for different species (e.g. S. cerevisiae), allowing the use of an alternative PAM sequence compared with the one recognized by CRISPR/Cas9. Novel nucleases disclosed herein can further recognize the same or alternative PAM sequences. These novel nucleases can provide an alternative system for multiplex genome editing as compared with known multiplex approaches and can be used as an improved system in mammalian gene editing.

[0038] Well-known Cas 12a protein-RNA complexes recognize a T-rich PAM and cleavage leads to a staggered DNA double-stranded break. Casl2a-type nuclease interacts with the pseudoknot structure formed by the 5 '-handle of crRNA. A guide RNA segment, composed of a seed region and the 3' terminus, possesses complementary binding sequences with the target

DNA sequences. Casl2a type nucleases characterized to date have been demonstrated to work with a single gRNA and to process gRNA arrays. While Casl2a-type and Cas9 nuclease systems have proven highly impactful, neither system has been demonstrated to function as predictably as is desired to enable the full range of applications envisioned for gene-editing technologies.

[0039] In the current state, a range of efforts have attempted to engineer improved CRISPR editing systems having increased efficiency and accuracy, which have included engineering of the PAM specificity, stability, and sequence of the gRNA and-or the nuclease. For example, chemical modifications of CRISPR/Cas9 gRNA expected to increase gRNA stability was found to lead to a 3.8-fold higher indel frequencies in human cells. In addition, other studies included structure-guided mutagenesis of Casl2a and screened to identify variants with an increased range of recognized PAM sequences. These engineered AsCasl2a recognized TYCV and TATV PAMs in addition to the established TTTV sequence, with enhanced activities in vitro and in tested human cells.

[0040] In certain embodiments, Casl2a-like nucleases and engineered gRNAs disclosed herein are contemplated for use in bacteria, and other prokaryotes. In certain embodiments, engineered designer nucleases are contemplated for use in eukaryotes such as yeast, mammals, e.g., human as well as of use in birds and fish, or cells derived from same.

[0041] In some embodiments, off-targeting rates for nuclease constructs disclosed herein can be reduced compared to a control, e.g., a native sequence, for improved editing. Off-targeting rates can be readily tested.

[0042] In some embodiments, nuclease constructs disclosed herein can share conserved encoded motifs of known nucleases. In other embodiments, nuclease constructs disclosed herein do not share conserved encoded peptide motifs with known nucleases. In preferred embodiments, provided herein are compositions, methods, and/or kits wherein the CRISPR nuclease comprises a Type V nuclease. In certain embodiments, provided herein are compositions, methods, and/or kits wherein the CRISPR nuclease comprises a Type V-A, V-B, V-C, V-D, or V-E CRISPR nuclease. In certain embodiments, provided herein are compositions, methods, and/or kits wherein the CRISPR nuclease comprises a Type V-A nuclease. Naturally occurring type V-A CRISPR nucleases comprise a RuvC-like nuclease domain but lack an HNH endonuclease domain, and recognize a 5 ’ T -rich PAM located immediately upstream from the target nucleotide sequence, the orientation determined using the non-target strand (i.e., the strand not hybridized with the spacer sequence) as the coordinate. These CRISPR nucleases cleave a double-stranded DNA to generate a staggered double-stranded break rather than a blunt end. The cleavage site is distant from the PAM site (e.g., separated by at least 10, 11, 12, 13, 14, or 15 nucleotides downstream from the PAM on the non-target strand and/or separated by at least 15, 16, 17, 18, or 19 nucleotides upstream from the sequence complementary to PAM on the target strand).

[0043] In certain embodiments, a type V-A CRISPR nuclease comprises Cpfl. Cpfl proteins are known in the art and are described, e.g., in U.S. Patent Nos. 9,790,490 and 10,113,179. Cpfl orthologs can be found in various bacterial and archaeal genomes. For example, in certain embodiments, the Cpfl protein is derived from Francisella novicida U112 (Fn), Acidaminococcus sp. BV3L6 (As), Lachnospiraceae bacterium ND2006 (Lb), Lachnospiraceae bacterium MA2020 (Lb2), Candidatus Methanoplasma termitum (CMt), Moraxella bovoculi 237 (Mb), Porphyromonas crevioricanis (Pc), Prevotella disiens (Pd), Francisella tularensis 1 , Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011 GWA2 33 10, Parcubacteria bacterium GW2011 GWC2 44 17, Smithella sp. SCADC, Eubacterium eligens, Leptospira inadai, Porphyromonas macacae, Prevotella bryantii, Proteocatella sphenisci, Anaerovibrio sp. RM50 , Moraxella caprae, Lachnospiraceae bacterium COE1, or Eubacterium coprostanoligenes .

[0044] In certain embodiments, a type V-A CRISPR nuclease comprises AsCpfl or a variant thereof. In certain embodiments, a type V-A CRISPR nucleases comprises an amino acid sequence at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the amino acid sequence set forth in SEQ ID NO: 3 of International (PCT) Application Publication No. WO 2021/158918. In certain embodiments, a type V-A CRISPR nucleases comprises the amino acid sequence set forth in SEQ ID NO: 3 of International (PCT) Application Publication No. WO 2021/158918.

[0045] In certain embodiments, a type V-A CRISPR nuclease comprises LbCpfl or a variant thereof. In certain embodiments, a type V-A CRISPR nucleases comprises an amino acid sequence at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the amino acid sequence set forth in SEQ ID NO: 4 of International (PCT) Application Publication No. WO 2021158918. In certain embodiments, a type V-A Cas protein comprises the amino acid sequence set forth in SEQ ID NO: 4 of International (PCT) Application Publication No. WO 2021/158918.

[0046] In certain embodiments, a type V-A CRISPR nuclease comprises FnCpfl or a variant thereof. In certain embodiments, a type V-A Cas protein comprises an amino acid sequence at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,

98%, 99%, or 100% identical to the amino acid sequence set forth in SEQ ID NO: 5 of International (PCT) Application Publication No. WO 2021158918. In certain embodiments, a type V-A Cas protein comprises the amino acid sequence set forth in SEQ ID NO: 5 of International (PCT) Application Publication No. WO 2021/158918.

[0047] In certain embodiments, a type V-A CRISPR nuclease comprises Prevotella hryantii Cpfl (PbCpfl) or a variant thereof. In certain embodiments, a type V-A Cas protein comprises an amino acid sequence at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the amino acid sequence set forth in SEQ ID NO: 6 of International (PCT) Application Publication No. WO 2021/158918. In certain embodiments, a type V-A Cas protein comprises the amino acid sequence set forth in SEQ ID NO: 6 of International (PCT) Application Publication No. WO 2021/158918.

[0048] In certain embodiments, a type V-A CRISPR nuclease comprises Proteocatella sphenisci Cpfl (PsCpfl) or a variant thereof. In certain embodiments, a type V-A Cas protein comprises an amino acid sequence at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the amino acid sequence set forth in SEQ ID NO: 7 of International (PCT) Application Publication No. WO 2021158918. In certain embodiments, a type V-A Cas protein comprises the amino acid sequence set forth in SEQ ID NO: 7 of International (PCT) Application Publication No. WO 2021/158918.

[0049] In certain embodiments, a type V-A CRISPR nuclease comprises Anaerovibrio sp. RM50 Cpfl (As2Cpfl) or a variant thereof. In certain embodiments, a type V-A Cas protein comprises an amino acid sequence at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the amino acid sequence set forth in SEQ ID NO: 8 of International (PCT) Application Publication No. WO 2021158918. In certain embodiments, a type V-A Cas protein comprises the amino acid sequence set forth in SEQ ID NO: 8 of International (PCT) Application Publication No. WO 2021/158918.

[0050] In certain embodiments, a type V-A CRISPR nuclease comprises Moraxella caprae Cpfl (McCpfl) or a variant thereof. In certain embodiments, a type V-A Cas protein comprises an amino acid sequence at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the amino acid sequence set forth in SEQ ID NO: 9 of International (PCT) Application Publication No. WO 2021/158918. In certain embodiments, a type V-A Cas protein comprises the amino acid sequence set forth in SEQ ID NO: 9 of International (PCT) Application Publication No. WO 2021/158918.

[0051] In certain embodiments, a type V-A CRISPR nuclease comprises Lachnospiraceae bacterium COE1 Cpfl (Lb3Cpfl) or a variant thereof. In certain embodiments, a type V-A Cas protein comprises an amino acid sequence at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the amino acid sequence set forth in SEQ ID NO: 10 of International (PCT) Application Publication No. WO 2021158918. In certain embodiments, a type V-A Cas protein comprises the amino acid sequence set forth in SEQ ID NO: 10 of International (PCT) Application Publication No. WO 2021/158918.

[0052] In certain embodiments, a type V-A CRISPR nuclease comprises Eubacterium coprostanoli genes Cpfl (EcCpfl) or a variant thereof. In certain embodiments, a type V-A Cas protein comprises an amino acid sequence at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the amino acid sequence set forth in SEQ ID NO: 11 of International (PCT) Application Publication No. WO 2021158918. In certain embodiments, a type V-A Cas protein comprises the amino acid sequence set forth in SEQ ID NO: 11 of International (PCT) Application Publication No. WO 2021/158918.

[0053] In certain embodiments, a type V-A CRISPR nuclease is not Cpfl. In certain embodiments, a type V-A CRISPR nuclease is not AsCpfl.

[0054] In certain embodiments, a type V-A CRISPR nuclease comprises a Type V-A nuclease described in U.S. Patent No. 9,982,279.

[0055] In certain embodiments, a Type VA CRISPR nuclease polypeptide used in compositions and methods herein can be represented by a polypeptide that includes a sequence that has at least 60, 70, 80, 85, 90, 95, 96, 97, 98, 99, or 100% sequence identity, preferably at least 80%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% sequence identity with SEQ ID NO: 1 SEQ ID NO: 1 wherein the Type VA CRISPR nuclease polypeptide further comprises at least one, two, three, four, five or six nuclear localization sequences (NLS), each of which can be at or near the amino end or carboxy end of the CRISPR nuclease polypeptide; and/or one or more purification tags; in addition, a cleavage sequence can be provided to remove portions of a protopeptide. As used herein, the term “at or near” an N-terminus or a C-terminus includes where the nearest amino acid of the NLS to the N- or C-terminus is within 300 amino acids, in some cases within 200 amino acids, from the N- or C-terminus of the polypeptide (e.g., a core polypeptide such as one of the CRISPR nucleases described herein, to which the NLS or NLSs is attached). In certain emobidments, a Type V CRISPR nuclease polypeptide, e.g., Type Va CRISPR polypeptide, comprises two, three, four, or five NLSs, each of which are at or near the N-terminus or the C-terminus of the polypeptide, in preferred embodiments the NLSs are at or near the N-terminus. In certain embodiments, a CRISPR nuclease polypeptide, including one or more NLSs and, in some cases, a purification tag and/or a cleavage site, comprises a sequence at least 60, 70, 80, 85, 90, 95, 98, 99%, or 100%, identical, preferably at least 80%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% identical to any one of SEQ ID NOs: 109-112. In certain embodiments, a Type V, e.g., VA CRISPR nuclease polypeptide comprises at least 1-30, 1-20, 1- 15, 1-10, 1-9, 1-8, 1-7, 1-6, 1-5, 2-30, 2-20, 2-15, 2-10, 2-9, 2-8, 2-7, 2-6, 2-5, 3-30, 3-20, 3-15, 3-10, 3-9, 3-8, 3-7, 3-6, or 3-5, preferably 1-10, more preferably 2-10, even more preferably 3-10 NLSs, each of which is at or near the N-terminus or the C-terminus of the polypeptide, in preferred embodiments at or near the N-terminus. In certain embodiments, at least two, or at least three, of the NLSs have different mechanisms, that is, different mechanisms by which they localize an attached polypeptide to a nucleus. Such mechanisms are well-known in the art; see, e.g., Lu et al. Cell Commun Signal (2021) 19:60 hftpsV/doLorg/IO.1186/s 12964 -021 -0074 ! -y. Suitable NLS, purification tag, and cleavage site sequences can be as described elsewhere herein, e.g., in sections labled Nuclear Localization Signals, Purification Tags, and Cleavage Sites.

[0056] SEQ ID NO:l

MNNGTNNFQNFIGISSLQKTLRNALIPTETTQQFIVKNGIIKEDELRGENRQILKDI MDDY

YRGFISETLSSIDDIDWTSLFEKMEIQLKNGDNKDTLIKEQTEYRKAIHKKFANDDR FKN

MFSAKLISDILPEFVIHNNNYSASEKEEKTQVIKLFSRFATSFKDYFKNRANCFSAD DISSS

SCHRIVNDNAEIFFSNALVYRRIVKSLSNDDINKISGDMKDSLKEMSLEEIYSYEKY GEFI

TQEGISFYNDICGKVNSFMNLYCQKNKENKNLYKLQKLHKQILCIADTSYEVPYKFE SD

EEVYQSVNGFLDNISSKHIVERLRKIGDNYNGYNLDKIYIVSKFYESVSQKTYRDWE TIN

TALEIHYNNILPGNGKSKADKVKKAVKNDLQKSITEINELVSNYKLCSDDNIKAETY IHEI

SHILNNFEAQELKYNPEIHLVESELKASELKNVLDVIMNAFHWCSVFMTEELVDKDN NF

YAELEEIYDEIYPVISLYNLVRNYVTQKPYSTKKIKLNFGIPTLADGWSKSKEYSNN AIIL

MRDNLYYLGIFNAKNKPDKKIIEGNTSENKGDYKKMIYNLLPGPNKMIPKVFLSSKT GV

ET YKP S A YILEGYKQNKHIKS SKDFDITFCHDLID YFKNCIAIHPEWKNF GFDF SDTS TYE

DIS GF YREVELQGYKIDWT YISEKDIDLLQEKGQL YLFQI YNKDF SKKS T GNDNLHTM YL

KNLFSEENLKDIVLKLNGEAEIFFRKSSIKNPIIHKKGSILVNRTYEAEEKDQFGNI QIVRK

NIPENIY QELYKYFNDKSDKELSDEAAKLKNVV GHHEAATNIVKDYRYTYDKYFLHMPI

TINFKANKTGFINDRILQYIAKEKDLHVIGIDRGERNLIYVSVIDTCGNIVEQKSFN IVNGY

DYQIKLKQQEGARQIARKEWKEIGKIKEIKEGYLSLVIHEISKMVIKYNAIIAMEDL SYGF

KKGRFKVERQVYQKFETMLINKLNYLVFKDISITENGGLLKGYQLTYIPDKLKNVGH QC

GCIFYVPAAYTSKIDPTTGFVNIFKFKDLTVDAKREFIKKFDSIRYDSEKNLFCFTF DYNN

FITQNTVMSKSSWSVYTYGVRIKRRFVNGRFSNESDTIDITKDMEKTLEMTDINWRD GH

DLRQDIIDYEIVQHIFEIFRLTVQMRNSLSELEDRDYDRLISPVLNENNIFYDSAKA GDALP

KDADANGAYCIALKGLYEIKQITENWKEDGKFSRDKLKISNKDWFDFIQNKRYL

[0057] Nucleotide sequences coding for SEQ ID NO: 1 can include sequences with less than

99, 95, 90, 85, 80, 75, 70, 65, 60, 55, 50, 45, or 40% sequence identity with SEQ ID NO: 22, in preferred embodiments less than 75% sequence identity. . In certain embodiments, a nucleotide sequence coding for SEQ ID NO: 1 can also include nucleic acid sequences coding for one or more NLS at the N-terminus and/or C-terminus, as described herein, and/or a tag such as a purification tag at the N-terminus, as described herein. In certain embodiments, provided herein are compositions comprising a first polynucleotide coding for a polypeptide comprising a nucleic acid-guided nuclease comprising a CRISPR Type V nuclease polypeptide, wherein the polynucleotide has less than 75% sequence identity to SEQ ID NO: 22, such as wherein the nuclease polypeptide comprises at least 1, 2, 3, 4, or 5 NLSs, wherein each of the NLSs is at or near the N-terminus or the C-terminus of the nuclease polypeptide. NLSs can be any of those described herein. The first polynucleotide can comprise a sequence coding for a purification tag, such as a purification tag described herein, and/or cleavage site, such as a cleavage site described herein. In certain embodiments the first polynucleotide codes for a polypeptide comprising a sequence at least 60, 70, 80, 85, 90, 95, 98, 99%, or 100%, identical, preferably at least 80%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% identical to any one of SEQ ID NOs: 109-112, such as SEQ ID NO: 109, or SEQ ID NO:

110, or SEQ ID NO: 111, or SEQ ID NO: 112. the first polynucleotide comprises a sequence at least 50, 60, 70, 80, 90, 95, 97, or 99% identical, or 100% identical , preferably at least 80%, more preferably at least 90%, even more preferably at least 95%, still more preferably at least 98% identical to SEQ ID NO: 113. In certain embodiment the composition further comprises a second polynucleotide coding for a gNA or portion thereof, wherein the gNA, e.g., gRNA, comprises a spacer sequence that targets a target nucleotide sequence within a polynucleotide, or a polynuclotide coding for the gNA, e.g., gRNA, wherein the gNA, e.g., gRNA is compatible with the Type V CRISPR nuclease. In certain embodiments the first and second polynucleotides are the same. The composition can further comprise a third polynucleotide comprising a donor template. In certain embodiments, provided is a vector comprising one of the polynucleotide compositions of this paragraph. In certain embodiments, provided is a cell comprising one of the polynucleotide compositions of this paragraph, e.g., a human cell, such as an immune cell, for example a T cell, or a stem cell, such as an iPSC. In certain embodiments, provided is a method comprising inserting any one of the polynucleotide compositions of this paragraph into a cell. In certain embodiments inserting the composition comprises electroporation.

[0058] SEQ ID NO: 22:

ATGAACAACGGCACAAATAATTTTCAGAACTTCATCGGGATCTCAAGTTTGCAGAAA

ACGCTGCGCAATGCTCTGATCCCCACGGAAACCACGCAACAGTTCATCGTCAAGAA

CGGAATAATTAAAGAAGATGAGTTACGTGGCGAGAACCGCCAGATTCTGAAAGATA

TCATGGATGACTACTACCGCGGATTCATCTCTGAGACTCTGAGTTCTATTGATGACA

TAGATTGGACTAGCCTGTTCGAAAAAATGGAAATTCAGCTGAAAAATGGTGATAAT AAAGATACCTTAATTAAGGAACAGACAGAGTATCGGAAAGCAATCCATAAAAAATT

TGCGAACGACGATCGGTTTAAGAACATGTTTAGCGCCAAACTGATTAGTGACATATT

ACCTGAATTTGTCATCCACAACAATAATTATTCGGCATCAGAGAAAGAGGAAAAAA

CCCAGGTGATAAAATTGTTTTCGCGCTTTGCGACTAGCTTTAAAGATTACTTCAAGA

ACCGTGCAAATTGCTTTTCAGCGGACGATATTTCATCAAGCAGCTGCCATCGCATCG

TCAACGACAATGCAGAGATATTCTTTTCAAATGCGCTGGTCTACCGCCGGATCGTAA

AATCGCTGAGCAATGACGATATCAACAAAATTTCGGGCGATATGAAAGATTCATTA

AAAGAAATGAGTCTGGAAGAAATATATTCTTACGAGAAGTATGGGGAATTTATTAC

CCAGGAAGGCATTAGCTTCTATAATGATATCTGTGGGAAAGTGAATTCTTTTATGAA

CCTGTATTGTCAGAAAAATAAAGAAAACAAAAATTTATACAAACTTCAGAAACTTC

ACAAACAGATTCTATGCATTGCGGACACTAGCTATGAGGTCCCGTATAAATTTGAAA

GTGACGAGGAAGTGTACCAATCAGTTAACGGCTTCCTTGATAACATTAGCAGCAAA

CATATAGTCGAAAGATTACGCAAAATCGGCGATAACTATAACGGCTACAACCTGGA

TAAAATTTATATCGTGTCCAAATTTTACGAGAGCGTTAGCCAAAAAACCTACCGCGA

CTGGGAAACAATTAATACCGCCCTCGAAATTCATTACAATAATATCTTGCCGGGTAA

CGGTAAAAGTAAAGCCGACAAAGTAAAAAAAGCGGTTAAGAATGATTTACAGAAAT

CCATCACCGAAATAAATGAACTAGTGTCAAACTATAAGCTGTGCAGTGACGACAAC

ATCAAAGCGGAGACTTATATACATGAGATTAGCCATATCTTGAATAACTTTGAAGCA

CAGGAATTGAAATACAATCCGGAAATTCACCTAGTTGAATCCGAGCTCAAAGCGAG

TGAGCTTAAAAACGTGCTGGACGTGATCATGAATGCGTTTCATTGGTGTTCGGTTTT T

ATGACTGAGGAACTTGTTGATAAAGACAACAATTTTTATGCGGAACTGGAGGAGAT

TTACGATGAAATTTATCCAGTAATTAGTCTGTACAACCTGGTTCGTAACTACGTTAC C

CAGAAACCGTACAGCACGAAAAAGATTAAATTGAACTTTGGAATACCGACGTTAGC

AGACGGTTGGTCAAAGTCCAAAGAGTATTCTAATAACGCTATCATACTGATGCGCGA

CAATCTGTATTATCTGGGCATCTTTAATGCGAAGAATAAACCGGACAAGAAGATTAT

CGAGGGTAATACGTCAGAAAATAAGGGTGACTACAAAAAGATGATTTATAATTTGC

TCCCGGGTCCCAACAAAATGATCCCGAAAGTTTTCTTGAGCAGCAAGACGGGGGTG

GAAACGTATAAACCGAGCGCCTATATCCTAGAGGGGTATAAACAGAATAAACATAT

CAAGTCTTCAAAAGACTTTGATATCACTTTCTGTCATGATCTGATCGACTACTTCAA A

AACTGTATTGCAATTCATCCCGAGTGGAAAAACTTCGGTTTTGATTTTAGCGACACC

AGTACTTATGAAGACATTTCCGGGTTTTATCGTGAGGTAGAGTTACAAGGTTACAAG

ATTGATTGGACATACATTAGCGAAAAAGACATTGATCTGCTGCAGGAAAAAGGTCA

ACTGTATCTGTTCCAGATATATAACAAAGATTTTTCGAAAAAATCAACCGGGAATGA

CAACCTTCACACCATGTACCTGAAAAATCTTTTCTCAGAAGAAAATCTTAAGGATAT

CGTCCTGAAACTTAACGGCGAAGCGGAAATCTTCTTCAGGAAGAGCAGCATAAAGA ACCCAATCATTCATAAAAAAGGCTCGATTTTAGTCAACCGTACCTACGAAGCAGAA

GAAAAAGACCAGTTTGGCAACATTCAAATTGTGCGTAAAAATATTCCGGAAAACAT

TTATCAGGAGCTGTACAAATACTTCAACGATAAAAGCGACAAAGAGCTGTCTGATG

AAGCAGCCAAACTGAAGAATGTAGTGGGACACCACGAGGCAGCGACGAATATAGTC

AAGGACTATCGCTACACGTATGATAAATACTTCCTTCATATGCCTATTACGATCAAT

TTCAAAGCCAATAAAACGGGTTTTATTAATGATAGGATCTTACAGTATATCGCTAAA

GAAAAAGACTTACATGTGATCGGCATTGATCGGGGCGAGCGTAACCTGATCTACGT

GTCCGTGATTGATACTTGTGGTAATATAGTTGAACAGAAAAGCTTTAACATTGTAAA

CGGCTACGACTATCAGATAAAACTGAAACAACAGGAGGGCGCTAGACAGATTGCGC

GGAAAGAATGGAAAGAAATTGGTAAAATTAAAGAGATCAAAGAGGGCTACCTGAG

CTTAGTAATCCACGAGATCTCTAAAATGGTAATCAAATACAATGCAATTATAGCGAT

GGAGGATTTGTCTTATGGTTTTAAAAAAGGGCGCTTTAAGGTCGAACGGCAAGTTTA

CCAGAAATTTGAAACCATGCTCATCAATAAACTCAACTATCTGGTATTTAAAGATAT

TTCGATTACCGAGAATGGCGGTCTCCTGAAAGGTTATCAGCTGACATACATTCCTGA

TAAACTTAAAAACGTGGGTCATCAGTGCGGCTGCATTTTTTATGTGCCTGCTGCATA

CACGAGCAAAATTGATCCGACCACCGGCTTTGTGAATATCTTTAAATTTAAAGACCT

GACAGTGGACGCAAAACGTGAATTCATTAAAAAATTTGACTCAATTCGTTATGACAG

TGAAAAAAATCTGTTCTGCTTTACATTTGACTACAATAACTTTATTACGCAAAACAC

GGTCATGAGCAAATCATCGTGGAGTGTGTATACATACGGCGTGCGCATCAAACGTC

GCTTTGTGAACGGCCGCTTCTCAAACGAAAGTGATACCATTGACATAACCAAAGATA

TGGAGAAAACGTTGGAAATGACGGACATTAACTGGCGCGATGGCCACGATCTTCGT

CAAGACATTATAGATTATGAAATTGTTCAGCACATATTCGAAATTTTCCGTTTAACA

GTGCAAATGCGTAACTCCTTGTCTGAACTGGAGGACCGTGATTACGATCGTCTCATT

TCACCTGTACTGAACGAAAATAACATTTTTTATGACAGCGCGAAAGCGGGGGATGC

ACTTCCTAAGGATGCCGATGCAAATGGTGCGTATTGTATTGCATTAAAAGGGTTATA

TGAAATTAAACAAATTACCGAAAATTGGAAAGAAGATGGTAAATTTTCGCGCGATA

AACTCAAAATCAGCAATAAAGATTGGTTCGACTTTATCCAGAATAAGCGCTATCTCT

[0059] Exemplary nucleotide sequences coding for SEQ ID NO: 1 can include, e.g., SEQ ID NOs: 23-42:

[0060] SEQ ID NO: 23

ATGAACAACGGAACAAATAATTTTCAGAACTTTATTGGGATCAGTTCGCTTCAGAAA

ACGCTTCGTAATGCTCTGATTCCCACAGAAACCACTCAGCAGTTTATCGTAAAGAAT

GGCATTATCAAGGAGGATGAATTACGCGGCGAGAACCGCCAAATCTTAAAAGATAT

CATGGACGACTACTACCGCGGTTTCATTAGCGAAACTCTTAGTTCAATTGACGACAT TGACTGGACGTCCTTGTTCGAAAAGATGGAGATTCAATTAAAGAACGGTGATAACA

AGGATACGTTGATTAAAGAACAGACGGAGTACCGTAAGGCTATCCACAAAAAATTT

GCAAACGACGACCGCTTTAAAAATATGTTTAGCGCAAAATTAATCTCCGACATCCTG

CCTGAATTCGTCATCCATAACAATAACTATAGCGCCTCGGAAAAAGAAGAAAAAAC

GCAGGTTATTAAACTTTTCTCGCGCTTTGCAACAAGCTTTAAGGATTACTTCAAAAA

TCGCGCCAATTGTTTTTCAGCCGACGACATTAGCTCCAGTTCCTGCCACCGTATTGT G

AATGACAACGCTGAGATTTTTTTTTCCAATGCGCTGGTTTATCGTCGTATTGTTAAG A

GCCTTAGTAACGACGACATTAATAAAATTAGCGGTGATATGAAGGATAGCTTGAAA

GAAATGAGTCTGGAAGAGATCTATAGTTACGAGAAGTACGGCGAATTTATTACCCA

GGAGGGCATTTCATTTTACAATGATATCTGTGGAAAAGTCAACTCCTTTATGAACTT

GTATTGCCAAAAGAATAAAGAAAACAAAAACCTGTACAAACTGCAAAAGTTACACA

AGCAGATTTTGTGTATCGCAGACACGTCATACGAAGTACCGTACAAGTTTGAGTCCG

ATGAAGAAGTGTACCAAAGCGTTAATGGCTTTTTGGATAACATTTCGAGCAAACATA

TCGTAGAGCGTTTGCGTAAGATTGGTGATAATTACAACGGTTACAATTTAGACAAAA

TCTATATCGTCTCTAAGTTTTACGAAAGTGTTTCTCAGAAAACTTACCGCGATTGGG

AGACGATCAACACTGCGCTGGAGATTCATTACAATAATATCCTTCCAGGTAACGGTA

AAAGCAAAGCTGATAAGGTGAAAAAGGCGGTTAAAAATGACCTTCAAAAGTCTATC

ACAGAAATCAACGAATTGGTCAGCAATTATAAGCTTTGCAGTGACGATAACATTAA

GGCCGAGACTTACATCCATGAGATCTCTCACATTCTTAATAATTTTGAAGCGCAAGA

GCTGAAATACAATCCTGAAATCCATCTGGTCGAAAGTGAATTAAAAGCCTCCGAATT

AAAAAATGTCTTGGACGTGATCATGAATGCGTTCCATTGGTGCTCAGTTTTTATGAC

GGAAGAGTTGGTGGACAAAGACAACAATTTTTACGCCGAGCTTGAGGAAATTTACG

ACGAAATTTACCCCGTTATTTCGTTATACAACCTTGTGCGTAATTACGTTACACAAA

AGCCCTATTCGACAAAGAAAATCAAGTTAAATTTCGGGATTCCCACATTAGCTGATG

GATGGTCCAAATCCAAAGAATACTCGAATAACGCTATCATCCTTATGCGTGATAATT

TGTACTACTTAGGCATCTTCAATGCGAAGAACAAACCTGACAAGAAAATTATCGAA

GGAAACACTTCGGAGAACAAAGGTGATTATAAAAAGATGATCTACAACTTGCTTCC

CGGGCCAAACAAAATGATTCCCAAGGTATTTTTGAGTTCTAAAACCGGTGTCGAAAC

TTACAAACCAAGTGCTTATATTTTGGAAGGATACAAACAGAACAAACATATCAAGT

CTTCGAAAGACTTCGATATTACGTTCTGCCACGATCTGATCGATTACTTCAAGAACT

GTATTGCTATTCACCCCGAGTGGAAGAACTTTGGATTTGATTTCTCCGACACGTCCA

CTTATGAAGATATCTCTGGCTTCTATCGCGAGGTTGAATTACAAGGGTATAAGATTG

ACTGGACTTATATTTCGGAGAAGGATATCGATCTTTTGCAAGAAAAAGGGCAACTTT

ATTTATTTCAGATCTATAACAAGGACTTTTCAAAAAAGAGCACTGGAAATGACAATC

TGCATACCATGTACCTTAAGAACCTGTTCTCGGAAGAGAACCTGAAGGACATTGTAC TTAAACTGAATGGAGAGGCAGAGATCTTCTTTCGCAAATCAAGCATTAAGAACCCA

ATTATTCACAAAAAGGGGAGTATCTTAGTAAATCGCACATATGAGGCTGAGGAAAA

AGATCAGTTTGGTAACATTCAGATCGTGCGTAAGAACATTCCTGAAAATATCTATCA

GGAACTTTATAAGTATTTCAACGATAAAAGTGATAAAGAGCTGAGTGACGAAGCGG

CTAAACTTAAGAATGTTGTGGGACACCATGAGGCAGCAACCAATATTGTGAAGGAT

TATCGCTATACGTACGACAAATACTTTTTACACATGCCCATCACTATTAATTTTAAA G

CTAATAAGACTGGCTTCATTAACGATCGCATCCTGCAGTACATTGCTAAGGAAAAGG

ATCTTCACGTTATCGGTATCGATCGCGGGGAGCGTAATCTTATCTACGTCTCTGTCA T

TGACACGTGTGGCAATATTGTGGAGCAAAAGTCCTTCAATATTGTTAACGGCTATGA

CTATCAGATTAAATTGAAACAGCAGGAAGGTGCGCGTCAGATTGCCCGCAAGGAAT

GGAAGGAAATTGGCAAGATCAAAGAAATTAAGGAGGGCTACTTAAGCTTAGTAATT

CACGAAATTAGTAAAATGGTTATCAAATACAACGCCATCATCGCGATGGAGGATCTT

TCGTACGGGTTTAAGAAAGGTCGTTTTAAAGTGGAGCGTCAGGTGTACCAGAAATTT

GAAACTATGCTTATTAACAAACTTAACTACCTGGTTTTCAAGGATATCAGTATTACT

GAAAACGGGGGGCTGTTAAAAGGGTATCAATTAACTTACATTCCAGACAAATTAAA

GAACGTTGGACATCAGTGTGGCTGCATTTTTTATGTACCAGCTGCATACACTTCAAA

GATCGATCCTACGACTGGGTTCGTGAACATTTTTAAGTTTAAAGACTTGACGGTAGA

TGCCAAGCGCGAATTCATCAAGAAATTCGACAGCATTCGCTACGACTCTGAGAAAA

ATCTTTTCTGTTTCACATTCGATTATAACAATTTCATTACGCAGAACACAGTAATGT C

CAAGTCTTCTTGGAGTGTTTATACATATGGTGTCCGCATTAAGCGCCGTTTCGTCAA C

GGCCGCTTCAGTAATGAGAGCGATACTATTGACATCACAAAAGACATGGAAAAAAC

ACTGGAAATGACCGACATCAATTGGCGTGACGGCCATGACTTACGTCAGGATATCAT

TGATTATGAGATCGTTCAACACATCTTCGAAATCTTTCGCTTGACTGTTCAAATGCG C

AATTCCTTGTCGGAATTGGAGGACCGTGATTATGACCGCTTAATTTCCCCCGTCTTA A

ATGAAAACAATATTTTTTATGACTCTGCAAAAGCTGGAGATGCTCTGCCGAAAGACG

CCGATGCAAATGGGGCATATTGCATTGCTTTAAAGGGGCTTTACGAGATCAAGCAA

ATCACCGAAAACTGGAAAGAGGATGGAAAGTTTTCGCGTGATAAACTGAAGATCTC

TAACAAAGACTGGTTCGACTTTATCCAGAACAAGCGTTATTT

[0061] SEQ ID NO: 24

ATGAACAACGGCACCAATAACTTCCAAAACTTCATCGGGATCTCTAGCCTTCAGAAG

ACGCTTCGCAATGCTCTTATCCCAACTGAGACCACTCAACAATTTATTGTGAAGAAT

GGAATTATTAAAGAGGACGAACTGCGTGGCGAGAATCGTCAGATCTTAAAGGACAT

TATGGATGATTATTACCGTGGATTCATCTCCGAAACATTATCGTCGATCGATGATAT

CGATTGGACTTCTCTGTTCGAGAAAATGGAAATTCAATTGAAAAACGGAGATAATA

AAGATACGCTTATCAAAGAACAGACGGAATATCGTAAAGCGATTCATAAGAAATTC GCAAATGACGATCGTTTCAAAAATATGTTCAGTGCCAAGCTTATTTCGGACATTTTA

CCTGAATTTGTAATTCATAATAATAACTACTCAGCAAGTGAGAAGGAGGAGAAAAC

CCAAGTTATTAAACTGTTCTCTCGTTTCGCAACGTCCTTTAAAGATTACTTTAAAAA C

CGCGCGAATTGCTTTAGCGCTGACGACATTTCCAGCTCATCCTGTCATCGCATCGTA

AACGACAATGCGGAAATCTTCTTCAGCAACGCCCTGGTTTACCGCCGCATCGTCAAA

AGCTTATCGAATGACGACATCAATAAGATCTCAGGAGATATGAAGGACTCGCTTAA

GGAGATGTCTCTGGAGGAAATTTATAGTTACGAAAAGTATGGAGAGTTCATTACCCA

GGAGGGAATCTCGTTCTACAATGACATTTGCGGGAAGGTGAACTCCTTCATGAACTT

ATACTGCCAGAAAAACAAAGAGAACAAAAATCTGTATAAATTGCAGAAATTACATA

AACAGATTCTTTGTATTGCTGACACTTCCTACGAAGTACCCTATAAATTCGAGTCAG

ATGAAGAAGTATACCAGTCCGTGAACGGATTTCTGGACAATATCTCCTCAAAACACA

TCGTGGAACGCTTACGTAAAATTGGCGATAATTATAATGGTTACAATCTTGACAAAA

TTTATATCGTATCTAAATTTTACGAGAGTGTGAGCCAAAAGACCTACCGCGACTGGG

AGACCATCAACACAGCTTTAGAAATTCACTATAATAATATCTTACCCGGCAATGGTA

AGAGCAAGGCTGACAAGGTAAAAAAGGCCGTCAAGAATGATTTGCAGAAATCTATT

ACAGAAATTAATGAGTTAGTCTCCAACTATAAGCTTTGTTCCGACGATAACATCAAA

GCTGAGACATATATTCATGAGATTAGTCACATTCTTAACAACTTCGAGGCCCAGGAA

CTTAAGTACAATCCTGAAATTCATCTTGTCGAGTCTGAGCTGAAAGCTAGTGAATTG

AAAAATGTTTTAGACGTTATTATGAACGCATTCCACTGGTGCTCTGTGTTTATGACA

GAAGAACTGGTCGACAAGGACAATAACTTCTATGCCGAACTTGAGGAAATCTACGA

TGAAATTTACCCTGTAATCTCCTTGTATAATCTTGTACGTAATTACGTCACTCAAAA A

CCTTACAGCACGAAAAAAATTAAATTGAACTTCGGGATTCCTACACTTGCCGACGGG

TGGTCTAAATCCAAGGAATATAGCAACAATGCCATTATTTTAATGCGCGACAATCTT

TACTATTTAGGAATTTTTAACGCTAAGAACAAGCCCGATAAAAAGATTATTGAAGGA

AACACGTCTGAAAATAAGGGCGACTACAAAAAGATGATTTATAACCTTTTGCCCGGT

CCAAACAAAATGATCCCAAAGGTATTCCTGTCATCCAAAACAGGGGTTGAGACATA

TAAGCCCAGCGCATATATTCTGGAAGGATACAAACAGAATAAACATATCAAAAGCA

GCAAAGATTTTGACATTACTTTTTGCCACGATTTAATCGACTACTTCAAAAACTGTA T

CGCTATCCACCCTGAATGGAAGAATTTCGGATTTGATTTCTCAGATACAAGTACGTA

TGAGGATATCAGCGGTTTCTATCGCGAAGTTGAACTTCAAGGGTATAAAATTGACTG

GACCTACATTAGTGAGAAGGACATCGACCTGTTACAGGAAAAAGGCCAATTGTACT

TGTTTCAGATCTACAATAAGGATTTCTCAAAAAAATCGACCGGCAATGATAACTTGC

ACACCATGTACCTGAAGAACCTTTTTTCGGAGGAAAACCTTAAAGACATTGTCCTGA

AGTTGAATGGAGAAGCGGAGATTTTCTTTCGTAAGTCTTCCATTAAAAATCCAATTA

TTCATAAGAAGGGCAGCATCCTTGTGAACCGTACGTACGAGGCGGAAGAGAAGGAC CAATTCGGTAACATTCAAATCGTCCGCAAGAACATCCCTGAAAATATTTATCAGGAG

CTTTACAAGTATTTCAATGATAAGTCCGACAAGGAATTATCAGATGAGGCTGCGAAG

TTGAAAAATGTTGTTGGTCATCACGAGGCGGCGACGAATATTGTAAAGGATTATCGC

TACACTTATGACAAGTACTTTCTGCACATGCCGATCACCATTAATTTCAAGGCGAAC

AAAACAGGATTTATTAATGACCGCATCTTACAATACATTGCCAAAGAAAAGGACTT

ACACGTTATTGGCATTGATCGTGGAGAACGCAACTTAATCTACGTAAGCGTTATTGA

CACTTGCGGGAATATCGTAGAACAAAAGAGCTTCAACATCGTGAATGGTTACGATT

ACCAGATCAAGCTTAAGCAGCAGGAGGGAGCGCGCCAGATCGCGCGCAAGGAATG

GAAGGAGATTGGTAAGATCAAGGAAATCAAGGAAGGTTATCTGTCCTTGGTAATCC

ACGAAATTTCGAAAATGGTTATCAAATACAATGCTATTATTGCAATGGAGGACTTGT

CCTACGGCTTTAAAAAAGGACGCTTTAAGGTGGAGCGCCAGGTTTATCAAAAGTTTG

AAACAATGCTGATTAACAAGCTGAACTATTTGGTCTTTAAAGATATCTCCATCACCG

AAAATGGTGGGCTTTTGAAAGGCTATCAACTTACATATATCCCTGATAAGCTTAAGA

ATGTGGGTCATCAGTGCGGGTGCATTTTTTATGTTCCTGCAGCCTACACGTCCAAAA

TCGATCCTACAACTGGATTTGTTAATATCTTCAAATTTAAGGATCTTACCGTCGACG C

GAAGCGCGAATTTATCAAGAAATTCGATAGTATTCGTTATGATTCCGAAAAAAACCT

TTTCTGTTTCACCTTTGATTATAATAACTTTATCACGCAAAATACTGTCATGAGCAA A

TCGAGTTGGTCTGTGTACACTTACGGAGTACGCATCAAGCGTCGTTTTGTTAATGGG

CGCTTCAGTAACGAGTCAGACACGATTGATATCACAAAAGATATGGAGAAAACGCT

GGAGATGACAGACATCAATTGGCGCGATGGTCATGACTTACGTCAAGACATTATCG

ATTATGAAATTGTCCAGCATATCTTTGAGATCTTTCGTTTGACTGTTCAGATGCGCA A

CAGCCTGTCAGAATTGGAGGATCGTGACTATGATCGCCTTATTTCTCCCGTCTTAAA T

GAGAACAATATCTTCTACGACTCAGCCAAGGCTGGAGATGCACTGCCAAAAGACGC

CGACGCAAATGGGGCCTACTGTATTGCATTGAAGGGGTTGTACGAGATCAAACAGA

TTACAGAAAATTGGAAGGAGGACGGTAAGTTCTCTCGTGATAAGCTGAAGATTTCTA

ACAAAGACTGGTTCGATTTCATTCAGAACAAACGTTACCTG

[0062] SEQ ID NO: 25

ATGAACAACGGTACCAATAACTTTCAGAATTTCATTGGAATCAGCAGCTTACAGAAA

ACCCTGCGCAATGCACTTATCCCCACTGAGACAACCCAGCAGTTCATTGTAAAGAAC

GGGATTATTAAAGAAGATGAGCTTCGCGGGGAGAATCGTCAGATCTTAAAGGATAT

TATGGACGATTACTACCGTGGCTTCATTTCGGAGACGCTGTCGTCGATCGACGACAT

CGACTGGACATCCTTGTTTGAAAAGATGGAAATCCAACTGAAGAATGGCGATAACA

AGGACACGTTAATCAAAGAGCAGACGGAATACCGTAAAGCTATCCACAAAAAGTTC

GCTAATGACGACCGCTTTAAGAACATGTTCTCAGCAAAACTTATTAGCGATATTTTA

CCTGAATTTGTCATCCACAATAACAATTACTCCGCGAGTGAAAAAGAGGAGAAAAC CCAGGTGATTAAGCTGTTTTCCCGTTTTGCAACCAGTTTCAAGGACTATTTTAAGAAT

CGTGCTAATTGTTTCTCTGCAGACGACATTTCCTCGTCGTCCTGCCATCGCATTGTT A

ATGATAATGCTGAAATCTTTTTTTCAAACGCACTTGTGTATCGTCGCATTGTCAAAA G

CTTAAGTAATGACGATATCAATAAGATCTCAGGAGACATGAAGGACTCCCTGAAAG

AAATGTCATTGGAAGAAATTTACTCTTATGAAAAGTATGGAGAATTTATTACGCAGG

AGGGTATCAGCTTCTATAACGACATTTGTGGTAAAGTGAACAGCTTTATGAATCTTT

ATTGTCAAAAGAATAAAGAGAACAAAAATCTGTACAAGCTGCAGAAATTGCATAAA

CAAATTCTGTGCATTGCAGATACTTCGTATGAGGTTCCTTACAAATTCGAGTCGGAT

GAGGAGGTGTATCAAAGCGTAAACGGATTTTTGGATAACATTAGTAGTAAGCATATT

GTGGAACGCCTTCGCAAGATTGGTGACAACTATAACGGATACAACTTAGACAAGAT

CTATATTGTCTCGAAGTTTTACGAAAGTGTTTCCCAAAAGACTTATCGCGACTGGGA

GACAATCAACACTGCGCTGGAAATTCACTATAACAATATCTTGCCGGGGAACGGAA

AAAGTAAGGCAGATAAGGTGAAGAAAGCAGTCAAAAATGATCTGCAAAAAAGCAT

TACTGAAATTAACGAACTTGTGTCAAATTACAAATTGTGTTCGGATGACAATATTAA

AGCGGAAACGTATATCCACGAGATCTCGCACATTCTTAATAATTTCGAGGCGCAGGA

ATTAAAGTATAATCCTGAGATCCATTTGGTGGAATCAGAACTTAAAGCTAGTGAACT

GAAAAATGTCCTGGACGTTATTATGAATGCATTTCACTGGTGTTCTGTCTTTATGAC A

GAAGAACTTGTCGACAAAGACAACAACTTTTATGCGGAATTAGAAGAGATTTACGA

CGAAATTTATCCCGTTATTTCGTTATATAATTTAGTTCGTAATTACGTGACTCAGAA A

CCCTACAGCACAAAAAAGATTAAATTAAACTTTGGGATTCCGACTCTTGCTGATGGA

TGGAGCAAGTCCAAGGAGTACTCTAATAACGCCATTATCTTGATGCGTGACAACCTG

TACTACCTGGGCATTTTTAACGCTAAAAACAAACCCGACAAAAAGATCATTGAAGG

GAACACCTCGGAAAATAAGGGGGACTATAAAAAAATGATCTACAATCTGTTGCCAG

GCCCAAATAAGATGATCCCAAAGGTTTTTTTATCTTCCAAAACTGGCGTAGAAACTT

ACAAGCCGAGCGCATACATCCTTGAAGGATATAAACAAAACAAACATATCAAAAGT

TCAAAGGACTTCGATATTACGTTCTGCCATGATTTAATCGATTATTTCAAGAATTGC A

TCGCGATTCACCCAGAGTGGAAAAACTTTGGGTTTGATTTTTCAGACACCAGCACTT

ACGAGGATATTAGTGGATTCTATCGTGAGGTTGAACTGCAGGGCTATAAAATTGACT

GGACCTATATTTCTGAAAAAGATATTGATCTGCTTCAGGAGAAAGGCCAATTGTACT

TATTTCAAATCTATAACAAGGATTTCTCCAAGAAGTCCACGGGTAATGACAACTTAC

ACACAATGTATCTGAAGAATCTGTTTAGTGAGGAGAACTTGAAGGACATTGTGCTGA

AGCTTAATGGCGAGGCCGAAATCTTTTTTCGTAAGTCCTCCATTAAAAACCCTATTA

TCCATAAGAAAGGGAGTATTCTTGTCAACCGCACGTATGAGGCCGAAGAAAAGGAC

CAATTCGGAAACATCCAAATTGTCCGTAAAAATATTCCTGAGAACATTTACCAGGAG

CTTTACAAGTATTTCAACGACAAGAGTGATAAAGAACTTTCAGATGAGGCGGCGAA ACTGAAGAATGTAGTGGGGCACCACGAAGCTGCCACGAATATTGTAAAGGATTACC

GTTACACCTACGACAAGTACTTTTTGCATATGCCCATCACAATTAATTTTAAGGCCA

ATAAAACTGGTTTTATCAACGATCGTATCTTACAGTACATTGCTAAGGAAAAAGATC

TGCACGTTATCGGTATCGATCGCGGGGAACGCAATCTGATTTATGTTAGTGTGATTG

ACACGTGCGGAAATATTGTTGAGCAGAAGAGCTTTAATATCGTAAATGGATATGACT

ATCAAATTAAACTGAAGCAACAGGAAGGGGCCCGCCAGATTGCCCGCAAGGAGTGG

AAAGAAATTGGAAAGATCAAGGAGATTAAAGAAGGGTACCTTTCCCTTGTTATCCA

CGAAATCTCGAAAATGGTGATCAAGTACAATGCCATTATTGCTATGGAGGATCTGTC

ATATGGGTTTAAGAAAGGCCGCTTTAAGGTGGAACGTCAGGTTTACCAGAAGTTTGA

GACCATGCTTATCAATAAGCTGAATTATCTTGTCTTCAAAGACATCTCAATCACAGA

GAACGGCGGGCTGTTAAAAGGATATCAGCTGACCTATATCCCCGACAAACTGAAAA

ATGTCGGGCACCAATGCGGCTGTATTTTCTACGTGCCCGCTGCATACACATCTAAAA

TTGACCCAACGACTGGATTCGTAAATATTTTTAAGTTTAAGGATCTTACGGTAGATG

CAAAGCGCGAATTTATCAAGAAATTTGATAGTATCCGTTACGACAGCGAGAAAAAC

TTATTTTGTTTTACGTTCGATTATAACAACTTCATCACGCAAAATACCGTCATGTCA A

AATCTTCCTGGTCAGTCTATACGTATGGCGTCCGTATCAAGCGCCGCTTCGTCAACG

GGCGTTTTTCAAACGAGTCAGATACCATCGATATCACCAAAGATATGGAAAAAACA

TTGGAGATGACGGACATCAATTGGCGCGATGGTCATGACTTACGCCAGGACATTATT

GACTACGAAATCGTACAACATATTTTTGAGATTTTCCGTCTGACCGTGCAAATGCGC

AACTCATTATCCGAACTTGAGGATCGTGATTACGACCGCTTGATCAGTCCTGTTCTG

AACGAGAATAATATTTTTTACGACAGTGCCAAGGCGGGAGACGCACTGCCCAAGGA

CGCTGACGCTAACGGAGCTTATTGTATTGCGTTGAAGGGACTTTACGAAATCAAGCA

AATCACTGAAAACTGGAAGGAGGATGGTAAATTCTCACGCGACAAGTTGAAAATTT

CGAACAAGGACTGGTTCGATTTCATCCAAAACAAGCGTTATTTA

[0063] SEQ ID NO: 26

ATGAACAACGGGACTAATAACTTCCAGAACTTCATCGGTATTTCATCATTACAAAAA

ACGCTTCGTAACGCCTTGATCCCAACAGAAACGACCCAACAATTTATTGTAAAAAAC

GGCATCATCAAAGAAGACGAACTGCGTGGCGAAAATCGCCAAATTTTGAAGGACAT

TATGGATGACTATTATCGTGGGTTTATCTCGGAGACATTATCCTCCATCGACGACAT T

GATTGGACGAGTCTTTTTGAGAAAATGGAGATCCAGCTTAAAAATGGTGATAACAA

GGATACATTGATCAAGGAGCAAACCGAGTACCGCAAGGCCATCCATAAGAAGTTCG

CAAATGACGACCGCTTCAAAAATATGTTTAGTGCCAAATTGATCTCGGATATCCTTC

CTGAGTTCGTAATTCACAACAATAATTATAGCGCATCCGAAAAGGAGGAAAAGACT

CAAGTCATTAAGCTTTTCAGTCGCTTTGCTACCTCGTTTAAGGACTATTTCAAGAAC C

GCGCGAACTGCTTCTCAGCGGATGACATTTCTTCCTCGTCGTGTCACCGCATCGTGA ATGATAATGCGGAGATCTTCTTTAGTAATGCCTTGGTATACCGCCGCATTGTTAAAT

CCCTGTCTAACGACGATATCAATAAGATCTCAGGAGATATGAAGGATAGCCTTAAA

GAAATGTCTCTGGAAGAAATTTACTCCTATGAAAAGTACGGTGAGTTTATCACCCAA

GAGGGGATTAGCTTTTATAACGATATCTGCGGGAAGGTGAATTCGTTTATGAACCTT

TATTGTCAAAAGAATAAGGAGAATAAGAACTTATATAAGCTTCAGAAACTGCATAA

ACAAATCTTATGCATTGCCGATACTAGCTATGAAGTTCCGTATAAATTCGAGAGCGA

TGAAGAAGTTTATCAGAGCGTCAATGGGTTCTTGGATAACATTTCATCAAAACACAT

CGTGGAACGTCTGCGTAAGATTGGGGATAACTACAACGGATATAATCTTGACAAAA

TTTATATTGTATCTAAATTCTATGAGTCGGTGAGTCAAAAGACCTACCGTGATTGGG

AAACAATCAATACCGCGTTAGAAATCCACTATAACAACATTCTGCCAGGGAATGGT

AAAAGTAAAGCGGACAAAGTCAAGAAGGCTGTGAAGAACGATCTGCAAAAGAGTA

TTACAGAGATTAACGAATTAGTCTCCAATTATAAGTTATGCTCGGACGATAACATTA

AGGCGGAGACGTATATTCATGAGATTTCGCATATTCTTAACAACTTCGAGGCACAAG

AGCTTAAGTATAACCCAGAGATTCACCTTGTCGAATCGGAGCTGAAGGCATCGGAA

TTAAAAAATGTCTTAGATGTAATCATGAACGCGTTCCATTGGTGCAGTGTTTTCATG

ACTGAGGAGTTAGTTGACAAGGACAATAACTTCTACGCAGAATTAGAAGAGATCTA

TGATGAGATTTATCCAGTGATTTCGCTGTATAATCTGGTACGTAATTACGTCACTCA A

AAGCCCTACTCAACAAAAAAAATTAAGCTGAACTTCGGAATTCCGACTCTGGCCGA

CGGGTGGTCCAAGTCAAAGGAGTATTCTAATAATGCTATCATCCTGATGCGCGATAA

CTTATACTATTTGGGAATTTTCAATGCCAAAAATAAACCAGATAAAAAGATTATCGA

AGGTAATACAAGCGAGAATAAGGGTGACTATAAGAAAATGATTTACAATCTTCTTC

CAGGCCCTAACAAGATGATTCCCAAAGTTTTTTTGTCCAGTAAAACAGGGGTCGAAA

CTTACAAGCCCAGTGCCTATATCCTTGAAGGGTACAAGCAGAATAAGCACATCAAA

TCCTCGAAAGACTTTGATATTACATTTTGTCATGACTTAATCGATTATTTTAAGAAC T

GTATCGCAATCCATCCAGAATGGAAGAACTTCGGGTTTGATTTCTCTGATACTTCCA

CGTATGAGGATATTTCCGGGTTCTACCGCGAAGTAGAGCTTCAGGGCTATAAAATTG

ACTGGACATATATTTCAGAAAAAGACATCGATCTGTTACAAGAAAAAGGACAGTTG

TATCTGTTTCAAATCTATAATAAGGATTTCTCCAAAAAGTCAACTGGAAATGATAAC

TTACATACAATGTATCTGAAAAATCTTTTTAGTGAAGAGAATTTGAAGGATATCGTG

CTGAAGTTAAATGGCGAAGCAGAGATCTTCTTCCGCAAGTCCTCGATCAAGAATCCT

ATCATCCACAAGAAAGGTAGTATTCTGGTTAACCGCACGTACGAGGCCGAGGAAAA

AGACCAGTTCGGTAATATCCAGATTGTACGTAAGAATATTCCTGAAAATATTTACCA

GGAATTATACAAGTATTTTAACGACAAATCGGATAAGGAGCTTTCAGATGAGGCCG

CAAAGTTGAAGAACGTCGTAGGACACCATGAGGCCGCTACGAATATCGTCAAGGAC

TACCGCTATACGTATGACAAGTACTTCCTGCACATGCCTATTACTATCAATTTCAAA GCTAATAAAACAGGATTCATCAATGATCGTATCCTTCAGTACATTGCCAAAGAAAAA

GATCTGCACGTAATCGGAATCGACCGTGGCGAACGTAATCTGATTTACGTATCAGTT

ATCGACACATGTGGTAACATCGTGGAGCAGAAATCTTTTAACATTGTTAACGGCTAT

GATTATCAGATTAAGCTTAAACAGCAGGAGGGGGCACGCCAAATCGCTCGTAAAGA

ATGGAAGGAGATTGGAAAGATTAAAGAGATTAAAGAGGGGTACCTTTCGCTGGTTA

TTCACGAAATTTCCAAGATGGTGATTAAGTACAATGCAATCATCGCGATGGAAGATC

TTAGTTACGGATTCAAAAAGGGACGCTTCAAAGTTGAGCGTCAGGTCTACCAGAAA

TTTGAAACGATGCTGATTAACAAATTGAATTACTTGGTATTCAAAGATATCTCAATT

ACTGAAAATGGTGGCTTATTAAAGGGTTACCAGCTTACCTATATCCCGGATAAGCTG

AAGAACGTGGGCCATCAATGCGGCTGCATCTTTTACGTCCCTGCCGCATATACCTCT

AAAATTGACCCCACCACCGGATTCGTAAATATTTTTAAATTCAAGGACCTGACGGTG

GACGCCAAGCGCGAATTCATCAAAAAATTCGACTCAATCCGCTATGATTCCGAAAA

AAATCTTTTCTGCTTTACGTTCGATTATAATAACTTCATTACCCAAAACACGGTGAT G

TCAAAATCGTCCTGGAGCGTGTATACTTATGGAGTGCGTATCAAGCGCCGCTTTGTT

AATGGGCGCTTCAGTAACGAAAGCGATACCATCGACATTACCAAAGACATGGAGAA

GACGCTTGAAATGACGGATATCAATTGGCGTGACGGACACGATCTTCGTCAGGATAT

CATCGACTACGAGATTGTGCAACATATCTTTGAGATTTTCCGTTTAACTGTTCAAAT G

CGTAACTCCTTGTCCGAATTGGAAGACCGTGATTACGACCGCTTGATTTCACCAGTG

CTTAACGAGAATAACATCTTCTACGACTCCGCCAAAGCAGGCGATGCCCTGCCAAA

GGACGCTGATGCAAATGGTGCATACTGTATCGCGTTGAAGGGCTTATACGAGATTAA

GCAAATCACCGAAAATTGGAAAGAGGATGGAAAGTTCAGTCGCGATAAGCTGAAGA

TCTCTAATAAAGATTGGTTTGACTTTATCCAGAACAAACGTTATTTA

[0064] SEQ ID NO: 27

ATGAACAACGGTACCAATAATTTCCAAAATTTCATCGGAATCTCATCCTTGCAAAAA

ACCTTGCGCAATGCTTTGATCCCCACCGAAACCACGCAGCAGTTCATCGTGAAAAAC

GGCATTATCAAAGAGGATGAGTTGCGCGGGGAAAACCGTCAAATTCTTAAGGATAT

CATGGACGATTACTACCGTGGGTTTATCAGTGAGACCCTGTCAAGCATTGACGACAT

TGACTGGACCAGCTTATTTGAGAAGATGGAGATTCAATTAAAGAACGGGGACAATA

AGGACACGCTTATCAAAGAGCAGACAGAATACCGTAAAGCGATTCATAAGAAATTT

GCAAATGACGATCGCTTCAAGAACATGTTTTCAGCAAAATTAATCAGCGACATCCTT

CCCGAATTTGTGATTCATAATAACAACTATTCGGCTAGCGAAAAAGAGGAGAAAAC

TCAGGTTATTAAGCTTTTCTCGCGTTTTGCCACTTCGTTCAAAGACTATTTTAAGAA T

CGCGCAAACTGCTTTTCGGCTGATGATATTTCCAGTTCTAGCTGCCATCGTATCGTT A

ACGATAATGCTGAGATTTTCTTCTCTAATGCCCTGGTGTATCGTCGTATCGTTAAAT C

TTTGAGCAACGACGATATTAATAAGATTTCAGGCGACATGAAGGATTCTTTAAAGGA GATGTCTTTAGAAGAGATTTATTCCTATGAGAAATATGGCGAGTTTATCACCCAAGA

AGGAATTTCGTTCTACAACGACATCTGTGGCAAAGTGAACAGCTTCATGAATTTATA

CTGCCAAAAGAATAAGGAGAATAAAAATTTATATAAACTGCAGAAACTGCATAAGC

AAATTCTTTGCATTGCAGACACCTCTTATGAAGTTCCTTATAAGTTTGAATCGGACG

AGGAGGTATATCAGAGTGTGAACGGGTTCCTGGACAATATTTCATCCAAGCATATTG

TTGAACGTTTACGCAAAATTGGAGACAATTACAATGGGTATAACCTTGACAAAATTT

ACATCGTGTCGAAGTTTTACGAATCGGTAAGCCAGAAGACCTATCGTGACTGGGAA

ACTATCAATACCGCCTTAGAAATTCATTACAACAATATTCTTCCTGGTAACGGCAAA

AGCAAAGCCGATAAGGTAAAGAAGGCTGTCAAGAACGACCTGCAAAAGTCTATCAC

AGAGATCAACGAGTTAGTCTCTAACTACAAATTATGTTCCGACGACAATATTAAAGC

CGAAACCTACATCCATGAGATCTCACACATTCTTAACAATTTTGAGGCCCAGGAGCT

GAAATATAACCCAGAAATTCACCTTGTAGAGAGCGAATTAAAAGCCTCCGAGCTGA

AGAACGTTTTGGATGTAATCATGAACGCATTTCATTGGTGCAGCGTATTTATGACAG

AGGAGTTGGTCGACAAGGACAATAACTTTTACGCCGAGCTTGAAGAAATCTACGAT

GAAATTTACCCGGTAATTAGTTTATATAATTTAGTTCGCAACTACGTAACTCAGAAA

CCCTACAGTACCAAGAAGATTAAATTGAACTTTGGGATCCCGACACTTGCTGACGGT

TGGAGTAAATCAAAAGAATACTCCAATAATGCAATTATCCTGATGCGCGACAATCTT

TACTACTTGGGGATCTTTAACGCAAAGAACAAACCAGATAAGAAAATCATCGAGGG

CAACACCAGCGAGAATAAAGGCGATTACAAGAAAATGATCTATAATCTTTTGCCGG

GACCGAACAAAATGATCCCAAAGGTTTTCCTGTCGTCGAAAACGGGAGTCGAGACA

TATAAACCATCTGCGTACATCTTGGAAGGTTACAAACAGAATAAGCATATTAAGTCT

AGTAAAGACTTCGACATCACCTTTTGTCATGACCTGATTGATTATTTCAAGAACTGT

ATTGCTATCCATCCAGAATGGAAAAACTTCGGATTTGACTTCTCCGATACTAGCACC

TACGAAGACATTTCGGGTTTTTATCGCGAAGTAGAGCTTCAAGGGTACAAAATTGAT

TGGACATATATTAGCGAGAAAGACATTGATTTGCTTCAAGAGAAGGGACAGTTATA

TTTATTCCAGATCTACAACAAAGACTTCTCGAAGAAATCCACCGGTAATGATAATCT

TCACACTATGTACCTGAAGAATTTATTTTCAGAGGAAAATCTGAAGGACATTGTACT

TAAACTTAATGGAGAAGCCGAAATCTTCTTCCGCAAGAGTTCCATTAAAAATCCGAT

TATTCATAAAAAGGGAAGTATCCTTGTGAACCGCACGTATGAGGCCGAAGAGAAGG

ATCAGTTTGGGAATATTCAAATTGTCCGCAAAAACATCCCCGAGAACATCTACCAGG

AACTGTATAAATACTTTAATGATAAATCTGATAAAGAGTTATCAGACGAGGCTGCCA

AACTGAAAAACGTAGTCGGTCATCATGAGGCAGCGACCAATATTGTAAAGGACTAC

CGTTACACCTACGACAAGTATTTCCTTCACATGCCGATCACGATTAATTTTAAGGCT

AACAAGACCGGCTTTATCAATGACCGCATCTTGCAGTACATCGCGAAAGAGAAAGA

TTTACACGTCATCGGAATTGATCGTGGAGAGCGTAATCTTATCTACGTCAGCGTCAT CGACACCTGTGGAAACATTGTGGAACAAAAAAGTTTTAATATCGTAAACGGCTACG

ACTATCAAATTAAACTTAAACAGCAAGAGGGAGCTCGCCAGATCGCTCGCAAAGAG

TGGAAAGAGATTGGGAAAATTAAAGAAATTAAAGAGGGTTACCTGTCGCTGGTAAT

TCACGAAATCTCGAAAATGGTCATCAAATATAATGCAATTATCGCTATGGAGGATCT

GTCCTACGGGTTCAAGAAGGGACGTTTTAAAGTAGAGCGCCAGGTGTATCAAAAAT

TCGAAACCATGTTGATCAATAAGCTTAACTATTTGGTCTTCAAAGATATTTCGATTA C

GGAGAACGGAGGTTTGTTGAAAGGATATCAGCTGACGTATATCCCAGACAAGTTGA

AAAACGTGGGGCATCAATGTGGATGTATTTTCTATGTGCCCGCGGCCTACACGAGTA

AGATCGATCCTACCACTGGTTTCGTCAACATTTTCAAATTTAAAGATCTTACCGTGG

ATGCGAAGCGCGAATTTATTAAGAAATTTGATAGCATTCGCTATGATTCCGAAAAGA

ACCTGTTCTGTTTTACGTTCGACTATAACAATTTCATTACCCAAAACACGGTGATGA

GCAAATCCTCTTGGTCAGTTTATACATACGGTGTACGTATCAAACGCCGTTTCGTTA

ACGGACGCTTTTCCAATGAGTCTGATACAATCGATATCACGAAAGATATGGAAAAA

ACATTAGAGATGACTGATATCAACTGGCGTGACGGGCACGACCTGCGTCAAGACAT

TATTGACTACGAGATTGTGCAGCATATCTTCGAAATCTTTCGCTTAACTGTGCAAAT

GCGTAACTCGTTATCCGAGTTAGAAGACCGTGACTACGATCGCCTGATTTCACCCGT

CTTGAACGAAAATAACATCTTCTACGATTCCGCGAAGGCTGGGGACGCATTGCCCAA

GGACGCAGACGCGAATGGAGCGTACTGTATTGCGCTTAAAGGATTATATGAAATCA

AGCAGATCACCGAAAATTGGAAGGAGGACGGGAAGTTCTCACGCGACAAACTGAA

GATTTCAAATAAGGACTGGTTCGATTTCATTCAGAATAAGCGTTACCTG

[0065] SEQ ID NO: 28

TGAATAATGGTACGAACAACTTTCAGAACTTCATCGGCATCTCCAGCCTTCAAAAGA

CTTTACGCAACGCATTGATTCCCACGGAGACTACGCAACAGTTTATCGTAAAAAATG

GTATTATCAAAGAAGATGAATTACGCGGGGAGAATCGCCAGATTCTTAAGGACATT

ATGGACGATTATTACCGTGGATTCATCAGTGAGACACTGAGCTCCATTGATGACATC

GACTGGACGTCATTGTTTGAAAAGATGGAAATCCAGTTGAAAAATGGCGATAACAA

AGATACATTGATTAAAGAGCAGACAGAGTACCGCAAAGCAATTCACAAGAAATTCG

CCAATGATGATCGTTTTAAGAACATGTTTAGTGCCAAGCTTATTTCGGATATCTTAC C

CGAATTCGTGATTCACAACAACAATTATTCGGCAAGTGAGAAAGAGGAAAAGACCC

AGGTTATCAAATTGTTTTCGCGCTTCGCCACTTCGTTCAAAGATTATTTCAAGAACC G

TGCAAACTGTTTCTCCGCTGACGACATCAGTTCCAGCTCATGCCACCGTATTGTAAA

TGACAATGCGGAGATCTTTTTCAGTAATGCCTTAGTATATCGTCGCATTGTAAAGAG

CTTATCTAATGATGACATTAACAAGATCTCGGGTGATATGAAGGACTCACTTAAGGA

GATGAGTCTGGAAGAGATCTACTCCTACGAAAAATACGGGGAATTCATCACCCAGG

AGGGAATTTCATTCTACAACGATATCTGCGGCAAAGTTAACTCCTTTATGAATCTGT ACTGTCAAAAGAACAAGGAGAATAAAAACCTGTATAAATTGCAGAAACTTCATAAA

CAAATTTTGTGTATCGCAGACACGAGTTATGAAGTACCTTATAAATTCGAATCCGAC

GAAGAGGTATATCAGTCCGTAAATGGGTTCCTGGACAATATCAGTAGTAAGCACATT

GTGGAACGCTTACGCAAAATTGGAGACAATTACAACGGGTATAACCTGGACAAAAT

CTACATCGTATCCAAATTTTATGAAAGCGTGTCTCAAAAAACTTATCGTGATTGGGA

AACAATCAACACGGCTCTTGAGATCCATTACAATAACATCTTGCCGGGTAACGGCAA

ATCGAAGGCAGACAAAGTTAAAAAAGCAGTTAAGAACGACTTACAGAAAAGCATTA

CGGAGATTAACGAGTTAGTAAGTAATTACAAATTATGCTCCGACGATAATATCAAA

GCTGAAACCTACATCCATGAAATTAGCCACATTTTGAACAATTTCGAAGCGCAGGAG

CTGAAATATAACCCTGAAATCCATCTGGTAGAGTCTGAGTTGAAGGCGTCAGAACTG

AAAAACGTTCTTGACGTCATCATGAATGCCTTTCACTGGTGTAGTGTTTTTATGACT G

AGGAGCTTGTAGATAAGGACAACAACTTCTATGCTGAACTTGAAGAGATCTACGAT

GAAATCTACCCCGTAATCAGTCTGTATAATTTAGTTCGTAACTACGTCACGCAGAAA

CCCTATTCGACTAAGAAAATTAAGCTGAACTTTGGGATCCCTACTTTGGCAGACGGG

TGGAGCAAGAGTAAAGAATACAGTAATAATGCAATTATCTTGATGCGCGATAACTT

ATATTACTTAGGTATTTTCAATGCTAAGAACAAACCTGATAAGAAGATTATCGAAGG

AAATACGAGTGAGAATAAGGGAGACTACAAAAAGATGATTTACAACTTGCTGCCAG

GGCCTAATAAGATGATTCCAAAAGTTTTTCTGTCGAGCAAGACAGGGGTTGAAACTT

ATAAGCCATCCGCTTATATCCTTGAGGGGTACAAGCAGAATAAGCATATCAAGTCCT

CCAAAGATTTTGATATTACATTTTGCCACGACTTAATTGATTACTTCAAGAACTGCA T

CGCAATCCATCCCGAATGGAAGAATTTCGGCTTCGATTTCTCAGATACGTCCACGTA

TGAGGATATCTCAGGCTTTTACCGCGAAGTTGAGCTGCAAGGTTATAAAATTGATTG

GACATACATCTCCGAAAAAGACATTGATCTTTTACAGGAAAAGGGCCAATTATACTT

ATTTCAAATCTATAACAAAGATTTTAGCAAGAAGTCCACAGGTAATGATAACCTGCA

TACGATGTATTTGAAAAATCTTTTCAGTGAAGAGAATTTGAAGGATATCGTCCTGAA

GCTGAACGGTGAGGCTGAGATCTTCTTCCGCAAATCGTCTATCAAAAACCCCATCAT

TCACAAAAAGGGAAGTATCTTAGTAAACCGCACTTATGAAGCGGAGGAAAAGGATC

AGTTCGGGAACATCCAGATCGTGCGCAAGAACATTCCAGAAAACATCTATCAGGAA

CTTTACAAATATTTCAATGACAAGTCTGATAAAGAATTATCAGACGAGGCGGCGAA

ACTTAAAAATGTTGTTGGACACCACGAAGCAGCGACGAATATTGTAAAGGATTATC

GCTACACATACGATAAATACTTTTTGCACATGCCAATCACCATTAACTTTAAGGCGA

ACAAGACAGGTTTCATTAACGACCGTATTCTGCAATATATCGCAAAGGAAAAAGAC

CTGCACGTTATTGGGATCGATCGTGGCGAACGCAATTTGATCTACGTAAGCGTTATC

GACACTTGCGGAAATATCGTTGAACAAAAAAGCTTTAATATCGTCAATGGATACGAT

TACCAAATCAAGCTGAAACAACAAGAAGGGGCACGTCAGATCGCTCGTAAAGAATG GAAAGAGATTGGTAAGATCAAAGAGATTAAAGAAGGGTATCTTTCTTTAGTAATTC

ACGAGATTTCGAAAATGGTTATTAAATACAATGCGATTATTGCTATGGAAGACTTAA

GCTACGGCTTTAAGAAAGGTCGCTTCAAAGTGGAGCGCCAAGTGTATCAGAAGTTT

GAAACGATGTTGATTAACAAATTAAATTACCTGGTCTTTAAGGACATCAGTATCACA

GAAAATGGGGGGTTGCTTAAAGGGTACCAGCTTACATACATCCCTGATAAACTGAA

AAATGTCGGTCATCAGTGCGGATGTATCTTCTATGTACCAGCAGCCTATACCAGTAA

GATTGACCCTACTACTGGCTTTGTGAATATTTTTAAATTCAAGGATTTAACCGTGGA C

GCCAAGCGTGAATTTATTAAAAAATTTGATTCGATTCGCTACGACAGTGAGAAAAAC

CTTTTCTGCTTTACCTTTGACTACAACAATTTTATTACCCAGAACACCGTAATGTCA A

AGAGTTCGTGGTCTGTATATACCTACGGTGTTCGCATCAAGCGCCGCTTCGTAAACG

GGCGTTTCAGTAACGAATCTGACACCATCGACATCACTAAAGATATGGAGAAGACA

TTGGAAATGACGGACATTAATTGGCGTGATGGCCATGACTTACGTCAGGACATTATT

GATTACGAAATTGTGCAGCATATCTTCGAGATTTTCCGTTTGACAGTTCAGATGCGC

AACTCACTGAGTGAGTTAGAAGATCGCGATTACGACCGTCTGATCTCACCGGTCCTT

AATGAAAACAACATTTTCTACGACTCAGCAAAGGCGGGTGATGCCCTGCCAAAGGA

TGCGGACGCTAATGGCGCCTACTGCATCGCCCTGAAAGGATTGTATGAAATTAAGCA

GATTACAGAAAATTGGAAGGAAGATGGTAAATTTAGCCGTGATAAATTAAAAATCT

CGAACAAGGATTGGTTCGATTTTATTCAGAACAAACGTTATTTG

[0066] SEQ ID NO: 29

ATGAACAATGGAACAAATAATTTTCAAAATTTTATCGGCATCTCAAGTCTTCAAAAA

ACCCTTCGCAATGCCCTGATTCCAACTGAAACAACCCAGCAATTTATCGTCAAGAAC

GGCATCATTAAGGAAGACGAGTTACGCGGGGAGAACCGTCAAATCCTGAAAGATAT

CATGGATGACTACTATCGTGGGTTCATTTCGGAAACCTTGTCTTCAATCGACGACAT

TGACTGGACGAGTCTTTTCGAGAAAATGGAAATTCAGCTTAAAAATGGAGACAACA

AGGATACTCTGATTAAGGAACAGACAGAATATCGCAAAGCTATCCACAAAAAGTTC

GCTAATGATGATCGTTTCAAAAATATGTTTTCTGCTAAATTGATTTCCGATATCTTG C

CTGAATTTGTAATCCACAACAACAATTATTCTGCTTCCGAGAAGGAAGAGAAGACCC

AGGTCATTAAATTATTCAGCCGCTTTGCAACCAGCTTTAAAGACTACTTTAAGAATC

GCGCTAACTGCTTTTCGGCGGATGACATCTCATCATCATCATGCCACCGCATTGTGA

ACGACAATGCGGAGATCTTCTTTTCGAATGCGTTAGTTTATCGTCGCATTGTCAAAA

GTCTTAGCAATGATGACATCAACAAGATCTCAGGAGACATGAAAGATTCCTTAAAG

GAGATGTCTCTTGAGGAAATCTATTCGTATGAGAAATACGGCGAGTTCATTACCCAG

GAAGGTATTAGTTTCTACAATGATATCTGCGGCAAAGTAAATTCTTTTATGAATCTG

TATTGCCAAAAAAACAAAGAAAACAAGAATCTTTATAAGTTACAAAAGTTACATAA

GCAAATTCTGTGCATCGCTGATACATCTTATGAGGTACCCTACAAATTTGAAAGTGA TGAGGAGGTCTATCAGAGTGTCAACGGCTTCTTAGACAACATCTCTTCCAAACATAT

CGTGGAACGCCTGCGTAAAATCGGAGATAACTACAACGGATATAACTTAGATAAAA

TCTACATCGTGTCCAAGTTTTATGAAAGTGTGAGCCAAAAAACATATCGTGACTGGG

AAACCATTAACACCGCATTGGAAATTCACTATAACAACATTTTGCCAGGCAACGGG

AAAAGTAAGGCGGACAAAGTTAAGAAAGCAGTTAAAAATGACCTGCAAAAAAGCA

TCACTGAAATTAACGAATTGGTATCGAATTACAAATTATGTAGCGACGATAATATCA

AAGCAGAAACTTACATTCACGAGATTAGTCACATTTTAAATAACTTCGAGGCCCAGG

AATTGAAATACAATCCCGAAATTCATTTGGTTGAATCAGAACTGAAAGCATCAGAGT

TGAAAAATGTGTTAGATGTCATTATGAATGCGTTTCATTGGTGCTCTGTGTTCATGA C

CGAGGAACTGGTTGATAAAGATAACAACTTTTACGCTGAATTGGAGGAGATTTACG

ATGAGATTTACCCGGTCATTTCGCTTTATAACTTAGTGCGCAATTATGTGACGCAGA

AACCATATTCCACGAAGAAAATCAAACTTAATTTTGGCATCCCTACTCTGGCTGATG

GTTGGTCGAAATCGAAAGAGTACAGCAACAACGCGATCATTCTTATGCGTGACAAT

CTTTACTATTTGGGCATTTTTAATGCCAAGAATAAGCCAGATAAGAAAATCATTGAG

GGGAATACTTCCGAGAATAAGGGGGATTACAAAAAGATGATCTATAACTTGCTGCC

CGGCCCCAACAAAATGATTCCTAAGGTTTTCTTGTCAAGCAAGACGGGCGTCGAAAC

ATATAAGCCGTCAGCTTATATTCTGGAAGGCTATAAACAGAATAAGCACATCAAGTC

TTCCAAGGACTTTGACATCACTTTTTGCCACGATTTGATCGACTACTTTAAGAACTG T

ATTGCGATTCATCCGGAATGGAAGAACTTCGGTTTCGACTTTTCCGATACCTCAACA

TACGAGGATATCAGCGGCTTCTACCGTGAAGTCGAGCTTCAAGGCTACAAGATCGAT

TGGACATATATTTCAGAGAAGGACATTGATTTGTTACAAGAGAAAGGTCAACTTTAC

TTATTTCAGATCTATAACAAAGACTTTTCGAAGAAATCGACAGGAAACGATAACTTA

CACACTATGTATTTAAAAAATCTGTTTTCGGAGGAAAACCTGAAAGATATTGTGCTG

AAACTTAACGGCGAGGCAGAGATCTTTTTCCGTAAAAGCTCAATCAAGAATCCTATC

ATCCATAAAAAAGGTAGTATTCTTGTCAACCGCACATATGAAGCGGAGGAGAAGGA

CCAATTCGGAAACATCCAAATTGTCCGTAAGAATATTCCGGAGAACATTTACCAAGA

GTTGTATAAATACTTTAACGATAAGTCAGATAAGGAACTTAGCGATGAGGCGGCGA

AGCTTAAAAACGTAGTTGGGCATCATGAAGCTGCTACCAACATTGTAAAAGATTACC

GTTACACCTATGACAAGTATTTCTTGCACATGCCCATTACGATCAATTTCAAAGCAA

ATAAGACAGGCTTTATCAATGATCGCATCCTGCAGTACATTGCTAAAGAGAAGGATT

TGCATGTTATCGGTATTGATCGCGGAGAGCGCAATTTGATCTACGTCTCCGTAATCG

ACACTTGCGGTAACATTGTTGAGCAGAAGTCGTTCAACATCGTTAATGGTTATGATT

ACCAAATCAAGCTGAAGCAGCAAGAGGGTGCCCGCCAGATCGCGCGTAAGGAATGG

AAAGAAATCGGGAAAATTAAAGAGATCAAAGAAGGCTATTTGTCTCTGGTAATTCA

CGAAATCAGCAAGATGGTGATCAAGTATAACGCGATCATTGCGATGGAGGATCTTT CTTATGGCTTCAAGAAAGGGCGCTTTAAAGTCGAACGCCAGGTCTACCAGAAATTTG

AGACAATGCTTATCAACAAGCTTAACTATCTTGTATTTAAGGATATTTCCATCACTG

AGAACGGAGGACTTTTAAAGGGGTACCAACTGACGTACATTCCTGATAAGCTGAAG

AACGTTGGTCATCAATGCGGATGCATCTTCTATGTGCCAGCGGCTTACACCTCCAAA

ATCGATCCCACTACAGGCTTTGTCAATATCTTCAAATTCAAGGATTTGACCGTTGAC

GCGAAGCGCGAGTTTATCAAGAAGTTTGATAGCATTCGCTACGACAGCGAAAAAAA

TTTATTTTGTTTTACTTTCGACTACAATAACTTTATTACTCAGAACACTGTCATGTC A

AAGAGTTCGTGGAGTGTCTACACGTACGGAGTACGTATTAAGCGCCGTTTCGTCAAC

GGACGCTTCTCAAACGAAAGCGACACGATCGACATCACCAAAGACATGGAAAAAAC

TCTTGAGATGACGGATATCAATTGGCGCGACGGCCATGACCTGCGTCAGGATATCAT

TGATTACGAGATCGTTCAGCACATCTTCGAAATCTTCCGCCTTACCGTCCAGATGCG

CAACAGTTTAAGCGAGCTTGAAGACCGCGACTACGATCGTTTGATTAGCCCCGTTCT

GAACGAGAATAATATTTTCTACGACAGCGCAAAGGCCGGTGATGCTTTGCCAAAGG

ACGCAGACGCGAATGGAGCCTACTGCATCGCCCTGAAGGGCTTATATGAGATTAAG

CAAATTACCGAAAATTGGAAGGAAGATGGTAAGTTCTCCCGTGATAAGCTTAAAAT

TAGCAATAAGGATTGGTTCGACTTCATCCAGAACAAACGTTACCTG

[0067] SEQ ID NO: 30

ATGAACAACGGAACAAACAATTTCCAAAACTTCATCGGTATCTCTTCGTTGCAGAAG

ACTCTGCGTAATGCTTTGATCCCGACGGAGACAACCCAACAATTTATCGTCAAAAAC

GGTATTATTAAGGAGGACGAGTTACGTGGAGAAAATCGTCAAATCCTTAAGGACAT

CATGGACGATTATTATCGCGGGTTTATTTCTGAAACCCTGAGCAGTATCGATGATAT

CGACTGGACCTCACTTTTTGAGAAAATGGAGATCCAGTTGAAGAACGGTGATAACA

AAGACACTCTGATCAAAGAGCAAACTGAATACCGCAAGGCAATTCACAAAAAGTTC

GCCAACGACGACCGTTTCAAGAATATGTTCTCAGCTAAGTTAATCAGCGACATTTTG

CCAGAGTTCGTTATCCACAACAATAATTATAGTGCTTCAGAGAAGGAGGAAAAAAC

CCAAGTGATTAAACTTTTTTCGCGCTTTGCAACCTCATTCAAGGACTACTTCAAGAA T

CGCGCGAATTGCTTCAGTGCGGACGACATTTCTTCTTCAAGTTGCCATCGTATCGTT A

ACGATAACGCGGAAATTTTCTTCTCTAATGCTTTGGTGTATCGCCGCATTGTAAAAT C

GCTTAGTAACGATGACATTAATAAGATCTCAGGTGATATGAAAGATTCATTGAAGG

AAATGAGCTTGGAAGAGATTTACAGTTACGAAAAATATGGAGAATTTATTACTCAG

GAAGGCATCTCATTCTATAACGATATCTGCGGGAAGGTAAATTCGTTTATGAACTTA

TATTGCCAGAAAAATAAAGAGAATAAAAATTTGTATAAGCTTCAGAAGTTGCACAA

ACAGATCCTGTGCATTGCAGACACCTCGTATGAGGTTCCGTATAAATTTGAGTCCGA

TGAAGAAGTGTATCAGTCTGTGAATGGTTTCTTAGATAATATCTCTTCCAAGCATAT T

GTCGAACGCCTGCGCAAAATTGGTGATAACTATAACGGATACAATCTGGATAAAAT TTACATCGTTTCTAAATTTTACGAGTCAGTCTCGCAGAAGACCTACCGCGACTGGGA

AACAATTAACACGGCATTGGAGATTCACTACAATAATATCTTGCCTGGTAACGGTAA

GTCTAAGGCAGATAAGGTAAAAAAAGCTGTGAAAAACGACCTTCAGAAAAGCATCA

CGGAGATTAATGAGCTGGTGAGTAATTACAAATTATGTTCAGACGATAATATTAAAG

CTGAAACGTATATCCATGAAATCTCGCATATCTTGAACAACTTCGAGGCCCAAGAAC

TTAAATATAACCCCGAAATCCATTTAGTCGAGTCTGAATTGAAAGCGTCGGAATTAA

AAAACGTCTTAGACGTCATTATGAACGCGTTTCACTGGTGTTCAGTTTTCATGACCG

AAGAGCTGGTCGACAAAGACAACAACTTCTATGCGGAATTGGAGGAAATCTATGAT

GAAATCTACCCTGTTATTTCACTGTATAACCTTGTGCGCAACTATGTCACTCAGAAG

CCGTATTCGACCAAAAAAATTAAATTGAATTTCGGTATCCCTACTCTTGCAGACGGA

TGGAGTAAAAGCAAGGAATACAGTAATAACGCCATTATTCTTATGCGCGACAATTTA

TACTACCTGGGCATCTTTAACGCAAAGAATAAGCCGGATAAGAAGATTATTGAGGG

TAACACCAGTGAGAACAAGGGCGACTATAAGAAGATGATCTATAACTTATTGCCAG

GTCCAAATAAAATGATCCCAAAAGTATTCTTATCATCAAAGACGGGAGTTGAAACCT

ATAAGCCTAGTGCCTATATTCTTGAGGGATATAAACAGAACAAGCACATTAAGTCGT

CTAAGGATTTTGACATTACGTTCTGCCATGACTTAATCGACTATTTTAAAAACTGTA T

TGCGATTCACCCCGAATGGAAGAATTTTGGATTCGATTTTTCGGATACCTCGACCTA

TGAAGATATTTCGGGATTTTATCGTGAAGTGGAGTTGCAAGGCTATAAAATCGATTG

GACCTATATCTCAGAAAAAGACATTGATTTATTACAGGAAAAGGGACAACTGTACC

TTTTCCAAATTTATAACAAGGACTTTTCTAAAAAGTCCACAGGAAATGATAACCTTC

ACACCATGTACCTGAAGAACCTTTTCTCAGAGGAAAACCTGAAGGACATTGTCCTTA

AGTTAAATGGAGAAGCGGAGATCTTTTTCCGTAAATCTAGTATCAAGAATCCGATTA

TCCATAAAAAAGGTTCGATTTTGGTAAATCGCACCTATGAAGCGGAAGAGAAAGAT

CAATTTGGTAACATCCAGATCGTGCGCAAGAATATCCCGGAGAACATTTACCAAGA

GCTGTATAAGTACTTCAATGATAAGTCTGATAAGGAACTGTCAGATGAAGCTGCGA

AATTGAAGAACGTGGTTGGGCATCATGAAGCCGCTACCAATATCGTCAAGGATTAC

CGTTATACCTATGACAAATATTTCTTACACATGCCGATTACGATCAATTTTAAGGCA

AACAAGACAGGATTCATCAACGACCGTATCTTGCAGTATATTGCCAAAGAGAAGGA

TCTGCATGTGATCGGTATTGACCGCGGGGAGCGCAATTTAATCTATGTATCGGTGAT

CGATACTTGTGGTAACATCGTAGAACAAAAGAGCTTTAACATCGTGAATGGTTACGA

CTATCAGATCAAGCTGAAACAACAGGAAGGAGCCCGCCAGATCGCTCGCAAGGAAT

GGAAAGAAATCGGGAAAATTAAGGAAATCAAGGAAGGCTACCTTTCATTGGTCATT

CACGAAATTTCGAAAATGGTAATTAAGTACAACGCGATCATCGCCATGGAGGACCT

TTCGTACGGATTTAAGAAGGGTCGTTTCAAAGTTGAGCGCCAGGTATACCAAAAATT

CGAGACTATGCTTATCAACAAACTTAACTACTTGGTCTTTAAGGACATTTCTATTAC C GAAAACGGCGGCTTACTTAAAGGCTATCAATTGACATATATTCCCGACAAACTGAA

GAATGTTGGACATCAATGCGGGTGTATTTTCTATGTGCCGGCAGCTTACACTAGTAA

GATCGACCCTACAACCGGGTTCGTAAACATTTTTAAATTCAAAGACTTAACAGTCGA

TGCGAAGCGTGAATTTATTAAGAAGTTTGATAGTATCCGCTATGACAGTGAAAAGA

ACTTGTTTTGCTTTACGTTCGACTACAATAACTTTATTACACAGAACACGGTCATGT C

TAAATCATCATGGTCGGTTTACACATATGGGGTGCGCATCAAGCGTCGCTTTGTAAA

TGGCCGTTTTAGTAATGAGAGCGACACAATCGACATCACAAAGGATATGGAGAAAA

CTCTTGAGATGACAGACATCAATTGGCGTGACGGTCATGACTTACGCCAAGATATCA

TCGACTACGAAATCGTACAGCATATTTTTGAGATTTTTCGTCTTACTGTGCAAATGC G

TAATTCTTTATCCGAACTGGAAGATCGTGATTACGACCGCTTGATTAGTCCCGTCTT A

AATGAGAACAATATTTTCTATGATTCTGCGAAAGCCGGAGATGCACTGCCCAAAGA

CGCTGATGCCAATGGCGCGTATTGCATTGCATTAAAAGGATTATATGAGATTAAACA

GATTACCGAAAATTGGAAAGAGGACGGTAAATTCTCACGCGATAAATTGAAGATTT

CTAACAAGGACTGGTTCGACTTTATCCAAAATAAACGTTATCTT

[0068] SEQ ID NO: 31

ATGAATAACGGTACCAACAACTTTCAGAATTTCATTGGCATTAGCTCGCTTCAAAAA

ACTTTACGCAATGCTCTTATTCCGACTGAGACGACACAACAGTTTATCGTTAAGAAT

GGCATCATCAAAGAAGATGAATTACGCGGAGAAAACCGCCAGATCCTGAAAGACAT

TATGGACGATTATTACCGTGGGTTCATCTCCGAGACGTTGTCATCGATCGATGACAT

CGACTGGACGTCACTTTTTGAAAAAATGGAGATCCAGTTAAAGAACGGTGACAATA

AGGATACATTGATCAAAGAACAGACCGAGTACCGTAAAGCGATTCATAAAAAGTTT

GCGAACGATGATCGCTTCAAGAATATGTTTTCTGCGAAATTAATTTCCGACATTTTA

CCTGAATTTGTTATTCATAATAACAACTACTCGGCGTCTGAGAAAGAGGAGAAAACC

CAAGTGATTAAACTTTTTTCACGTTTCGCAACGTCGTTCAAAGACTATTTTAAAAAT C

GTGCTAATTGCTTTAGCGCGGATGACATCAGCTCTAGTTCATGTCATCGCATTGTCA

ACGATAATGCTGAGATCTTTTTCAGTAATGCGTTAGTGTACCGTCGTATTGTGAAGT

CCTTATCTAATGATGATATCAATAAGATCAGCGGGGATATGAAGGACTCACTTAAGG

AGATGAGCTTGGAGGAAATCTATTCCTATGAGAAGTATGGTGAGTTTATTACGCAAG

AAGGAATTAGCTTTTACAACGATATCTGTGGAAAGGTGAATTCGTTTATGAATTTGT

ATTGCCAGAAAAATAAGGAGAACAAGAACCTTTATAAATTGCAAAAGTTACACAAG

CAAATCCTGTGCATTGCAGATACTTCCTACGAGGTGCCTTACAAGTTTGAATCCGAC

GAAGAGGTCTACCAATCTGTAAACGGTTTCTTAGATAATATTAGTTCCAAGCATATT

GTGGAGCGCCTTCGTAAAATTGGCGATAATTACAACGGTTACAATTTAGACAAAATT

TACATTGTCAGTAAATTCTACGAGTCCGTATCTCAAAAGACGTATCGTGATTGGGAG

ACTATCAATACGGCCCTGGAGATCCACTACAACAATATCTTGCCCGGTAATGGTAAG TCGAAGGCCGATAAAGTTAAGAAAGCGGTGAAAAATGACTTACAGAAGTCAATCAC

CGAAATTAACGAATTGGTGTCCAATTATAAATTGTGTTCAGATGATAATATCAAAGC

CGAGACCTACATTCATGAGATTTCCCATATCTTAAATAATTTCGAGGCGCAAGAGCT

TAAGTATAACCCAGAAATCCACCTGGTAGAATCTGAGTTGAAGGCGTCAGAGTTAA

AAAATGTTTTAGATGTCATTATGAACGCGTTTCACTGGTGCTCCGTATTTATGACGG

AGGAATTAGTAGATAAAGACAACAATTTCTATGCCGAACTTGAGGAAATCTATGAT

GAGATCTATCCCGTCATTAGCCTGTATAACTTGGTCCGCAACTATGTTACCCAAAAA

CCGTACAGTACCAAGAAGATTAAGCTGAATTTCGGCATTCCTACACTGGCTGATGGT

TGGAGTAAATCGAAGGAATATTCGAATAACGCGATTATCTTGATGCGCGACAACTTA

TACTATTTGGGGATCTTTAACGCCAAAAACAAACCGGATAAGAAGATTATTGAGGG

AAACACATCAGAGAACAAAGGCGACTACAAAAAAATGATTTACAACTTGTTACCGG

GGCCTAACAAAATGATCCCGAAGGTGTTCTTATCCAGTAAAACAGGCGTTGAGACCT

ACAAACCTTCCGCATACATCCTGGAAGGGTATAAGCAGAACAAGCACATTAAGTCC

AGCAAGGATTTCGATATTACCTTCTGTCATGATTTAATTGACTATTTCAAGAACTGT A

TTGCAATCCACCCCGAGTGGAAGAACTTCGGATTCGACTTCTCAGATACGAGCACAT

ATGAGGACATCTCGGGGTTCTATCGTGAAGTAGAACTGCAGGGATATAAAATTGATT

GGACATATATTTCCGAAAAAGACATCGACCTTTTACAAGAGAAGGGTCAACTTTACT

TGTTCCAAATTTACAATAAAGACTTCTCAAAAAAAAGCACGGGTAACGATAATTTAC

ACACTATGTATTTAAAGAACCTTTTCTCGGAAGAGAATTTAAAGGATATCGTATTGA

AGTTGAATGGAGAAGCGGAGATCTTCTTCCGTAAGTCCAGTATTAAAAACCCTATTA

TTCACAAGAAGGGATCGATTTTAGTTAACCGCACATACGAGGCCGAAGAGAAGGAC

CAATTTGGGAACATTCAAATTGTCCGCAAAAACATCCCTGAGAACATTTATCAAGAG

CTTTATAAGTACTTTAACGATAAGTCCGATAAGGAATTGTCAGATGAGGCGGCAAA

GTTGAAGAATGTCGTGGGGCATCATGAAGCTGCCACCAACATTGTGAAGGACTACC

GCTACACTTACGACAAATACTTCCTGCACATGCCCATTACGATCAATTTTAAGGCCA

ATAAGACAGGCTTTATTAACGACCGTATTCTTCAATATATCGCTAAGGAGAAGGACC

TTCATGTGATTGGGATCGACCGCGGAGAACGTAATTTAATTTATGTGTCCGTCATCG

ATACGTGTGGAAATATCGTGGAACAGAAATCATTCAATATCGTGAATGGCTATGATT

ACCAGATCAAATTAAAACAGCAGGAGGGCGCTCGCCAAATTGCGCGTAAGGAATGG

AAAGAGATCGGAAAAATCAAAGAAATCAAAGAAGGATATTTGTCATTGGTGATCCA

TGAGATTTCAAAAATGGTAATTAAATATAATGCAATTATCGCAATGGAAGACCTGTC

CTATGGTTTTAAGAAGGGTCGTTTCAAGGTAGAACGCCAAGTGTATCAAAAGTTCGA

GACGATGCTGATCAATAAGCTGAATTATCTTGTGTTTAAGGACATTAGCATCACGGA

AAATGGAGGGCTGTTGAAAGGCTATCAACTGACGTATATCCCTGACAAGCTGAAAA

ATGTTGGCCATCAGTGCGGGTGCATTTTCTACGTCCCCGCGGCGTATACAAGCAAGA TCGATCCTACTACGGGATTCGTAAATATTTTTAAATTCAAAGACTTAACCGTGGACG

CCAAGCGCGAATTCATTAAGAAGTTTGATAGCATTCGCTACGATTCAGAAAAAAATC

TTTTCTGTTTTACGTTCGATTACAACAATTTTATCACCCAGAACACAGTGATGAGCA A

GTCATCCTGGTCTGTCTATACCTACGGTGTCCGTATCAAACGCCGCTTCGTCAACGG

ACGCTTCTCTAATGAATCTGATACCATTGACATCACCAAGGACATGGAAAAGACACT

TGAGATGACAGATATTAACTGGCGTGACGGACATGACCTGCGTCAGGACATCATCG

ATTATGAGATTGTTCAGCATATCTTCGAGATCTTCCGCCTGACAGTACAAATGCGCA

ATTCACTGTCAGAACTTGAAGACCGCGACTATGACCGCCTGATCTCTCCAGTATTAA

ATGAGAACAATATCTTTTATGACAGTGCTAAGGCCGGCGATGCCCTTCCGAAAGATG

CTGATGCTAACGGAGCTTATTGTATTGCATTAAAGGGTCTTTATGAGATCAAGCAAA

TTACCGAGAATTGGAAGGAGGATGGCAAATTCTCGCGCGACAAACTGAAAATCAGT

AACAAGGACTGGTTCGATTTTATTCAGAATAAACGTTACCTG

[0069] SEQ ID NO: 32

ATGAATAACGGAACGAACAACTTCCAGAACTTCATCGGCATCAGTTCTTTACAAAAA

ACCCTGCGTAACGCCCTTATTCCGACTGAGACAACACAACAGTTCATCGTTAAAAAC

GGAATTATCAAAGAGGACGAGTTGCGCGGCGAGAATCGCCAAATTTTGAAAGATAT

TATGGACGACTATTATCGTGGTTTTATTTCAGAAACACTGAGTTCGATTGACGATAT

CGATTGGACGAGCCTGTTTGAGAAAATGGAAATCCAGTTGAAAAATGGCGATAATA

AAGACACTTTAATCAAAGAACAAACCGAGTATCGTAAAGCGATCCATAAAAAGTTC

GCTAATGACGATCGTTTTAAGAATATGTTCAGTGCGAAACTGATTTCAGACATTTTG

CCCGAGTTCGTGATCCATAATAACAACTATTCCGCCTCGGAAAAGGAAGAAAAAAC

CCAGGTGATTAAGCTGTTCAGTCGCTTCGCAACATCTTTCAAGGATTATTTCAAGAA

TCGCGCGAATTGCTTCAGTGCGGACGATATTTCTAGTTCAAGCTGCCATCGTATCGT T

AATGATAACGCGGAGATTTTTTTTAGCAATGCTCTGGTGTACCGCCGCATTGTTAAG

TCACTGTCCAACGATGATATTAACAAGATCTCAGGAGACATGAAAGACTCGCTTAA

AGAGATGAGTCTGGAAGAGATCTATTCTTATGAGAAGTATGGCGAGTTTATTACCCA

AGAAGGAATCTCATTCTACAATGATATTTGTGGAAAGGTGAACAGCTTTATGAATCT

TTACTGCCAAAAAAACAAGGAGAATAAGAATCTTTACAAACTTCAGAAGTTACATA

AACAGATTTTGTGTATTGCGGATACGTCTTATGAAGTCCCCTACAAATTTGAATCGG

ATGAAGAGGTATACCAAAGTGTGAACGGATTCTTGGACAATATTTCTTCTAAACATA

TTGTTGAACGCTTACGTAAGATCGGGGATAACTACAATGGCTACAATCTTGACAAAA

TCTACATTGTTAGCAAATTCTACGAGAGTGTCAGCCAAAAGACGTACCGCGATTGGG

AAACAATTAATACTGCGCTTGAGATTCACTATAATAACATTTTACCAGGCAACGGCA

AGTCCAAGGCGGATAAAGTTAAAAAAGCTGTTAAAAACGATTTGCAAAAATCTATC

ACAGAAATTAACGAGTTAGTTAGTAACTACAAACTGTGCTCCGATGACAACATTAA GGCTGAGACGTATATCCATGAGATCTCTCACATCTTAAACAATTTTGAAGCTCAAGA

ACTTAAGTACAATCCGGAAATCCACCTGGTGGAATCCGAGCTGAAGGCTAGCGAAC

TGAAGAACGTATTGGACGTGATCATGAACGCGTTCCACTGGTGTTCTGTCTTTATGA

CGGAAGAGCTTGTCGACAAAGATAATAACTTTTACGCGGAACTTGAGGAAATTTAC

GATGAGATTTACCCAGTTATTTCATTGTATAACCTTGTCCGTAATTACGTGACCCAA A

AGCCTTATAGTACGAAAAAAATCAAATTAAATTTTGGAATCCCAACACTGGCTGACG

GTTGGAGCAAATCTAAGGAGTATTCTAATAACGCAATCATCTTAATGCGTGACAACC

TGTATTATTTGGGTATCTTCAATGCCAAAAATAAGCCTGACAAAAAGATTATCGAAG

GAAATACTTCGGAGAATAAGGGGGATTACAAAAAAATGATTTACAATTTGCTGCCC

GGGCCGAACAAGATGATCCCCAAAGTGTTCTTATCCTCGAAGACTGGTGTAGAAAC

ATACAAGCCAAGCGCATACATTCTGGAGGGTTACAAGCAAAACAAACACATCAAAT

CTTCAAAAGACTTTGACATTACATTTTGCCATGATCTTATTGACTACTTCAAAAACT G

CATTGCTATTCACCCCGAGTGGAAGAACTTTGGGTTTGACTTCAGCGACACGTCTAC

GTATGAGGACATCTCCGGGTTCTACCGTGAAGTTGAGTTACAAGGGTATAAGATTGA

CTGGACGTATATTTCAGAGAAAGATATCGATCTTTTGCAGGAAAAGGGCCAGTTATA

TTTATTCCAGATTTACAACAAGGACTTTAGTAAGAAGTCAACAGGAAATGACAACTT

GCATACGATGTATTTGAAAAATCTTTTTTCTGAGGAAAATCTTAAGGACATCGTACT

GAAATTGAATGGCGAGGCTGAAATCTTCTTCCGTAAATCCTCCATTAAGAATCCCAT

TATCCACAAAAAGGGGTCTATCCTGGTGAATCGTACCTACGAGGCAGAGGAGAAGG

ATCAATTCGGAAATATTCAGATTGTTCGTAAGAACATCCCCGAGAACATTTATCAAG

AATTGTATAAGTACTTTAATGACAAATCTGACAAAGAGTTATCCGACGAAGCTGCGA

AACTGAAAAACGTTGTTGGTCACCACGAGGCCGCCACTAATATCGTAAAAGACTAC

CGTTATACCTATGACAAGTACTTTTTGCACATGCCGATCACTATCAACTTCAAGGCG

AATAAGACGGGCTTCATTAACGATCGTATCCTGCAATACATCGCCAAGGAGAAGGA

CCTTCACGTCATTGGGATTGACCGTGGTGAGCGTAACCTGATTTATGTAAGCGTCAT

TGATACCTGCGGTAATATCGTCGAACAGAAAAGTTTCAACATTGTAAATGGATATGA

CTATCAGATCAAACTTAAGCAGCAGGAGGGTGCACGCCAGATTGCCCGCAAGGAAT

GGAAGGAGATTGGGAAGATTAAGGAAATTAAAGAAGGTTACTTATCACTGGTTATT

CACGAGATCAGTAAAATGGTAATCAAATATAACGCGATCATTGCCATGGAGGATCT

GAGCTATGGCTTTAAAAAGGGCCGTTTCAAAGTCGAGCGCCAGGTATATCAAAAGT

TTGAAACAATGCTGATTAACAAATTAAACTATCTGGTTTTCAAAGATATTTCGATCA

CTGAAAATGGCGGGCTGTTGAAGGGATACCAACTTACATACATCCCTGACAAACTG

AAAAATGTCGGTCACCAATGTGGATGTATCTTTTATGTACCAGCAGCGTATACGAGC

AAAATCGATCCAACTACGGGTTTTGTGAACATCTTTAAGTTCAAGGATTTGACAGTA

GATGCCAAACGCGAGTTCATTAAAAAATTTGATTCAATTCGCTACGATTCAGAGAAA AATCTTTTTTGTTTCACGTTCGATTACAATAATTTCATTACGCAGAACACAGTAATGT

CAAAGTCAAGCTGGTCGGTCTACACGTATGGAGTCCGTATTAAACGTCGTTTTGTAA

ACGGCCGTTTCTCAAATGAATCAGATACAATTGATATTACGAAGGATATGGAGAAG

ACATTAGAGATGACTGACATTAACTGGCGCGACGGACATGATCTTCGTCAGGACATT

ATTGATTATGAGATTGTACAGCATATCTTTGAGATCTTCCGCCTGACCGTTCAGATG C

GCAATTCGTTGTCCGAGTTAGAAGACCGCGATTACGACCGTTTAATCAGTCCCGTCT

TAAACGAAAATAACATCTTCTACGATTCAGCCAAGGCAGGCGATGCCTTGCCAAAG

GATGCTGACGCAAATGGCGCATACTGTATTGCGTTGAAAGGCCTTTATGAAATCAAG

CAAATTACCGAAAACTGGAAAGAAGACGGAAAATTCTCCCGTGATAAGTTGAAAAT

CTCTAATAAGGATTGGTTCGATTTCATCCAAAATAAACGCTATTTG

[0070] SEQ ID NO: 33

ATGAACAACGGAACTAATAATTTCCAAAATTTTATAGGCATCTCTTCTTTACAGAAG

ACTCTTCGTAACGCCCTAATCCCGACTGAGACCACACAACAATTCATAGTGAAAAAT

GGGATCATTAAAGAAGACGAGCTGCGTGGGGAGAACAGGCAGATCCTAAAAGACA

TAATGGACGATTATTATAGAGGGTTCATCTCAGAGACATTATCTAGCATCGACGACA

TTGACTGGACCTCCCTGTTTGAAAAAATGGAAATCCAGCTGAAGAATGGTGACAAT

AAAGACACATTAATAAAAGAACAAACAGAGTACAGGAAAGCCATCCACAAGAAGT

TCGCAAACGATGACAGATTCAAAAATATGTTCAGTGCGAAGCTAATATCCGACATCT

TACCAGAGTTTGTAATACACAATAACAATTACAGCGCGAGCGAAAAGGAAGAGAAA

ACGCAAGTAATTAAGCTTTTTAGTAGGTTCGCTACCTCTTTCAAAGATTACTTCAAA

AATCGTGCTAACTGCTTCTCAGCCGACGACATATCTTCAAGTTCCTGTCACCGTATC G

TGAATGATAACGCTGAGATATTCTTCTCAAACGCCCTTGTATACCGTAGGATCGTAA

AGTCCTTATCTAACGATGATATAAACAAGATCAGTGGAGACATGAAAGACAGCCTT

AAAGAGATGTCTCTAGAAGAAATTTACTCCTATGAAAAGTATGGGGAGTTTATAAC

ACAGGAGGGGATCAGCTTCTACAACGACATCTGCGGAAAGGTGAACAGTTTCATGA

ATCTTTACTGCCAGAAGAATAAAGAGAACAAAAATCTTTATAAGCTTCAAAAGTTGC

ACAAACAAATACTGTGCATTGCCGATACATCATATGAGGTCCCCTATAAGTTCGAAT

CTGATGAGGAAGTTTATCAATCTGTTAACGGCTTTCTAGACAATATCAGCTCAAAAC

ACATCGTAGAAAGACTGAGGAAAATAGGTGATAATTATAATGGATACAACTTGGAT

AAAATATATATAGTCTCTAAATTTTACGAGTCAGTATCCCAGAAAACGTATAGGGAT

TGGGAGACCATCAACACGGCGTTAGAGATTCATTACAATAACATCTTACCGGGAAA

CGGAAAAAGTAAGGCGGACAAAGTAAAGAAAGCCGTTAAAAATGACTTACAAAAG

AGTATAACAGAAATAAACGAACTAGTAAGCAACTACAAGCTTTGTTCCGATGATAA

TATCAAGGCCGAGACATATATCCATGAGATCTCCCACATTCTAAACAATTTCGAAGC

GCAAGAACTTAAATATAATCCCGAAATCCACCTGGTGGAAAGTGAACTAAAGGCTA GTGAGTTAAAGAACGTTCTTGATGTTATCATGAACGCCTTCCATTGGTGCTCTGTTTT

TATGACCGAGGAGTTGGTTGATAAAGATAATAATTTCTACGCTGAATTAGAGGAGAT

ATACGACGAAATCTACCCAGTGATTTCACTATACAACTTGGTCAGGAACTATGTTAC

ACAAAAGCCGTACAGCACTAAGAAAATTAAGCTAAATTTCGGTATCCCCACGTTAG

CCGACGGGTGGAGCAAGTCCAAAGAATATTCCAACAATGCGATTATTTTAATGCGTG

ACAATCTTTATTACCTTGGCATCTTCAATGCCAAAAACAAACCTGACAAAAAGATTA

TAGAAGGTAATACGTCCGAGAACAAAGGCGATTACAAGAAGATGATTTATAACCTA

CTGCCCGGACCAAACAAAATGATCCCCAAAGTTTTTCTTAGTTCTAAAACCGGCGTA

GAGACGTATAAACCTTCTGCCTATATCTTAGAGGGATATAAGCAGAACAAACATATC

AAATCTTCCAAGGACTTTGATATTACATTCTGCCACGATTTAATTGACTACTTCAAA A

ATTGCATAGCGATACATCCGGAGTGGAAGAACTTTGGCTTCGACTTCAGTGATACAT

CCACCTATGAGGATATATCAGGCTTCTATCGTGAGGTCGAATTGCAAGGGTACAAAA

TCGATTGGACGTATATATCCGAGAAAGACATAGACCTTCTTCAAGAAAAGGGGCAG

TTATATTTATTCCAAATATACAACAAGGACTTCAGTAAGAAGTCAACAGGTAATGAC

AACTTACACACCATGTACTTGAAAAATTTATTTTCTGAAGAAAACCTAAAGGACATT

GTACTAAAACTGAACGGGGAGGCAGAAATTTTTTTTAGAAAGAGCAGCATAAAAAA

CCCAATAATTCATAAGAAAGGAAGCATTTTAGTTAATAGGACGTACGAGGCAGAGG

AAAAGGACCAGTTTGGCAATATCCAGATCGTAAGGAAAAATATTCCTGAAAACATA

TATCAGGAACTATATAAATACTTTAACGACAAATCCGACAAAGAATTATCCGACGA

GGCTGCAAAGCTGAAGAACGTCGTAGGGCACCATGAGGCAGCGACTAATATTGTGA

AAGACTATAGGTATACATACGACAAATACTTTCTGCACATGCCCATCACGATTAACT

TCAAGGCGAACAAGACGGGATTCATTAACGACCGTATATTACAATATATTGCTAAG

GAGAAAGATCTGCATGTAATAGGTATCGACAGAGGCGAACGTAATTTAATCTACGT

GTCCGTCATCGACACGTGCGGGAACATCGTAGAGCAAAAGAGTTTTAATATAGTAA

ATGGCTATGATTACCAAATTAAGCTAAAGCAGCAAGAAGGAGCAAGACAGATAGCT

AGGAAAGAATGGAAGGAGATAGGAAAAATAAAGGAGATCAAGGAGGGGTATCTTA

GCCTAGTAATTCATGAAATATCTAAGATGGTTATCAAATACAACGCTATCATAGCGA

TGGAAGACTTATCTTATGGTTTCAAGAAAGGAAGGTTCAAAGTAGAGCGTCAAGTTT

ATCAAAAGTTCGAAACGATGTTGATTAATAAACTAAACTATTTGGTATTTAAAGATA

TATCTATCACCGAGAATGGTGGTCTACTAAAGGGTTACCAGCTTACATACATACCGG

ACAAACTTAAAAACGTCGGACATCAGTGTGGATGCATTTTCTACGTTCCAGCTGCAT

ATACCAGCAAGATCGACCCAACGACTGGGTTCGTAAATATTTTTAAATTCAAGGATT

TGACTGTCGACGCCAAAAGAGAGTTCATAAAAAAGTTCGATTCAATTAGGTACGAC

AGCGAAAAGAATTTGTTCTGCTTTACTTTTGACTATAACAATTTCATTACTCAGAAC A

CTGTAATGTCTAAGTCCTCTTGGTCAGTCTATACTTATGGCGTTCGTATCAAACGTA G ATTTGTTAACGGTAGATTCTCAAATGAAAGTGATACAATAGATATCACGAAAGATAT

GGAGAAAACATTAGAAATGACAGACATAAACTGGAGAGACGGACATGACTTGAGA

CAGGACATTATTGACTACGAGATCGTGCAGCACATCTTTGAGATCTTTCGTTTGACC

GTACAAATGCGTAACAGTTTATCTGAGCTTGAGGACAGGGACTACGATAGATTGAT

ATCACCTGTATTAAATGAGAATAACATCTTCTATGATTCCGCAAAAGCAGGCGACGC

TCTACCCAAAGACGCTGATGCGAACGGTGCTTATTGCATAGCTTTAAAGGGTTTGTA

TGAGATCAAACAGATAACAGAAAATTGGAAGGAAGATGGTAAGTTCTCCCGTGACA

AGCTTAAAATATCAAATAAGGACTGGTTCGATTTTATACAGAATAAGCGTTATTA

[0071] SEQ ID NO: 34

ATGAACAATGGAACTAATAACTTCCAGAATTTCATTGGTATCTCCTCTTTACAAAAA

ACTCTAAGAAACGCCCTAATTCCGACTGAAACTACACAGCAATTCATCGTCAAAAAC

GGGATCATTAAGGAGGATGAGTTGAGGGGTGAAAATCGTCAAATTCTTAAAGACAT

CATGGACGACTACTACAGGGGGTTCATCAGCGAGACGTTATCTAGTATAGACGATAT

AGACTGGACTTCACTGTTCGAGAAGATGGAAATCCAATTAAAAAATGGGGACAATA

AAGATACACTTATAAAGGAACAGACAGAGTATAGAAAGGCAATACACAAAAAGTTT

GCCAACGACGATCGTTTCAAGAACATGTTTAGTGCTAAATTGATTTCAGATATTCTG

CCGGAATTTGTTATTCACAACAATAATTATAGCGCCAGTGAGAAAGAAGAAAAAAC

GCAGGTTATCAAACTGTTCAGTCGTTTCGCTACATCTTTTAAGGATTACTTTAAAAA C

CGTGCAAATTGTTTTTCAGCCGACGATATTAGTAGCAGCTCTTGTCACCGTATTGTT A

ATGATAATGCGGAGATTTTCTTTTCAAACGCATTGGTCTACAGGAGGATAGTCAAGT

CCCTTTCAAATGACGACATTAATAAGATCTCAGGTGACATGAAAGATTCCTTAAAGG

AAATGTCCCTGGAAGAGATCTATTCCTATGAAAAGTACGGTGAGTTCATTACTCAAG

AGGGTATAAGCTTTTACAATGACATATGTGGTAAGGTTAATAGCTTTATGAACCTGT

ATTGCCAGAAGAACAAAGAAAATAAGAATCTGTATAAGTTGCAAAAGCTACACAAA

CAAATTTTGTGCATTGCCGATACATCATACGAGGTGCCATACAAATTCGAGAGCGAT

GAGGAGGTTTATCAGAGCGTGAATGGATTCCTGGACAATATTAGTAGTAAGCATATC

GTGGAAAGGCTTAGAAAGATAGGTGACAATTACAATGGCTACAATCTGGATAAAAT

CTACATCGTCTCAAAATTCTATGAAAGTGTATCCCAGAAGACGTACCGTGATTGGGA

AACTATCAACACCGCTCTGGAGATACATTACAACAATATACTTCCCGGAAACGGCA

AGTCAAAAGCCGACAAAGTCAAAAAAGCGGTCAAGAACGATTTACAAAAGTCTATC

ACTGAAATTAATGAATTAGTTAGTAATTACAAACTGTGTAGTGATGATAATATTAAG

GCAGAGACTTACATACACGAAATTTCACACATTTTAAACAACTTCGAGGCACAGGA

ACTTAAATATAATCCTGAAATTCACCTGGTTGAAAGTGAATTGAAAGCCAGCGAGCT

AAAGAACGTTTTGGACGTAATCATGAACGCATTCCACTGGTGCTCTGTCTTTATGAC

AGAGGAACTAGTGGATAAGGACAATAATTTTTATGCGGAGCTGGAGGAAATATACG ATGAGATATATCCCGTAATATCATTATATAATCTGGTAAGAAACTATGTGACTCAAA

AGCCGTATAGCACCAAGAAAATTAAACTTAATTTCGGCATACCCACTTTAGCGGACG

GCTGGTCAAAATCCAAAGAGTATAGTAATAATGCCATCATCCTGATGCGTGACAACC

TGTACTATTTAGGTATATTTAACGCCAAAAATAAACCCGACAAAAAGATTATAGAG

GGCAACACCTCAGAGAACAAAGGTGATTATAAGAAGATGATTTACAACCTTTTACC

CGGTCCTAATAAGATGATTCCCAAAGTCTTTCTATCTAGCAAAACTGGTGTTGAAAC

ATACAAACCCTCAGCTTATATTTTAGAAGGGTATAAGCAGAATAAGCATATTAAAA

GCTCCAAAGATTTCGATATTACCTTTTGCCATGACTTGATAGACTATTTCAAAAATT G

TATTGCCATTCACCCTGAATGGAAAAACTTCGGATTTGACTTCTCTGACACATCCAC

CTACGAAGACATTTCAGGTTTTTACAGGGAAGTCGAGCTACAGGGTTATAAAATTGA

TTGGACATACATCAGCGAGAAAGATATTGACCTACTTCAAGAAAAAGGGCAGCTAT

ACCTGTTCCAGATATACAATAAAGACTTCAGTAAAAAAAGCACCGGGAACGATAAT

CTTCACACAATGTACTTAAAAAATTTATTTAGTGAAGAGAATCTGAAGGATATAGTG

CTGAAGTTAAACGGGGAGGCAGAGATATTTTTTAGAAAATCTAGTATTAAGAATCC

GATCATCCACAAGAAGGGTTCTATCCTTGTTAATAGGACTTATGAGGCAGAAGAAA

AAGACCAATTCGGCAACATACAAATTGTCCGTAAAAATATCCCTGAGAACATTTATC

AGGAACTATACAAGTACTTCAATGATAAAAGCGACAAGGAGCTGAGCGACGAGGCT

GCTAAGTTAAAGAATGTGGTGGGCCACCATGAGGCAGCAACGAATATTGTGAAGGA

CTATCGTTATACCTACGATAAATACTTTCTTCATATGCCGATCACCATTAATTTCAA G

GCAAACAAAACTGGCTTCATTAACGATCGTATCTTACAATATATCGCAAAAGAGAA

AGACCTTCACGTTATCGGGATCGATAGAGGCGAGCGTAACCTAATTTATGTTTCTGT

GATAGACACCTGTGGGAACATAGTCGAACAGAAATCATTTAATATTGTTAACGGCTA

CGATTATCAGATAAAGTTGAAGCAACAAGAGGGTGCACGTCAAATAGCAAGGAAAG

AATGGAAAGAAATAGGCAAGATTAAAGAAATAAAAGAAGGTTATTTATCCCTTGTA

ATACACGAAATTAGCAAAATGGTGATTAAATATAATGCGATCATTGCCATGGAGGA

TCTTTCTTACGGCTTCAAAAAGGGGAGATTCAAAGTCGAGAGGCAGGTGTATCAGA

AGTTTGAGACCATGCTAATCAATAAACTAAATTATCTAGTATTCAAAGACATAAGCA

TCACCGAAAATGGCGGCTTGTTGAAGGGTTATCAATTGACCTACATCCCAGATAAAC

TAAAAAACGTAGGGCATCAATGCGGATGTATATTTTACGTTCCAGCCGCATACACTT

CCAAAATCGATCCAACTACGGGTTTTGTGAACATCTTCAAATTCAAAGACTTGACTG

TCGATGCTAAGAGGGAGTTTATCAAGAAATTTGACTCCATTAGATACGACAGTGAG

AAGAATCTGTTCTGTTTTACCTTTGATTATAACAACTTTATAACTCAAAACACAGTC A

TGAGTAAGTCATCTTGGTCAGTGTATACGTATGGTGTGAGGATTAAAAGGAGGTTTG

TTAACGGGAGATTTTCCAATGAAAGTGATACAATAGATATAACCAAGGACATGGAA

AAGACTCTTGAAATGACCGACATTAACTGGAGAGATGGCCACGACTTACGTCAAGA TATAATCGATTACGAGATAGTGCAACATATCTTTGAGATATTTAGGCTTACTGTCCA

AATGCGTAACTCATTAAGTGAGTTGGAGGACAGGGATTACGATAGGCTAATAAGTC

CTGTTCTTAACGAAAACAATATATTCTACGATTCAGCAAAGGCGGGAGACGCCCTGC

CCAAGGACGCGGATGCTAACGGCGCATACTGTATTGCCCTGAAAGGCTTGTACGAG

ATAAAACAGATCACGGAGAACTGGAAAGAAGATGGAAAATTCAGTCGTGACAAGTT

AAAAATTAGTAACAAAGACTGGTTCGACTTTATTCAGAACAAGAGATATCTG

[0072] SEQ ID NO: 35

ATGAACAACGGAACCAATAACTTTCAAAACTTTATAGGCATCTCCAGTCTACAGAAG

ACACTACGTAACGCTTTGATACCAACTGAGACCACGCAGCAGTTTATCGTCAAGAAC

GGTATTATAAAGGAAGACGAGCTAAGGGGGGAAAACCGTCAGATCTTAAAGGACAT

CATGGATGACTACTACAGAGGCTTCATAAGTGAGACTTTGTCTAGTATAGACGACAT

CGACTGGACCAGTTTATTTGAGAAGATGGAAATTCAGTTAAAGAACGGGGACAATA

AAGACACACTAATTAAAGAGCAGACCGAATACAGAAAAGCTATACACAAAAAGTTT

GCCAACGATGATAGATTCAAAAATATGTTTTCAGCAAAATTGATTTCCGACATATTG

CCAGAATTCGTAATCCATAATAACAATTATTCTGCAAGTGAGAAGGAAGAGAAGAC

CCAAGTAATCAAGCTGTTTTCCCGTTTTGCTACGAGTTTCAAAGATTATTTCAAGAA T

AGGGCTAATTGTTTCTCCGCGGACGACATAAGTAGCAGTTCCTGTCACAGGATTGTG

AACGATAATGCTGAGATATTTTTTTCCAATGCCCTAGTGTATAGGAGAATAGTTAAA

AGCTTAAGCAACGACGATATCAATAAAATTTCAGGGGACATGAAGGACAGCTTAAA

GGAAATGAGTTTGGAGGAGATTTACAGTTATGAAAAATACGGAGAGTTTATAACTC

AGGAAGGCATCTCTTTCTATAATGATATCTGTGGGAAGGTAAACTCCTTCATGAATT

TATATTGCCAGAAGAATAAGGAAAACAAAAATCTTTACAAGCTTCAAAAGTTACAT

AAGCAGATCTTATGTATTGCCGACACGAGTTATGAAGTGCCTTATAAATTCGAGAGT

GATGAGGAAGTGTATCAGTCTGTTAACGGATTCCTAGATAATATAAGTTCCAAACAT

ATAGTCGAGAGGCTGAGGAAGATTGGCGATAACTATAATGGATATAATCTTGACAA

AATCTATATAGTCTCTAAATTTTATGAAAGCGTCAGCCAGAAGACATATAGAGATTG

GGAAACTATAAACACAGCCCTTGAAATACATTACAATAACATCCTACCCGGCAATG

GTAAGTCTAAGGCAGACAAAGTTAAAAAAGCAGTAAAGAATGACTTACAGAAGTCA

ATCACGGAGATAAATGAGTTGGTCAGTAACTACAAATTATGCTCCGACGATAATATT

AAGGCCGAAACATATATACACGAGATAAGTCATATATTAAACAATTTCGAAGCCCA

GGAGTTAAAATATAACCCTGAAATTCATCTGGTCGAAAGTGAGTTAAAGGCCAGTG

AGTTAAAGAATGTACTTGACGTAATTATGAATGCTTTTCATTGGTGCTCCGTGTTCA T

GACCGAGGAGTTAGTAGATAAAGACAATAACTTTTACGCCGAACTTGAAGAGATAT

ACGACGAGATTTATCCGGTAATCAGCTTGTACAACTTAGTTAGAAATTATGTAACAC

AGAAGCCTTACTCTACTAAAAAAATAAAACTGAACTTTGGTATCCCAACTCTTGCAG ATGGTTGGAGTAAAAGCAAGGAATATAGCAACAATGCGATCATCTTGATGAGAGAC

AACTTGTACTATTTGGGAATCTTCAACGCGAAAAATAAACCCGACAAAAAAATCAT

CGAAGGGAATACCTCTGAGAATAAAGGTGACTATAAGAAAATGATTTACAATCTAC

TTCCTGGTCCTAATAAAATGATCCCGAAAGTGTTTCTTAGTTCTAAGACTGGTGTCG

AGACGTACAAACCTAGCGCGTACATCTTAGAAGGGTACAAGCAGAATAAACACATC

AAATCAAGCAAAGACTTCGATATTACTTTTTGCCATGACTTGATAGACTACTTTAAA

AACTGCATAGCAATCCACCCGGAGTGGAAAAACTTTGGCTTTGATTTCTCTGACACC

TCTACATATGAGGACATATCTGGTTTTTACCGTGAGGTTGAATTGCAGGGATACAAA

ATTGACTGGACTTACATATCTGAAAAAGATATCGATCTATTGCAGGAGAAAGGCCA

GCTTTACCTTTTCCAGATCTATAATAAGGACTTCTCTAAGAAGTCTACAGGGAATGA

TAATTTGCACACTATGTACTTAAAAAATCTGTTTTCCGAGGAAAACTTGAAAGACAT

TGTTTTAAAGTTGAACGGAGAAGCTGAAATATTTTTCAGAAAGAGCTCCATAAAAA

ACCCGATCATTCATAAGAAGGGATCTATCCTGGTTAACAGAACGTACGAAGCGGAA

GAAAAAGACCAATTCGGAAACATTCAAATTGTTAGAAAGAATATCCCTGAGAACAT

CTACCAGGAGTTATATAAGTATTTTAATGATAAGTCAGATAAGGAACTATCTGACGA

AGCGGCGAAGCTTAAAAATGTTGTAGGACACCATGAGGCTGCTACAAATATAGTCA

AGGACTACCGTTATACCTACGATAAGTACTTTCTACACATGCCCATTACCATCAATT T

TAAAGCTAATAAAACGGGTTTTATCAACGATCGTATCCTACAATATATTGCGAAAGA

GAAGGATTTGCATGTCATTGGCATTGATAGAGGTGAGAGGAACCTAATATACGTATC

CGTGATTGATACGTGCGGGAACATAGTTGAACAGAAATCATTTAATATAGTTAATGG

GTACGACTATCAGATTAAGCTAAAGCAACAAGAAGGCGCCAGGCAAATTGCCCGTA

AAGAATGGAAAGAGATCGGGAAGATCAAGGAAATAAAAGAAGGATACCTTTCCCT

GGTCATCCATGAAATTAGCAAAATGGTGATTAAGTACAATGCCATAATCGCGATGG

AGGACTTAAGCTACGGGTTCAAAAAGGGGAGGTTTAAGGTGGAGAGGCAAGTGTAC

CAGAAATTTGAGACCATGCTAATCAACAAACTGAACTACCTAGTTTTTAAGGACATT

TCAATTACAGAGAATGGAGGACTTTTAAAGGGTTACCAACTAACGTATATACCAGAT

AAGTTGAAAAATGTCGGTCACCAGTGTGGCTGCATCTTTTACGTTCCCGCCGCTTAT

ACATCTAAAATTGATCCAACCACAGGCTTTGTAAATATCTTTAAATTCAAAGATTTA

ACTGTGGATGCAAAAAGAGAGTTTATCAAGAAATTCGATAGCATTCGTTATGATAGC

GAGAAGAACCTGTTCTGCTTTACTTTCGACTATAACAACTTTATAACTCAAAACACC

GTGATGTCAAAAAGCTCATGGTCAGTCTACACCTATGGTGTAAGGATTAAAAGGCGT

TTCGTGAATGGGAGATTCTCCAATGAAAGTGACACGATCGACATAACAAAGGACAT

GGAGAAGACACTAGAGATGACTGATATTAATTGGAGAGACGGACACGATCTGCGTC

AAGATATAATTGATTATGAGATAGTACAGCACATATTTGAGATCTTCCGTTTGACTG

TCCAAATGCGTAATTCCCTTTCTGAGCTGGAAGATAGGGACTATGATAGATTAATAT CCCCTGTACTAAATGAGAACAACATTTTCTATGATAGTGCAAAAGCCGGGGATGCAT

TGCCGAAAGACGCTGACGCTAATGGGGCGTACTGTATAGCTTTAAAGGGGCTTTACG

AAATAAAGCAGATAACCGAAAACTGGAAGGAAGATGGCAAATTCTCAAGGGACAA

ACTTAAGATCTCTAACAAGGATTGGTTCGATTTTATACAAAACAAACGTTATTTG

[0073] SEQ ID NO:36

ATGAATAATGGTACAAACAACTTTCAGAATTTCATTGGGATCTCTAGCTTACAGAAG

ACCCTGAGGAATGCGTTGATTCCAACTGAAACAACCCAGCAATTCATCGTGAAAAA

TGGGATAATCAAAGAGGATGAGTTAAGGGGTGAAAACCGTCAAATATTGAAGGATA

TTATGGACGACTACTACCGTGGATTCATCTCAGAGACGTTGAGCAGCATTGACGACA

TAGACTGGACTAGCCTTTTCGAGAAGATGGAAATTCAGTTAAAGAACGGAGATAAC

AAAGATACACTAATCAAGGAACAGACAGAATACAGAAAAGCAATTCATAAGAAATT

CGCTAATGACGATCGTTTTAAAAACATGTTCTCTGCAAAATTAATTAGCGACATTCT

GCCGGAATTCGTTATACATAATAATAACTACAGTGCTTCTGAAAAGGAAGAGAAAA

CTCAGGTAATAAAACTGTTCTCTCGTTTTGCCACATCCTTCAAAGACTACTTTAAAA A

TAGAGCGAACTGCTTTAGCGCCGACGATATTAGTTCTTCCTCATGCCACAGGATTGT

CAACGATAATGCAGAGATATTCTTTTCTAACGCACTAGTCTACAGAAGGATTGTAAA

GTCTTTGTCAAATGATGACATAAACAAGATTAGTGGAGATATGAAAGACTCTCTAAA

GGAAATGAGCCTTGAGGAGATATACTCTTATGAAAAGTACGGTGAGTTTATTACCCA

AGAAGGCATTAGTTTCTATAATGACATTTGTGGAAAAGTTAACAGTTTTATGAATCT

ATACTGTCAAAAAAATAAGGAGAATAAAAATCTTTATAAGTTGCAAAAACTGCATA

AGCAGATATTATGTATAGCAGACACGAGCTATGAGGTACCGTACAAGTTCGAGAGC

GATGAGGAAGTCTACCAATCTGTCAACGGATTTTTGGACAACATTTCTTCAAAACAT

ATTGTGGAGAGGCTTAGGAAAATAGGCGACAATTATAATGGATATAACTTAGATAA

GATATATATTGTTTCCAAATTCTACGAATCTGTAAGCCAGAAGACATACAGAGATTG

GGAAACGATAAACACAGCCCTTGAAATTCACTATAACAACATACTACCTGGAAACG

GCAAATCAAAGGCCGACAAAGTTAAGAAGGCCGTAAAGAATGATTTACAGAAGAG

CATAACGGAGATCAATGAGCTGGTGTCTAACTATAAATTGTGTAGCGATGACAACAT

AAAAGCCGAGACTTACATTCACGAAATTTCACACATACTTAACAACTTTGAAGCTCA

GGAATTAAAGTATAATCCCGAAATACACCTTGTGGAGTCCGAACTAAAGGCTAGTG

AGCTTAAGAACGTCCTAGACGTAATTATGAATGCCTTCCACTGGTGTAGTGTTTTTA T

GACCGAGGAACTTGTTGACAAAGATAATAATTTTTATGCAGAACTAGAAGAGATAT

ACGATGAAATATACCCGGTGATCAGTTTGTACAATCTTGTCAGGAACTATGTGACAC

AAAAGCCCTATTCAACAAAGAAAATAAAACTTAATTTCGGAATTCCTACGTTAGCTG

ATGGCTGGTCTAAATCCAAGGAATACAGCAACAACGCTATAATTCTGATGAGAGAT

AACTTGTACTATCTAGGCATCTTCAATGCCAAAAATAAGCCTGATAAGAAGATTATA GAGGGCAACACTTCAGAGAACAAGGGCGACTACAAGAAAATGATCTATAACCTATT

GCCTGGCCCAAACAAGATGATTCCGAAGGTCTTCCTATCATCCAAGACCGGCGTTGA

GACATACAAGCCATCAGCGTATATTTTAGAGGGGTACAAACAAAACAAGCACATAA

AGTCTAGTAAAGACTTCGATATAACATTTTGTCATGACTTAATTGACTACTTTAAGA

ATTGCATCGCTATACACCCGGAATGGAAGAATTTCGGCTTCGACTTCTCTGATACAT

CTACCTACGAGGACATTAGCGGGTTTTACCGTGAAGTCGAATTACAAGGGTATAAG

ATAGATTGGACGTACATCTCTGAGAAAGACATAGACTTGCTTCAGGAAAAGGGCCA

GTTGTATCTATTCCAAATATACAATAAGGATTTTTCCAAGAAATCTACGGGTAATGA

CAATCTTCACACAATGTATCTTAAGAACCTTTTCTCAGAAGAGAACCTGAAGGACAT

TGTCTTAAAACTAAATGGCGAAGCTGAGATTTTTTTCAGGAAGTCTTCAATTAAGAA

CCCGATAATCCACAAGAAGGGGAGTATTCTTGTGAATAGAACTTACGAGGCCGAAG

AAAAAGACCAATTTGGTAACATCCAGATAGTCAGAAAGAACATTCCAGAGAACATC

TACCAAGAGCTATACAAATATTTCAACGACAAGTCCGATAAGGAACTGTCCGATGA

GGCAGCCAAGTTGAAGAATGTCGTGGGTCATCATGAAGCTGCTACTAACATTGTCAA

GGACTATCGTTATACTTACGACAAGTATTTCCTACACATGCCGATAACAATTAATTT

CAAGGCTAACAAAACAGGCTTTATCAACGATCGTATCTTGCAGTACATAGCTAAGG

AAAAGGATTTGCATGTGATTGGCATTGATAGAGGGGAGCGTAACTTGATATATGTGT

CTGT CATAGAC ACGT GT GGC AAC ATCGTCGAAC AGAAATCATTC AAC AT AGTAAAC

GGCTACGATTACCAAATTAAGCTGAAACAGCAAGAGGGTGCACGTCAAATTGCGCG

TAAAGAGTGGAAAGAAATTGGTAAAATCAAGGAAATTAAAGAAGGCTACTTGTCTC

TTGTTATACATGAAATTTCCAAGATGGTTATAAAGTATAACGCGATAATTGCTATGG

AAGACTTATCATACGGGTTTAAAAAGGGGAGGTTCAAGGTAGAGAGGCAGGTCTAT

CAAAAGTTCGAGACGATGTTGATTAATAAACTAAACTATCTAGTGTTCAAAGATATC

AGCATTACGGAGAACGGGGGGCTACTGAAAGGATATCAACTAACGTACATTCCCGA

TAAGTTAAAGAACGTTGGTCATCAATGTGGTTGCATCTTCTACGTGCCTGCTGCCTA T

ACGTCCAAAATAGATCCAACTACTGGATTTGTTAACATCTTTAAATTCAAAGATTTA

ACCGTAGACGCCAAAAGGGAATTTATAAAAAAATTTGACAGCATCCGTTACGATAG

CGAAAAGAATCTGTTCTGTTTTACTTTCGACTACAATAATTTCATCACGCAAAATAC

GGTAATGTCTAAGTCAAGTTGGAGCGTCTACACGTATGGAGTCAGGATCAAGAGGC

GTTTCGTAAATGGAAGATTCTCTAATGAGTCAGATACTATAGACATCACGAAAGATA

TGGAGAAAACCTTGGAGATGACGGATATTAACTGGCGTGATGGACACGATTTAAGA

CAGGACATTATTGACTATGAGATTGTGCAACACATCTTCGAAATATTCCGTCTAACA

GTCCAAATGAGGAATAGCCTAAGTGAATTGGAGGACCGTGATTACGATAGGCTTAT

AAGTCCTGTCCTTAACGAAAACAATATTTTCTATGATAGTGCTAAGGCGGGGGACGC

ACTGCCTAAAGACGCAGATGCTAACGGGGCATACTGCATTGCGTTAAAGGGTCTGT ACGAAATCAAGCAGATTACGGAAAACTGGAAAGAGGATGGCAAGTTTAGCAGAGA

TAAGTTGAAGATAAGTAACAAAGATTGGTTTGACTTTATTCAGAATAAAAGGTATTT

[0074] SEQ ID NO: 37

ATGAATAACGGCACTAATAATTTCCAGAATTTCATCGGCATTAGCAGCTTACAAAAG

ACGTTGAGGAATGCCTTAATACCCACAGAAACTACTCAACAATTTATAGTGAAGAAT

GGGATAATTAAGGAAGACGAGTTGAGAGGTGAAAATAGGCAAATCTTGAAAGACAT

TATGGATGACTACTACAGGGGCTTCATTAGTGAAACGTTGTCTTCAATAGATGACAT

TGATTGGACTTCTTTGTTTGAGAAGATGGAAATACAGTTAAAGAACGGCGACAATA

AGGATACACTTATCAAAGAGCAAACAGAATATAGAAAAGCAATTCACAAAAAGTTT

GCTAACGATGATAGGTTCAAGAACATGTTTAGCGCTAAACTAATATCAGACATCCTT

CCCGAGTTCGTTATTCATAACAATAACTATAGTGCAAGTGAAAAAGAGGAGAAGAC

ACAGGTGATTAAGCTGTTCTCCAGATTCGCGACTTCTTTCAAAGATTACTTCAAAAA

CAGAGCCAACTGTTTTTCAGCTGACGATATCTCTAGTAGTAGTTGTCACCGTATAGT

GAACGATAACGCTGAGATCTTCTTTAGCAATGCATTAGTGTATAGAAGGATAGTTAA

GTCTCTAAGCAATGATGATATCAATAAAATTTCCGGAGACATGAAGGACTCCCTAAA

GGAAATGTCCTTAGAAGAGATCTACTCATATGAGAAATACGGGGAATTTATTACGC

AGGAAGGGATCTCCTTTTACAATGACATATGCGGGAAGGTCAACTCTTTCATGAACT

TATACTGCCAAAAGAACAAGGAGAACAAGAATTTATATAAACTTCAGAAACTTCAC

AAACAAATACTGTGCATAGCCGATACCTCATATGAGGTTCCTTACAAATTTGAATCA

GATGAAGAGGTATACCAATCCGTTAACGGCTTTCTTGACAATATTAGCTCAAAGCAC

ATCGTGGAGAGGTTGAGAAAGATTGGTGATAATTATAATGGCTACAATCTAGATAA

GATATATATTGTTAGCAAGTTCTACGAGTCTGTGTCCCAAAAAACATATAGGGATTG

GGAGACAATTAATACTGCTCTAGAAATCCATTACAACAACATCCTTCCTGGAAATGG

CAAGAGTAAGGCCGACAAAGTCAAGAAAGCAGTGAAAAATGATCTGCAAAAATCA

ATTACTGAGATAAACGAGCTAGTATCTAATTACAAGCTTTGTAGCGACGATAACATT

AAGGCAGAAACGTACATACACGAGATTAGTCACATCTTAAATAATTTTGAAGCCCA

AGAACTGAAATATAACCCTGAGATACACCTTGTTGAATCCGAGTTAAAGGCGTCTGA

ACTAAAAAACGTGTTAGACGTTATTATGAATGCCTTCCACTGGTGTAGCGTCTTTAT

GACTGAGGAGTTGGTTGATAAGGATAATAACTTTTACGCTGAATTGGAAGAAATTTA

TGACGAAATCTATCCTGTTATTTCTCTATATAATTTGGTGAGAAATTACGTAACGCA

AAAGCCCTATAGTACGAAAAAAATAAAACTAAATTTCGGGATCCCTACCCTAGCCG

ACGGTTGGTCTAAATCCAAGGAGTACTCAAACAATGCAATAATATTGATGAGGGAC

AACCTGTACTACCTAGGCATATTTAATGCCAAAAATAAGCCCGATAAAAAGATTATA

GAAGGGAACACGTCAGAAAATAAAGGAGACTATAAGAAAATGATCTACAACCTTTT GCCCGGCCCCAATAAAATGATCCCGAAGGTCTTCCTAAGTAGCAAGACTGGCGTAG

AGACCTACAAACCATCTGCATACATTTTGGAGGGGTACAAGCAAAACAAGCACATA

AAGAGTAGTAAGGATTTTGACATTACATTCTGCCATGACTTAATTGACTACTTTAAA

AATTGCATCGCAATTCACCCTGAATGGAAAAATTTTGGATTTGATTTCTCTGATACT T

CAACATATGAGGATATTTCAGGGTTCTACAGGGAGGTCGAACTACAGGGTTACAAA

ATAGACTGGACGTATATTTCTGAGAAAGATATAGATTTGCTTCAGGAAAAGGGTCA

GCTATATCTGTTCCAGATATATAATAAGGACTTCTCCAAAAAGAGTACCGGAAATGA

TAATCTGCACACAATGTACTTAAAAAACTTGTTCTCTGAGGAGAATCTAAAAGACAT

CGTACTAAAACTTAACGGGGAGGCCGAAATTTTTTTTAGGAAGTCCAGCATCAAGA

ACCCGATTATTCATAAAAAAGGTAGCATTTTGGTGAACCGTACTTATGAGGCGGAAG

AAAAAGACCAATTCGGTAATATTCAAATCGTTAGAAAGAACATCCCTGAGAACATT

TATCAGGAACTATACAAATACTTTAACGACAAATCAGATAAGGAGCTTTCTGATGAG

GCAGCTAAATTGAAAAATGTAGTGGGACATCACGAAGCAGCCACTAACATAGTGAA

GGACTACAGATACACATACGATAAGTACTTCCTGCACATGCCTATTACAATTAACTT

TAAAGCAAATAAAACAGGGTTTATTAACGACAGAATCTTACAGTATATTGCCAAAG

AAAAGGATCTGCATGTGATAGGAATAGACAGAGGAGAAAGAAACCTGATATACGTC

TCCGTGATTGATACATGTGGGAACATAGTAGAACAGAAGTCCTTTAACATTGTTAAT

GGGTACGATTATCAAATTAAATTAAAACAACAAGAAGGAGCACGTCAAATAGCTAG

GAAAGAATGGAAAGAGATAGGAAAAATTAAGGAAATTAAGGAGGGTTACCTGTCC

CTTGTAATTCATGAAATATCCAAAATGGTAATTAAATATAACGCGATCATCGCGATG

GAAGATCTAAGCTACGGGTTCAAAAAAGGCAGGTTTAAGGTGGAGAGGCAAGTTTA

CCAAAAGTTCGAGACAATGTTGATTAATAAGTTAAACTACTTAGTTTTCAAAGATAT

CTCCATAACCGAGAATGGCGGGCTTTTAAAAGGGTACCAACTAACATATATCCCGG

ATAAATTGAAGAACGTTGGACACCAGTGTGGCTGCATATTTTATGTACCCGCTGCGT

ATACTTCTAAAATTGACCCGACCACCGGGTTTGTAAACATATTCAAGTTTAAGGACC

TAACAGTTGACGCCAAACGTGAGTTCATCAAGAAGTTCGATAGTATAAGGTATGACT

CTGAGAAGAACCTTTTCTGCTTCACGTTTGACTATAATAATTTCATCACCCAAAATA C

AGTTATGTCAAAAAGCTCTTGGTCAGTATATACGTATGGCGTAAGGATTAAGCGTAG

GTTCGTGAACGGTAGATTTTCCAACGAGTCAGATACTATTGATATTACCAAGGATAT

GGAGAAGACATTAGAAATGACAGATATAAATTGGAGGGATGGGCACGATCTAAGGC

AAGATATCATTGATTACGAAATTGTTCAGCACATATTCGAGATATTCCGTCTTACAG

TACAAATGCGTAACAGCTTGTCTGAGTTGGAAGATCGTGACTATGACAGGTTGATAT

CACCGGTCTTGAACGAGAACAATATATTCTACGACAGCGCTAAGGCGGGAGACGCT

CTGCCTAAAGACGCAGATGCCAATGGGGCGTACTGCATTGCCTTAAAAGGCTTATAC GAGATTAAACAGATCACAGAGAACTGGAAAGAGGACGGCAAGTTTTCTAGAGATAA

ATTGAAAATCTCAAACAAAGACTGGTTCGATTTCATCCAAAACAAAAGATACCTT

[0075] SEQ ID NO: 38

ATGAACAATGGAACTAACAACTTCCAGAACTTTATCGGCATCTCTTCCCTCCAAAAG

ACACTGAGAAATGCACTGATCCCAACCGAAACGACTCAACAATTTATTGTTAAGAA

CGGCATCATAAAAGAAGACGAGCTTCGCGGCGAGAACCGCCAGATACTTAAGGATA

TTATGGACGATTATTACCGAGGCTTTATCAGCGAAACTCTTAGCTCTATTGATGATA T

CGACTGGACCTCCCTCTTCGAAAAAATGGAGATACAGCTCAAGAACGGCGATAATA

AAGACACCTTGATAAAGGAACAGACTGAGTACAGGAAAGCGATCCACAAGAAATTC

GCGAACGACGACAGGTTTAAAAACATGTTCTCTGCAAAATTGATATCCGACATCTTG

CCGGAATTTGTGATACACAACAATAACTATAGCGCTTCAGAGAAAGAAGAGAAGAC

CCAAGTAATCAAGTTGTTCAGCCGCTTCGCAACGTCTTTTAAAGATTACTTTAAGAA

CCGGGCCAATTGTTTCTCCGCGGATGATATTAGCTCATCAAGTTGCCATCGAATTGT

CAATGATAATGCGGAGATCTTCTTCAGCAATGCGCTGGTCTACAGACGAATCGTAAA

AAGTCTTTCAAATGACGACATCAATAAGATTAGTGGAGATATGAAGGATTCCCTTAA

GGAAATGAGTCTTGAAGAAATATACTCATACGAAAAGTACGGGGAATTTATTACCC

AGGAGGGGATCTCCTTCTATAACGACATCTGTGGAAAAGTAAACTCATTCATGAACC

TGTACTGTCAGAAAAACAAAGAAAACAAAAATCTGTATAAACTCCAAAAATTGCAC

AAGCAAATATTGTGTATAGCGGACACATCATACGAGGTTCCATATAAGTTCGAAAGT

GATGAAGAAGTCTACCAATCAGTGAATGGGTTTCTGGACAACATTAGTTCCAAGCAC

ATAGTTGAACGACTGCGAAAGATTGGTGACAATTACAACGGCTATAATTTGGACAA

GATTTATATAGTTAGCAAATTTTATGAATCCGTATCACAAAAGACTTATAGAGACTG

GGAAACAATCAACACGGCACTTGAGATCCATTATAACAATATTCTTCCAGGGAACG

GCAAAAGCAAGGCTGATAAGGTAAAAAAGGCCGTTAAGAATGATCTTCAAAAATCC

ATAACGGAGATCAACGAACTTGTAAGTAACTACAAATTGTGCTCTGACGACAATAT

AAAGGCTGAAACGTATATTCACGAGATTAGCCATATCCTGAATAACTTTGAGGCCCA

AGAACTCAAGTATAACCCGGAAATACATTTGGTAGAAAGCGAGCTTAAAGCGAGTG

AGCTGAAAAACGTCCTCGATGTGATCATGAATGCTTTCCACTGGTGTAGTGTCTTTA

TGACTGAGGAGTTGGTTGATAAAGACAATAATTTCTACGCTGAACTGGAAGAAATTT

ACGACGAAATCTATCCAGTGATCTCCCTCTATAACCTCGTTCGAAACTACGTGACGC

AGAAACCTTATTCTACAAAGAAAATTAAGTTGAACTTCGGCATTCCTACACTTGCTG

ACGGATGGTCCAAATCCAAAGAGTACTCAAACAACGCAATCATCCTCATGCGGGAT

AACCTTTATTATTTGGGCATTTTCAACGCCAAAAACAAACCTGATAAAAAGATAATT

GAAGGCAATACGAGTGAGAACAAGGGCGACTACAAAAAAATGATATATAACTTGTT

GCCAGGCCCCAACAAGATGATTCCTAAAGTTTTTCTGTCTTCTAAGACTGGAGTTGA AACTTACAAACCCTCCGCCTACATTCTTGAAGGGTATAAACAGAATAAGCACATAA

AGTCCTCAAAGGATTTCGACATTACGTTTTGCCATGACCTCATCGACTATTTCAAGA

ACTGTATCGCCATACATCCGGAGTGGAAGAATTTTGGATTTGATTTCTCCGACACAT

CTACCTATGAAGACATAAGCGGTTTCTACCGGGAGGTCGAGCTTCAGGGCTATAAG

ATAGATTGGACATACATTAGTGAAAAAGATATCGATCTTCTGCAAGAAAAGGGACA

ACTTTACCTTTTTCAGATTTATAATAAAGACTTTTCAAAAAAGTCCACAGGGAACGA

TAATCTGCACACCATGTATCTCAAGAATCTGTTTAGTGAAGAAAACCTTAAAGACAT

AGTTTTGAAGCTTAACGGAGAGGCTGAGATTTTTTTTAGAAAGTCCTCAATTAAAAA

CCCTATAATACACAAGAAAGGCTCTATTCTTGTTAACAGGACATATGAAGCCGAGG

AGAAAGATCAGTTTGGCAATATCCAGATTGTTCGCAAGAATATCCCGGAAAATATAT

ATCAGGAGCTGTATAAATACTTTAACGACAAGAGCGACAAGGAGCTGAGTGACGAG

GCCGCGAAGCTTAAGAATGTAGTAGGTCACCACGAAGCAGCCACCAATATCGTCAA

AGACTATAGGTACACGTACGACAAGTACTTTTTGCACATGCCTATAACTATAAACTT

CAAAGCTAATAAAACTGGGTTTATTAATGACAGGATTCTCCAATACATCGCTAAAGA

GAAGGATCTGCATGTAATTGGCATAGACAGAGGTGAGAGAAACTTGATATATGTCA

GCGTAATAGACACATGTGGCAATATCGTGGAACAGAAGTCTTTTAACATCGTCAATG

GTTACGACTACCAAATTAAGTTGAAACAGCAGGAAGGCGCACGACAGATCGCACGA

AAGGAATGGAAAGAGATAGGCAAAATAAAAGAAATAAAGGAGGGCTATCTCAGTC

TCGTTATACACGAAATTTCAAAAATGGTTATTAAGTACAATGCAATCATAGCGATGG

AGGATCTCAGTTATGGGTTCAAAAAGGGTCGGTTTAAAGTTGAGCGCCAAGTGTACC

AAAAGTTCGAGACAATGCTGATTAACAAGCTGAACTACCTCGTCTTCAAAGATATAA

GTATTACGGAGAACGGTGGCCTTCTTAAAGGCTATCAACTTACTTACATCCCGGACA

AGCTCAAAAACGTAGGGCACCAATGCGGGTGTATTTTCTATGTGCCTGCGGCATATA

CGTCAAAGATTGACCCAACCACAGGATTCGTAAACATATTCAAGTTTAAGGACCTCA

CCGTTGATGCGAAAAGGGAGTTCATTAAAAAATTTGATTCTATTCGATATGATAGTG

AGAAAAATCTCTTTTGTTTCACATTTGACTATAATAATTTTATTACTCAGAATACTG T

CATGAGCAAGTCATCTTGGTCAGTGTACACATACGGGGTGCGGATCAAACGCAGGT

TCGTCAATGGTCGCTTCTCAAACGAATCAGACACCATTGACATCACAAAGGACATGG

AAAAAACCCTTGAGATGACCGACATTAATTGGCGCGATGGTCATGATCTGCGGCAA

GACATCATAGACTACGAAATCGTCCAACACATCTTTGAGATCTTTCGCTTGACGGTC

CAAATGCGGAACTCCCTGTCCGAGCTCGAGGATAGAGATTATGATCGGCTGATATCT

CCCGTGCTTAATGAAAATAACATCTTCTACGACTCCGCCAAGGCGGGTGATGCCCTG

CCGAAGGATGCGGATGCTAATGGCGCTTATTGCATTGCTCTTAAGGGGCTCTATGAG

ATAAAGCAGATCACGGAAAACTGGAAAGAAGACGGTAAGTTTAGTAGAGACAAGC

TGAAGATCTCAAATAAAGACTGGTTTGATTTCATACAG. AAC. AAG. CGG. TAC. CTG [0076] SEQ ID NO: 39

ATGAACAATGGCACTAACAATTTTCAGAATTTCATCGGCATTTCAAGTCTGCAAAAA

ACTCTGAGGAATGCTTTGATCCCTACTGAAACCACTCAGCAATTTATAGTCAAGAAC

GGTATAATTAAAGAAGATGAACTCAGGGGTGAAAATAGACAAATACTCAAGGACAT

TATGGATGACTATTATAGAGGCTTCATCTCAGAGACTCTCTCATCAATAGATGATAT

CGATTGGACTAGCCTTTTCGAGAAAATGGAGATTCAGTTGAAAAATGGTGATAACA

AAGATACGTTGATAAAGGAACAGACCGAGTACAGGAAAGCCATTCATAAGAAATTT

GCTAATGACGATAGATTTAAGAATATGTTTAGTGCAAAACTGATTAGTGACATTCTG

CCGGAGTTCGTTATCCATAATAATAACTACTCTGCATCCGAAAAGGAGGAAAAGAC

GCAAGTTATTAAACTGTTCAGCCGCTTCGCCACAAGCTTCAAGGACTACTTCAAAAA

TAGAGCCAACTGCTTTTCTGCCGACGATATATCATCATCTTCATGCCATCGGATCGT T

AACGATAACGCCGAGATATTCTTCAGCAACGCCCTTGTATATCGAAGAATAGTCAAA

AGTCTGAGTAATGATGATATTAATAAAATTAGCGGTGATATGAAAGACTCCCTGAA

GGAAATGTCACTGGAGGAAATTTATAGTTACGAAAAGTACGGCGAATTCATTACTC

AAGAAGGCATATCCTTCTATAACGACATTTGCGGAAAGGTCAACTCATTCATGAACC

TTTATTGCCAGAAGAATAAGGAGAATAAAAATCTTTACAAATTGCAAAAACTTCAC

AAACAAATTCTTTGCATCGCGGATACGTCCTACGAAGTTCCTTACAAATTTGAATCC

GATGAGGAAGTGTATCAGAGTGTCAATGGATTTTTGGATAATATCTCTTCAAAACAT

ATTGTGGAGAGATTGCGCAAAATAGGTGATAACTACAATGGCTACAACCTGGACAA

GATTTATATTGTTAGCAAGTTCTATGAAAGTGTCAGTCAAAAGACCTACAGAGATTG

GGAGACAATCAACACGGCGCTCGAAATACACTACAATAACATCCTCCCCGGCAATG

GGAAGAGTAAAGCCGATAAGGTTAAAAAAGCTGTTAAGAACGACCTCCAGAAATCC

ATCACGGAAATAAACGAGCTGGTTTCCAACTATAAGCTGTGTAGCGATGATAATATT

AAGGCTGAGACATATATACATGAGATCAGCCACATTCTCAACAATTTCGAGGCACA

GGAACTCAAATACAATCCCGAGATTCACTTGGTGGAAAGTGAGTTGAAGGCGTCAG

AGCTTAAGAATGTACTTGACGTAATAATGAATGCTTTTCATTGGTGCTCCGTGTTCA T

GACTGAGGAACTCGTGGATAAGGATAATAACTTTTATGCGGAGTTGGAAGAGATAT

ACGATGAAATATACCCGGTTATCTCACTGTATAATCTGGTCAGAAATTACGTGACCC

AAAAGCCTTATAGTACAAAAAAAATAAAGTTGAACTTCGGTATTCCGACATTGGCA

GATGGTTGGTCCAAAAGCAAAGAATACTCTAATAACGCCATTATATTGATGCGAGA

CAATTTGTATTACCTTGGGATCTTTAACGCGAAAAACAAACCGGATAAGAAGATCAT

CGAAGGTAATACATCTGAGAATAAGGGGGATTACAAGAAGATGATTTATAATCTGT

TGCCGGGGCCAAACAAGATGATTCCGAAGGTCTTTCTGTCATCTAAGACAGGAGTA

GAGACCTACAAACCTTCTGCGTACATTTTGGAAGGCTACAAACAGAACAAGCATAT

AAAATCTAGCAAGGACTTTGATATCACGTTTTGTCATGATCTGATAGATTATTTCAA AAACTGCATCGCTATACATCCTGAGTGGAAGAATTTCGGCTTTGACTTTTCTGACAC

CAGCACATACGAAGACATCTCAGGTTTCTACCGGGAAGTCGAGCTCCAGGGGTACA

AGATTGACTGGACATATATAAGTGAAAAAGACATCGACCTCCTCCAAGAGAAGGGC

CAACTTTACCTGTTCCAGATCTATAACAAAGACTTTTCTAAAAAGTCCACGGGTAAC

GACAACTTGCACACTATGTATCTGAAAAACTTGTTCTCTGAAGAGAACCTCAAGGAC

ATCGTCCTGAAGCTTAACGGGGAGGCGGAGATCTTCTTTAGAAAGTCCTCTATCAAA

AATCCCATTATCCATAAAAAGGGCTCTATACTCGTTAATAGGACATATGAAGCGGAG

GAAAAAGATCAATTTGGGAACATCCAGATCGTCCGGAAAAATATACCTGAGAATAT

CTATCAAGAGCTGTACAAGTATTTTAATGATAAGTCAGACAAAGAGCTCAGTGATG

AGGCGGCAAAGCTCAAGAACGTGGTGGGGCATCATGAAGCTGCGACGAACATTGTC

AAAGATTATAGATACACTTACGATAAATACTTCCTCCACATGCCGATAACGATTAAC

TTCAAAGCCAATAAGACGGGGTTTATAAATGATCGGATCCTTCAGTACATTGCGAAA

GAGAAAGACCTCCATGTGATCGGAATTGACCGAGGAGAAAGGAATCTGATTTACGT

GTCCGTGATTGATACTTGCGGGAATATAGTCGAGCAAAAGAGTTTCAACATAGTCAA

CGGGTATGACTATC AGATAA AGCTCAAAC AGCAGGAAGGT GCGAGGC AAATTGCGC

GCAAAGAGTGGAAGGAGATAGGCAAGATTAAAGAAATCAAGGAAGGTTATCTCAG

CTTGGTGATCCATGAAATATCTAAGATGGTTATAAAGTACAATGCCATAATAGCCAT

GGAGGATCTTTCCTACGGGTTTAAGAAGGGCCGATTTAAAGTGGAGCGACAAGTTT

ACCAGAAGTTCGAAACCATGTTGATTAACAAACTTAACTATTTGGTGTTCAAGGATA

TAAGTATAACCGAAAACGGCGGTTTGCTTAAGGGTTATCAGCTCACGTATATTCCTG

ATAAACTTAAAAACGTTGGACACCAGTGTGGATGTATCTTCTACGTGCCAGCCGCTT

ACACTAGTAAGATAGATCCTACCACGGGGTTTGTGAATATTTTTAAGTTTAAAGACT

TGACAGTCGACGCCAAAAGGGAATTTATAAAAAAGTTTGATTCTATCCGCTACGATA

GTGAAAAAAATCTCTTTTGCTTTACTTTCGACTATAACAACTTCATTACGCAGAACA

CTGTCATGAGTAAGTCCAGCTGGAGCGTCTACACATATGGCGTCCGAATTAAACGAC

GATTTGTAAACGGGCGGTTTTCAAACGAATCTGACACGATAGACATTACCAAGGAT

ATGGAGAAGACACTTGAGATGACCGACATAAACTGGCGGGACGGTCACGATCTTCG

GCAGGACATAATTGATTACGAAATCGTCCAGCATATATTCGAAATATTTCGACTTAC

AGTGCAAATGCGGAACAGTCTCTCTGAACTGGAAGATCGCGATTATGACCGGTTGAT

TTCTCCGGTCCTCAATGAAAATAACATATTTTATGATAGTGCTAAGGCAGGTGATGC

GTTGCCAAAGGATGCAGACGCTAATGGTGCCTATTGTATCGCGCTCAAGGGATTGTA

CGAGATAAAGCAAATTACGGAGAACTGGAAGGAGGATGGTAAGTTTAGCCGAGAC

AAGTTGAAGATTAGCAATAAAGACTGGTTTGATTTTATCCAAAACAAGAGGTACCTG

[0077] SEQ ID NO: 40 ATGAATAACGGAACTAATAACTTTCAAAATTTCATAGGTATTTCAAGCTTGCAGAAG

ACCCTGAGGAATGCCCTGATTCCAACCGAGACAACGCAGCAGTTCATAGTCAAAAA

TGGCATTATTAAGGAAGATGAGCTGCGGGGGGAAAACCGACAGATACTCAAGGATA

TTATGGACGACTATTACCGGGGATTTATCTCAGAAACGCTGAGCAGTATTGATGACA

TCGATTGGACCAGTCTTTTCGAGAAAATGGAAATTCAACTTAAGAATGGTGACAATA

AAGACACTCTCATAAAGGAGCAAACTGAATACCGAAAAGCCATACACAAAAAGTTT

GCCAACGATGACCGCTTTAAAAACATGTTTTCAGCTAAGCTCATTAGCGACATTCTC

CCCGAGTTTGTGATTCATAACAATAACTATAGCGCATCCGAGAAGGAGGAAAAAAC

CCAAGTTATCAAATTGTTCAGTAGATTCGCTACGAGCTTTAAAGATTACTTTAAAAA

CCGGGCTAACTGCTTCAGTGCAGACGATATCAGCTCCTCATCCTGTCATCGCATCGT

CAATGATAATGCTGAGATCTTCTTTTCTAATGCACTGGTTTACCGCAGGATAGTTAA

GTCTCTTAGTAACGACGACATCAACAAGATATCAGGAGATATGAAGGATTCCCTTAA

AGAAATGAGTCTCGAGGAGATATATTCTTATGAAAAATACGGCGAATTTATTACCCA

AGAGGGCATTAGTTTCTATAATGACATATGCGGAAAAGTTAATAGTTTTATGAATCT

CTATTGTCAGAAGAATAAGGAGAATAAGAACCTCTACAAATTGCAGAAGTTGCACA

AGCAAATTCTGTGTATCGCGGACACCTCTTACGAGGTCCCATATAAGTTCGAGAGTG

ATGAAGAAGTATACCAGAGCGTTAATGGGTTCCTGGACAACATCTCAAGTAAACAC

ATAGTCGAAAGGCTCCGAAAGATCGGTGATAACTATAACGGATATAATTTGGATAA

AATTTATATAGTTAGCAAATTTTACGAGAGCGTCAGTCAGAAGACCTACCGGGACTG

GGAGACCATAAACACAGCGCTGGAAATACATTATAACAACATACTGCCTGGGAACG

GT AAGT C AAAGGCAGAC AAGGTTAAAAAGGCTGT GAAGAATGACCTGC AAAAATC A

ATTACAGAAATAAATGAGTTGGTAAGTAATTACAAACTTTGCAGCGATGATAATATA

AAGGCAGAGACGTACATACATGAAATATCTCATATCCTCAACAATTTCGAAGCCCA

AGAACTGAAGTACAACCCGGAAATTCATCTTGTAGAGTCTGAGTTGAAGGCCTCCG

AATTGAAAAACGTTCTTGACGTAATTATGAATGCCTTCCACTGGTGCTCAGTATTCA

TGACGGAAGAGCTCGTGGATAAAGACAACAATTTTTACGCTGAACTGGAAGAAATA

TATGACGAGATTTACCCCGTAATTTCACTCTACAACTTGGTACGAAATTACGTTACC

CAAAAGCCATACTCAACAAAAAAAATTAAACTGAACTTCGGGATACCCACCCTCGC

AGATGGATGGTCAAAGTCCAAAGAGTACAGTAACAATGCAATTATCCTGATGCGAG

ACAACCTTTATTACCTCGGGATTTTCAACGCTAAAAATAAACCTGATAAAAAAATAA

TTGAGGGTAATACCTCTGAAAACAAGGGGGATTATAAAAAGATGATATACAATCTG

CTGCCTGGCCCGAACAAAATGATTCCTAAAGTCTTCTTGTCTTCCAAGACTGGAGTC

GAAACCTACAAGCCAAGTGCTTATATACTCGAAGGGTACAAACAAAATAAGCACAT

AAAATCCAGCAAGGATTTTGATATTACATTCTGCCACGATTTGATTGATTATTTTAA G

AACTGTATAGCCATCCACCCAGAATGGAAGAATTTTGGTTTTGATTTTAGCGATACC TCAACATATGAGGATATCTCTGGCTTTTACCGCGAGGTAGAACTGCAAGGTTATAAG

ATCGATTGGACTTATATTTCTGAAAAGGACATAGATCTCCTGCAAGAGAAAGGGCA

ACTTTATTTGTTTCAAATATACAACAAAGATTTTAGTAAGAAGAGTACTGGCAATGA

TAACCTTCACACTATGTATCTGAAGAACCTTTTTTCTGAGGAGAACTTGAAGGACAT

AGTCCTTAAACTCAATGGGGAAGCTGAAATATTCTTTCGCAAAAGCTCCATTAAAAA

CCCGATCATTCATAAAAAGGGTTCCATCTTGGTAAACCGCACATACGAGGCGGAAG

AAAAAGATCAGTTCGGAAATATCCAGATCGTAAGGAAGAATATCCCCGAAAATATA

TACCAAGAGCTTTACAAATATTTTAACGATAAGTCAGACAAGGAACTGTCAGACGA

AGCAGCCAAGTTGAAGAATGTCGTAGGGCACCACGAAGCAGCTACAAACATAGTTA

AAGATTATCGGTACACCTACGATAAATATTTCCTGCATATGCCAATAACCATAAACT

TCAAAGCCAACAAAACAGGGTTCATCAATGACCGAATACTTCAGTATATAGCCAAG

GAAAAAGACCTGCATGTTATAGGAATAGATAGAGGTGAGCGCAACTTGATATATGT

CAGCGTGATAGACACCTGCGGAAATATCGTCGAGCAAAAAAGTTTCAACATTGTTA

ATGGCTACGATTACCAAATTAAATTGAAGCAGCAAGAGGGGGCTCGGCAAATCGCG

CGAAAGGAATGGAAAGAAATCGGGAAGATTAAAGAAATTAAAGAGGGCTACCTGT

CTCTTGTAATTCACGAAATATCTAAGATGGTCATCAAGTATAATGCCATTATTGCGA

TGGAAGATCTGTCCTACGGATTTAAGAAAGGCAGGTTTAAAGTCGAAAGGCAGGTG

TACCAGAAATTCGAGACCATGCTGATTAATAAGCTCAACTATCTCGTATTTAAGGAT

ATTTCTATAACTGAAAATGGAGGGCTTCTCAAAGGATATCAACTCACATACATACCT

GATAAGCTGAAGAACGTAGGCCACCAGTGTGGATGCATATTCTATGTACCAGCTGC

ATACACAAGCAAGATCGATCCAACTACTGGGTTTGTCAATATCTTCAAATTTAAGGA

CTTGACGGTCGATGCCAAACGGGAGTTCATCAAAAAGTTTGATAGTATTCGATATGA

TAGTGAGAAGAACTTGTTTTGCTTCACATTTGACTACAACAATTTCATAACGCAAAA

TACGGTTATGTCTAAATCCTCATGGAGCGTCTACACTTACGGAGTGAGGATAAAGCG

GCGCTTCGTAAATGGCAGGTTTAGCAATGAATCCGACACGATTGACATAACCAAGG

ATATGGAGAAAACCCTCGAGATGACCGATATAAATTGGCGGGATGGACACGATCTG

CGACAAGACATAATCGATTATGAAATCGTGCAGCACATATTTGAGATATTCAGGCTT

ACGGTCCAAATGAGAAATTCCCTTTCCGAACTTGAAGACCGCGATTACGACCGACTG

ATAAGCCCCGTTCTGAACGAAAATAACATCTTCTACGACAGCGCTAAAGCGGGAGA

CGCGCTGCCGAAAGATGCGGACGCAAATGGAGCCTATTGTATCGCCTTGAAAGGGT

TGTACGAGATCAAACAGATAACCGAGAATTGGAAGGAGGATGGGAAGTTTAGTCGA

GACAAACTTAAAATAAGCAACAAGGACTGGTTCGACTTTATTCAAAACAAACGATA

TCTC

[0078] SEQ ID NO: 41 ATGAATAATGGTACTAACAATTTTCAAAACTTTATCGGCATCTCTTCACTTCAGAAA

ACTCTTCGGAACGCCCTTATACCGACGGAGACAACGCAGCAGTTTATAGTTAAAAAC

GGGATCATTAAAGAAGATGAACTCAGAGGGGAAAACAGGCAAATATTGAAGGACA

TTATGGACGATTACTACCGGGGGTTTATTTCAGAGACCCTTTCATCTATTGATGACA T

AGATTGGACCTCCCTTTTCGAGAAAATGGAGATACAATTGAAAAACGGCGACAATA

AAGATACACTTATCAAGGAACAAACTGAGTATCGCAAGGCGATTCACAAGAAGTTT

GCGAATGACGATCGCTTTAAGAATATGTTTTCTGCGAAGCTCATAAGTGACATTCTG

CCTGAATTTGTCATTCATAACAACAATTATTCTGCTAGCGAAAAAGAGGAAAAAACT

CAAGTCATTAAGCTTTTTAGCAGGTTCGCTACTAGTTTTAAAGACTATTTTAAGAAC C

GGGCGAATTGCTTTAGCGCTGACGACATATCATCCTCATCCTGTCATCGCATAGTCA

ATGATAATGCAGAAATATTCTTTTCTAATGCGCTCGTGTATCGGAGAATAGTGAAAA

GCCTCTCTAACGATGACATTAACAAAATAAGCGGCGATATGAAGGATAGTCTGAAG

GAAATGTCCCTCGAAGAAATATACTCATACGAGAAGTACGGAGAATTTATCACCCA

GGAAGGAATTAGTTTTTACAACGACATCTGTGGTAAGGTTAACTCTTTTATGAATCT

GTATTGTCAAAAGAATAAAGAAAATAAAAATCTTTATAAGCTCCAAAAGCTTCACA

AACAAATCTTGTGCATTGCGGATACGTCATACGAAGTACCTTACAAATTTGAAAGCG

ACGAAGAGGTGTATCAGTCAGTGAATGGGTTCCTTGACAATATTTCTAGCAAACATA

TTGTGGAGCGACTTCGAAAGATCGGTGATAATTACAATGGCTATAATTTGGATAAAA

TTTACATAGTTAGTAAGTTTTATGAATCCGTCTCACAAAAGACGTACCGAGATTGGG

AGACCATCAACACTGCTCTGGAGATTCATTACAATAATATATTGCCTGGGAATGGGA

AGTCAAAGGCCGACAAGGTTAAAAAAGCCGTAAAAAACGATCTTCAAAAGTCCATT

ACCGAGATAAATGAACTTGTATCCAACTATAAGTTGTGCTCTGACGATAATATTAAA

GCAGAAACGTATATCCACGAAATAAGTCACATCCTGAACAACTTCGAAGCTCAAGA

GCTCAAGTATAATCCTGAAATTCATCTCGTCGAAAGCGAGCTGAAAGCATCCGAGTT

GAAGAATGTGCTTGATGTGATCATGAACGCATTCCATTGGTGCAGTGTGTTCATGAC

CGAAGAACTTGTAGACAAAGACAACAACTTCTACGCTGAATTGGAAGAGATTTACG

ATGAAATTTACCCCGTGATATCCCTCTATAATCTGGTAAGAAATTACGTCACGCAAA

AACCATACAGTACCAAGAAAATAAAGCTCAACTTTGGTATTCCGACGTTGGCAGAT

GGGTGGAGTAAGAGCAAGGAGTATTCTAACAATGCAATCATCCTCATGCGCGACAA

TTTGTATTATCTGGGGATCTTCAACGCGAAAAATAAGCCCGACAAAAAGATAATAG

AAGGCAATACGTCCGAGAACAAAGGGGACTATAAGAAAATGATTTATAACCTTCTT

CCAGGACCCAACAAGATGATCCCAAAGGTTTTCTTGAGTTCAAAAACCGGCGTAGA

AACTTATAAACCGTCCGCCTACATTCTGGAAGGGTACAAGCAAAACAAGCACATTA

AGTCATCTAAGGATTTCGACATTACTTTTTGTCATGATTTGATAGACTACTTCAAAA A

TTGTATAGCGATACATCCGGAATGGAAAAATTTTGGGTTCGATTTTTCCGACACAAG TACTTATGAAGACATCTCAGGGTTTTATAGGGAAGTTGAACTGCAAGGTTACAAAAT

AGACTGGACTTATATTAGTGAGAAGGACATTGATTTGCTCCAGGAAAAGGGTCAATT

GTATCTGTTCCAGATATATAACAAGGATTTCTCTAAAAAATCTACAGGTAACGACAA

TCTCCACACGATGTACCTCAAGAATCTCTTCAGCGAAGAGAATTTGAAGGATATCGT

ACTTAAGCTCAATGGAGAAGCGGAAATATTCTTCAGAAAGTCCAGCATTAAGAATC

CTATAATTCACAAGAAAGGGTCAATTCTCGTAAACCGGACTTATGAGGCCGAAGAA

AAAGATCAGTTTGGTAACATTCAGATTGTACGGAAAAACATTCCCGAGAACATCTAT

CAAGAACTGTATAAATACTTTAATGATAAATCCGACAAGGAACTTTCTGACGAGGCT

GCAAAATTGAAGAACGTAGTGGGACACCATGAGGCCGCAACCAATATAGTAAAGGA

TTACAGATACACTTATGATAAGTATTTCCTCCATATGCCGATCACGATTAATTTCAA G

GCGAATAAAACCGGCTTCATTAACGATCGCATTTTGCAATATATTGCGAAGGAAAA

GGATTTGCACGTGATAGGTATAGACCGGGGTGAACGAAACTTGATTTACGTCTCTGT

GATCGACACATGCGGAAATATAGTTGAACAGAAGTCCTTTAATATTGTGAATGGTTA

CGACTACCAGATAAAATTGAAGCAACAGGAGGGCGCAAGACAGATAGCTCGCAAA

GAGTGGAAGGAAATCGGCAAGATCAAAGAAATAAAGGAGGGTTATCTTTCCCTGGT

AATTCATGAAATTAGCAAGATGGTTATTAAGTATAATGCTATAATAGCTATGGAGGA

CCTTTCCTATGGGTTCAAGAAAGGTCGCTTCAAAGTGGAGCGACAAGTGTATCAAAA

GTTCGAGACTATGTTGATAAATAAATTGAATTATTTGGTTTTTAAAGACATTTCAAT A

ACTGAGAACGGGGGTCTCTTGAAGGGGTACCAATTGACTTATATTCCGGACAAGTTG

AAGAATGTCGGACACCAGTGTGGTTGCATTTTCTACGTGCCTGCCGCTTACACCTCA

AAAATCGATCCGACCACTGGTTTTGTAAATATATTTAAATTCAAAGATCTCACCGTT

GATGCCAAACGGGAGTTTATCAAAAAATTCGATTCCATTCGCTACGACTCTGAGAAA

AACCTTTTTTGTTTCACGTTCGATTATAACAACTTTATAACCCAAAATACTGTAATG T

CCAAGTCAAGTTGGTCTGTCTATACTTACGGAGTAAGGATCAAGCGCCGCTTCGTTA

ATGGGAGATTCTCAAACGAGTCTGATACCATAGACATAACTAAAGACATGGAAAAA

ACCCTGGAAATGACGGACATCAATTGGCGAGACGGGCATGATCTTCGACAGGACAT

AATAGATTACGAAATTGTTCAACACATTTTCGAGATATTTCGACTTACGGTTCAGAT

GAGGAATTCCCTTTCCGAATTGGAAGACCGGGATTATGATCGACTTATATCTCCCGT

GCTCAATGAAAACAATATTTTTTATGATTCAGCGAAAGCTGGGGACGCGCTGCCAAA

AGATGCCGATGCCAATGGAGCATACTGTATCGCCCTGAAGGGTTTGTATGAGATTAA

GCAAATTACTGAAAACTGGAAGGAAGATGGCAAGTTTTCTAGAGATAAGCTTAAGA

TTAGCAATAAGGACTGGTTTGACTTCATTCAAAATAAAAGGTATCTT

[0079] SEQ ID NO: 42

ATGAATAATGGAACAAATAATTTTCAAAATTTTATTGGTATCAGTTCATTGCAAAAG

ACTTTGAGAAATGCTTTGATCCCGACTGAGACCACACAGCAGTTCATCGTCAAAAAT GGCATAATCAAGGAAGACGAACTTAGGGGTGAGAATAGACAAATATTGAAGGACAT

CATGGATGACTATTATAGGGGGTTCATTTCCGAAACGCTCAGTAGTATTGATGACAT

TGACTGGACTAGTCTTTTCGAGAAAATGGAAATTCAGCTTAAGAACGGGGACAATA

AAGACACGCTGATCAAGGAGCAAACGGAATATAGGAAGGCGATCCATAAAAAATTC

GCGAATGATGATCGGTTTAAAAACATGTTTAGTGCCAAGTTGATCAGCGACATACTG

CCCGAATTCGTGATCCACAACAATAATTACAGCGCCTCCGAAAAGGAGGAAAAAAC

TCAGGTCATTAAATTGTTTAGCCGATTCGCAACGAGTTTCAAAGATTATTTTAAGAA

CCGGGCCAACTGTTTTTCAGCGGATGATATTAGCTCCAGCAGCTGCCATCGCATAGT

AAATGATAACGCTGAAATCTTTTTTAGCAACGCACTTGTCTACCGGAGGATTGTAAA

ATCACTGTCAAATGATGACATTAACAAAATATCTGGAGATATGAAGGACTCACTCA

AAGAAATGAGCCTGGAAGAAATATATTCATACGAAAAATACGGGGAGTTTATTACC

CAGGAAGGTATCAGTTTTTATAATGATATATGTGGAAAAGTTAATTCATTTATGAAT

CTTTACTGT C AA AAAAAT AAGGAGA AC AAGAATTT GT AC AAGCTCC AAAAACTT C A

TAAACAGATTCTGTGCATCGCAGACACAAGTTATGAGGTACCGTACAAATTTGAGA

GCGACGAAGAAGTTTATCAGAGTGTGAATGGTTTCCTGGACAATATCTCTTCTAAAC

ACATTGTTGAGAGGCTTAGGAAGATCGGTGATAATTATAACGGCTATAATCTGGACA

AAATTTATATTGTATCAAAGTTTTATGAATCAGTCTCTCAAAAGACGTATCGGGATT

GGGAAACAATTAACACGGCTCTGGAGATCCACTACAATAACATTCTGCCCGGCAAC

GGGAAGAGCAAAGCTGATAAGGTCAAGAAGGCAGTCAAGAACGACCTTCAGAAGA

GCATAACAGAAATTAACGAATTGGTCAGTAACTACAAACTGTGTAGTGATGACAAC

ATAAAAGCCGAAACATACATCCATGAAATAAGCCATATCCTGAATAACTTCGAAGC

CCAAGAACTTAAATACAATCCCGAGATTCATCTTGTCGAATCAGAACTCAAGGCGTC

CGAGCTCAAAAATGTCCTTGACGTGATAATGAATGCCTTCCACTGGTGCAGCGTATT

CATGACGGAGGAGTTGGTAGATAAAGACAACAACTTTTATGCCGAATTGGAAGAGA

TTTATGATGAGATTTACCCCGTTATTTCTCTGTACAACTTGGTTCGAAACTACGTAA C

ACAAAAACCATACTCAACCAAAAAGATCAAACTCAATTTTGGCATACCTACATTGGC

TGATGGTTGGTCCAAGTCAAAGGAATATAGCAATAATGCAATAATTCTCATGCGAG

ATAACTTGTATTATTTGGGGATCTTTAACGCTAAGAACAAACCAGATAAAAAGATAA

TCGAGGGGAACACAAGTGAGAACAAGGGTGATTACAAAAAAATGATTTACAATCTG

CTTCCTGGGCCTAACAAAATGATTCCGAAGGTGTTTCTTAGCTCTAAAACTGGAGTG

GAGACGTATAAGCCTTCCGCGTACATTCTCGAAGGCTACAAGCAAAATAAGCATAT

CAAGTCCAGTAAGGACTTCGACATCACTTTTTGCCACGATCTCATCGATTACTTTAA

GAACTGTATCGCAATACACCCCGAGTGGAAAAACTTTGGTTTTGATTTTTCAGACAC

TAGTACCTACGAGGACATTTCCGGCTTCTATCGAGAAGTCGAACTCCAGGGCTACAA

AATCGATTGGACGTACATTTCTGAGAAGGACATCGACTTGCTCCAAGAGAAAGGTC AACTTTACCTCTTCCAAATTTACAATAAAGACTTTTCAAAGAAGAGCACCGGTAATG

ACAACTTGCATACCATGTATCTGAAGAACCTGTTTTCTGAGGAGAACCTCAAGGATA

TTGTATTGAAGTTGAATGGCGAAGCAGAAATATTTTTCCGAAAGTCATCTATCAAGA

ACCCCATTATACACAAAAAAGGCTCTATCCTGGTGAACCGGACTTACGAGGCAGAG

GAGAAGGATCAATTCGGAAACATACAGATAGTCCGCAAAAACATCCCTGAGAATAT

CTATCAGGAACTCTATAAGTACTTCAATGATAAATCAGACAAGGAGCTTAGCGACG

AAGCAGCTAAACTTAAAAACGTGGTTGGCCATCACGAGGCCGCTACCAACATAGTC

AAAGACTACCGCTATACTTATGACAAGTACTTTTTGCACATGCCCATAACAATTAAT

TTCAAAGCTAACAAAACAGGGTTTATAAATGACAGAATCCTCCAATACATCGCCAA

AGAGAAGGACCTCCATGTAATCGGGATTGATAGAGGCGAACGGAACTTGATTTACG

TTAGTGTCATTGATACCTGTGGTAACATTGTCGAACAAAAGTCATTCAACATAGTCA

ATGGATATGATTATCAGATAAAACTCAAGCAACAAGAAGGCGCGAGGCAGATTGCC

AGGAAGGAATGGAAAGAAATCGGGAAGATCAAGGAGATCAAGGAGGGTTACCTGT

CCTTGGTGATACACGAGATTTCAAAAATGGTTATAAAATACAATGCCATTATCGCGA

TGGAGGATTTGTCTTATGGATTTAAGAAGGGGAGGTTCAAAGTCGAACGACAAGTC

TATCAGAAGTTTGAAACAATGCTCATTAACAAGCTCAATTACCTTGTTTTCAAGGAT

ATAAGCATCACTGAAAACGGCGGACTCCTTAAGGGATATCAGCTGACTTATATCCCC

GACAAGCTCAAGAACGTAGGGCACCAATGCGGATGCATCTTTTACGTGCCTGCAGC

ATATACTTCAAAAATTGATCCGACTACTGGCTTTGTTAACATTTTCAAGTTCAAGGA T

CTGACGGTAGACGCTAAGAGAGAATTCATAAAAAAGTTTGACAGCATCAGGTACGA

TAGTGAAAAGAACCTTTTTTGTTTTACCTTTGACTACAATAATTTTATTACGCAAAA T

ACAGTTATGAGCAAATCAAGTTGGAGCGTTTACACATATGGCGTTCGGATCAAGCGC

AGATTCGTCAATGGTCGCTTCTCAAATGAGAGCGATACAATCGATATAACGAAGGA

TATGGAGAAGACGCTTGAGATGACAGATATCAACTGGCGGGACGGACATGACCTTA

GACAAGACATAATCGATTACGAAATAGTACAGCATATCTTTGAGATTTTTAGGCTTA

CAGTTCAGATGCGGAACTCTCTTTCCGAACTGGAGGACCGGGATTATGATCGGTTGA

TCTCCCCAGTACTGAACGAAAATAATATCTTTTACGATAGCGCGAAGGCTGGTGATG

CACTCCCAAAAGACGCTGATGCGAACGGAGCTTATTGCATAGCCCTTAAAGGGCTTT

ACGAGATTAAACAAATAACAGAAAATTGGAAGGAAGATGGCAAATTTTCCCGCGAC

AAGTTGAAGATTAGTAACAAAGACTGGTTCGACTTCATTCAGAATAAACGCTACCTC

[0080] Nucleic acid-guided nucleases can encompass a native sequence, an engineered sequence, or engineered nucleotide sequences of synthetized variants. Non-limiting examples of types of engineering that can be done to obtain a non-naturally occurring nuclease system are as follows. Engineering can include codon optimization to facilitate expression or improve expression in a host cell, such as a heterologous host cell. Engineering can reduce the size or molecular weight of the nuclease in order to facilitate expression or delivery. Engineering can alter PAM selection in order to change PAM specificity or to broaden the range of recognized PAMs. Engineering can alter, increase, or decrease stability, processivity, specificity, or efficiency of a targetable nuclease system. Engineering can alter, increase, or decrease protein stability. Engineering can alter, increase, or decrease processivity of nucleic acid scanning. Engineering can alter, increase, or decrease target sequence specificity. Engineering can alter, increase, or decrease nuclease activity. Engineering can alter, increase, or decrease editing efficiency. Engineering can alter, increase, or decrease transformation efficiency. Engineering can alter, increase, or decrease nuclease or guide nucleic acid expression. As used herein, a non- naturally occurring nucleic acid sequence can be an engineered sequence or engineered nucleotide sequences of synthetized variants. Such non-naturally occurring nucleic acid sequences can be amplified, cloned, assembled, synthesized, generated from synthesized oligonucleotides or dNTPs, or otherwise obtained using methods known by those skilled in the art. In certain embodiments, examples of non-naturally occurring nucleic acid-guided nucleases disclosed herein can include those nucleic acid-guided nucleases with engineered polypeptide sequences ( e.g SEQ ID NOs:2-4) and those nucleotide sequences of synthetized variants (e.g., SEQ ID NOs: 43-63)

[0081] SEQ ID NO: 2

MGHHHHHHS S GVDLGTENLYFQSPAAKKKKLDGS VDMNN GTNNF QNFIGIS SLQKTLR

NALIPTETTQQFIVKNGIIKEDELRGENRQILKDIMDDYYRGFISETLSSIDDIDWT SLFEK

MEIQLKNGDNKDTLIKEQTEYRKAIHKKFANDDRFKNMFSAKLISDILPEFVIHNNN YSA

SEKEEKTQVIKLFSRFATSFKDYFKNRANCFSADDISSSSCHRIVNDNAEIFFSNAL VYRRI

VKSLSNDDINKISGDMKDSLKEMSLEEIYSYEKYGEFITQEGISFYNDICGKVNSFM NLY

CQKNKENKNLYKLQKLHKQILCIADTS YEVPYKFESDEEVYQSVN GFLDNIS SKHIVERL

RKIGDNYNGYNLDKIYIVSKFYESVSQKTYRDWETINTALEIHYNNILPGNGKSKAD KV

KKAVKNDLQKSITEINELVSNYKLCSDDNIKAETYIHEISHILNNFEAQELKYNPEI HLVE

SELKASELKNVLDVIMNAFHWCSVFMTEELVDKDNNFYAELEEIYDEIYPVISLYNL VR

NYVTQKPYSTKKIKLNFGIPTLADGWSKSKEYSNNAIILMRDNLYYLGIFNAKNKPD KKI

IEGNTSENKGDYKKMIYNLLPGPNKMIPKVFLSSKTGVETYKPSAYILEGYKQNKHI KSS

KDFDITFCHDLIDYFKNCIAIHPEWKNFGFDFSDTSTYEDISGFYREVELQGYKIDW TYIS

EKDIDLLQEKGQLYLFQIYNKDFSKKSTGNDNLHTMYLKNLFSEENLKDIVLKLNGE AEI

FFRKSSIKNPIIHKKGSILVNRTYEAEEKDQFGNIQIVRKNIPENIYQELYKYFNDK SDKEL

SDEAAKLKNVVGHHEAATNIVKDYRYTYDKYFLHMPITINFKANKTGFINDRILQYI AK

EKDLHVIGIDRGERNLIYVSVIDTCGNIVEQKSFNIVNGYDYQIKLKQQEGARQIAR KEW

KEIGKIKEIKEGYLSLVIHEISKMVIKYNAIIAMEDLSYGFKKGRFKVERQVYQKFE TMLI NKLNYLVFKDISITENGGLLKGYQLTYIPDKLKNVGHQCGCIFYVPAAYTSKIDPTTGFV

NIFKFKDLTVDAKREFIKKFDSIRYDSEKNLFCFTFDYNNFITQNTVMSKSSWSVYT YGV

RIKRRFVNGRFSNESDTIDITKDMEKTLEMTDINWRDGHDLRQDIIDYEIVQHIFEI FRLTV

QMRNSLSELEDRDYDRLISPVLNENNIFYDSAKAGDALPKDADANGAYCIALKGLYE IK

QITENWKEDGKFSRDKLKISNKDWFDFIQNKRYLKRPAATKKAGQAKKKKASGSGAG S

PKKKRKVEDPKKKRKVIPG*

[0082] SEQ ID NO:3

SPAAKKKKLDGSVDMNNGTNNFQNFIGISSLQKTLRNALIPTETTQQFIVKNGIIKE DELR

GENRQILKDIMDDYYRGFISETLSSIDDIDWTSLFEKMEIQLKNGDNKDTLIKEQTE YRK

AIHKKFANDDRFKNMFSAKLISDILPEFVIHNNNYSASEKEEKTQVIKLFSRFATSF KDYF

KNRANCFSADDISSSSCHRIVNDNAEIFFSNALVYRRIVKSLSNDDINKISGDMKDS LKEM

SLEEIYSYEKYGEFITQEGISFYNDICGKVNSFMNLYCQKNKENKNLYKLQKLHKQI LCI

ADTSYEVPYKFESDEEVYQSVNGFLDNISSKHIVERLRKIGDNYNGYNLDKIYIVSK FYE

SVSQKTYRDWETINTALEIHYNNILPGNGKSKADKVKKAVKNDLQKSITEINELVSN YK

LCSDDNIKAETYIHEISHILNNFEAQELKYNPEIHLVESELKASELKNVLDVIMNAF HWCS

VFMTEELVDKDNNFYAELEEIYDEIYPVISLYNLVRNYVTQKPYSTKKIKLNFGIPT LAD

GWSKSKEYSNNAIILMRDNLYYLGIFNAKNKPDKKIIEGNTSENKGDYKKMIYNLLP GP

NKMIPKVFLSSKTGVETYKPSAYILEGYKQNKHIKSSKDFDITFCHDLIDYFKNCIA IHPE

WKNFGFDFSDTSTYEDISGFYREVELQGYKIDWTYISEKDIDLLQEKGQLYLFQIYN KDF

SKKSTGNDNLHTMYLKNLFSEENLKDIVLKLNGEAEIFFRKSSIKNPIIHKKGSILV NRTY

EAEEKDQFGNIQIVRKNIPENIYQELYKYFNDKSDKELSDEAAKLKNVVGHHEAATN IV

KDYRYTYDKYFLHMPITINFKANKTGFINDRILQYIAKEKDLHVIGIDRGERNLIYV SVID

TCGNIVEQKSFNIVNGYDYQIKLKQQEGARQIARKEWKEIGKIKEIKEGYLSLVIHE ISKM

VIKYNAIIAMEDLSYGFKKGRFKVERQVYQKFETMLINKLNYLVFKDISITENGGLL KGY

QLTYIPDKLKNVGHQCGCIFYVPAAYTSKIDPTTGFVNIFKFKDLTVDAKREFIKKF DSIR

YDSEKNLFCFTFDYNNFITQNTVMSKSSWSVYTYGVRIKRRFVNGRFSNESDTIDIT KDM

EKTLEMTDINWRDGHDLRQDIIDYEIVQHIFEIFRLTVQMRNSLSELEDRDYDRLIS PVLN

ENNIFYDSAKAGDALPKDADANGAYCIALKGLYEIKQITENWKEDGKFSRDKLKISN KD

WFDFIQNKRYLKRPAATKKAGQAKKKKASGSGAGSPKKKRKVEDPKKKRKVIPG*

[0083] SEQ ID NO: 4

PAAKKKKLDGSVDMNNGTNNFQNFIGISSLQKTLRNALIPTETTQQFIVKNGIIKED ELRG ENRQILKDIMDDYYRGFISETLSSIDDIDWTSLFEKMEIQLKNGDNKDTLIKEQTEYRKA I HKKFANDDRFKNMFSAKLISDILPEFVIHNNNYSASEKEEKTQVIKLFSRFATSFKDYFK NRANCFSADDISSSSCHRIVNDNAEIFFSNALVYRRIVKSLSNDDINKISGDMKDSLKEM S LEEIY S YEKY GEFITQEGISFYNDICGKVNSFMNLYCQKNKENKNL YKLQKLHKQILCIA DT S YEVP YKFESDEEV Y Q S VN GFLDNIS SKHIVERLRKIGDN YN GYNLDKI YI VSKF YES

VSQKTYRDWETINTALEIHYNNILPGNGKSKADKVKKAVKNDLQKSITEINELVSNY KL

CSDDNIKAETYIHEISHILNNFEAQELKYNPEIHLVESELKASELKNVLDVIMNAFH WCSV

FMTEELVDKDNNFYAELEEIYDEIYPVISLYNLVRNYVTQKPYSTKKIKLNFGIPTL ADG

WSKSKEYSNNAIILMRDNLYYLGIFNAKNKPDKKIIEGNTSENKGDYKKMIYNLLPG PN

KMIPKVFLSSKTGVETYKPSAYILEGYKQNKHIKSSKDFDITFCHDLIDYFKNCIAI HPEW

KNFGFDFSDTSTYEDISGFYREVELQGYKIDWTYISEKDIDLLQEKGQLYLFQIYNK DFSK

KSTGNDNLHTMYLKNLFSEENLKDIVLKLNGEAEIFFRKSSIKNPIIHKKGSILVNR TYEA

EEKDQFGNIQIVRKNIPENIYQELYKYFNDKSDKELSDEAAKLKNVVGHHEAATNIV KD

YRYTYDKYFLHMPITINFKANKTGFINDRILQYIAKEKDLHVIGIDRGERNLIYVSV IDTC

GNIVEQKSFNIVNGYDYQIKLKQQEGARQIARKEWKEIGKIKEIKEGYLSLVIHEIS KMVI

KYNAIIAMEDLSYGFKKGRFKVERQVYQKFETMLINKLNYLVFKDISITENGGLLKG YQ

LTYIPDKLKNVGHQCGCIFYVPAAYTSKIDPTTGFVNIFKFKDLTVDAKREFIKKFD SIRY

DSEKNLFCFTFDYNNFITQNTVMSKSSWSVYTYGVRIKRRFVNGRFSNESDTIDITK DME

KTLEMTDINWRDGHDLRQDIIDYEIVQHIFEIFRLTVQMRNSLSELEDRDYDRLISP VLNE

NNIFYDSAKAGDALPKDADANGAYCIALKGLYEIKQITENWKEDGKFSRDKLKISNK D

WFDFIQNKRYLKRPAATKKAGQAKKKKASGSGAGSPKKKRKVEDPKKKRKVIPG*

[0084] SEQ ID NO: 109:

SMSRRRKANPTKLSENAKKLAKEVENASGSGAGSKRPAATKKAGQAKKKKASGSGAG

SPAAKKKKLDGSVDASGSGAGSPKKKRKVEDASGSGAGSPKKKRKVASGSGAGSMNN

GTNNFQNFIGISSLQKTLRNALIPTETTQQFIVKNGIIKEDELRGENRQILKDIMDD YYRGF

ISETLSSIDDIDWTSLFEKMEIQLKNGDNKDTLIKEQTEYRKAIHKKFANDDRFKNM FSA

KLISDILPEFVIHNNNYSASEKEEKTQVIKLFSRFATSFKDYFKNRANCFSADDISS SSCHR

IVNDNAEIFFSNALVYRRIVKSLSNDDINKISGDMKDSLKEMSLEEIYSYEKYGEFI TQEGI

SFYNDICGKVNSFMNLYCQKNKENKNLYKLQKLHKQILCIADTSYEVPYKFESDEEV YQ

SVNGFLDNISSKHIVERLRKIGDNYNGYNLDKIYIVSKFYESVSQKTYRDWETINTA LEIH

YNNILPGNGKSKADKVKKAVKNDLQKSITEINELVSNYKLCSDDNIKAETYIHEISH ILN

NFEAQELKYNPEIHLVESELKASELKNVLDVIMNAFHWCSVFMTEELVDKDNNFYAE LE

EIYDEIYPVISLYNLVRNYVTQKPYSTKKIKLNFGIPTLADGWSKSKEYSNNAIILM RDNL

YYLGIFNAKNKPDKKIIEGNTSENKGDYKKMIYNLLPGPNKMIPKVFLSSKTGVETY KPS

AYILEGYKQNKHIKS SKDFDITFCHDLID YFKN CIAIHPEWKNF GFDF SDTS T YEDIS GF Y

REVELQGYKIDWTYISEKDIDLLQEKGQLYLFQIYNKDFSKKSTGNDNLHTMYLKNL FS

EENLKDIVLKLNGEAEIFFRKSSIKNPIIHKKGSILVNRTYEAEEKDQFGNIQIVRK NIPENI

YQELYKYFNDKSDKELSDEAAKLKNVVGHHEAATNIVKDYRYTYDKYFLHMPITINF K

ANKTGFINDRILQYIAKEKDLHVIGIDRGERNLIYVSVIDTCGNIVEQKSFNIVNGY DYQI KLKQQEGARQIARKEWKEIGKIKEIKEGYLSLVIHEISKMVIKYNAIIAMEDLSYGFKKG

RFKVERQV YQKFETMLINKLNYL VFKDISITEN GGLLKGY QLTYIPDKLKNV GHQCGCIF

YVPAAYTSKIDPTTGFVNIFKFKDLTVDAKREFIKKFDSIRYDSEKNLFCFTFDYNN FITQ

NTVMSKSSWSVYTYGVRIKRRFVNGRFSNESDTIDITKDMEKTLEMTDINWRDGHDL R

QDIIDYEIVQHIFEIFRLTVQMRNSLSELEDRDYDRLISPVLNENNIFYDSAKAGDA LPKD

ADANGAYCIALKGLYEIKQITENWKEDGKFSRDKLKISNKDWFDFIQNKRYL

[0085] SEQ ID NO: 110:

MSRRRKANPTKLSENAKKLAKEVENASGSGAGSKRPAATKKAGQAKKKKASGSGAGS

PAAKKKKLDGSVDASGSGAGSPKKKRKVEDASGSGAGSPKKKRKVASGSGAGSMNNG

TNNFQNFIGISSLQKTLRNALIPTETTQQFIVKNGIIKEDELRGENRQILKDIMDDY YRGFI

SETLSSIDDIDWTSLFEKMEIQLKNGDNKDTLIKEQTEYRKAIHKKFANDDRFKNMF SAK

LISDILPEFVIHNNNYSASEKEEKTQVIKLFSRFATSFKDYFKNRANCFSADDISSS SCHRI

VNDNAEIFFSNALVYRRIVKSLSNDDINKISGDMKDSLKEMSLEEIYSYEKYGEFIT QEGI