Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
DNA-CUTTING AGENT BASED ON CAS9 PROTEIN FROM THE BACTERIUM PASTEURELLA PNEUMOTROPICA
Document Type and Number:
WIPO Patent Application WO/2020/251413
Kind Code:
A1
Abstract:
The present invention describes a novel bacterial nuclease of a CRISPR-Cas9 system from the bacterium P. pneumotropica, as well as the use of said nuclease for creating strictly specific two-strand cuts in a DNA molecule. The present nuclease possesses unusual properties and can be used as an instrument for introducing changes at strictly specified locations in a genomic DNA sequence of single-celled and multi-celled organisms. The invention thus increases the universality of accessible CRISPR-Cas9 systems, making it possible to use Cas9 nuclease from various organisms to cut genomic or plasmid DNA in a large number of specific sites and under various conditions.

Inventors:
SEVERINOV KONSTANTIN VIKTOROVICH (RU)
SHMAKOV SERGEY ANATOLIEVICH (RU)
ARTAMONOVA DARIA NIKOLAEVNA (RU)
GORYANIN IGNATY IGOREVICH (RU)
MUSHAROVA OLGA SERGEEVNA (RU)
ANDREEVA JULIA VALEREVNA (RU)
ZYUBKO TATIANA IGOREVNA (RU)
FEDOROVA YANA VITALIEVNA (RU)
KHODORKOVSKII MIKHAIL ALEKSEEVICH (RU)
POBEGALOV GEORGE EVGENEVICH (RU)
ARSENIEV ANATOLIY NIKOLAEVICH (RU)
SELKOVA POLINA ANATOLEVNA (RU)
VASILIEVA ALEKSANDRA ANDREEVNA (RU)
ARTAMONOVA TATIANA OLEGOVNA (RU)
ABRAMOVA MARINA VIKTOROVNA (RU)
Application Number:
PCT/RU2020/050137
Publication Date:
December 17, 2020
Filing Date:
June 30, 2020
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SKOLKOVO INSTITUTE OF SCIENCE AND TECH (RU)
International Classes:
C12Q1/68; C07K14/195; C12N15/87
Other References:
ASTRID WENINGER ET AL.: "Combinatorial optimization of CRISPR/Cas9 expression enables precision genome engineering in the methylotrophic yeast Pichia pastoris", JOURNAL OF BIOTECHNOLOGY, vol. 235, 10 October 2016 (2016-10-10), pages 139 - 149, XP029733267, DOI: 10.1016/j.jbiotec.2016.03.027
A. VASILEVA ET AL.: "Pasteurella pneumotropica and Demequina sediminicola Cas9 orthologscharacterization", FEBSCONGRESS.ORG, 14 January 2020 (2020-01-14), XP055771473, Retrieved from the Internet
MOJICA F. J. M. ET AL.: "Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements", JOURNAL OF MOLECULAR EVOLUTION, vol. 80, 2005, pages 174 - 182, XP019363173, DOI: 10.1007/s00239-004-0046-3
JANSEN R. ET AL.: "identification of genes that are associated with DMA repeats in prokaryotes", MOLECULAR MICROBIOLOGY, vol. 43, 2002, pages 1565 - 1575, XP002424877, DOI: 10.1046/j.1365-2958.2002.02839.x
JANSEN R. ET AL., MOLECULAR MICROBIOLOGY, vol. 43, 2002, pages 1565 - 1575
BROUNS S. J. J.: "Small CRISPR RNAs guide antiviral defense in prokaryotes", SCIENCE, vol. 321, pages 960 - 964, XP055401088, DOI: 10.1126/science.1159689
CONG L ET AL.: "Multiplex genome engineering using CRISPR/Cas systems", SCIENCE, vol. 339, no. 6121, 15 February 2013 (2013-02-15), pages 819 - 23, XP055400719, DOI: 10.1126/science.1231143
DELTCHEVA E. ET AL.: "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III", NATURE, vol. 471, 2011, pages 602, XP055619637, DOI: 10.1038/nature09886
SONG M: "The CRISPR/Cas9 system: Their delivery, in vivo and ex vivo applications and clinical development by startups", BIOTECHNOL PROG, vol. 33, no. 4, July 2017 (2017-07-01), pages 1035 - 1045
HSU PD ET AL.: "DNA targeting specificity of RNA-guided Cas9 nucleases", NAT BIOTECHNOL., vol. 31, no. 9, September 2013 (2013-09-01), pages 827 - 32, XP055219426, DOI: 10.1038/nbt.2647
ALTSCHUL ET AL., J. MOL. BIOL., vol. 215, 1990, pages 403 - 10
SHEN B ET AL.: "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", CELL RES, vol. 23, no. 5, May 2013 (2013-05-01), pages 720 - 3, XP055141533, DOI: 10.1038/cr.2013.46
MAXWELL CS ET AL.: "A detailed cell-free transcription-translation-based assay to decipher CRISPR protospacer-adjacent motifs", METHODS, vol. 143, 1 July 2018 (2018-07-01), pages 48 - 57, XP055698442, DOI: 10.1016/j.ymeth.2018.02.016
SAMBROOK ET AL.: "Molecular Cloning: A Laboratory Manual", 1989, CSH PRESS
LIU C ET AL.: "Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications", J CONTROL RELEASE, vol. 266, 28 November 2017 (2017-11-28), pages 17 - 26, XP085292687, DOI: 10.1016/j.jconrel.2017.09.012
LINO CA ET AL.: "Delivering CRISPR: a review of the challenges and approaches", DRUG DELIV, vol. 25, no. 1, November 2018 (2018-11-01), pages 1234 - 1257, XP055573342, DOI: 10.1080/10717544.2018.1474964
LANFORD ET AL., CELL, vol. 46, 1986, pages 575 - 582
See also references of EP 3985123A4
Attorney, Agent or Firm:
KOTLOV, Dmitry Vladimirovich (RU)
Download PDF:
Claims:
ФОРМУЛА ИЗОБРЕТЕНИЯ

1. Применение белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’-NNNN(A/G)T-3’ в указанной молекуле ДНК.

2. Применение по п. 1 , характеризующееся тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 35 °С до 45 °С.

3. Применение белка по п. 1 , где белок содержит аминокислотную последовательность SEQ ID NO: 1.

4. Способ изменения последовательности геномной ДНК одноклеточного или многоклеточного организма, включающий введение в по меньшей мере одну клетку этого организма эффективного количества: а) либо белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , либо нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1 , и б) либо направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5’-NNNN(A/G)T-3’, и взаимодействующей с указанным белком после образования дуплекса, либо последовательности ДНК, кодирующей указанную направляющую РНК;

при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5’-NNNN(A/G)T-3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5’-NNNN(A/G)T -3’.

5. Способ по п. 4, дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК.

Description:
СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ CAS9 БЕЛКА ИЗ БАКТЕРИИ

PASTEURELLA PNEUMOTROPICA

Область техники

Изобретение относится к биотехнологии, а именно, к новым ферментам Cas нуклеазам систем CRISPR-Cas, применяемым для разрезания ДНК и редактирования генома различных организмов. Данная технология может применяться в будущем для генной терапии наследственных заболеваний человека, а также для редактирования генома других организмов.

Уровень техники

Изменение последовательности ДНК - одна из актуальных задач биотехнологии на сегодняшний день. Редактирование и изменение геномов эукариотических и прокариотических организмов, а также манипуляции с ДНК in vitro, требуют направленного внесения двунитевых разрывов в последовательности ДНК.

Для решения этой задачи в настоящее время используют следующие методики: искусственные нуклеазные системы, содержащей домены типа «цинковые пальцы», TALEN-системы и бактериальные CRISPR-Cas системы. Первые два метода требуют трудозатратой оптимизации аминокислотной последовательности нуклеазы для узнавания конкретной последовательности ДНК. В отличие от них в случае CRISPR-Cas систем структурами, узнающими ДНК мишень, являются не белки, а короткие направляющие РНК. Разрезание конкретной ДНК мишени не требует синтеза нуклеазы или ее гена de novo, а обеспечивается за счет использования направляющих РНК, комплементарных целевой последовательности. Это делает CRISPR Cas системы удобными и эффективными инструментами разрезания различных ДНК-последовательностей. Методика позволяет осуществлять единовременное разрезание ДНК в нескольких участках при использовании направляющих РНК разной последовательностей. Такой подход используется в том числе для одновременного изменения нескольких генов в эукариотических организмах.

По своей природе CRISPR-Cas системы являются иммунными системами прокариот, способными высоко специфично вносить разрывы в генетический материал вирусов (Mojica F. J. М. et a!. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements //Journal of molecular evolution. - 2005. - T. 80. - Ns. 2. - C. 174-182). Аббревиатура CRISPR-Cas расшифровывается как “Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes” (Jansen R. et ai. identification of genes that are associated with DMA repeats in prokaryotes //Molecular microbiology. - 2002. - T. 43. - Ns. 8. - C. 1565-1575), что переводе с английского обозначает “короткие палиндромные повторы, регулярно расположенные группами, и ассоциированные с ними гены”. Все CRISPR-Cas системы состоят из CRISPR кассет и генов, кодирующих различные Cas белки (Jansen R. et al. , Molecular microbiology. - 2002. - T. 43. - Ns. б. - С. 1565-1575). CRISPR кассеты состоят из последовательностей-спейсеров, каждый из которых имеет уникальную нуклеотидную последовательность, и повторяющихся палиндромных повторов (Jansen R. et al. , Molecular microbiology. - 2002. - T. 43. - Ns. 6. - С. 1565-1575). В результате транскрипции CRISPR кассет и их последующего процессинга образуются направляющие крРНК, которые вместе с Cas белками формируют эффекторный комплекс (Brouns S. J. J. et ai. Small CRISPR RNAs guide antiviral defense in prokaryotes //Science. - 2008. - T. 321 . - Ns. 5891 . - C. 960-984). За счет комплементарного спаривания крРНК с целевым участком ДНК, именуемым протоспейсером, Cas-нуклеаза узнает ДНК-мишень и высоко специфично вносит в нее разрыв.

CRISPR-Cas системы, представленными одиночным белком-эффектором, разделяют на шесть различных типов (от I до VI) в зависимости от Cas белков, входящих в состав систем. В 2013 году впервые было предложено использовать систему CRISPR- Cas9, относящуюся к типу II, для редактирования геномной ДНК клеток человека (Cong L, et al., Multiplex genome engineering using CRISPR/Cas systems. Science. 2013 Feb 15;339(6121 ):819-23). Система CRISPR-Cas9 II типа отличается простотой состава и механизма работы: для ее функционирования необходимо формирование эффекторного комплекса, состоящего лишь из одного белка Cas9 и двух коротких РНК: крРНК (crRNA) и трейсерной РНК (tracrRNA). Трейсерная РНК комплементарно спаривается с участком крРНК, происходящим из CRISPR повтора, образуя вторичную структуру, необходимую для связывания направляющих РНК с Cas эффектором. Определение последовательности направляющих РНК является важным шагом в характеризации неизученных ранее Cas- ортологов. Эффекторный белок Cas9 является РНК-зависимой ДНК эндонуклеазой с двумя нуклеазными доменами (HNH и RuvC), вносящими разрывы в комплементарные нити целевой ДНК, таким образом образуя двунитевой разрыв ДНК (Deitcheva Е. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase П! //Nature. - 201 1 . - T. 471 . - Ns. 7340. - C. 602).

На сегодняшний день известно несколько CRISPR-Cas нуклеаз, способных направлено и специфично вносить двунитевые разрывы в ДНК. Технология CRISPR-Cas9 является одной из самых современных и быстроразвивающихся методик внесения разрывов в ДНК различных организмов, начиная от бактериальных штаммов и заканчивая клетками человека, а также in vitro (Song М. The CRISPR/Cas9 system: Their delivery, in vivo and ex vivo applications and clinical development by startups. Biotechnol Prog. 2017 Jul;33(4):1035-1045).

Эффекторному рибонуклеиновому комплексу, состоящему из Cas9 и дуплекса крРНК и тракрРНК, для распознавания и последующего гидролиза ДНК помимо комплементарного соответствия спейсера крРНК и протоспейсера необходимо присутствие РАМ (от англ.“РАМ” - protospacer adjusted motif) на ДНК мишени (Mojica F. J. М. et al. 2009). РАМ представляет собой строго определенную последовательность из нескольких нуклеотидов, расположенных в системах типа II вплотную либо в нескольких нуклеотидах от З’-конца протоспейсера на нетаргетной цепи. При отсутствии РАМ гидролиза связей в ДНК с образованием двунитевого разрыва не происходит. Необходимость присутствия РАМ последовательности на мишени повышает специфичность узнавания, но в то же время накладывает ограничение в выборе целевых участков ДНК, в которые необходимо внести разрыв. Таким образом, наличие нужной РАМ последовательности, фланирующей ДНК-мишень с З'-конца, является характеристикой, ограничивающей применение CRISPR-Cas систем на любых участках ДНК.

Различные CRISPR-Cas белки используют для своей работы разные, оригинальные РАМ последовательности. Использование CRISPR-Cas белков с новыми разнообразными РАМ последовательностями необходимо для обеспечения возможности изменения любого участка ДНК, как in vitro, так и в геноме живых организмов. Изменение эукариотических геномов также требует использования нуклеаз малого размера для обеспечения доставки CRISPR-Cas систем в клетки посредством AAV вирусов.

Несмотря на известность ряда способов разрезания ДНК и изменения последовательности геномной ДНК, на сегодняшний день сохраняется потребность в новых эффективных инструментах для модификации ДНК в различных организмах и в строго определенных местах последовательности ДНК.

Сущность изобретения

Задачей настоящего изобретения является создание новых инструментов для изменения последовательности геномной ДНК одноклеточных или многоклеточных организмов на основе систем CRISPR-Cas9. Существующие в настоящее время системы имеют ограниченное применение из-за специфичной последовательности РАМ, которая должна присутствовать на З'-конце участка ДНК, подвергающегося модификации. Поиск новых ферментов Cas9 с другими РАМ последовательностями позволит расширить арсенал имеющихся средств для образования двунитевого разрыва в необходимых, строго определенных местах в молекулах ДНК разных организмов. Для решения этой задачи авторами была охарактеризована ранее предсказанная для бактерии Pasteurella pneumotropica (Р. pneumotropica)

CRISPR нуклеаза II типа PpCas9, которая может быть применена для внесения направленных изменений в геном как этого, так и других организмов. Существенными признаками, отличающими настоящее изобретение, являются: (а) короткая, отличающаяся от других известных последовательность РАМ; (б) относительно малый размер охарактеризованного белка PpCas9 - 1055 аминокислотных остатков (а. о.).

Указанная задача решается путем применения белка, содержащего

аминокислотную последовательность SEQ ID NO: 1 , или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной

последовательностью 5’-NNNN(A/G)T-3’ в указанной молекуле ДНК. В некоторых вариантах изобретения данное применение характеризуется тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 35 °С до 45 °С.

Указанная задача также решается путем создания способа изменения последовательности геномной ДНК одноклеточного или многоклеточного организма, включающего введение в по меньшей мере одну клетку этого организма эффективного количества: а) либо белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , либо нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1 , и б) либо направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5’-NNNN(A/G)T-3’, и взаимодействующей с указанным белком после образования дуплекса, либо последовательности ДНК, кодирующей указанную направляющую РНК; при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5’-NNNN(A/G)T-3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5’-NNNN(A/G)T-3’. В некоторых вариантах изобретения данный способ характеризуется тем, что дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК.

В качестве направляющей РНК может быть использована смесь из крРНК (crRNA) и трейсерной РНК (tracrRNA), способных образовать комплекс с участком целевой ДНК и белком PpCas9. В предпочтительных вариантах изобретения в качестве направляющей РНК может быть использована гибридная РНК, сконструированная на основе крРНК и трейсерной РНК. Методы конструирования гибридной направляющей РНК известны специалистам (Hsu PD, et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep;31 (9):827-32). Один из вариантов конструирования гибридной РНК раскрыт в Примерах ниже.

Изобретение может быть использовано как для разрезания целевой ДНК in vitro, так и для модификации генома какого-либо живого организма. Модификация генома может проводиться прямым способом - разрезанием генома в соответствующем сайте, а также вставкой экзогенной последовательности ДНК за счет гомологичной репарации.

В качестве экзогенной последовательности ДНК может быть использован любой участок двунитевой или однонитевой ДНК из генома организма, отличного от организма, используемого при введении (или смесь таких участков между собой и с другими фрагментами ДНК), при этом этот участок (или смесь участков) предназначен для интеграции в место двуцепочечного разрыва в целевой ДНК, образованного под действием нуклеазы PpCas9. В некоторых вариантах изобретения в качестве экзогенной последовательности ДНК может быть использован участок двуцепочечной ДНК из генома организма, используемого при введении белка PpCas9, но при этом измененный мутациями (заменой нуклеотидов), а также вставками или делециями одного или нескольких нуклеотидов.

Техническим результатом настоящего изобретения является повышение универсальности доступных систем CRISPR-Cas9, позволяющее использовать нуклеазу Cas9 для разрезания геномной или плазмидной ДНК в большем количестве специфических сайтов и специфических условий.

Краткое описание рисунков

Фиг. 1 . Схема устройства локуса CRISPR PpCas9 системы. DR - direct repeat, или прямой повтор - регулярно повторяющийся участок, входящий в состав CRISPR кассеты.

Фиг. 2. РАМ скрининг in vitro. Схема эксперимента.

Фиг. 3. Разрезание нуклеазой PpCas9 фрагментов 7N библиотеки при разных температурах проведения реакции.

Фиг. 4. (А) Анализ результатов in vitro скрининга нуклеазы PpCas9 с

использованием расчета логарифма изменения доли каждого конкретного нуклеотида в каждой позиции РАМ (FC). (Б) РАМ Logo нуклеазы PpCas9. Для каждой позиции обозначены частоты представленности аденина, цитозина, тимина и гуанина. Высота букв соответствует частоте представленности нуклеотида в данной позиции РАМ последовательности.

Фиг. 5. Проверка влияния однонуклеотидных замен в первой позиции РАМ на эффективность разрезания нуклеазой PpCas9 ДНК-мишени.

Фиг. 6. Проверка значимости нуклеотидных позиций в РАМ последовательности PpCas9.

Фиг. 7. Проверка влияния замены А на G в бой позиции РАМ на эффективность разрезания нуклеазой PpCas9 ДНК-мишени.

Фиг. 8. Проверка влияния однонуклеотидных замен в 7ой позиции РАМ на эффективность разрезания нуклеазой PpCas9 ДНК-мишени.

Фиг. 9. Разрезание различных сайтов ДНК с помощью белка PpCas9. Дорожки 1 и 2 - положительный контроль.

Фиг. 10. Проверка распознавания нуклеазой PpCas9 РАМ последовательности CAGCATT. Дорожки 1 и 2 - положительный контроль.

Фиг. 11. Схема инструмента разрезания ДНК PpCas9.

Фиг. 12. Эксперимент по разрезанию ДНК -мишени. Использованы гибридные направляющие РНК разной длины. Фиг. 13. Выравнивание аминокислотных последовательностей белков PpCas9 и

Cas9 из Staphylococcus aureus при помощи программы NCBI BLASTp (default parameters).

Подробное раскрытие изобретения

В описании данного изобретения термины «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные термины не предназначены для того, чтобы их истолковывали как «состоит только из». Если не определено отдельно, технические и научные термины в данной заявке имеют стандартные значения, общепринятые в научной и технической литературе.

Используемый здесь термин «процент гомологии двух последовательностей» эквивалентен термину «процент идентичности двух последовательностей». Идентичность последовательностей определяется на основании референсной последовательности. Алгоритмы для анализа последовательности известны в данной области, такие как BLAST, описанный в Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990). Для целей настоящего изобретения для определения уровня идентичности и сходства между нуклеотидными последовательностями и аминокислотными последовательностями может быть использовано сравнение нуклеотидных и аминокислотных последовательностей, производимое с помощью пакета программ Blast, предоставляемого National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/blast) с использованием содержащего разрывы выравнивания со стандартными параметрами. Процент идентичности двух последовательностей определяется числом положений идентичных аминокислот в этих двух последовательностях с учетом числа пробелов и длины каждого пробела, которые необходимо ввести для оптимального сопоставления двух последовательностей путем выравнивания. Процент идентичности равен числу идентичных аминокислот в данных положениях с учетом выравнивания последовательностей, разделенному на общее число положений и умноженному на 100.

Термин "специфически гибрид изуется" относится к ассоциации между двумя одноцепочечными молекулами нуклеиновых кислот или в достаточной степени комплементарными последовательностями, что разрешает такую гибридизацию в предопределенных условиях, обычно использующихся в данной области.

Фраза "двунитевой разрыв, расположенный непосредственно перед нуклеотидной последовательностью РАМ" означает, что двунитевой разрыв в целевой последовательности ДНК будет произведен на расстоянии от 0 до 25 нуклеотидов перед нуклеотидной последовательностью РАМ.

Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двуцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.

Под белком, содержащим определенную аминокислотную последовательность следует понимать белок, имеющий аминокислотную последовательность, составленную из указанной аминокислотной последовательности и, возможно, других последовательностей, соединённых пептидными связями с указанной аминокислотной последовательностью. Примером других последовательностей может служить последовательность сигнала ядерной локализации (NLS), или другие последовательности, обеспечивающие повышенную функциональность для указанной аминокислотной последовательности.

Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двуцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.

Под эффективным количеством вводимых в клетку белка и РНК следует понимать такое количество белка и РНК, которое при попадании в указанную клетку будет способно образовать функциональный комплекс, то есть комплекс, который будет специфически связываться с целевой ДНК и производить в ней двунитевой разрыв в месте, определяемом направляющей РНК и РАМ последовательностью на ДНК. Эффективность этого процесса может быть оценена при помощи анализа целевой ДНК, выделенной из указанной клетки с помощью стандартных методов, известных специалистам.

Доставка белка и РНК в клетку может быть осуществлена различными способами. Например, белок может быть доставлен в виде ДНК-плазмиды, которая кодирует ген этого белка, как мРНК для трансляции этого белка в цитоплазме клетки, или как рибонуклеопротеидный комплекс, включающий этот белок и направляющую РНК. Доставка может быть осуществлена различными методами, известными специалистам.

Нуклеиновая кислота, кодирующая компоненты системы, может быть введена в клетку, непосредственно или опосредованно: за счет трансфекции или трансформации клеток известными специалистам способами, за счет использования рекомбинатного вируса, за счет манипуляций с клеткой, таких как микроинъекция ДНК и т.п.

Доставка рибонуклеинового комплекса, состоящего из нуклеазы и направляющих РНК и экзогенной ДНК (при необходимости) может осуществляться путем трансфекции комплексов в клетку или за счет механического введения комплекса внутрь клетки, например, микроинъекции. Молекула нуклеиновой кислоты, кодирующая белок, который необходимо ввести в клетку, может быть интегрирована в хромосому или может представлять собой внехромосомно реплицирующуюся ДНК. В некоторых вариантах для обеспечения эффективной экспрессии гена белка с вводимой в клетку ДНК необходимо изменить последовательность этой ДНК в соответствии с типом клетки в целях оптимизации кодонов при экспрессии, обусловленное неравномерностью частот встречаемости синонимичных кодонов в кодирующих областях генома различных организмов. Оптимизация кодонов необходима для увеличения экспрессии в клетках животных, растений, грибов или микроорганизмов.

Для функционирования белка, имеющего последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 , в эукариотической клетке необходимо, чтобы этот белок оказался в ядре этой клетки. Поэтому, в некоторых вариантах изобретения, для образования двунитевых разрывов в целевой ДНК используют белок, имеющий последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 , и который дополнительно модифицирован с одного или с обоих концов добавлением одного или нескольких сигналов ядерной локализации. Например, может быть использован сигнал ядерной локализации из вируса SV40. Для эффективной доставки в ядро сигнал ядерной локализации может быть отделен от основной последовательности белка спейсерной последовательностью, например, описанной в Shen В, et al. "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", Cell Res. 2013 May;23(5):720-3. Также, в других вариантах осуществления, может быть использован другой сигнал ядерной локализации, или альтернативный метод доставки указанного белка в ядро клетки.

Настоящее изобретение охватывает применение белка из организма Р. pneumotropica, гомологичного ранее охарактеризованным белкам Cas9, для внесения двуцепочечных разрывов в молекулы ДНК в строго определенных положениях. Использование CRISPR нуклеаз для внесения направленных изменений в геном имеет ряд преимуществ. Во-первых, специфичность действия системы определяется последовательностью крРНК, что позволяет использовать один тип нуклеазы для всех локусов-мишеней. Во-вторых, методика позволяет доставить в клетку сразу несколько направляющих РНК, комплементарных разным генам-мишеням, что позволяет осуществлять единовременное изменение сразу нескольких генов.

PpCas9 - Cas нуклеаза, найденная в бактериях Pasteurella pneumotropica АТСС 35149, являющихся патогенами грызунов, обитающих в легких животных. Pasteurella pneumotropica (Р. pneumotropica) CRISPR Cas9 система (далее CRISPR PpCas9) относится к IIC типу CRISPR Cas систем и состоит из CRISPR кассеты, несущей четыре прямых повтора (direct repeats, DR) последовательностью

5’ATTATAGCACTGCGAAATGAAAAAGGGAGCTACAAC3’ разделенных последовательностями уникальных спейсеров. Ни один из спейсеров системы не совпадает по последовательности с известными на сегодня бактериофагами или плазмидами, что не позволяет определить требуемый PpCas9 РАМ биоинформатическим анализом. K CRISPR кассете прилегает ген эффекторного Cas9 белка PpCas9, а также гены белков Cas1 и Cas2, участвующих в адаптации, встраивании новых спейсеров. Рядом с Cas генами была обнаружена последовательность, частично комплементарная прямым повторам, складывающаяся в характерную вторичную структуру, - предполагаемая трейсерная РНК (tracrRNA) (Фиг. 1 )

Знание характерной архитектуры PHK-Cas белкового комплекса систем IIC типа позволила предсказать направление транскрипции CRISPR кассеты: пре-крРНК транскрибируется в противоположном от Cas генов направлении (Фиг.1 )

Таким образом, анализ последовательности локуса PpCas9 позволил предсказать последовательности трейсерной и направляющих РНК (Таблица 1).

Таблица 1. Определенные биоинформатическиими методами последовательности направляющих РНК системы CRISPR PpCas9. Жирным шрифтом обозначена последовательность прямого повтора DR.

Для проверки активности PpCas9 нуклеазы и определения требуемого PpCas9 РАМ мотива, были проведены эксперименты по воссозданию реакции разрезания ДНК in vitro. Для определения РАМ последовательности белка PpCas9 использовали in vitro разрезание двунитевых РАМ библиотек. Для этого необходимо было получить все компоненты эффекторного комплекса PpCas9: направляющие РНК и нуклеазу в рекомбинантной форме. Определение последовательности направляющих РНК позволило синтезировать in vitro молекулы crRNA и tracrRNA. Синтез осуществляли с помощью набора NEB HiScribe Т7 RNA synthesis. Двунитевые ДНК библиотеки представляли собой фрагменты размером 374 пар нуклеотидов (п.н.), содержащие последовательность протоспейсера, фланкированную рандомизированными семью нуклеотидами (5’-NNNNNNN-3’) с 3’ конца: 5’- cccg д д д taccacg д ад ад atg д tg д aaatcatctttctcg tg д gcatccttg atg д ccacctcg teg д аад tg сссасд ад д atg а cag caatg ccaatg ctg g g g g g gctcttctg ag aacg ag ctctg ctg cctg acacg g ccag g acg g ccaacaccaaccag aactt g g g ag aacag cactccg ctctg g g cttcatcttcaactcg teg actccctg caaacacaaag aaag ag catg ttaaaatag g atcta catcacg taacctg tcttag aag ag g ctag atactg caattcaag g accttatctcctttcattg agcacNNNNNNN aactccatcta ccagcctactctcttatctctggtatt -3’

Для разрезания этой мишени использовали направляющие РНК следующей последовательности:

tracrRNA:

5’GCGAAATGAAAAACGUUGUUACAAUAAGAGAUGAAUUUCUCGCAAAGCTCUGCC

UCUUGAAAUUUCGGUUUCAAGAGGCAUCUUUUU

и crRNA:

5’ uaucuccuuucauugagcacGUUGUAGCUCCCUUUUUCAUUUCGC.

Жирным шрифтом выделена последовательность crRNA, комплементарная протоспейсеру (целевой ДНК последовательности).

Для получения рекомбинантного белка PpCas9 его ген был клонирован в плазмиду рЕТ21 а. В качестве кодирующей ген ДНК, использовалась ДНК, синтезированная в компании Integrated DNA Technologies (ЮТ). Последовательность была кодон- оптимизирована для исключения редких кодонов, встречающихся в геноме Р. pneumotropica. Клетки E.coli Rosetta были трансформированы полученной плазмидой рЕТ21 a-6xHis-PpCas9.

500 мкл ночной культуры разводили в 500 мл среды LB, и растили клетки при температуре 37 °С до достижения оптической плотности 0.6 отн.ед. Синтез целевого белка индуцировали добавлением ИПТГ до концентрации 1 мМ, после чего клетки инкубировали при температуре 20 °С в течение 6 часов. Затем проводили центрифугирование клеток на скорости 5000 g в течение 30 минут, полученные осадки клеток замораживали при температуре -20 °С.

Осадки размораживали на льду в течение 30 минут, ресуспензировали в 15 мл лизисного буфера (Tris-HCI 50мМ pH 8, 500 мМ NaCI, b-меркаптоэтанол 1 мМ, имидазол 10 мМ) с добавлением 15 мг лизоцима и снова инкубировали на льду в течение 30 минут. Затем клетки разрушали воздействием ультразвука в течение 30 минут и центрифугировали в течение 40 минут на скорости 16000 д. Полученный супернатант пропускали через фильтр 0,2 мкм и наносили на колонку HisTrap HP 1 mL (GE Healthcare) на скорости 1 мл/мин.

Хроматографию проводили при помощи FPLC хроматографа АКТА (GE Healthcare) на скорости 1 мл/мин. Колонку с нанесенным белком промывали 20 мл лизисного буфера с добавлением 30 мМ имидазола, после чего белок смывали лизисным буфером с добавлением 300 мМ имидазола.

Затем, фракцию белка, полученную в ходе афинной хроматографии, пропускали через гель-фильтрационную колонку Superdex 200 10/300 GL (24 мл), уравновешенную следующим буфером: Tris-HCI 50 мМ pH 8, 500 мМ NaCI, 1 мМ DTT. При помощи концентратора Amicon (с фильтром на 30 кДа) фракции, соответствующие мономерной форме белка PpCas9, сконцентрировали до 3 мг/мл, после чего очищенный белок хранили при температуре -80 °С в буфере, содержащем 10% глицерин.

In vitro реакцию порезки линейных РАМ библиотек проводили в объёме 20 мкл в следующих условиях. Реакционная смесь состояла из: 1Х CutSmart буфера (NEB), 5 мМ DTT, 100 нМ РАМ-библиотеки, 2 мкМ трРНК/крРНК, 400 нМ белка PpCas9. В качестве контроля аналогичным образом были приготовлены пробы, не содержащие РНК. Пробы инкубировали при различных температурах и анализировали методом гель-электрофореза в 2% агарозном геле. В случае правильного узнавания и специфического разрезания ДНК белком PpCas9 должны формироваться два фрагмента ДНК длиной порядка 326 и 48 пар оснований (см. Фиг. 2).

Результаты опыта показали, что PpCas9 обладает нуклеазной активностью и разрезает часть фрагментов РАМ библиотеки. Градиент температур (Фиг. 3) показал, что белок активен в диапазоне температур 35 - 45 °С. В дальнейшем в работе в качестве рабочей использовалась температура 42 °С.

Реакцию разрезания библиотеки повторяли в подобранных условиях. Продукты реакции наносили на 1.5% агарозный гель и подвергали электрофорезу. Непорезанные фрагменты ДНК длиной 374 п.н. экстрагировали из геля и подготавливали для высокоэффективного секвенирования с помощью набора NEB NextUltra II. Образцы секвенировали на платформе lllumina и далее проводили анализ последовательностей биоформатическими методами: определяли разницу в представленности нуклеотидов в отдельных позициях РАМ (NNNNNNN) в сравнении с контрольным образцом с использованием подхода, описанного в (Maxwell CS, et al., A detailed cell-free transcription- translation-based assay to decipher CRISPR protospacer-adjacent motifs. Methods. 2018 Jul 1 ;143:48-57). Кроме того, для анализа результатов построили РАМ лого (Фиг. 4).

Оба подхода к анализу данных (Фиг. 4) указывают на значимость 5, 6 и 7 позиций РАМ. Таким образом, в результате in vitro анализа удалось установить предположительную РАМ последовательность для PpCas9: NNNNATT. Однако эта последовательность является лишь предположительной в силу неточности результатов, получаемых скрининговыми подходами к определению РАМ.

В связи с этим для уточнения последовательности была произведена проверка значимости отдельных позиций последовательности РАМ. Для этого проводили реакции in vitro разрезания ДНК фрагментов, содержащих ДНК-мишень 5’- atctcctttcattgagcac-3’, фланкированную РАМ последовательностью СААСАТТ (или ее производных): 5’- cccg д д д taccacg д ад ад atg д tg д aaatcatctttctcg tg д gcatccttg atg д ccacctcg teg д аад tg сссасд ад д atg а сад caatg ccaatg ctg д д д д д gctcttctg ад аасд ад ctctg ctg cctg асасд дссад д асд д ссаасассаассад aactt д д д ад аасад cactccg ctctg д д cttcatcttcaactcg teg actccctg сааасасааад ааад ад catg ttaaaatag д atcta catcacg taacctg tcttag aag ag g ctag atactg caattcaag g accttatctcctttcattaaacacCAACATT aactccatcta ccagcctactctcttatctctggtatt- 3’

Все реакции разрезания ДНК проводили в следующих условиях:

IxCutSmart буфер

400 нМ PpCas9

20 нМ ДНК

2 мкМ crRNA

2 мкМ tracrRNA

Время инкубации - 30 минут, температура проведения реакции - 42 °С.

Замена первой позиции РАМ на все четыре возможные варианта нуклеотидов не повлияла на эффективность работы белка (Фиг. 5).

Предсказанная значимость пятой и шестой была подтверждена экспериментально путем однонуклеотидных замен (пурин на пиримидин и наоборот) в каждой из позиций РАМ. При заменах в пятой и шестой позициях белок практически переставал работать. При замене в седьмой позиции эффективность работы PpCas9 снижалась в два раза, что отражает сниженные требования к нуклеотиду в этой позиции (Фиг. 6). Таким образом, согласно полученным результатам in vitro РАМ скрининга нуклеазы PpCas9, в пятой позиции РАМ наиболее вероятными нуклеотидами являются аденин или гуанин, что удалось подтвердить экспериментально (Фиг. 7). Замена А на G никак не снижала эффективность разрезания фрагмента.

Согласно результатам in vitro скрининга фрагменты с“Т” либо с“С” в седьмой позиции должны распознаваться более эффективно. Для окончательной проверки значимости нуклеотидов в этой позиции были проведены дополнительные эксперименты. Результаты проведенных in vitro тестов показали, что при замене нуклеотида“Т” в седьмой позиции на А или G эффективность разрезания снижается на 40-50% (Фиг. 8). Таким образом, седьмая позиция РАМ является менее консервативной в сравнении с пятой и шестой: пурины в седьмом положении лишь снижают эффективность узнавания, но не препятствуют белку PpCas9 вносить двунитевые разрывы в ДНК.

В результате проведенных исследований удалось сделать следующий вывод: РАМ, распознаваемый нуклеазой PpCas9, соответствует следующей формуле 5’- NNNN(A/G)T- 3’. Последовательности NNNNRTY (NNNN(A/G)-T-(T/C)) распознаются более эффективно чем NNNNRTR (NNNN-(A/G)-T-(A/G)).

Нижеследующие примеры осуществления способа приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Пример 1. Тестирование активности белка PpCas9 в разрезании различных ДНК мишеней.

Для того, чтобы проверить способность PpCas9 узнавать различные последовательности ДНК, фланкированные 5’-NNNN(A/G)T-3’ последовательностью, были проведены эксперименты по in vitro разрезанию ДНК-мишеней из последовательности гена grin2b человека (см. Таблицу 2).

Таблица 2. ДНК-мишени гена grin2b человека.

В реакции разрезания в качестве мишени использовался ПЦР фрагмент гена grin2b, несущий сайты узнавания (Таблица 2), предположительно распознаваемыми PpCas9 в соответствии с РАМ консенсусом 5’-NNNN(A/G)T-3’. Для узнавания этих последовательностей были синтезированы крРНК, направляющие PpCas9 на данные сайты.

Реакции разрезания проводились в подобранных для PpCas9 условиях, результат представлен на Фиг. 9. Из Фиг. 9 видно, что фермент PpCas9 успешно порезал три из четырех мишеней с подходящим РАМ.

Мишень на шестой дорожке имела РАМ последовательность CAGCATT, которая согласно предсказаниям на основании результатов «depletion analysis» должна эффективно распознаваться белком. Однако в данном эксперименте узнавание данного фрагмента не произошло.

Поэтому была произведена дополнительная проверка РАМ CAGCATT на другой мишени-протоспейсере, ограниченной таким же РАМ (Фиг. 10). В этом случае РАМ эффективно распознавался, что приводило к порезке ДНК. Таким образом, белок имеет некие дополнительные предпочтения к последовательности ДНК мишени, возможно связанные со вторичной структурой ДНК.

Таким образом, проведенные исследовательские испытания показали наличие нуклеазной активности у PpCas9, а также позволили определить его РАМ последовательность и верифицировать последовательности направляющих РНК.

PpCas9 рибонуклеопротеиновый комплекс специфически вносит разрывы в мишени, ограниченные РАМ 5’ NNNN(A/G)T 3’ с 5’ конца протоспейсера. Схема PpCas9- РНК комплекса представлена на Фиг. 1 1 . Пример 2. Использование гибридной направляющей РНК для разрезания ДНК мишени.

sgRNA - форма направляющих РНК, которая представляет собой слитые воедино tracrRNA (трейсерная РНК) и crRNA. Для подбора отимальной sgRNA были сконструированы три варианта этой последовательности, отличающиеся длиной tracrRNA - crRNA дуплекса. РНК синтезировали in vitro и проводили с ними эксперименты по разрезанию ДНК -мишени (Фиг. 12)

В качестве гибридных РНК были использованы следующие РНК последовательности:

1 - sgRNAI 25DR:

UAUCUCCUUUCAUUGAGCACGUUGUAGCUCCCUUUUUCAUUUCGCGAAAGCGAAAUGA

AAAACGUUGUUACAAUAAGAGAUGAAUUUCUCGCAAAGCTCTGCCUCUUGAAAUUUC GG

UUUCAAGAGGCAUCUUUUU

2 - sgRNA2 36DR

UAUCUCCUUUCAUUGAGCACGUUGUAGCUCCCUUUUUUCAUUUCGCAGUGCUAUAAUG

AAAAUUAUAGCACUGCGAAAUGAAAAACGUUGUUACAAUAAGAGAUGAAUUUCUCGC AAA

GCUCUGCCUCUUGAAAUUUCGGUUUCAAGAGGCAUCUUUUU

Жирным шрифтом обозначена 20-нуклеотидная последовательность,

обеспечивающая спаривание с ДНК -мишенью (вариабельная часть sgRNA). Кроме того, в эксперименте делали контрольную пробу без РНК, а также положительный контроль - порезка мишени с помощью crRNA+trRNA.

В качестве ДНК мишени использовалась последовательность, содержащая сайт узнавания 5’ tatctcctttcattgagcac 3’ с соответсвующим консенсусу РАМСААСАТТ : 5’- cccg д д д taccacg д ад ад atg д tg д aaatcatctttctcg tg д gcatccttg atg д ccacctcg teg д аад tg сссасд ад д atg а сад caatg ccaatg ctg д д д д д gctcttctg ад аасд ад ctctg ctg cctg асасд д ссад д асд д ссаасассаассад aactt д д д ад аасад cactccg ctctg д д cttcatcttcaactcg teg actccctg сааасасааад ааад ад catg ttaaaatag д atcta catcacgtaacctgtcttagaagaggctagatactgcaattcaaggaccttatctccttt cattgagcacCAACATTcaactccat ctaccagcctactctcttatctctggtatt - 3’

Жирным шрифтом обозначен сайт узнавания, заглавными буквами РАМ.

Реакцию проводили в следующих условиях: концентрация ДНК последовательности, содержащей РАМ (СААСАТТ) - 20 нМ, концентрация белка - 400 нМ, концентрация РНК - 2 мкМ; время инкубирования - 30 минут, температура инкубирования - 37 °С.

Подобранные sgRNAI и sgRNA2 оказались так же эффективны, как и нативные последовательности tracrRNA и crRNA: разрезание произошло в более 80% ДНК-мишенях (Фиг. 12).

Эти варианты гибридной РНК могут быть использованы для разрезания любой другой целевой ДНК при изменении последовательности, непосредственно спаривающейся с ДНК -мишенью. Пример 3. Белки Cas9 из близкородственных организмов, относящихся к Р. pneumotropica.

На сегодняшний день в Р. pneumotropica не охарактеризовано ни одного фермента системы CRISPR-Cas9. Сравнимый по размерам белок Cas9 из Staphylococcus aureus идентичен PpCas9 на 28 % (Фиг. 13, степень идентичности была рассчитана по

программе BLASTp, default parameters). Похожая степень идентичности существует и для других известных белков Cas9 (не показано).

Таким образом, белок PpCas9 существенно отличается по аминокислотной последовательности от других Cas9 белков, изученных на сегодняшний день.

Специалисту в области генетической инженерии очевидно, что полученный и охарактеризованный в данном Описании вариант последовательности белка PpCas9 может быть изменен без изменения функции самого белка (например, направленным мутагенезом аминокислотных остатков, напрямую не влияющих на функциональную активность (Sambrook et al., Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108)). В частности, специалисту известно, что могут быть изменены неконсервативные аминокислотные остатки, не затрагивающие остатки, определяющие функциональность белка (определяющие его функцию или структуру). Примерами таких изменений могут служить замены неконсервативных аминокислотных остатков на гомологичные. Некоторые из участков, содержащих неконсервативные аминокислотные остатки, приведены на Фиг. 12. В некоторых вариантах осуществления изобретения возможно использование белка, содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’- NNNN(A/G)T-3’ в указанной молекуле ДНК. Гомологичные белки могут быть получены путем мутагенеза (например, сайт-направленного или ПЦР-опосредуемого мутагенеза) соответствующих молекул нуклеиновых кислот с последующим тестированием кодируемого модифицированного белка Cas9 на сохранение его функций в соответствии с описанными здесь функциональными анализами.

Пример 4. Описанная в настоящем изобретении система PpCas9 в комплексе с направляющими РНК может быть использована для изменения последовательности геномной ДНК многоклеточного организма, в том числе эукариотического. Для введения система PpCas9 в комплексе с направляющими РНК в клетки этого организма (во все клетки или в часть клеток) могут быть применены различные подходы, известные специалистам. Например, методы доставки CRISPR-Cas9 систем в клетки организмов раскрыты в источниках (Liu С et al., Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications. J Control Release. 2017 Nov 28;266:17-26; Lino CA et al., Delivering CRISPR: a review of the challenges and approaches. Drug Deliv. 2018 Nov;25(1 ):1234-1257), и в источниках, раскрытых внутри этих источников.

Для эффективной экспрессии нуклеазы PpCas9 в эукариотических клетках будет желательно провести оптимизацию кодонов для аминокислотной последовательности белка PpCas9 методами, известными специалистам (например, IDT codon optimization tool).

Для эффективной работы нуклеазы PpCas9 в эукариотических клетках необходимо обеспечить импорт этого белка внутрь ядра эукариотической клетки. Для этого можно использовать сигнал ядерной локализации из Т-антигена вируса SV40 (Lanford et al., Cell, 1986, 46: 575-582), соединённый с последовательностью PpCas9 с помощью спейсерной последовательности, описанной в Shen В, et al. "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", Cell Res. 2013 May;23(5):720-3 или без нее. Таким образом, полная аминокислотная последовательность нуклеазы, транспортируемой внутрь ядра эукариотической клетки, будет представлять собой следующую последовательность: MAPKKKRKVGIHGVPAA-PpCas9-KRPAATKKAGQAKKKK (далее

PpCas9 NLS). Для доставки белка с приведенной выше аминокислотной последовательностью, могут быть использованы по меньшей мере два подхода.

Доставка в виде гена осуществляется путем создания плазмиды, несущей ген PpCas9 NLS под регуляцией промотора (например, CMV промотора) и последовательности, кодирующей направляющие РНК под регуляцией U6 промотора. В качестве ДНК- мишеней используются ДНК последовательности фланкированные 5’- NNNN(G/A)T -3’, например, последовательности гена grin2b человека:

5’-CAGCT G AAGT ААТ GTT AG AG-3’

Таким образом, кассета для экспрессии sgPHK выглядит следующим образом:

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttaga gagataattggaattaatttgactgtaaa cacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgc agttttaaaattatgttttaaaatgg actatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgt ggaaaggacgaaacaccg

CAGCT G AAGT AAT GTT AG AGGTT GT AGCT CCCTTTTT CATTT CGCG AAAGCG AAAT GAAAA ACGTT GTT ACAAT AAGAG AT G AATTT CT CGCAAAGCT CT GCCT CTT G AAATTT CGGTTT CAA GAGGCAT CTTTTT

Жирным шрифтом выделена последовательность U6 промотора, далее идет последовательность, необходимая для узнавания целевой ДНК, а далее идет последовательность, образующая структуру sgRNA, которая выделена красным.

Плазмидную ДНК очищают и трансфицируют в клетки человека НЕК293 с помощью реагента Lipofectamine 2000 (Thermo Fisher Scientific). Клетки инкубируют в течение 72 часов, после чего из них выделяется геномная ДНК с помощью колонок для очистки геномной ДНК (Thermo Fisher Scientific). Целевой ДНК сайт анализируется с помощью секвенирования на платформе lllumina с целью определения числа вставок-делеций в ДНК, происходящих в целевом сайте по причине направленного двунитевого разрыва и последующей его репарации.

Для амплификации целевых фрагментов используют праймеры, фланкирующие предположительное место внесения разрыва.

После амплификации пробы готовятся по протоколу реагента Ultra II DNA Library Prep Kit for lllumina (NEB) для подготовки образцов к высокопроизводительному секвенированию. Затем проводится секвенирование на платформе lllumina 300cycles, прямое прочтение. Результаты секвенирования анализируются биоинформатическими методами. В качестве детекции разрезания принимается вставка или делеция нескольких нуклеотидов в целевой последовательности ДНК.

Доставка в виде рибонуклеинового комплекса осуществляется путем инкубации рекомбинантной формы PpCas9 NLS с направляющими РНК в CutSmart буфере (NEB). Рекомбинантный белок получают из бактериальных клеток-продуцентов, очищая его с помощью аффинной хроматографии (NiNTA, Qiagen) разделением по размеру (Superdex 200).

Белок смешивают с РНК в соотношении 1 :2 (PpCas9 NLS : sgRNA), инкубируют в течение 10 минут на комнатной температуре, затем смесь трансфицируют в клетки.

Далее проводится анализ экстрагированной из них ДНК на предмет вставок- делеций в целевом ДНК сайте (как описано выше).

Охарактеризованная в настоящем изобретении нуклеаза PpCas9 из бактерии Pasieurei!a prseumotropsca имеет ряд преимуществ относительно ранее охарактеризованных Cas9 белков.

PpCas9 обладает коротким, двухбуквенным, отличным от других известных Cas нуклеаз РАМ мотивом, необходимым для функционирования системы. В изобретении было показано, что для функционирования PpCas9 достаточно присутствия короткого РАМ мотива (RT), распложенного в 4 нуклеотидах от протоспейсера.

Известные на сегодняшний день большинство Cas нуклеаз, способных вносить двунитевые разрывы в ДНК, имеют сложные многобуквенные РАМ последовательности, ограничивающие выбор последовательностей, пригодных для разрезания. Среди изученных Cas нуклеаз, распознающих короткие РАМ, только PpCas9 может распознавать последовательности, фланкированные RT мотивом.

Второе преимущество PpCas9 - малый размер белка (1055 а. о). На сегодняшний день это единственный изученный малоразмерный белок, обладающий двухбуквенной RT РАМ последовательностью.

PpCas9 - новая, малоразмерная Cas нуклеаза, имеющая короткий, простой в использовании РАМ, отличающийся от известных на сегодняшний день РАМ последовательностей других нуклеаз. Белок PpCas9 разрезает с высокой эффективностью различные ДНК-мишени, в том числе и при 37 °С, и может стать основой нового инструмента геномного редактирования.

Несмотря на то, что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные случаи приведены лишь в целях иллюстрирования настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть, понятно, что возможно осуществление различных модификаций без отступления от сути настоящего изобретения.