Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
COMPOSITION FOR BASE EDITING FOR ANIMAL EMBRYO AND BASE EDITING METHOD
Document Type and Number:
WIPO Patent Application WO/2018/117746
Kind Code:
A1
Abstract:
Provided are a base editing composition comprising deaminase and target-specific nuclease, a base editing method using the base editing composition, and a method for producing a genetically modified animal. The base editing composition has a base editing activity in mammal embryos.

Inventors:
KIM JIN-SOO (KR)
KIM KYOUNG MI (KR)
RYU SEUK MIN (KR)
Application Number:
PCT/KR2017/015380
Publication Date:
June 28, 2018
Filing Date:
December 22, 2017
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
INST BASIC SCIENCE (KR)
International Classes:
C12N15/10; C07K14/47; C12N9/02; C12N9/16; C12N9/78; C12N15/85; C12N15/877
Domestic Patent References:
WO2016022363A22016-02-11
Foreign References:
US20150166980A12015-06-18
KR20150101477A2015-09-03
Other References:
KOMOR, ALEXIS C.: "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage", NATURE, 19 May 2016 (2016-05-19), pages 420 - 424, XP055548777, DOI: doi:10.1038/nature17946
MA, YUNQING: "Targeted AID-mediated mutagenesis (TAM) enables efficient genomic diversification in mammalian cells", NATURE METHODS, vol. 13, no. 12, 10 October 2016 (2016-10-10), pages 1029 - 1035, XP055449587
KIM, KYOUNGMI: "Highly efficient RNA-guided base editing in mouse embryos", NATURE BIOTECHNOLOGY, vol. 35, no. 5, 27 February 2017 (2017-02-27), pages 435 - 437, XP055479394, ISSN: 1087-0156, DOI: 10.1038/nbt.3816
CHO, S.W. ET AL.: "Analysis of off-target effects of CRISPR/Cas-derived RNA-guided endonucleases and nickases", GENOME RES, vol. 24, 2014, pages 132 - 141, XP055227885, DOI: 10.1101/gr.162339.113
CHO, S.W.KIM, S.KIM, J.M.KIM, J.S.: "Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease", NAT BIOTECHNOL, vol. 31, 2013, pages 230 - 232
HUR, J.K. ET AL.: "Targeted mutagenesis in mice by electroporation of Cpf1 ribonucleoproteins", NAT BIOTECHNOL, vol. 34, 2016, pages 807 - 808, XP055465092, DOI: 10.1038/nbt.3596
SUNG, Y.H. ET AL.: "Highly efficient gene knockout in mice and zebrafish with RNA-guided endonucleases", GENOME RES, vol. 24, 2014, pages 125 - 131, XP055647267, DOI: 10.1101/gr.163394.113
See also references of EP 3561059A4
Attorney, Agent or Firm:
YOU ME PATENT AND LAW FIRM (KR)
Download PDF:
Claims:
【청구범위】

【청구항 1】

시티딘 디아미나제, 및 이의 코딩 유전자, 및

표적 특이적 뉴클레아제 또는 이의 코딩 유전자를 포함하는, 포유 동물 세포의 염기 교정용 조성물.

【청구항 2】

제 1항에 있어서, 상기 표적 특이적 뉴클레아제는 RNA-가이드 뉴클레아제 및 가이드 RNA를 포함하는 것인, 포유 동물 세포의 염기 교정용 조성물.

【청구항 3】

제 2항에 있어서, 상기 RNA-가이드 뉴클레아제는 Cas9 단백질 또는 Cpfl 단백질인, 포유 동물 세포의 염기 교정용 조성물.

【청구항 4】

제 2항에 있어서, 상기 RNA-가이드 뉴클레아제는 Cas9 니카아제, 촉매활성 결핍 Cas9 단백질, 또는 .야생형과 상이한 PAM 서열을 인식하는 Cas9 단백질인, 포유 동물 세포의 염기 교정용 조성물.

【청구항 5]

제 4항에 있어서, 상기 RNA-가이드 뉴클레아제는 스트렙토코커스 피요젠스 Streptococcus pyogenes) 유래의 Cas9 단백질의

(1) D10, H840, 또는 D10 및 H840;

(2) D1135, R1335, 및 T1337로 이루어진 군에서 선택된 하나 이상; 또는

(3) 상기 (1) 및 (2)의 아미노산 잔기 모두

가 야생형과 다른 아미노산으로 치환된 것인,

포유 동물 세포의 염기 교정용 조성물.

【청구항 6】

저) 2항에 있어서, 상기 가이드 R A는 CRISPR RNA (crRNA) 및 trans— activating crRNA (tracrRNA)를 포함하는 이중 RNA, 또는 단일 가이드 RNA (sgRNA)인, 포유 동물 세포의 염기 교정용 조성물.

【청구항 7】

제 1항에 있어세 상기 시티딘 디아미나제는 APOBEC (apolipoprotein B mRNA editing enzyme , catalytic polypept ide~l ike) , AID (activation- induced cyt idine deaminase) , tadA (tRNA-speci f ic adenosine deaminase) 또는 이들이 조합인, 포유 동물 세포의 염기 교정용 조성물.

【청구항 8】

제 2항 내지 제 7항 중 어느 항에 있어서, 상기 포유 동물 세포의 염기 교정용 조성물은 시티딘 디아미나제 코딩 mRNA , RNA-가이드 뉴클레아제 코딩 mRNA , 및 가이드 RNA를 포함하는 것인, 포유 동물 세포의 염기 교정용 조성물.

【청구항 9】

제 2항 내지 제 7항 중 어느 항에 있어서, 상기 포유 동물 세포의 염기 교정용 조성물은 시티딘 디아미나제, RNA-가이드 뉴클레아제, 및 가이드 RNA가 복합체를 형성하는 리보핵산단백질을 포함하는 것인, 포유 동물 세포의 염기 교정용 조성물.

【청구항 10]

저 U항 내지 제 7항 증 어느 한 항에 있어서, 우라실 DNA 글리코실라제 억제제 (urac i l DNA glycosyl ase inhi bi tor : UGI ) 또는 이의 코딩 유전자, 핵위치화서열 (NLS) 또는 이의 코딩 유전자, 또는 이들 모두를 추가로 포함하는, 포유 동물 세포의 염기 교정용 조성물.

【청구항 11】

제 1항 내지 제 7항 중 어느 한 항에 있어서, 상기 포유 동물 세포는 포유 동물 배아인, 포유 동물 세포의 염기 교정용 조성물.

【청구항 12】

제 1항 내지 제 7항 중 어느 한 항의 포유 동물 세포의 염기 교정용 조성물을 포유 동물 세포에 주입하는 단계를 포함하는, 포유 동물 세포의 염기 교정 방법 .

【청구항 13】

제 12항에 있어서, 상기 염기 교정용 조성물은 우라실 DNA 글리코실라제 억제제 (urac i l DNA glycosyl ase inhibi tor : UGI ) 또는 이의 코딩 유전자, 핵위치화서열 (NLS) 또는 이의 코딩 유전자, 또는 이들 모두를 추가로 포함하는 것인, 포유 동물 세포의 염기 교정 방법.

【청구항 14】

제 12항에 있어서, 상기 주입은 미세주입 또는 전기천공에 의하여 수행되는 것인, 포유 동물 세포의 염기 교정 방법.

【청구항 15]

제 12항에 있어서, 상기 포유 동물 세포는 포유 동물 배아인, 포유 동물 세포의 염기 교정 방법 .

【청구항 16】

거 U항 내지 제 7항 중 어느 한 항의 포유 동물 세포의 염기 교정용 조성물이 주입된, 유전자 변형 포유 동물 세포.

【청구항 17】

제 16항에 있어서, 상기 염기 교정용 조성물은 우라실 DNA 글리코실라제 억제제 (urac i l DNA g lycosyl ase inhibi tor : UGI ) 또는 이의 코딩 유전자, 핵위치화서열 (NLS) 또는 이의 코딩 유전자, 또는 이들 모두를 추가로 포함하는 것인, 유전자 변형 포유 동물 세포.

【청구항 18】

제 16항에 있어서, 상기 포유 동물 세포는 포유 동물 배아인, 유전자 변형 포유 동물 세포.

【청구항 19]

제 18항의 유전자 변형 포유 동물 배아를 포유 동물 위탁모 난관에 이식하여 발생시킨, 제외한 유전자 변형 포유 동물.

【청구항 20]

제 18항의 유전자 변형 포유 동물 배아를 포유 동물 위탁모 난관에 이식하는 단계를 포함하는, 유전자 변형 포유 동물의 제조 방법.

Description:
【발명의 설명】

【발명의 명칭】

동물 배아의 염기 교정용 조성물 및 염기 교정 방법 【기술분야】

디아미나제 및 표적특이적 뉴클레레아제를 포함하는 염기 교정용 조성물, 및 상기 염기 교정용 조성물을 이용한 염기 교정 방법 및 유전자 변형 동물 제조 방법이 제공된다. 【발명의 배경이 되는 기술】

대다수의 인간 유전 질환은, 몇몇 삽입 /결실 (insert ions/deletions; indels) 또는 게놈에서의 광범위한 염색체 재배열보다는, 단일 염기 치환 또는 점 돌연변이에 의해 유발된다. CRISPR (clustered, regular interspaced, short palindromic repeat )-Cas9 또는 Cpf 1 시스템과 같은 programmable nuclease에 의한 ' 게놈 교정 (genome editing)은 선천적 유전 질환을 일으키는 유전적 결함을 치료하기 위한 유전자 교정 (gene correct ion)을 가능하게 하지만, 표적 특이적으로 단일 염기 치환을 유도하기에는 기술적으로 어려움이 있다. 이는 programmable nuclease에 의해 생성된 대부분의 DNA 이증 가닥 절단 (DSB)이 template donor DNA를 사용하는 상동성 재조합 (homologous recombination, HR)이 아닌 오류가 발생하기 쉬운 비상동 말단연결 (error-prone non-homologous end- joining (NHEJ)에 의해 복구되기 때문이다. 그 결과, 단일 뉴클레오타이드 치환보다 뉴클레아제 표적 부위에서의 indel이 보다 빈번하게 얻어진다. 최근, AP0BEC1 (apol ipoprotein B editing complex 1) 또는 AID (activation— induced deaminase)와 같은 시티딘 디아미나제 (cytidine deaminase)가 Cas9 니카아제 (Cas9 nickase; nCas9) 또는 촉매활성 결핍 Cas9 (catalyticallyᅳ deficient Cas9; dCas9)와 연결되어, 표적 부위에서, DSB 생성 없이, C를 T로 (또는 G를 A로) 치환시킴이 보고된 바 있으며, 이는 효모 및 배양된 포유류 세포에서의 염기 교정 (base editing)을 보여주는 것이라고 할 수 있다. 이러한 RNA-gu ied programmable deaminase는 게놈 교정의 범위를 새로운 차원으로 확대시키고, 인간을 포함한 전 유기체에서 표적 돌연변이를 유발하거나 유전자 교정을 시행할 수 있는 방법을 제안할 수 있다. 그러나 RNA— progra隱 able deaminase의 생체 내 ( //7 ra)에서의 염기 교정 기능은 아직 증명되지 않았다.

【발명의 내용】

【해결하고자 하는 과제】

본 명세서는 programmabl e deami nase를 이용하여 마우스와 같은 진핵 세포 (예컨대, 포유류 등의 동물 세포)에서 단일 뉴클레오타이드 치환을 유도하는 기술을 제공한다.

일 예는 ( 1) 디아미나제, 및 이의 코딩 유전자, 및 (2) 표적 특이적 뉴클레아제 또는 이의 코딩 유전자를 포함하는 염기 교정용 조성물을 제공한다. 상기 세포는 진핵세포 (예컨대ᅳ 진핵 동물의 배아 세포)일 수 있고, 상기 염기 교정 방법은 진핵세포에서 염기 교정 (예컨대, 염기 치환)을 수행하는 것일 수 있다.

상기 변형 표적 특이적 뉴클레아제는 NA—가이드 뉴클레아제 및 표적 유전자의 표적 부위와 흔성화 가능한 (상보적 핵산 서열을 갖는) 가이드 RNA 또는 이의 코딩 DNA (또는 코딩 DNA를 포함하는 재조합 백터)를 포함하는 것일 수 있다. 이 경우, 상기 염기 교정용 조성물은, ( 1) 디아미나제 또는 이의 코딩 유전자 (mRNA 또는 코딩 DNA를 포함하는 재조합 백터), (2) RNA-가이드 뉴클레아제 또는 이의 코딩 유전자 (mRNA 또는 코딩 DNA를 포함하는 재조합 백터), 및 (3) 가이드 RNA 또는 이의 코딩 유전자 (DNA)를 포함하는 것일 수 있다.

상기 염기 교정용 조성물은, ( 1) 디아미나제 또는 이의 코딩 유전자 (mRNA 또는 코딩 DNA를 포함하는 재조합 백터) , (2) RNA-가이드 뉴클레아제 또는 이의 코딩 유전자 (mRNA 또는 코딩 DNA를 포함하는 재조합 백터) , 및 (3) 가이드 RNA 또는 이의 코딩 유전자 (DNA)에 더하여, (4) 우라실 DNA 글리코실라제 억제제 (urac i l DNA glycosyl ase inhibi tor : UGI ) 또는 이의 코딩 유전자 및 /또는 (5) 핵위치화서열 (NLS) 또는 이의 코딩 유전자를 추가로 포함할 수 있다. 상기 염기 교정용 조성물에서, 상기 디아미나제, RNA-가이드 뉴클레아제, 및 임의로 UGI 및 /또는 NLS가 연결된 융합 단백질 또는 이들의 코딩 유전자가 연결된 융합 유전자 형태로 사용되는 경우, 각각의 단백질 또는 유전자 사이 중 하나 이상, 예컨대, 상기 디아미나제와 RNA—가이드 뉴클레아제 사이, 뉴클레아제와 UGI 사이, 및 UGI와 NLS 사이 중 하나 이상에 적절한 링커 (융합 단백질의 경우 펩타이드 링커 (3-30 , 또는 3-20 아미노산) , 융합 유전자의 경우 올리고뉴클레오타이드 링커 (9 내지 90 또는 9— 60nt ) )를 추가로 포함할 수 있다.

다른 예는 상기 염기 교정용 조성물을 세포에 도입시키는 단계를 포함하는, 염기 교정 방법을 제공한다. 상기 세포는 진핵세포일 수 있고, 상기 염기 교정 방법은 진핵세포에서 염기 교정 (예컨대, 염기 치환)을 수행하는 것일 수 있다.

일 예에서, 상기 세포에 염기 교정용 조성물을 도입하는 단계는,

1) 상기 세포를 디아미나제 코딩 DNA , RNA-가이드 뉴클레아제 코딩 DNA , 및 가이드 RNA 코딩 유전자를 각각 포함하거나 이들 중 2 이상을 포함하는 재조합 백터로 형질감염시키거나,

2) 상기 세포에 디아미나제, RNA-가이드 뉴클레아제, 및 가이드 RNA

(예컨대, 디아미나제, RNA-가이드 뉴클레아제, 및 가이드 RNA가 복합체를 형성한 리보핵산단백질)를 직접 주입하거나,

3 ) 상기 세포에 디아미나제 코딩 m NA , RNA-가이드 뉴클레아제 코딩 mRNA , 및 가이드 RNA를 직접 주입하여 수행할 수 있다.

앞서 설명한 바와 같이 , 상기 염기 .교정용 조성물을 도입하는 단계 1)

2) 또는 3 )에서 사용된 염기 교정용 조성물은 각각 우라실 DNA 글리코실라제 억제제 (urac i l DNA gl ycosyl ase i nhi bi tor : UGI ) 또는 이의 코딩 유전자 및 /또는 (5) 핵위치화서열 (NLS) 또는 이의 코딩 유전자를 추가로 포함할 수 있으며, 경우에 따라서 적절한 링커를 추가로 포함할 수 있다.

다른 예는 상기 염기 교정 방법에 의하여 교정된 염기를 포함하는 유전자 변형 세포를 제공한다.

다른 예는 상기 유전자 변형 세포로부터 얻어진 유전자 변형 동물을 제공한다.

다른 예는 상기 염기 교정용 조성물이 도입된 포유 동물 배아를 포유 동물 위탁모 난관에 이식하는 단계를 포함하는 유전자 변형 동물의 제조 방법을 제공한다.

【과제의 해결 수단】

본 발명자들은 programmable deaminase를 이용하여 마우스와 같은 진핵 세포 (예컨대, 포유류 등의 동물 세포)에서 단일 염기 치환을 성공적으로 유도할 수 있음을 확인하였다.

일 예는 ( 1) 디아미나제, 및 이의 코딩 유전자, 및 (2) 표적 특이적 뉴클레아제 또는 이의 코딩 유전자를 포함하는 염기 교정용 조성물을 제공한다. 상기 염기 교정용 조성물은 진핵세포에서 염기 교정 (예컨대, 염기 치환) 활성을 갖는 것일 수 있다. 상기 진핵세포는 진핵 동물의 세포, 예컨대 배아 세포일 수 있으며, 일 구체예에서, 포유 동물 세포, 예컨대 포유 동물 배아세포일 수 있다.

본 명세서에 사용된 코딩 유전자는 cDNA , rDNA 또는 이를 포함하는 재조합 백터 , 또는 mRNA 형태로 사용될 수 있다. .

상기 디아미나제는 진핵세포에서 특정 염기에서 아민기를 제거하는 활성을 갖는 효소를 총칭하는 것으로, 예컨대, 시티딘을 우리딘으로 전환시키는 시티딘 디아미나제 및 /또는 아데노신 디아미나제일 수 있다. 일 예에서 상기 디아미나제는 APOBECl (apo l i poprotein B edi t ing comp l ex 1) , AID (act i vat i on- induced deaminase) , tadA ( tRNA-spec i f i c adenos ine deaminase) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다. 이와 같은 염기 전환 (예컨대, 시티딘을 우리딘으로 전환)에 의하여 진핵세포에서 단일 뉴클레오타이드 치환을 유도할 수 있다.

상기 표적 특이적 뉴클레아제는 RNA-가이드 뉴클레아제 및 표적 유전자의 표적 부위와 흔성화 가능한 (또는 상보적 핵산 서열을 갖는) 가이드 RNA 또는 이의 코딩 DNA (또는 코딩 DNA를 포함하는 재조합 백터)를 포함하는 것일 수 있다. 이 경우, 상기 염기 교정용 조성물은, ( 1) 디아미나제 또는―이의 코딩 유전자 ( m NA 또는 코딩 DNA를 포함하는 재조합 백터) , (2) 변형 RNA-가이드 뉴클레아제 또는 이의 코딩 유전자 (mRNA 또는 코딩 DNA를 포함하는 재조합 백터), 및 (3) 가이드 NA 또는 이의 코딩 DNA를 포함하는 것일 수 있다.

일 예에서, 상기 염기 교정용 조성물은, ( 1) 디아미나제 또는 이의 코딩 유전자 (mRNA 또는 코딩 DNA를 포함하는 재조합 백터), (2) RNA- 가이드 뉴클레아제 또는 이의 코딩 유전자 (mRNA 또는 코딩 DNA를 포함하는 재조합 백터) , 및 (3) 가이드 RNA 또는 이의 코딩 유전자 (DNA)에 더하여, (4) 우라실 DNA 글리코실라제 억제제 (uraci l DNA glycosyl ase inhi bi tor : UGI ) 또는 이의 코딩 유전자 및 /또는 (5) 핵위치화서열 (NLS) 또는 이의 코딩 유전자를 추가로 포함할 수 있다. 상기 염기 교정용 조성물에서, 상기 디아미나제, RNA-가이드 뉴클레아제, 및 임의로 UGI 및 /또는 NLS가 연결된 융합 단백질 또는 이들의 코딩 유전자가 연결된 융합 유전자 형태로 사용되는 경우, 각각의 단백질 또는 유전자 사이 중 하나 이상, 예컨대, 상기 디아미나제와 RNA—가이드 뉴클레아제 사이, 뉴클레아제와 UGI 사이, 및 UGI와 NLS 사이 중 하나 이상에 적절한 링커 (융합 단백질의 경우 펩타이드 링커 (3-30, 또는 3-20 아미노산), 융합 유전자의 경우 올리고뉴클레오타이드 링커 (9 내지 90 또는 9-60nt))를 추가로 포함할 수 있다ᅳ

일 예에서, 상기 RNA—가이드 뉴클레아제는 유전자 이중가닥 절단 활성을 상실하도록 ' 변형된 변형 RNA—가이드 뉴클레아제일 수 있다.

상기 변형 RNA-가이드 뉴클레아제는 표적 유전자의 한 가닥을 절단 (닉 (nick) 생성)하도록 변형된 변형 Cas9 (CRISPR 관련 단백질 9) 또는 변형 Cpfl (Prevotella 및 Francisella 1 유래 CRISPR) 시스템일 수 있다. 일 예에서, 상기 변형 RNA-가이드 뉴클레아제는 Cas9 니카아제 (Cas9 nickase; nCas9) 또는 촉미!활성 결핍 Cas9 (catalytical ly-def icient Cas9; dCas9) 등으로 이루어진 군에서 선택된 것일 수 있다.

상기 염기 교정용 조성물이 디아미나제 코딩 유전자 및 RNA-가이드 뉴클레아제 코딩 유전자를 포함하는 경우, 상기 코딩 유전자는 코딩 DNA 또는 mRNA일 수 있다. 또한. 상기 디아미나제 코딩 유전자 및 R A—가이드 뉴블레아제 코딩 유전자는 mR A 형태로 포함도ᅵ거나, 상기 유전자 (DNA)를 각각 별개의 백터에 포함하는 재조합 백터 (즉, 디아미나제 코딩 DNA를 포함하는 재조합 백터 및 RNA—가이드 뉴클레아제 코딩 DNA를 포함하는 재조합 백터) 또는 하나의 백터에 함께 포함하는 재조합 백터의 형태로 포함될 수 있다.

상기 가이드 RNA는 CRISPR RNA (crR A), trans-activating cr NA (tracrRNA), crRNA 및 tracrRNA (crRNA 및 tracrRNA의 복합체)를 포함하는 이중 가이드 RNA, 또는 단일 가이드 RNA (sgRNA)일 수 있다. 일 예에서, 상기 염기 교정용 조성물은 디아미나제 및 변형 RNA-가이드 뉴클레아제를 코딩하는 mRNA와 가이드 RNA를 포함하거나, 디아미나제 및 변형 RNA-가이드 뉴클레아제와 가이드 RNA를 포함하는 리보핵산단백질 (ribonucleoprotein; RNP)를 포함하는 것일 수 있다. 상기 리보핵산단백질은 디아미나제 및 변형 NA-가이드 뉴클레아제와 가이드 RNA를 흔합물 형태로 포함하거나, 디아미나제 및 변형 RNA -가이드 뉴클레아제와 가이드 RNA가 결합된 복합체 형태로 포함할 수 있다.

다른 예는 상기 염기 교정용 조성물을 세포에 도입시키는 단계를 포함하는ᅳ 염기 교정 방법을 제공한다. 상기 세포는 진핵세포일 수 있고, 상기 염기 교정 방법은 진핵세포에서 염기 교정 (예컨대, 염기 치환)을 수행하는 것일 수 있다ᅳ

상기 진핵세포는 진핵 동물의 세포, 예컨대, 진핵 동물의 배아 세포일 수 있으며, 일 구체예에서, 포유 동물 세포, 예컨대 포유 동물 배아 세포일 수 있다. 상기 염기 교정 방법에 의하여 진핵 세포 (예컨대, 진핵 동물 배아 세포)에서 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 97% 이상, 99% 이상 또는 100%의 염기 전환를 (염기 치환률)을 달성할 수 있다. 또한, 상기 염기 편집 방법은 염기 치환에 의해 유전자 (예컨대, 코딩 서열) 내에 종결코돈을 생성하여 상기 유전자를 불활성화 (knock ¬ out )시키거나, 단백질을 생성하지 않는 비코딩 DNA 서열에 변이를 도입하는 등, 다양한 돌연변이를 유발시킬 수 있다.

특히, 상기 염기 교정용 조성물은 포유 동물 배아에 적용되어, 소망하는 유전자가 불활성화되거나 소망하는 돌연변이가 유발된 포유 동물 성체 제작에 유용하게 적용될 수 있다.

상기 세포에 염기 교정용 조성물을 도입하는 단계는 상기 세포에 디아미나제 또는 디아미나제 코딩 유전자, RNA-가이드 뉴클레아제 또는 NA-가이드 뉴클레아제 코딩 유전자, 및 가이드 RNA 또는 가이드 RNA 코딩 유전자를 도입시키는 단계일 수 있다. 상기 코딩 유전자들 중 하나 이상은 각각 별개의 또는 하나의 재조합 백터에 포함되어 도입될 수 있다.

일 예에서, 상기 세포에 염기 교정용 조성물을 도입하는 단계는,

1) 상기 세포를 디아미나제 코딩 DNA , RNA-가이드 뉴클레아제 코딩 DNA , 및 가이드 RNA 코딩 유전자를 각각 포함하거나 이들 중 2 이상을 포함하는 재조합 백터로 형질감염시키거나,

2) 상기 세포에 디아미나제, RNA—가이드 뉴클레아제, 및 가이드 RNA (예컨대, 디아미나제, RNA-가이드 뉴클레아제, 및 가이드 RNA를 포함하는 흔합물 또는 복합체 형태의 리보핵산단백질)를 직접 주입하거나,

3) 상기 세포에 디아미나제 코딩 mRNA , RNA-가이드 뉴클레아제 코딩 mRNA 및 가이드 RNA의 흔합물 또는 이들 각각을 직접 주입하여 수행할 수 있다.

상기 직접 주입은 상기 2)의 디아미나제, NA-가이드 뉴클레아제, 및 가이드 RNA (예컨대, 디아미나제, RNA-가이드 뉴클레아제, 및 가이드 RNA를 포함하는 흔합물 또는 복합체 형태의 리보핵산단백질), 또는 3)의 디아미나제 코딩 mRNA , NA-가이드 뉴클레아제 코딩 mRNA 및 가이드 RNA가, 재조합 백터를 사용하지 않고, 세포막 및 /또는 핵막을 통과하여 유전체 (genome)에 전달되는 것을 의미할 수 있으며, 예컨대, 전기천공법, 리포펙션, 미세주입 (mi croinj ect i on) 등에 의하여 수행될 수 있다.

다른 예는 상기 염기 교정 방법에 의하여 교정된 염기를 포함하는 유전자 변형 세포를 제공한다. 상기 유전자 변형 세포는 상기 염기 교정에 의하여 표적 유전자에 염기 치환, 예컨대 단일 염기 치환 또는 점 돌연변이가 발생한 세포일 수 있다. 상기 세포는 진핵세포일 수 있다. 상기 진핵세포는 진핵 동물의 세포, 예컨대 배아 세포일 수 있으며, 일 구체예에서, 인간을 포함하거나 인간을 제외한 포유 동물 세포, 예컨대 인간을 포함하거나 인간을 제외한 포유 동물의 배아 세포일 수 있다.

다른 예는 염기 교정용 조성물이 주입된 포유 동물 배아 또는 상기 염기 교정 방법에 의하여 교정된 염기를 포함하는 유전자 변형 포유 동물 배아를 포유 동물의 난관에 이식하여, 유전자 변형 동물을 생산하는 단계를 포함하는, 유전자 변형 동물의 제조 방법을 제공한다. 상기 유전자 변형 포유 동물은 상기 염기 교정에 의하여 표적 유전자에 염기 치환, 예컨대 단일 염기 치환 또는 점 돌연변이가 발생한 배아로부터 발생한 동물일 수 있다.

상기 배아 세포를 난관에 이식받는 포유 동물은 상기 배아 세포가 유래하는 포유 동물과 동종의 포유류 (위탁모)일 수 있다.

다른 예는 상기 유전자 변형 세포로부터 얻어진 유전자 변형 동물을 제공한다. 상기 유전자 변형 동물은 상기 유전자 변형 동물의 제조 방법에 의하여 제조된 것일 수 있다. 상기 동물은 진핵 동물, 예컨대 인간을 포함하거나 인간을 제외한 포유 동물일 수 있다.

본 명세서에서 상기 염기 교정용 조성물이 적용되는 세포는 진핵 세포, 예컨대, 진핵 동물 세포일 수 있다. 상기 진핵 동물은 인간 등의 영장류, 마우스 등의 설치류를 포함하는 포유 동물일 수 있다. 상기 진핵 동물 세포는 포유 동물의 배아일 수 있다. 예컨대, 상기 배아는 과배란 유도된 암컷 포유 동물 (예컨대, PMSG (Pregnant Mare Serum Gonadotropin) , hCG (human Choi r ini c Gonadotropin) 등과 같은 생식선 호르몬 주입에 의한 과배란 유도 등)과 수컷 포유 동물을 교배하여 얻어진 수정된 배아를 상기 암컷 포유 동물의 난관에서 채취한 것일 수 있다. 상기 염기 교정용 조성물이 적용 (주입)되는 배아는 수정된 1-세포기의 배아 (zygote)일 수 있다.

본 명세서에 사용된 바로서, 용어 "염기 교정 (base editing)"은 표적 유전자 내의 표적 부위에 점돌연변이를 유발하는 염기 변이 (치환, 결실 또는 부가)를 의미하는 것으로, 소수의 염기 (하나 또는 두 개의 염기, 예컨대 하나의 염기)만이 변이된다는 점에서 비교적 다수의 염기의 변이를 수반하는 유전자 교정 (gene editing)과 구별될 수 있다. 상기 염기 교정은 유전자의 이중가닥 절단 (double-stranded DNA cleavage)를 수반하지 않는 것일 수 있다.

본 명세서에 사용된 바로서, 용어 "염기 변이 (또는 염기 치환) "은 해당 염기를 포함하는 뉴클레오타이드에 변이 (예컨대, 치환)이 일어난 것을 의미하는 것으로, "뉴클레오타이드 변이 (또는 뉴클레오타이드 치환)' '와 동일한 의미로 사용될 수 있으며, 이러한 염기 변이는 대립유전자 중 하나 또는 두 개 모두에서 일어날 수 있다.

일 예에서, 상기 염기 변이 또는 이를 수반하는 염기 교정은 표적 부위에 종료코돈을 생성시키거나, 야생형과 다른 아미노산을 코딩하는 코돈을 생성시킴으로써, 표적 유전자를 불활성화 (knock-out)시키거나, 단백질을 생성하지 않는 비코딩 DNA 서열에 변이를 도입하는 등 다양한 형태일 수 있으나, 이에 제한되는 것은 아니다.

본 명세서에서, 상기 염기 교정 또는 염기 변이는 생체 외 (in vitro) 또는 생체 내 (in vivo)에서 수행되는 것일 수 있다.

본 명세서에 사용된 바로서, 용어 "염기 서열' '은 해당 염기를 포함하는 뉴클레오타이드의 서열을 의미하는 것으로 뉴클레오타이드 서열 또는 핵산 서열과 동일한 의미로 사용될 수 있다.

본 명세서에 사용된 바로서,

'표적 유전자 ( tar g e t gene )'는 염기 교정 (또는 염기 변이 )의 대상이 되는 유전자를 의미하고,

'표적 부위 (target site or target region)'는 표적 유전자 내의 표적 특이적 뉴클레아제에 의한 염기 교정이 일어나는 부위를 의미하는 것으로, 일 예에서 상기 표적 특이적 뉴클레아제가 RNA-가이드 뉴클레아제 (RNA-guided engineered nuclease; RGEN)를 포함하는 것인 경우, 표적 유전자 내의 RNA-가이드 뉴클레아제가 인식하는 서열 (PAM 서열)의 5' 말단 및 /또는 3' 말단에 인접하여 위치하고, 최대 길이가 약 50bp 또는 약 40bp 인 유전자 부위 (이중 가닥 또는 이중 가닥 중 어느 하나의 단일 가닥)를 의미한다.

일 예에서, 상기 표적 특이적 뉴클레아제가 RNA—가이드 뉴클레아제를 포함하는 경우, 상기 RNA-가이드 뉴클레아제와 함께, 표적화 서열을 포함하는 가이드 RNA 를 포함할 수 있다. 상기 '표적화 서열 (targeting sequence)'은 표적 부위 내의 연속하는 약 15 내지 약 30 개, 약 15 내지 약 35 개, 약 17 내지 약 23 개, 또는 약 18 개 내지 약 22 개, 예컨대, 약 20 개의 뉴클레오타이드 (nt)를 포함하는 부위의 염기서열과 상보적인 염기서열을 포함하는 (흔성화 가능한) 가이드 RNA 의 부위일 수 있다. 상기 표적화 서열과 상보적인 염기서열을 포함하는 표적 부위의 염기서열을 '표적 서열 (target sequence) '이라고 칭할 수 있으며 , 상기 표적 서열은 RNA—가이드 뉴클레아제가 인식하는 PAM 서열의 5' 말단 및 /또는 3' 말단에 인접하여 위치하는 연속하는 약 15nt 내지 약 30nt, 약 15nt 내지 약 25nt , 약 17nt 내지 약 23nt, 또는 약 18nt 내지 약 22 nt , 예컨대, 약 20nt 길이의 염기서열을 의미할 수 있다.

상기 디아미나제는 진핵세포에서 특정 염기에서 아민기를 제거하는 활성을 갖는 효소를 총칭하는 것으로, 예컨대, 시티딘을 우리딘으로 전환시키는 시티딘 디아미나제 및 /또는 아데노신 디아미나제일 수 있다. 일 예에서 상기 디아미나제는 APOBEC (apolipoprotein B mRNA editing enzyme , catalytic polypept ide ~ l ike) 효소, AID (act i vat ion- induced deaminase) , tadA (tRNA-speci fic adenosine deaminase) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다. 상기 APOBECl, AID, 및 tadA는 대장균 등의 원핵동물 유래, 또는 인간을 포함하는 영장류, 마우스를 포함하는 설치류 등의 포유동물과 같은 진핵 동물 유래의 것일 수 있다.

일 구체예에서 , 상기 APOBEC 는 포유류, 예컨대 인간, 래트, 마우스 등에서 유래하는 APOBECl (apolipoprotein B editing complex 1), AP0BEC2 , AP0BEC3B, AP0BEC3C, AP0BEC3D, AP0BEC3E, AP0BEC3F , AP0BEC3G, AP0BEC3H, AP0BEC4 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.

상기 APOBECl는 인간 APOBECl (예컨대, GenBank Accession No.

NP_005880.2 (코딩 유전자: NM )05889.3) , NP_001291495.1 (코딩 유전자: NM_001304566.1), NP— 001635.2 (코딩 유전자: NM—001644.4) 등), 마우스 APOBECl (예컨대, GenBank Accession No. NP_001127863.1 (코딩 유전자: 匪 _001134391.1), NP_112436.1 (코딩 유전자: NM_031159.3) 등), 래트 AP0BEC1 (예컨대 , GenBank Accession No. NP— 037039.1 (서열번호 6) (코딩 유전자: M 312907.2) 등) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.

상기 AID는 인간 AID (예컨대, GenBank Accession No.

NP_001317272.1 (코딩 유전자: NM— 001330343.1), NP— 065712.1 (코딩 유전자: 匪ᅳ 020661.3) 등), 마우스 AID (예컨대, GenBank Accession No. NP_033775.1 (코딩 유전자: NMJ309645.2) 등) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.

상기 tadA는 대장균 tadA (예컨대, GenBank Accession No.

NP_417054.2, YP— 002408701.1 , ΥΡ_002413581.3 등) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.

이와 같은 염기 전환 (예컨대, 시티딘을 우리딘으로 전환)에 의하여 진핵세포에서 단일 뉴클레오타이드 치환을 유도할 수 있다ᅳ

상기 디아미나제는, 단백질, 이를 코딩하는 유전자 (예컨대, DNA 또는 mRNA), 또는 상기 유전자를 포함하는 재조합 백터의 형태로 사용될 수 있다.

본 명세서에 사용된 바로서, 표적 특이적 뉴클레아제는, 유전자 ' 가위 (programmable nuclease)라고도 불리며, 목적하는 유전체 DNA 상의 특정 위치를 인식하여 절단 (단일가닥 절단 또는 이중가닥 절단)할 수 있는 모든 형태의 뉴클레아제 (예컨대, 엔도뉴클레아제)를 통칭한다.

예컨대, 상기 표적 특이적 뉴클레아제는 표적 유전자의 특정 서열을 인식하고 뉴클레오티드 절단 활성을 가져 표적 유전자에서 인델 (insertion and/or deletion, Indel)을 야기할 수 있는 모든 뉴클레아제에서 선택된 1종 이상일 수 있다.

예컨대, 상기 표적 특이적 뉴클레아제는 미생물 면역체계인 CRISPR에서 유래한 RGEN (RNA-guided engineered nuclease; 예컨대, Cas 단백질 (예컨대, Cas9 등), Cpfl, 등) 등으로 이루어진 군에서 선택된 1종 이상을 포함하는 것일 수 있으나, 이에 제한되는 것은 아니다.

상기 표적 특이적 뉴클레아제는 원핵 세포, 및 /또는 인간 세포를 비롯한 동식물 세포 (예컨대, 진핵 세포)의 유전체에서 특정 염기서열을 인식해 이중나선절단 (double strand break, DSB)을 일으킬 수 있다. 상기 이중나선절단은 DNA의 이중 나선을 잘라, 둔단 (blunt end) 또는 점착종단 (cohesive end)을 생성시킬 수 있다. DSB는 세포 내에서 상동재조합 (homologous recombination) 또는 비상동재접합 (non-homologous end- joining, NHEJ) 기작에 의해 효율적으로 수선될 수 있는데, 이 과정에 소망하는 변이를 표적 위치에 도입할 수 있다.

일 구체예에서 , 상기 표적 특이적 뉴클레아제는 Cas 단백질 (예컨대,

Cas9 단백질 (CRISPR (Clustered regular ly interspaced short palindromic repeats) associated protein 9)), Cpf 1 단백질 (CRISPR from Prevotel la and Franci sella 1) 등과 같은 타입 Π 및 /또는 타입 V의 CRISPR 시스템에 수반되는 뉴클레아제 (예컨대, 엔도뉴클레아제) 등으로 이루어진 군에서 선택된 1종 이상일 수 있다. 이 경우, 상기 표적 특이적 뉴클레아제는 유전체 DNA의 표적 부위로 안내하기 위한 표적 DNA 특이적 가이드 RNA를 추가로 포함한다. 상기 가이드 RNA는 생체 외 (in vitro)에서 전사된 (transcribed) 것일 수 있고, 예컨대 올리고뉴클레오티드 이중가닥 또는 플라스미드 주형으로부터 전사된 것일 수 있으나, 이에 제한되지 않는다. 상기 표적 특이적 뉴클레아제는, 생체 외에서 또는 생체 (세포) 내 전달 후, 가이드 RNA에 결합된 리보핵산-단백질 복합체를 형성 (RNA— Guided Engineered Nuclease)하여 리보핵산 단백질 (RNP) 형태로 작용할 수 있다.

Cas 단백질은 CRISPR/Cas 시스템의 주요 단백질 구성 요소로, 활성화된 엔도뉴클레아제 또는 nickase를 형성할 수 있는 단백질이다.

Cas. 단백질 또는 유전자 정보는 NCBI (National Center for

Biotechnology Informat ion)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다. 예컨대, 상기 Cas 단백질은,

스트렙토코커스 sp. (Streptococcus sp.), 예컨대, 스트랩토코커스 피요게네스 {Streptococcus pyogenes) 유래의 Cas 단백질, 예컨대, Cas9 단백질 (예컨대 , SwissProt Accession number Q99ZW2(NP_269215.1));

캄필로박터 속, 예컨대, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas 단백질, 예컨대, Cas9 단백질;

스트렙토코커스 속, 예컨대, 스트렙토코커스 써모필러스 (Streptococcus ther ophi les) 또는 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas 단백질, 예컨대, Cas9 단백질;

네이세리아 메닝기디티스 [Neisseria meningitidis) 유래의 Cas 단백질, 예컨대ᅳ Cas9 단백질;

파스테우렐라 Uasteurella) 속, 예컨대, 파스테우렐라 물토시다 (PasteureJla multocida) 유래의 Cas 단백질, 예컨대 Cas9 단백질;

프란시셀라 Franc i sell a) 속, 예컨대, 프란시샐라 노비시다 (Francisella novicida) 유래의 Cas 단백질, 예컨대 Cas9 단백질

등으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.

Cpfl 단백질은 상기 CRISPR/Cas 시스템과는 구별되는 새로운 CRISPR 시스템의 엔도뉴클레아제로서, Cas9에 비해 상대적으로 크기가 작고 tracrRNA가 필요 없으며, 단일 가이드 RNA에 의해 작용할 수 있다. 또한, 티민 (thymine)이 풍부한 PAM (protospacerᅳ adjacent motif) 서열을 인식하고 DNA의 이중 사슬을 잘라 점착종단 (cohesive end; cohesive double-strand break)을 생성한다.

예컨대, 상기 Cpfl 단백질은 캔디다투스 Candida is) 속, 라치노스피라 iLachnospira) 속, 뷰티리비브리오 {Butyr ivibr io) 속, 페레그리니박테리아 Per egrini bacteria) , 액시도미노코쿠스 {AcidominococcLis) 속, 포르파이로모나스 ^Porphyro議 as) 속, 프레보텔라 {Prevotella) 속, 프란시셀라 U ancisel la) 속, 캔디다투스 메타노플라스마 Candidatus Methanoplaswa) , 또는 유박테리움 Eubacterium) 속 유래의 것일 수 있고, 예컨대, Parcubacteria bacterium (GWC2011— GWC2_44_17) , Lachnospiraceae bacterium (MC2017) , Butyr i vibrio proteoclasi icus , Peregrini bacteria , bacterium (GW2011_GWA_33_10) , AcidaminococcLis s . (BV3L6) , Porphyromona s macacae, Lachnospiraceae bacterium (ND2006) , Porphyromonas crevior icanis , Prevotel la disiens, Mo r axel la bovocul i (237) , Smi ihella sp. (SC_K08D17) , Leptospira inadai , Lachnospiraceae bacterium (MA2020) , Franci sel la novicida (U112) , Car i da t us Methanoplas a term /turn, Candidatus Paceibacter , Eubacterium eligens등의 미생물 유래의 것일 수 있으나, 이에 제한되는 것은 아니다 . 상기 표적 특이적 뉴클레아제는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법 등과 같이 인위적 또는 비자연적 생산된 것 (non- naturally occurring)일 수 있다. 상기 표적 특이적 뉴클레아제는 in vitro에서 미리 전사된 mRNA 또는 미리 생산된 단백질 형태, 또는 표적 세포 또는 생체 내에서 발현하기 위하여 재조합 백터에 포함된 형태로 사용될 수 있다. 일 예에서, 상기 표적 특이적 뉴클레아제 (예컨대, Cas9, Cpfl, 등)는 재조합 DNMRecombinant DNA; rDNA)에 의하여 만들어진 재조합 단백질일 수 있다. 재조합 DAN는 다양한 유기체로부터 얻어진 이종 또는 동종 유전 물질을 포함하기 위하여 분자 클로닝과 같은 유전자 재조합 방법에 의하여 인공적으로 만들어진 DNA 분자를 의미한다. 예컨대, 재조합 DNA를 적절한 유기체에서 발현시켜 표적 특이적 뉴클레아제를 생산 { in vivo 또는 in w ro)하는 경우, 재조합 DNA는 제조하고자 하는 단백질을 코딩 하는 코돈들 중에서 상기 유기체에 발현하기에 최적화된 코돈을 선택하여 재구성된 뉴클레오타이드 서열을 갖는 것일 수 있다.

본 명세서에서 사용된 상기 표적특이적 뉴클레아제는 변이된 형태의 변이 표적특이적 뉴클레아제일 수 있다. 상기 변이 표적특이적 뉴클레아제는 DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실하도록 변이된 것을 의미할 수 있으며, 예컨대, 엔도뉴클레아제 활성을 상실하고 니카아제 활성을 갖도록 변이된 변이 표적특이적 뉴클레아제 및 엔도뉴클레아제 활성과 니카아제 활성을 모두 상실하도록 변이된 변이 표적특이적 뉴클레아제 중에서 선택된 1종 이상일 수 있다. 상기 변이 표적특이적 뉴클레아제가 니카아제 활성을 갖는 것인 경우, 상기 디아미나제에 의한 염기변환 (예컨대, 시티딘이 우라딘으로 변환)과 동시 또는 순서와 무관하게 순차적으로, 상기 염기 변환이 일어난 가닥 또는 그 반대 가닥 (예컨대, 염기 변환이 일어난 가닥의 반대 가닥)에서 ni ck이 도입될 수 있다 (예컨대, PAM 서열의 5 ' 말단 방향으로 3번째 뉴클레오타이드와 4번째 뉴클레오타이드 사이에 ni ck이 도입됨) . 이와 같은 표적특이적 뉴클레아제의 변이 (예컨대, 아미노산 치환 등)는 적어도 뉴클레아제의 촉매 활성 도메인 (예컨대, Cas9의 경우 RuvC 촉매 도메인)에서 일어나는 것일 수 있다. 일 예에서, 상기 표적특이적 뉴클레아제가 스트템토코커스 피요젠스 유래 Cas9 단백질 (Swi ssProt Access ion number Q99Zf2(NP_269215. 1); 서열번호 4)인 경우, 상기 변이는 촉매 활성을 갖는 아스파르트산 잔기 ' (catalyt i c aspartate res idue ; 예컨대, 서열번호 4의 경우 10번째 위치의 아스파르트산 (D10) 등), 서열번호 4의 762번째 위치의 글루탐산 (E762) , 840번째 위치의 히스티딘 (H840) , 854번째 위치의 아스파라긴 (N854) , 863번째 위치의 아스파라긴 (N863) , 986번째 ' 위치의 아스파르트산 (D986) 등으로 이루어진 군에서 선택된 하나 이상 임의의 다른 아미노산으로 치환된 돌연변이를 포함할 수 있다. 이 때, 치환되는 임의의 다른 아미노산은 알라닌 (al anine)일 수 있지만, 이에 제한되지 않는다. 다른 예에서, 상기 변이 표적특이적 뉴클레아제는 야생형 Cas9 단백질과 상이한 PAM 서열을 인식하도록 변이된 것일 수 있다. 예컨대, 상기 변이 표적특이적 뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 1135번째 위치의 아스파르트산 (D1135) , 1335번째 위치의 아르기닌 (R1335) , 및 1337번째 위치의 트레오닌 (T1337) 중 하나 이상, 예컨대 3개 모두가 다른 아미노산으로 치환되어, 야생형 Cas9의 PAM 서열 (NGG)와 상이한 NGA (N은 A , T , G , 및 C 중에서 선택된 임의의 염기임)을 인식하도록 변이된 것일 수 있다.

일 예에서, 상기 변이 표적특이적 뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 아미노산 서열 (서열번호 4) 중,

( 1) DIO , H840 , 또는 D10 + H840 ;

(2) D1135 , R1335 , T1337 , 또는 D1135 + R1335 + T1337 ; 또는

(3) ( 1)과 (2) 잔기 모두

에서 아미노산 치환이 일어난 것일 수 있다.

본 명세서에 사용된 바로서,' 상기 '다른 아미노산 1 은, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 발린, 아스파라긴산, 시스테인, 글투타민, 글리신, 세린, 트레오닌, 티로신, 아스파르트산, 글루탐산, 아르기닌, 히스티딘, 라이신, 상기 아미노산들의 공지된 모든 변형체 중에서, 야생형 단백질이 원래 변이 위치에 갖는 아미노산을 제외한 아미노산들 중에서 선택된 아미노산을 의미한다. 일 예에서, 상기 '다른 아미노산'은 알라닌, 발린, 글루타민. 또는 아르기닌일 수 있다.

일 예에서, 상기 변이 표적특이적 뉴클레아제는 엔도뉴클레아제 활성을 상실 (예컨대, 니카아제 활성을 갖거나, 엔도뉴클레아제 활성 및 니카아제 활성을 모두 상실)한 변형 Cas9 단백질, 또는 야생형 Cas9과 상이한 PAM 서열을 인식하는 것일 수 있다. 예컨대, 상기 변형 Cas9 단백질은, 스트랩토코커스 피요제네스 { Streptococcus pyogenes) 유래의 Cas9 단백질 (서열번호 4)에 있어서 ,

( 1 ) D10 또는 H840 위치에 돌연변이 (예컨대, 다른 아미노산으로의 치환)가 도입되어 엔도뉴클레아제 활성이 상실되고 니카아제 활성을 갖는 변형 Cas9 , 또는 스트렙토코커스 피요젠스 { Streptococcus pyogenes) 유래의 Cas9 단백질에 D10 및 H840 위치에 모두 돌연변이 (예컨대, 다른 아미노산으로의 치환)가 도입되어 엔도뉴클레아제 활성 및 니카아제 활성을 모두 상실한 변형 Cas9 단백질;

(2) D1135 , R1335 및 T1337 중에서 하나 이상 또는 이들 모두에 돌연변이 (예컨대, 다른 아미노산으로의 치환)가 도입되어 야생형과 상이한 PAM 서열을 인식하는 변형 Cas9 단백질; 또는

(3) ( 1 ) 및 (2)의 돌연변이가 모두 도입되어 니카아제 활성을 갖고 야생형과 상이한 PAM 서열을 인식하거나, 엔도뉴클레아제 활성 및 니카아제 활성을 모두 상실하고 야생형과 상이한 PAM 서열을 인식하는 변형 Cas9 단백질

일 수 있다.

예컨대, 상기 CAs9 단백질의 D10 위치에서의 돌연변이는 D10A 돌연변이 (Cas9 단백질의 아미노산 중 10번째 아미노산인 D가 A로 치환된 돌연변이를 의미함; 이하, Cas9에 도입된 돌연변이는 동일한 방법으로 표기됨)일 수 있고, 상기 H840 위치에서의 돌연변이는 H840A 돌연변이일 수 있으며, D1135 , R1335 , 및 T1337 위치에서의 돌연변이는 각각 D1135V , R1335Q , 및 T1337R일 수 있다.

본 명세서에서, "뉴클레아제 "는, 다른 언급이 없는 한, 앞서 설명된, 예컨대, Cas9 , Cpf l , 등과 같은 "표적 특이적 뉴클레아제"를 의미한다.

상기 뉴클레아제는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법 등과 같이 인위적 또는 비자연적 생산된 것 (non-na iral ly occurr i ng)일 수 있다. 일 예에서, 상기 뉴클레아제 (예컨대, Cas9 , Cpf l , 등)은 재조합 DNA에 의하여 만들어진 재조합 단백질일 수 있다. 재조합 DAN(Recomb i nant DNA ; rDNA)는 다양한 유기체로부터 얻어진 이종 또는 동종 유전 물질을 포함하기 위하여 분자 클로닝과 같은 유전자 재조합 방법에 의하여 인공적으로 만들어진 DNA 분자를 의미한다. 예컨대 , 재조합 DNA를 적절한 유기체에서 발현시켜 단백질 (뉴클레아제)를 생산 Un vivo 또는 in w ' ro)하는 경우, 재조합 DNA는 제조하고자 하는 단백질을 코딩 하는 코돈들 중에서 상기 유기체에 발현하기에 최적화된 코돈을 선택하여 재구성된 뉴클레오타이드 서열을 갖는 것일 수 있다.

상기 뉴클레아제는, 단백질, 이를 코딩하는 핵산 분자 (예컨대, DNA 또는 m NA) , 가이드 RNA와 결합된 리보핵산 단백질, 상기 리보핵산 단백질을 코딩하는 핵산 분자, 또는 상기 핵산 분자를 포함하는 재조합 백터의 형태로 사용될 수 있다.

상기 디아미나제 및 뉴클레아제, 및 /또는 이들을 코딩하는 핵산 분자는 핵 내로 전달, 작용, 및 /또는 핵 내에서 발현될 수 있는 형태일 수 있다.

상기 디아미나제 및 뉴클레아제는 세포 내로 도입되기에 용이한 형태일 수 있다. 일 예로, 상기 디아미나제 및 뉴클레아제는 세포 침투 펩타이드 및 /또는 단백질 전달 도메인 (protein transduct i on domain)과 연결될 수 있다. 상기 단백질 전달 도메인은 폴리-아르기닌 또는 HIV 유래의 TAT 단백질일 수 있으나, 이에 제한되지 않는다. 세포 침투 펩타이드 또는 단백질 전달 도메인은 상기 기술된 예 외에도 다양한 종류가 당업계에 공지되어 있으므로, 당업자는 상기 예에 제한되지 않고 다양한 예를 적용할 수 있다.

또한, 상기 디아미나제 및 뉴클레아제, 및 /또는 이들을 코딩하는 핵산 분자는 핵 위치 신호 (nuc l ear l oca l i zat i on s ignal ( NLS) 서열 또는 이를 코딩하는 핵산 서열을 추가로 포함할 수 있다. 따라서, 상기 디아미나제 코딩 핵산 분자 및 /또는 뉴클레아제 코딩 핵산 분자를 포함하는 발현 카세트는 상기 디아미나제 및 /또는 뉴클레아제를 발현시키기 위한 프로모터 서열 등의 조절 서열, 및, 임의로, NLS 서열 (서열번호 13)을 추가로 포함할 수 있다. 상기 NLS 서열은 당업계에 잘 알려져 있다.

상기 디아미나제 및 뉴클레아제, 및 /또는 이를 코딩하는 핵산 분자는 분리 및 /또는 정제를 위한 태그 또는 상기 태그를 코딩하는 핵산 서열과 연결될 수 있다. 일 예로, 상기 태그는 Hi s 태그, Fl ag 태그, S 태그 등과 같은 작은 펩타이드 태그, GST (Glutathione S-transf erase) 태그, MBP (Mal tose binding protein) 태그 등으로 이루어진 군에서 적절하게 선택될 수 있으나, 이에 제한되지 않는다.

또한, 본 명세서에 사용된 염기 교정용 조성물은 우라실 DNA 글리코실라제 억제제 (urac i l DNA glycosyl ase inhibi tor : UGI ) 또는 이의 코딩 유전자 (코딩 DNA를 포함하는 재조합 백터 형태 또는 in vi tro 전사된 m NA 형태 등)를 추가로 포함할 수 있다. 상기 염기 교정용 조성물이 우라실 DNA 글리코실라제 억제제를 추가로 포함하는 경우, 이를 포함하지 않는 경우와 비교하여, 디아미나제에 의한 특정 염기 치환 (예컨대 시토신 디아미나제에 의한 C에서 T로의 치환)의 비율이 높아지며, 우라실 DNA 글리코실라제 억제제를 추가로 포함하지 않는 경우에는 특정 염기 치환 (예컨대 시토신 디아미나제에 의한 C에서 T로의 치환) 이외의 형태의 염기 치환 비율이 높아진다 (즉, 다양한 형태의 염기 치환이 일어남) . 일 예에서 , 상기 우라실 DNA 글리코실라제 억제제는 서열번호 12에 의하여 코딩되는 것일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에서, 용어 "가이드 RNA (guide RNA)"는 표적 유전자 내의 표적 부위 내의 특이적인 염기 서열 (표적서열)에 흔성화 가능한 표적화 서열을 포함하는 RNA를 의미하며, 생체 외 (in vitro) 또는 생체 (또는 세포) 내에서 Cas 단백질, Cpfl 등과 같은 뉴클레아제와 결합하여 이를 표적 유전자 (또는 표적 부위)로 인도하는 역할을 한다.

상기 가이드 RNA는 복합체를 형성할 뉴클레아제의 종류 및 /또는 그 유래 미생물에 따라서 적절히 선택될 수 있다.

예컨대, 상기 가이드 RNA는,

표적 서열과 흔성화 가능한 부위 (표적화 서열)을 포함하는 CRISPR RNA (crRNA);

Cas 단백질, Cpfl 등과 같은 뉴클레아제와 상호작용하는 부위를 포함하는 ra35 ~ activating crRNA (tracrRNA); 및

상기 crRNA 및 tracrRNA의 주요 부위 (예컨대, 표적화 서열을 포함하는 crRNA 부위 및 뉴클레아제와 상호작용하는 tracrRNA의 부위)가 융합된 형태의 단일 가이드 RNA (single guide RNA; sgRNA)

로 이루어진 군에서 선택된 1종 이상일 수 있으며,

구체적으로 CRISPR RNA (crRNA) 및 fra^act ivat ing crRNA (tracrRNA)를 포함하는 이중 RNA (dual RNA), 또는 crRNA 및 tracrRNA의 주요 부위를 포함하는 단일 가이드 RNA (sgRNA)일 수 있다.

상기 sgRNA는 표적 유전자 (표적 부위) 내의 표적 서열과 상보적인 서열 (표적화 서열)을 가지는 부분 (이를 Spacer region, Target DNA recognition sequence, base pairing region 등으로도 명명함) 및 Cas 단백질 결합을 위한 hairpin 구조를 포함할 수 있다. 보다 구체적으로, 표적 유전자 내의 표적서열과 상보적인 서열 (표적화 서열)을 포함하는 부분, Cas 단백질 결합을 위한 hairpin 구조, 및 Terminator 서열올 포함할 수 있다. 상기 기술된 구조는 5'에서 3' 순으로 순차적으로 존재하는 것일 수 있으나, 이에 제한되는 것은 아니다. 상기 가이드 RNA가 crRNA 및 tracrRNA의 주요 부분 및 표적 DNA의 상보적인 부분을 포함하는 경우라면 어떠한 형태의 가이드 RNA도 본 발명에서 사용될 수 있다.

예컨대, Cas9 단백질은 표적 유전자 교정을 위하여 두 개의 가이드 RNA, 즉, 표적 유전자의 표적 부위와 흔성화 가능한 뉴클레오타이드 서열을 갖는 CRISPR RNA (crRNA)와 Cas9 단백질와 상호작용하는 5 ~ act ivat ing crRNA (tracrRNA; Cas9 단백질과 상호작용함)를 필요로 하며, 이들 crRNA와 tracrRNA는 서로 결합된 이중 가닥 crRNA: tracrRNA 복합체 형태, 또는 링커를 통하여 연결되어 단일 가이드 RNA (single guide RNA; sgRNA) 형태로 사용될 수 있다. 일 예에서 , Streptococcus pyogenes 유래의 Cas9 단백질을 사용하는 경우, sgRNA는 적어도 상기 crRNA의 흔성화 가능한 뉴클레오타이드 서열을 포함하는 crRNA 일부 또는 전부와 상기 Cas9의 tracrRNA의 Cas9 단백질와 상호작용하는 부위를 적어도 포함하는 tracrRNA 일부 또는 전부가 뉴클레오타이드 링커를 통하여 해어핀 구조 (stem-loop 구조)를 형성하는 것일 수 있다 (이 때 뉴클레오타이드 링커가 루프 구조에 해당할 수 있음).

상기 가이드 RNA, 구체적으로 crRNA 또는 sgRNA는 표적 유전자 내 표적 서열과 상보적인 서열 (표적화 서열)을 포함하며 , crRNA 또는 sgRNA의 업스트림 부위, 구체적으로 sgRNA 또는 dualRNA의 crRNA의 5' 말단에 하나 이상, 예컨대, 1-10개, 1-5개, 또는 1-3개의 추가의 뉴클레오티드를 포함할 수 있다. 상기 추가의 뉴클레오티드는 구아닌 (guanine, G)일 수 있으나, 이에 제한되는 것은 아니다.

다른 예에서, 상기 뉴클레아제가 Cpfl인 경우, 상기 가이드 RNA는 crRNA을 포함하는 것일 수 있으며, 복합체를 형성할 Cpfl 단백질 종류 및 /또는 그 유래 미생물에 따라서 적절히 선택될 수 있다.

상기 가이드 RNA의 구체적 서열은 뉴클레아제 (Cas9 또는 Cpfl)의 종류 (즉, 유래 미생물)에 따라서 적절히 선택할 수 있으며, 이는 이 발명이 속하는 기술 분야의 통상의 지식을 가진 자가 용이하게 알 수 있는 사항이다.

일 예에서, 표적특이적 뉴클레아제로서 Streptococcus pyogenes 유래의 Cas9 단백질을 사용하는 경우, crRNA는 다음의 일반식 1로 표현될 수 있다:

5 ' -(N cas9 ) (GUUUUAGAGCUA)-(X cas9 ) m -3 ' (일반식 1)

상기 일반식 1에서,

N cas9 는 표적화 서열, 즉 표적 유전자 (target gene)의 표적 부위 (target site)의 서열에 따라서 결정되는 부위 (표적 부위의 표적 서열과 흔성화 가능)이며, 1은 상기 표적화 서열에 포함된 뉴클레오타이드 수를 나타내는 것으로 15 내지 30, 17 내지 23, 또는 18 내지 22의 정수, 예컨대 20일 수 있고,

상기 표적화 서열의 3' 방향으로 인접하여 위치하는 연속하는 12개의 뉴클레오타이드 (GUUUUAGAGCUA) (서열번호 1)를 포함하는 부위는 crRNA의 필수적 부분이고,

X cas9 는 crRNA의 3' 말단쪽에 위치하는 (즉, 상기 crRNA의 필수적 부분의 3' 방향으로 인접하여 위치하는) m개의 뉴클레오타이드를 포함하는 부위로 m은 8 내지 12의 정수, 예컨대 11일 수 있으며, 상기 m개의 뉴클레오타이드들은 서로 같거나 다를 수 있으며, 각각 독립적으로 A, U, C 및 G로 이루어진 군에서 선택될 수 있다.

일 예에서 , 상기 X cas9 는 UGCUGUUUUG (서열번호 2)를 포함할 수 있으나 이에 제한되지 않는다.

또한, 상기 tracrRNA는 다음의 일반식 2로 표현될 수 있다:

(일반식 2)

상기 일반식 2에서,

60개의 뉴클레오타이드

(서열번호 3)로 표시된 부위는 tracrRNA의 필수적 부분이고,

Y cas9 는 상기 tracrRNA의 필수적 부분의 5' 말단에 인접하여 위치하는

P개의 뉴클레오타이드를 포함하는 부위로, p는 6 내지 20의 정수, 예컨대 8 내지 19의 정수일 수 있으며, 상기 p개의 뉴클레오타이드들은 서로 같거나 다를 수 있고, A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.

또한, sgRNA는 상기 crRNA의 표적화 서열과 필수적 부위를 포함하는 crRNA 부분과 상기 tracrRNA의 필수적 부분 (60개 뉴클레오타이드)를 포함하는 tracrRNA 부분이 올리고뉴클레오타이드 링커를 통하여 헤어핀 구조 (stem-loop 구조)를 형성하는 것일 수 있다 (이 때, 올리고뉴클레오타이드 링커가 루프 구조에 해당함). 보다 구체적으로, 상기 sgRNA는 crRNA의 표적화 서열과 필수적 부분을 포함하는 crRNA 부분과 tracrRNA의 필수적 부분을 포함하는 tracrRNA 부분이 서로 결합된 이중 가닥 RNA 분자에서, crRNA 부위의 3' 말단과 . tracrRNA 부위의 5' 말단이 올리고뉴클레오타이드 링커를 통하여 연결된 헤어핀 구조를 갖는 것일 수 있다. 링커)ᅳ

(일반식 3)

상기 일반식 3에서, (N cas9 )!는 표적화 서열로서 앞서 일반식 1에서 설명한 바와 같다.

상기 sgRNA에 포함되는 올리고뉴클레오타이드 링커는 3 내지 5개, 예컨대 4개의 뉴클레오타이드를 포함하는 것일 수 있으며, 상기 뉴클레오타이드들은 서로 같거나 다를 수 있고, A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.

상기 crRNA 또는 sgRNA는 5' 말단 (즉, crRNA의 타겟팅 서열 부위의 5' 말단)에 1 내지 3개의 구아닌 (G)을 추가로 포함할 수 있다.

상기 tracrRNA 또는 sgRNA는 tracrRNA의 필수적 부분 (60nt)의 3' 말단에 5개 내지 7개의 우라실 (U)을 포함하는 종결부위를 추가로 포함할 수 있다.

상기 가이드 RNA의 표적 서열은 표적 DNA 상의 PAM (Protospacer Adjacent Motif 서열 (5. pyogenes Cas9의 경우, 5'-NGG—3' (N은 A, T, G, 또는 C임))의 5'에 인접하여 위치하는 약 17개 내지 약 23개 또는 약 18개 내지 약 22개, 예컨대 20개의 연속하는 핵산 서열일 수 있다.

상기 가이드 NA의 표적 서열과 흔성화 가능한 가이드 RNA의 표적화 서열은 상기 표적 서열이 위치하는 DNA 가닥 (즉, PAM 서열 (5'ᅳ NGG— 3' (N은 A, T, G, 또는 C임 )이 위치하는 DNA 가닥) 또는 이의 상보적인 가닥의 뉴클레오타이드 서열과 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 서열 상보성을 갖는 뉴클레오타이드 서열을 의미하는 것으로, 상기 상보적 가닥의 뉴클레오타이드 서열과 상보적 결합이 가능하다. .

본 명세서에서, 표적 부위의 핵산 서열 (표적 서열)은 표적 유전자의 해당 유전자 부위의 두 개의 DNA 가닥 중 PAM 서열이 위치하는 가닥의 핵산 서열로 표시된다. 이 때, 실제로 가이드 RNA가 결합하는 DNA 가닥은 PAM 서열이 위치하는 가닥의 상보적 가닥일 수 있으므로, 상기 가이드 NA에 포함된 표적화 서열은, RNA 특성상 T를 U로 변경하는 것을 제외하고, 표적 서열과 동일한 핵산 서열을 가질 수 있다. 따라서, 본 명세서에서, 가이드 RNA의 표적화 서열과 표적 서열은 T와 U가 상호 변경되는 것을 제외하고 동일한 핵산 서열로 표시된다.

상기 가이드 RNA는 RNA 형태로 사용 (또는 상기 조성물에 포함)되거나, 이를 코딩하는 DNA를 포함하는 플라스미드 형태로 사용 (또는 상기 조성물에 포함)될 수 있다.

【발명의 효과】

본 명세서에 기술된 바에 따라서, 디아미나제 및 표적 특이적 뉴클레아제를, 예컨대, mRNA 또는 RNP의 형태로 microinjection 또는 electroporation 방법으로, 포유 동물 (예컨대, 마우스) 세포에 주입함으로써, 포유 동물 세포 내의 표적 유전자 또는 표적 부위에서 효율적으로 염기 편집 (예컨대, 단일 염기 치환)을 수행할 수 있고, 이러한 염기 편집이 포유 동물 배아에서 수행되는 경우, 상기 염기 편집으로 인한 점돌연변이가 유발된 개체로 성공적으로 발생시킬 수 있다. 이러한 결과는 다아미나제 및 표적 특이적 뉴클레아제를 이용하여 단일 아미노산 치환 또는 난센스 돌연변이가 유발된 다양한 동물 모델을 제작할 수 있을 뿐 아니라, 인간 배아의 유전적 결함 수정에의 적용 가능성을 보여준다.

【도면의 간단한 설명】

도 la 내지 le는 시티딘 디아미나제 매개 염기 교정에 의해 생성된 디스트로핀 결핍 변이 '마우스 (dystrophin一 deficient mutant mice)와 관련된 것으로,

도 la는 디스트로핀 유전자 (Ζ¾7ί/)의 표적 부위의 핵산 서열을 보여주고 (ΡΑΜ 서열 (NGG)은 파란색으로, sgRNA의 표적 서열은 검은색으로 나타내고, 시티딘 디아미나제 매개 염기 교정에 의해 치환된 염기는 붉은 색으로 표시함),

도 lb는 염기교정제 3 (BE3) (rAP0BECl-nCas9-UGI) 코딩 mRNA 및 도 la의 Dmd 유전자의 표적 서열과 흔성화 가능한 sgRNA를 마우스 접합체 (zygote)에 미세주입한 후 발생된 신생개체의 /¾ ^유전자 표적 부위 핵산 서열을 정렬한 결과를 보여주고 (Wt, 야생형; 표적 서열은 밑줄로 표시함; PAM 서열은 파란색으로, 치환된 염기는 붉은색으로 각각 표시함; 오른쪽 열의 'frequency .(%)'는 변이 (염기 치환)된 대립 유전자의 빈도를 나타내고, 는 해당 위치에 뉴클레오타이드가 존재하지 않음 (결실)을 나타냄; 왼쪽 열의 수치는 돌연변이 마우스 번호임), 도 lc는 야생형 및 Dmd 돌연변이 마우스 D108의 DNA의 Sanger sequencing chromatograms을 보여주고 (화살표는 치환된 염기를 나타내며, 염기 치환에 의하여 Gin 코딩 코돈이 종료코돈으로 변이된 것을 보여줌), 도 Id는 야생형 및 Zfe 돌연변이 마우스 D108의 전방 경골 (tibialis anterior; TA) 근육의 조직학적 분석 (형광 분석) 결과를 보여주고 (라미닌 (Laminin): 대조군; 4주령의 야생형 마우스 또는 Dmd 돌연변이 마우스 (D108)로부터 근육을 채취하고 liquid nitrogen-cooled isopentane에서 동결시켜서 근육 시료를 준비함.; 스케일 바: 50 μα) ,

도 le는 Ζ¾ί /유전자의 표적 부위에 염기치환 돌연변이를 유도한 과정 및 결과를 정리하여 보여준다.

도 2a 내지 2e는 시티딘 디아미나제 매개 염기 교정에 의해 생성된 백색증 마우스과 관련된 것으로,

도 2a는 티로시나제 유전자 (7 의 표적 부위의 핵산 서열을 보여주고 (PAM 서열 (NGG)은 파란색으로, sgRNA의 표적 서열은 검은색으로 나타내고, 시티딘 디아미나제 매개 염기 교정에 의해 치환된 염기는 붉은 색으로 표시함),

도 2b는 염기교정제 3 (BE3) (rAP0BECl-nCas9-UGI) RNP (BE3와 도 2a의 Tyr 유전자의 표적 서열과 흔성화 가능한 sgRNA와의 복합체)의 전기천공법에 의한 마우스 접합체 (zygote) 내로의 도입 후 발생된 신생 개체의 Tyr 유전자 표적 부위의 핵산 서열을 정렬한 결과를 보여주고 (Wt, 야생형; 표적 서열은 밑즐로 표시함; PAM 서열은 파란색으로, 치환된 염기는 붉은색으로 각각 표시함; 오른쪽 열의 'frequency ( >)'는 변이 (염기 치환)된 대립 유전자의 빈도를 나타내고, '-'는 해당 위치에 뉴클레오타이드가 존재하지 않음을 나타냄 ; 왼쪽 열의 수치는 Tyr 돌연변이 마우스 번호임),

도 2c는 야생형 및 Tyr 돌연변이 마우스 T113 및 T114의 DNA의 Sanger sequencing chromatograms을 보여주고 (화살표는 치환된 염기를 나타내며, 염기 치환에 의하여 Gin 코딩 코돈이 종료코돈으로 변이된 것을 보여줌),

도 2d는 BE3 RNP의 전기천공 주입 후에 발생한 Tyr 돌연변이 마우스들의 눈에 백색증 (화살표, T113 및 T114)이 나타남을 보여주고,

도 2e는 Tyr유전자의 표적 부위에 염기치환 돌연변이를 유도한 과정 및 결과를 정리하여 보여준다.

도 3a 및 3b는 BE3(디아미나제 -Cas9) mRNA와 sgRNA의 마우스 배아에의 미세주입에 의한 마우스 배아에서의 표적 돌연변이 유발을 보여주는 것으로, 보다 구체적으로, BE3 코당 mRNA와 sgRNA를 마우스 접합체에 미세주입 후 발생된 포배 (bl astocyst )의 표적 유전자 U d 및 7 / 의 표적 부위의 핵산 서열을 정렬한 결과를 보여준다 (3a : Dmd 변이 결과; 3b : Tyr 변이 결과; , 야생형 ; 표적 서열은 밑줄로 표시함; PAM 서열은 파란색으로, 치환된 염기는 붉은색으로 각각 표시함; 오른쪽 열의 ' frequency (%) '는 변이 (염기 치환)된 대립 유전자의 빈도를 나타내고, 'ᅳ '는 해당 위치에 뉴클레오타이드가 존재하지 않음 (결실됨)을 나타냄; 왼쪽 열의 수치는 돌연변이 마우스 배아세포의 번호임) .

도 3은 야생형 및 Ζ¾7ί/돌연변이 마우스들의 DNA의 Sanger sequenc ing chroma tograms을 보여준다 (화살표는 치환된 염기를 나타냄)

도 4는 잠재적인 비표적 부위 (of f— target s i te)에서의 돌연변이 여부를 시험한 결과를 보여주는 그래프로서, 비표적 부위에서 돌연변이가 거의 유발되지 않음을 확인할 수 있다 U)md 돌연변이 마우스 (n = 3)의 비표적 부위에서의 돌연변이 (염기 교정) 비율 (%)는 심부 시퀀싱 (Targeted deep sequenc ing)에 의하여 측정됨; 미스매치 뉴클레오타이드 및 PAM 서열은 각각 적색 및 청색으로 표시됨) .

도 5는 잠재적인 비표적 부위 (of fᅳ target s i te)에서의 τ돌연변이 여부를 시험한 결과를 보여주는 그래프로서, 비표적 부위에서 돌연변이가 거의 유발되지 않음을 확인할 수 있디- { Tyr 돌연변이 마우스 (n = 2)의 비표적 부위에서의 돌연변이 (염기 교정) 비율 (%)는 심부 시뭔싱 (Targeted deep sequenc ing)에 의하여 측정됨; 미스매치 뉴클레오타이드 및 PAM 서열은 각각 적색 및 청색으로 표시됨) .

도 6은 pCMV-BE3 백터의 개열지도이다.

도 7은 pET-Hi sx6-rAP0BECl-XTEN-nCas9-UGI-NLS 백터의 개열지도이다.

【발명을 실시하기 위한 구체적인 내용】

이하에서는 실시예를 들어 본 발명을 더욱 구체적으로 설명하고자 하나, 이는 예시적인 것에 불과할 뿐 본 발명의 범위를 제한하고자 함이 아니다. 아래 기재된 실시예들은 발명의 본질적인 요지를 벗어나지 않는 범위에서 변형될 수 있음은 당 업자들에게 있어 자명하다. 실시예 1: BE3 mRNA준비

PCMV-BE3 (Addgene; cat . #73021; 도 6)로부터 rAPOBECl-XTEN (링커) 및 UGI (uracil DNA glycosylase inhibitor)를 절단하여 분리한 후, pET- nCas9(D10A)-NLS 백터 (Cho, S.W. et al . Analysis of off-target effects of ' CRISPR/Casᅳ derived RNA-gu i ded endonuc leases and nickases. Genome Res 24, 132-141 .(2014) 참조)에 삽입하여, pET_Hisx6-rAP0BECl— XTEN- nCas9-UGI-NLS (서열번호 7; 도 7)를 제작하고, 이를 BE3 mRNA 주형으로 사용하였다.

pET-Hisx6-rAP0BECl-XTEN-nCas9-UGI-NLS (서열번호 7)의 각 부위의 서열을 정리하면 다음과 같다:

Hisx6: 서열번호 8;

rAPOBECl: 서열번호 9;

XTEN (링커): 서열번호 10;

nCas9 (D10A): 서열번호 11; '

링커: TCTGGTGGTTCT (서열번호 14)

UGI: 서열번호 12;

링커: TCTGGTGGTTCT (서열번호 14)

NLS: 서열번호 13.

상기 pET-Hisx6-rAP0BECl-XTEN— nCas9-UGIᅳ NLS 백터에 대하여 프라이머 (F: 5'-GGT GAT GTC GGC GAT ATA GG-3' , R: 5'-CCC CM GGG GTT ATG CTA GT-3 ' ) 및 Phusion High-Fidel i ty DNA Polymerase (Thermo Scientific)를 사용하는 PCR을 수행하여, 상기 mRNA 주형을 준비하였다. in vitro RNA 전사 키트 (mMESSAGE mMACHINE T7 Ultra kit, Ambion)를 사용하여 상기 준비된 mRNA 주형으로부터 BE3 mRNA 합성하고, MEGAclear kit (Ambion)로 정제하였다. 실시예 2: sgRNA 준비

다음의 핵산 서열을 갖는 디스트로핀 유전자 Dmd 또는 티로시나제 유전자 Tyr 표적 가이드 RNA (sgRNA)를 각각 합성하여, 하기의 시험에 사용하였다:

5'- (표적 서열) -(GUUUUAGAGCUA; 서열번호 1)一 (뉴클레오타이드 링커) - 서열번호 3)-3 '

(상기 표적 서열은 하기의 도 la (Dmd) 또는 도 2a (7 r)에 밑줄로 표시된 핵산 서열에서 "T"를 "U"로 변환한 서열이며,

상기 뉴클레오타이드 링커는 GAM의 뉴클레오타이드 서열을 가짐). 상기 sgRNA는 T7 RNA polymerase를 이용하는 in vitro 전사에 의하여 제작하였다 (Cho, S.W. , Kim, S. , Kim, J.M. & Kim, J.S. Targeted genome engineering in human eel Is with the Cas9 RNA-guided endonuc lease. Nat Biotechnol 31, 230-232 (2013) 참조) 실시예 3: 리보핵산단백질 (ribonucleoproteins; RNPs)의 준비

Rosetta 발현 세포 (EMD Milipore)를 상기 참고예 1에서 준비된 pET28-H i sx6-r AP0BECl-XTEN-nCas9 ( D10A) -UG I -NLS (BE3) 발현 백터로 형질전환시키고, 1ST:에서 12 내지 14 시간 동안 0.5 mM 이소프로필 베타- D—l—티오갈락토피라노사이드 (isopropyl bet a-D- 1- 1 h i oga 1 ac t opy r anos i de; IPTG)를 처리하여 단백질 발현을 유도하였다. 단백질 발현 유도 후, 원심분리하여 박테리아 세포를 수확하고, 펠렛화된 세포를 용해 완충액 [50 mM NaH 2 P0 4 (pH 8.0), 300 mM NaCl , 10 mM imidazole, 1% Triton X-100, 1 mM PMSF, 1 mM DTT, and 1 mg/ml lysozyme]에서 소니케이션하여 용해시켰다. 상기 얻어진 세포 용해물을 5,251xg에서 30분동안 원심분리하여 제거하고, 가용성 용해물을 Ni-NTA 비드 (Qiagen)를 사용하여 4 ° C에서 1 시간동안 배양하였다. 그 후, Ni-NTA 비드를 세정 완층액 [50 mM NaH 2 P0 4 (pH 8.0), 300 mM NaCl , and 20 mM imidazole]으로 3회 세척하고, 용출 완충액 [50 mM Tris-HCl (pH 7.6), 150—500 mM NaCl , 10—25% glycerol, and 0.2 M imidazole]로 BE3 단백질을 용출시켰다. 정제된 BE3 단백질을 Ultracell 100 셀를로스 컬럼 (Mil pore)을 사용하여 저장 완충액 [20 mM HEPES (pH 7.5), 150 mM C1 , 1 mM DTT, and 10% glycerol]으로 교환 및 농축시켰다. 상기 단백질의 순도를 SDS-PAGE로 결정하였다. sgRNA는 실시예 3에 기재된 바와 같이 T7 RNA polymerase를 이용하는 in vitro 전사에 의하여 준비하였다. 실시예 4: 동물의 준비

마우스를 대상으로 하는 실험은 서을대학교의 동물실험윤리위원회 (Institutional Animal Care and Use Committee; IACUC)의 승인을 받아 수행하였다. 마우스를 SPF (specific pathogen-free) 시설에서 12 시간의 암영 주기로 유지시켰다. C57BL/6J 및 ICR 마우스를 각각 배아 기증자 (embryo donor) 및 위탁모 (foster mother)로 사용하였다. 실시예 5: 마우스 접합체 (zygote)로의 미세주입 및 전기천공 과배란, 배아 채취 , 미세주입 및 전기천공은 "Hur, J. . et al ., Targeted mutagenesis in mice by electroporat ion of Cpf 1 r ibonucleoproteins. Nat Biotechnol 34, 807-808 (2016)"를 참조하여 수행하였다.

미세주입의 경우, BE3 mRNA (10 ng八 il)와 sgRNA (100 ng/ul)의 복합체를 포함하는 용액을 DEPC—처리된 주입 완충액 (0.25 mM EDTA, 10 mM Tris, pH 7.4)을 사용하여 희석시키고 (Sung, Y.H. et al. Highly efficient gene knockout in mice and zebraf ish with RNAᅳ guided endonuc leases. Genome Res 24, 125-131 (2014) 참조), Nikon ECLIPSE Ί7 micromanipulator 및 Fern to Jet 4i microinjector (Eppendorf)를 이용하여 수정된 1-세포기 배아의 전핵 (pronuclei) 내로 주입하였다.

전기천공의 경우, BE3—sgRNA RNP 복합체 (각각 및 6.S g/100zi 함유)를 함유하는 opti-MEM (Thermo Fisher Scientific) 으로 층진된 유리챔버를 포함하는 NEPA 21 electroporator (NEPA GENE Co. Ltd.)를 사용하여 상기 RNP 복합체를 1-세포기의 마우스 배아 세포에 전기천공으로 주입하였다 (Hur, J.K. et al. Targeted mutagenesis in mice by electroporat ion of Cpf 1 r ibonucleoproteins . Nat Biotechnol 34, 807- 808 (2016) 참조).

BE3 RNP 또는 mRNA 전달 후, 상기 배아를 KS0M+M (Millipore)의 미세액적 (microdrop)에서 배양하였으며 , 상기 배양은 37 ° C 및 5% C0 2 의 가습 조건하에서 4일간 수행하였다. 2-세포기 배아를 0.5-dpc pseudo pregnant foster mother의 난관에 이식하였다.

상기 과정을 아래의 그림에 요약하였다: ¾ P 쇼 ^ί^^^요 4 오ώ : ο

pg

Cytldine deamlnase-mediated base editing in mice

,: r»c? applicable

a: CalciJatad from the num eir of examined embryos b: CalcuSa!ed from the nu be of deveiopsi 2-cetl stage eiTihryos

얻어진 포배기 배아 또는 마우스 신생 개체의 ear cl ip에서 게놈 DNA를 주줄하여, 이에 대한 targeted deep sequencing 및 Sanger sequenc ing을 수행하였다. 실시예 7 : 표적심층시퀀성 (Targeted deep sequencing)

하기 실시예에서의 핵산 서열 분석은 아래와 같은 표적심층시퀀싱에 의하여 수행하였다.

Phus i on polymerase (Thermo Fi sher Sc i ent i f i c)를 사용하여 상기 참고예 5에서 추출된 게놈 DNA로부터 표적부위 또는 비표적 부위를 증폭시켰다. I l l umina Mi Seq를 사용하여 PCR 증폭산물 (PCR ampl i cons)의 pai red-end sequencing을 수행하였다 (LAS , Inc . (South Korea)에 의뢰하여 수행) . 비표적 부위 증폭에 사용된 프라이머들을 하기의 표 1 및 표 2에 나타내었다.

[표 1]

Dmd 표적 sgRNA의 잠재적인 비표적 부위 (of f-target s i tes)에서의 표적심층시퀀싱에 사용된 프라이머

1 st PCR 2 n " PCR

No . Forward( 5 ' 3 '→) Rever se( 5 ' 3 '→) Forward( 5 ' 3 '→) Rever se(5 ' 3 '→)

ACACTCTTTCCCTACA GTGACTGGAGHCAGAC

Dmd一 TTTTTGCTCCTTACAA TTATGTGGCCTTGCTC CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T1 ACAAGG ATTG TTCAGAGGAGCTACAA CAGTGAGTCATTGCATC

GCAAGG CATC

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd- ACCCCAAAATTCACCA TGAGGTCAGGGATGGT CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T2 GAGA GATT TTGAAAGGATACATGG AATCCTGACAATCCATG

GCTGA AACA

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd— TTTGAGCCTCTGGGAA TCAGCCTCTTCTCCAC CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T3 CATT TATCTATGCTGCCGAT CCCAAATTGTATAACTG

GATCC AAGCAG

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd- TGAAGTCCTAGAAAAC TGGCATTGCATTGAAT CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T4 AAAAGCA CTGT TAAAGGATAAACAGGC TGGGATATCTTTCCAAT

TGAGAAAAA TTCTGA

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd ~ GCTTTCTAAAGCCTTT CACCTGCCAAGTGTGG CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T5 TTAGC TT TATG TTTCTGGCAGT TACC TGAMGTGACAGCAA T

CAAGG CCATT

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd- CAACCCATATATATTT TGCCAATTGCCCTTTC CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T6 TGGCCAGT TATC TGCACCTAATCAGTGG CCATGAGCATGGGAAAT

CCTTT CTT

Dmd- TTTCAGGGAMGGTGA TGTGTGCAATAAACCA ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC s 0T7 CAGG CAGTGA CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT

TTTTCAGGGAAAGGTG GCAGTTTCACGTCTGGG ACAGG AGT

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd- CATCCAAAGTGGCTTG GTCTGGCCCAAACAGA CGACGCTC TCCGATC GTGTGCTCTTCCGATCT 0T8 AACA ATGT TGCACCTCCCATAACC CATGAATCTTCCCACAA

GTAAA GGAA

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd- GCACCTAGATTTTGGC AATGCCAAATGCATTG CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T9 CATC AAGG TTTAAAGGCATGCACA AATGCCAAATGCATTGA

ACCAC AGG

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd一 TGCAAGTTGTCTTCCG AGGCAAGGTGAGGACT CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT OT10 ACTG CAGA TGCCAGACATGCACAC CCATTCTCACAGTTATC

ACATA CCAAA '

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dnid— CGAGAGGTTGAGACCT CTCCTGAGGGTAGGGA CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T11 GGAG GCTT TAACCACACTACTGCT ACCCCTGAGAAATGAAC

CTCATGC ACG

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd- GTTTGGCGTGGGATAT GCACATCTTCCATGTG CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T12 GACT CTGT TACTCCAACCAACAGG TAGGCTGTGGTGATGGC

ACGAT TTT

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

AGAAGAGGGCCATGAG GGTCTTAGCCTCCAGC CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT TCAA CTCT TAAGATAACGCCATAG CCCTTCTTTTCCAGCTC CTGCAC CTT

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd— CCAGTCGTTAGGCCTG GGGTGACCTTGAAnC CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T14 TGAG CTGA TTCAGGAGCGCACTAG AGGCATGTACCATGACC

AACCT ACA

ACACTCTTTCCCTACA GTGACTGGAGTTCAGAC

Dmd- GAGAACGAGTGCCAAA CCCATGTATTTTCCCA CGACGCTCTTCCGATC GTGTGCTCTTCCGATCT 0T15 GGAG TTGC TTAACACATGGTTGGC CTAGTTATGAGGGAACA

TCCTT GTTGCT

[표 2]

Tyr 표적 sgRNA의 잠재적인 비표적 부위 (of f-target s i tes)에서의 표적심층시퀀싱에 사용된 프라이머

1 st PCR 2 nd PCR

No . Forward( 5 ' 3 '→) Rever se( 5 ' 3 '→) Forward( 5 ' 3 ' -→) Rever se( 5 ' 3 '→)

Tyr- ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC UY 1 GCATGAGCACACACTGA AGATGCCTGCTCTGTCT GACGCTCTTCCGATCTA GTGTGCTCTTCCGATCT AATATAA TTC GTCCCAAGTACCCTACT AAACAAGAGCTCACATT AC ATTGG

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr一 AGTGGTTGGCTTCTCTC GCATGGTATGTACTCCC GACGCTCTTCCGATCTG GTGTGCTCTTCCGATCT 0T2 TTATC TGTT CTTCTCTCTTATCCCAC CCCACAGACAGTAAGAA

TCATATC GTTCA

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- CATGTGTCTTCCTGGCT TCTGTGGCCTAGAGGAG

GACGCTCTTCCGATCTA GTGTGCTCTTCCGATCT

0T3 ATCTT TAAT

CTTGTGCTATGCATTGG ATCAAGAGAAGGCAGCA TAGA CATAG

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- TTGTCTTCCTGTGTCTG AGATTATGCCCAAGGGG GACGCTCTTCCGATCTC GTGTGCTCTTCCGATCT 0T4 CCTTA TTT CTATCCTATCCCCCTCT GGGACTAAACCACCACC

GC AGA

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- TGGCCAGAAGACTAGGA AGGGTTTGCAACTCCAT GACGCTCTTCCGATCTT GTGTGCTCTTCCGATCT 0T5 TGG AGG CTTTTCCCAGTTTCCTT TGTAGCAGAGAATGGCC

TCC TTG

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- TCACACCAGCTTGCCAT GAGAAAGGACCAAAGGA GACGCTCTTCCGATCTA GTGTGCTCTTCCGATCT 0T6 T GTTGA CACCAGCTTGCCA TCT GGGAGAGGTCCTTGATC

T CTAT

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- CCAACCAGAACCACCAG CTCTTCCTCTTCCTCTT GACGCTCTTCCGATCTC GTGTGCTCTTCCGATCT 0T7 AAT CCTCT AGAATTCCCAGGGACTA CTCCCTCCTCCTGATTC

AGC TATGA

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- CAGTTTCGGTAGCCTTG CAATTGATAGTGGCTGC GACGCTCTTCCGATCTC GTGTGCTCTTCCGATCT 0T8 ACTTA CTAGA AGTGCGATMCCCTTCT GGATTGCGAAACAGTGG

TGT ATCT

ACACTCTTTCCCTACAC . GTGACTGGAGTTCAGAC

Tyr- GGGAAATAGTAAGTAAC GAGACTGGAACAGCAAA GACGCTCTTCCGATCTC GTGTGCTCTTCCGATCT 0T9 AAGGAGAA CAC CACTTGTATGAGGGTGT AAATGCCCATGCAGCTC

TTCT T

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- TTTTGTTGTCAGCTGGC TCCAGGGATTTTGTGTT GACGCTCTTCCGATCTC GTGTGCTCTTCCGATCT 0T10 TTG GGT CCTATCCCATCCACTTT AAGCCATCAACAMGGA

CC TGG

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- CTTTCCCAGTGCCACCT GAGCCTTACAAATACAG GACGCTCTTCCGATCTC GTGTGCTCTTCCGATCT 0T11 AAA AGATGGA TTTCCCAGTGCCACCTA GACTMGCCATCAACCA

AA AGGA

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- CAAGGCCGGAGAGTTTA CCTCCGCTAACACAACA GACGCTCTTCCGATCTG GTGTGCTCTTCCGATCT 0T12 CTAAG TACA CCATCTAAGTAGGAAGG CAGCAGGGAGTAGGATG

CTAGA TAAGTA

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- TACTCTGCTGCAAGAGG TGTGTGTGTGTGTGTGT GACGCTCTTCCGATCTG GTGTGCTCTTCCGATCT 0T13 ATTTC GT ATGGATGCCTACCTGAC GAAGTAGACAGCATAGA

AAA GTACAGAAG

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- AAAGGACTGMGGAGTT ACGTCCAGGAAGTTCTC GACGCTCTTCCGATCTC GTGTGCTCTTCCGATCT OT U GAAGG TTTATG AAAGAGCTCACAGGGAC CCTGCTTCTATGAGGGT TAAA GTTC

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- GGCCCTGTCTATTTACT GGATATAACTCACAGAC GACGCTCTTCCGATCTG GTGTGCTCTTCCGATCT 0T15 AGAGTTG CTCAAGAA GCTCCACATTTCCATTC GGATATAACTCACAGAC

ATTC CTCAAGAA

ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

' Tyi- AGGAAGGAAGAAACTGA GTGAGGCAAACCCACAA GACGCTCTTCCGATCTA GTGTGCTCTTCCGATCT 0T16 AACCA GTA AAGAGGCCCAAGGATCA ATACATCTGACCCACCT

C TGC ACACTCTTTCCCTACAC GTGACTGGAGTTCAGAC

Tyr- ATTGTTGTGTCTTCTGC GCTCTATTACCCAGTTC GACGCTCTTCCGATCTA GTGTGCTCTTCCGATCT

0T17 CCTA CTTCC GTCACAACTGTAGGCAC GTTCCTTCCTCTACCAG

ATT AAAGC 실시예 8: 면역형광염색 (Immunof luorescent staining)

마우스로부터 절제한 전방 경골 (tibialis anterior; TA) 근육 절편을 라미닌 (laminin) 또는 디스트로핀 (dystrophin) 항체로 면역 염색하였다. 라미닌은 래빗 다클론항체 (abeam, abll575)의 1:500 희석액과 Alexa Fluor 568 항 -래빗 이차항체 (Thermo Fisher Scientific)의 1:1000 희석액을 차례로 사용하여 검출하였다. 디스트로핀은 래빗 다클론항체 (abeam, abl5277)의 1:500 희석액과 Alexa Fluor 488 항—래빗 이차항체 (Thermo Fisher Scientific)의 1: 1000 희석액을 차례로 사용하여 검출하였다. 상기 면역형광 염색된 절편을 Leica DM 14000 B 형광현미경으로 관찰하였다. 실시예 9: BE3를 사용하여 돌연변이가 유도된 마우스 배아의 서열분석

실시예 1-5에 기재된 바와 같이, 마우스 배아세포에 Base Editor 3

(BE3) (rAP0BECl-nCas9-UGI)를 미세주입에 의하여 주입하여, 디스트로핀 코딩 유전자 Dmd 및 티로시나제 코딩 유전자 Tyr에서 각각 점 돌연변이를 유도하였다.

도 la (Dmd) 및 도 2a (Tyr)에 나타낸 바와 같이, 각 유전자의 표적 부위 (도 la 및 도 2a에서, 위에 기재된 핵산 서열 중 밑줄로 표시한 서열 부위)에서 단일 염기 치환 (C→T)에 의하여 종료코돈이 생성될 것으로 예상되었다 (도 la 및 도 2a에서, 아래 기재된 핵산 서열이 단일 염기 치환이 일어난 핵산 서열이며, 치환 (C→T)된 염기를 붉은색으로 표시).

도 le 및 도 2e는 상기 수행된 Dmd 또는 Tyr 유전자에서의 표적 특이적 단일 염기 치환 돌연변이 과정 (미세주입 또는 전기천공) 및 결과를 요약해서 보여준다. 도 le 및 도 2e에 나타난 바와 같이 , Dmd 또는 Tyr 유전자의 표적 부위에서 각각 73% (Dmd; 15개 중 11개) 또는 100% (Tyr; 10개 중 10개 )의 빈도로 배아에서 변이가 관찰되었다.

또한. BE3 m NA와 sgRNA의 미세주입에 의하여 돌연변이가 유발된 마우스 배아의 표적 부위의 핵산 서열을 targeted deep sequencing로 확인하였다. 보다 구체적으로, BE3(rAP0BECl-nCas9— UGI) mRNA와 sgRNA의 마우스 배아에의 미세주입에 의한 마우스 배아에서의 표적 돌연변이 유발을 보여주는 것으로 , BE3 코딩 mRNA와 sgRNA를 마우스 접합체에 미세주입 후 발생된 포배 (bl astocyst )의 표적 유전자 d 및 의 표적 부위의 핵산 서열을 정렬하였다.

[md 표적 mRNA 미세주입에 의한 변이 결과]

서열 ' 빈도 (%) wt ACAGCAATTAAAAGCCAGTTAAAAATTTGTAAGG (SEQ ID NO: 15)

#64 ACAGCAATTAAAAGCTAGTTAAAAATTTGTAAGG 94

#65 ACAGCAATTAAAAGCTAGTTAAAAATTTGTAAGG 53

ACAGCAATTAAAAGTCAGTTAAAAATTTGTAAGG 38

#66 ACAGCAATTAMAGACAGnAMAATTTGTAAGG 55

ACAGCM TAAMG CAGTTAAAAATTTGTMGG 34

ACAGCAATTAMAGC AGTTAAAMTTTGTAAGG 6

ACAGCAATTAAAAGTTAGTTAAAAATTTGTAAGG 3

#67 ACAGCMTTAAMGTTAGTTAAAAA1TTGTAAGG 16

#68 ACAGCAATTAAAAGCTAGTTAAAAArTTGTAAGG 97

#72 ACAGCAAnAAAAGTTAGTTAAAMTTTGTAAGG 71

ACAGCMTTAAMGC AGTTAAAAATTTGTAAGG 25

#79 ACAGCAAnAAAAGGTAGTTAAAAATTTGTAAGG 99

#80 ACAGCAAnAAAAGTAAGTTAAAAATTTGTMGG 39

ACAGC TTAMAGTTAGTTAAAAATTTGTAAGG 20

ACAGCAA AAATTTGTAAGG 40 (-15 bp)

#87 ACAGCAA AAAAGCAAGTTAAAAATTTGTAAGG 84

ACAGCAATTAMAG CAGTTAMAATTTGTAAGG 12

#88 ACAGCMTT編 AGC AGTTAAAAATTTGTAAGG 77

ACAGCMTTAAMGnAGTTAAAMTTTGTAAGG 22

#95 ACAGCAAnAAAAGTTAGTTAAAAATTTGTMGG 54

ACAGCAATTAAMGCIAGTTAAAAATTTGTAAGG 45

[Tyr 표적 mRNA 미세주입에 의한 변이 결과]

서열 빈도 (%) Wt GCACCATCTGGACCTCAGTTCCCCTTCAAAGGGG (SEQ ID NO : 17)

#47 GCACCATCTGGACCTTAGnCCCCTTCAAAGGGG 73

#48 GCACCATCTGGACCmGTOCCCTTCAAAGGGG 99 M9 GCACCATCTGGACCTTAGrrTCCCTTCAAAGGGG 49 GCACCATCTGGACCTTAGTTCCCCTTCAMGGGG 45

#50 GCACCATCTGGACCTTAGTTCCCCTTCAAAGGGG 99

#51 GCACCATCTGGACCTTAGTTCCCCTTCAAAGGGG 56

GCACCATCTGGACCTCAGmCCTTTCAAAGGGG 14

GCACCATCTGGACCTCA TCAAAGGGG 25 8 bp)

#52 GCACCATCTGGACCTTAGnCCC-TTCAAAGGGG 100 1 bp)

#53 GCACCATCTGGACCTTAGTTCCCCTTCAAAGGGG . 26

GCACCATCTGGACCTAAGTTCCCCTTCAAAGGGG 23

#54 GCACCATCTGGACCTTAGTTCCCCTTCAAAGGGG 57

#55 GCACCATCT GGGG 16 (-21 bp)

GCACCATCTGGACCTAAGTTCCCCTTCAMGGGG 15

GCACCATCTGGATCTTAGTTCCCCTTCAAAGGGG 14

GCACCATCTGGACCTTAGTTACCCTTCAAAGGGG 11

#56 GCACCATCTGGACCTTAGTTCCCCTTCAAAGGGG 86

(Wt 야생형; 표적 서열은 밑줄로 표시함 PAM 서열 (NGG)은 볼드체로, 치환된 염기는 볼드체 +밑줄로 각각 표시함; 오른쪽 열의 수 (빈도 (%) )는 변이 (염기 치환)된 대립 유전자의 빈도를 나타내고 해당 위치에 뉴클레오타이드가 존재하지 않음 (결실됨)을 나타냄; 왼쪽 열의 수치는 돌연변이 마우스 배아세포의 번호임)

상기에 나타난 바와 같이, 상기 두 개의 유전자 (Dmd 또는 Tyr)의 표적 부위 모두에서, C→T 염기치환이 주요한 돌연변이 유발 패턴임을 확인할 수 있다. 실시예 10: BE3 및 Dmd 표적 sgRNA의 미세주입에 의하여 돌연변이가 유도된 마우스 개체의 돌연변이 유발 확인

마우스 배아에 BE3 mRNA와 Tyr 표적 sgRNA의 미세주입 후, foster mother 난관에 이식하여 (실시예 5 참조), Dmd 유전자에 점 돌연변이를 갖는 신생 돌연변이 마우스 (F0)를 얻었다.

도 lb 및 도 3은 BE3 (rAP0BECl-nCas9-UGI ) 코딩 mRNA 및 Dmd 유전자의 표적 부위의 핵산 서열과 흔성화 가능한 sgRNA를 마우스 접합체 (zygote)에 미세주입한 후 발생된 신생개체의 표적 유전자 (Dmd)의 표적 부위의 핵산 서열을 분석한 결과를 보여준다. 도 lb에 나타난 바와 같이, Dmd 유전자에 점 돌연변이를 유발한 경우, 총 9 마리 생쥐 중 5 마리 (D102 , D103 , D107 , D108 , 및 D109)가 Dmd 유전자의 표적 부위에 돌연변이를 가지며, 이들 5 개의 돌연변이 마우스 중 3 개 개체 (D102 , D103 , D108)는 하나 또는 두 개의 돌연변이 대립 유전자를 보유하고 있으며 야생형 대립 형질이 결여되어 있는 것으로 확인되었다. 다른 두 돌연변이 마우스 (D107 및 D109)는 모자이크 형태로 10%의 빈도로 야생형 대립 유전자를 보유하고 있었다. 또한, 도 lb 및 도 3에 나타난 바와 같이, 돌연변이 마우스 D109는 점 돌연변이가 아닌 20-염기쌍 (bp) 결실을 보였고, 이는 BE3에 포함된 Cas9 니카아제가 표적 부위에서 indel s을 유도하는 활성을 보유하고 있음을 보여준다.

도 lc는 야생형 및 Dmd 돌연변이 마우스 D108의 표적 유전자의 표적 부위의 Sanger sequenc ing chromatograms을 보여준다. 도 lc에서 보여지는 바와 같이, 야생형 대립 유전자가 없는 돌연변이 F0 마우스인 D108는 단일 염기 치환 (Cᅳ T)에 의하여 Dmd 유전자에 조기 종료코돈 (TAG)이 도입되었다. 도 Id는 야생형 및 Dtnd 돌연변이 마우스 D108의 TA 근육 절편에 대한 면역형광염색 (실시예 8 참조) 결과를 나타낸 것으로, 돌연변이 개체 (D108)의 근육에서 디스트로핀이 거의 발현되지 않음을 확인할 수 있다. 이는 BE3 mRNA 및 Dmd 표적 sgRNA의 주입 (미세주입)에 의하여 Dmd 유전자가 성공적으로 knock— down됨을 보여준다. 실시예 11 : BE3 및 sgRNA를 포함하는 RNA의 전기천공에 의하여 돌연변이가 유도된 마우스 배아의 돌연변이 유발 확인

실시예 3에서 준비된 재조합 BE3 단백질과 in vi tro 전사된 sgRNA의 흔합물 (rAPOBECl— nCas9(D10A)-UGI RNP)을 포함하는 BE3 리보핵산단백질 (RNPs)을 전기천공법으로 마우스 배아에 전달하였다 (실시예 5 참조) . 전기천공 후 4 일째에, 마우스 배아의 각 표적 유전자 (Dmd 또는 Tyr )의 표적 부위의 핵산 서열을 분석하여 그 결과를 아래에 나타내었다:

[Dmd , RNP e l ect roporat i on 변이 결과]

서열 빈도 (%) Wt ACAGCAATTAAAAGCCAGTTAAAAATTTGTAAGG (SEQ ID NO : 15)

#17 ACAGCAAHAAMGCTAGTTAAAAATTTGTAAGG 85

#18 ACAGCMTTAMAGCIAGTTAMMTTTGTMGG 66

ACAGCAATTAAAAGCAAGTTAAAAATTTGTAAGG 18 #19 ACAGC TTAAAAGCTAGTTAAA TTTGTAAGG 64

ACAGCAATTAAAAGCAAGTTAAAAATTTGTAAGG 24

#20 ACAGCAATTAAAAGCTAGTTAAA TTTGTAAGG 57

ACAGCMTTAAMG CAGTTAAAAATTTGTAAGG 30

#21 ACAGCAATTAAAAGCTAGTTAAAAATTTGTAAGG 100

#22 ACAGCAATTAAAAGCTAGTTAAAAATTTGTAAGG 96.

#23 ACAGCAATTAAAAGTCAGTTAAAAATTTGTAAGG 42

#24 ACAGCAATTAAMGTCAGTTAAAAATTTGTAAGG 51

#25 ACAGCM^AAMGTTAGTTAAAAATTTGTAAGG 68

ACAGCMTTAMAG CAGTTAAAAATTTGTAAGG 8

#26 ACAGCAATTAA GCCAGTT GTAAGG 98 (-8 bp) #28 ACAGCAATTAAAAGTAAGnAAAAATTTGTAAGG 100

#31 ACAGCAATTAAAAGCTAGTTAAAAATTTGTAAGG 77

#32 ACAGCAATTAAAAGCTAGTTAAAAATTTGTAAGG 100

[Tyr NP e l ect roporat ion 변이 결과]

서열 빈도 (%)

Wt GCACCATCTGGACCTCAGTTCCCC-TTCAAAGGGGTGG (SEQ ID NO : 17) #83 GCACCATCTGGACCT AGTTCCCCᅳ TTCMAGGGGTGG 25

GCACCATCTGGACCTCAGTTACCC-TTCAMGGGGTGG 18

GCACCATCTGGACCTTAGnCCCC-TTCAAAGGGGTGG 14

#34 GCACCATCTGGACCTTAGTTCCCC-TTCAAAGGGGTGG 54

GCACCATCTGGACCT GTTCCCC-TTCAAAGGGGTGG 45

#36 GCACCATCTGGACCTTAGTTCCCC-TTCAAAGGGGTGG 48

#37 GCACCATCTGGACCTTAG CCCC-TTCAAAGGGGTGG 56

#38 GCACCATCTGGACCTTAGTTCCCC-TTCAAAGGGGTGG 94

#40 GCACCATCTGGACCTGAGTTCCCC-TTCAAAGGGGTGG 59

GC TTCAAAGGGGTGG 21 (-22 bp)

GCACCATCTGGACCTCAGTTCCCC-TTCAAAGGGGTGG 14

#41 GCACCATCTGGACCTTAGTTTCCC-TOAAAGGGGTGG 44

#42 G G 35 (-35 bp) #44 GCACCATCTGGACCT AGnCCCCriTTAAAGGGGTGG 25 (+1 bp) GCACCATCTGGACCT AGTTCCCC-TTCAAAGGGGTGG 9

GCACCATCTGGACCTCAGTTCTCC-TTCAAAGGGGTGG 3 #45 GCACCATCTGGACCTTAGTTCCCC-TOAMGGGGTGG 55

#46 GCACCATCTGGACCTCAG TGG 76 (-16 bp)

GCACCATCTGGACCTTAGTTCCCC-TTCAAAGGGGTGG 23

(Wt , 야생형; 표적 서열은 밑줄로 표시함; PAM 서열은 볼드체로, 치환된 염기는 볼드체+밑줄로 각각 표시함; 오른쪽 열의 수치 (빈도 (%) )는 변이 (염기 치환)된 대립 유전자의 빈도를 나타내고, 는 해당 위치에 뉴클레오타이드가 존재하지 않음 (결실됨)을 나타냄; 왼쪽 열의 수치는 돌연변이 마우스 번호임)

상기 결과 및 도 l e 및 도 2e에 나타난 바와 같이, BE3 RNP의 전기천공 주입에 의하여, 포배기 배아의 Dmd 및 Tyr 표적 부위에서 각각 81% (Dmd : 16개 중 13개) 및 85¾ (Tyr : 13개 중 11개)의 빈도로 돌연변이가 유도되었다. 실시예 12 : BE3 및 Tyr 표적 sgRNA를 포함하는 RNP의 전기천공 주입에 의하여 돌연변이가 유도된 마우스 개체의 돌연변이 유발 확인

마우스 배아에 BE3 및 Tyr 특이적 sgRNA를 포함하는 RNP를 전기천공에 의하여 마우스 배아에 주입한 후, foster mother 난관에 이식하여 (실시예 5 참조), Tyr 유전자에 점 돌연변이를 갖는 마우스 (F0)를 얻었다.

도 2b는 상기 얻어진 신생 돌연변이 마우스의 Tyr 유전자의 표적 부위의 핵산 서열을 정렬한 결과를 보여준다. 도 2b에 나타난 바와 같이, 얻어진 신생 돌연변이 마우스 7 마리 (T110 , Till , T112 , T113 , T114 , T117 , 및 T118) 모두 Tyr 유전자의 표적 부위에서 다양한 돌연변이가 유발됨을 확인할 수 있다.

도 2c는 야생형 및 신생 돌연변이 마우스 (ΊΊ13 및 T114)의 표적 유전자의 표적 부위의 Sanger sequenc ing chromatograms을 보여주는 것으로, 상기 신생 돌연변이 마우스의 표적 부위에서의 단일 염기 치환 (C→T)에 의하여 종료코돈 (TAG)이 생성됨을 확인할 수 있다.

도 2d는 신생 돌연변이 마우스들의 눈의 표현형을 보여주는 것으로, 돌연변이 마우스 (ΊΊ13 , T114)에서 눈 백색증이 나타남을 확인할 수 있다. 이는 BE3 mRNA 및 Tyr 표적 sgRNA의 RNP의 주입 (전기천공)에 의하여 Tyr 유전자가 성공적으로 knock-down됨을 보여준다. 실시예 13: off-target effect 시험

BE3의 off-target 효과를 평가하기 위해, Cas- OFF i nder (ht t p · ' //www . rgenome . net / cas-of f i nder / ) ¾- 사용하여 마우스 게놈에서 최대 3-nucleotide mismatche를 갖는 잠재적인 비표적 부위 (off- target site)를 확인하고, 표적심층시퀀싱을 통해 신생 돌연변이 마우스 개체로부터 분리된 게놈 DNA를 분석하였다.

sgRNA 서열 및 표적심층시뭔싱에 사용된 프라이머 서열을 아래의 표 3에 정리하였다

[표 3]

상기 확인된 마우스 게놈에서의 비표적 부위 (off-target site) 및 상기 표적심층시퀀싱 결과를 하기의 표 4 (Dmd) 및 표 5 (Tyr), 및 도 4 (Dmd) 및 도 5 (Tyr)에 나타내었다:

[표 4]

마우스 게놈 내의 Dmd 표적 부위에 대한 비표적 부위 (Dmd— On: Dmd의 표적 (on-target) 부위 ; Dmd-OT: Dmd의 비표적 (of f—target ) 부위 )

Chromosom Direc

No. Gene Sequence Posit ion

e t ion

AAGCCAGTTMAAATTTGTAAGG

DmhOn Dmd Exon chrX 83781748 +

(서열번호 19) mi AAGCCAGTTAgAAgTTTGTAAGG

Dmd- Atpllc Intron chrX 60354718 +

(서열번호 20)

Intergenic AAGCaAGTgtAAAATTTGTATGG

Dwd-O12 - chr3 123915964 - region (서열번호 21)

AA t aCAGTTAA t AATTTGTAAGG

DmHm Ptprd Intron chr4 78045958 +

(서열번호 22)

AAGCaAGTaAAAcATTTGTATGG

Dmd-!XA Cfh Intron chrl 139933967 +

(서열번호 23)

t tGCCAGTTtAAAATTTGTAAGG

Z¾fl4)T5 So si Intron chrl7 80462531 - (서열번호 24)

Intergenic AAGCaA t TgAAAAATTTGTATGG

DnuH - chrl7 81921018 + region (서열번호 25)

AAGCCAGaaAcAAATTTGTAGGG

Dmd—Un Grid2 Intron chr6 64297703 - (서열번호 26)

Intergenic AAGCt AGTggAAAATTTGTACGG

Dmh018 ᅳ chr6 147759582 - region (서열번호 27)

Intergenic AAc t CAaTTAAAAATTTGTATGG

Dm -0 9 - chrl4 26539529 - region (서열번호 28)

Dwh AAGCCAGagM t AATTTGTAGGG

Spag9 Intron chrll 94052933 + OT10 (서열번호 29)

Dmd— AAaCCAGTTAAAt ATTTcTAAGG

Tlel Intron chr4 72159600 + 0T11 (서열번호 30)

Dmd- AAGCCAtTTMAM TGagTGG

RNflUb Intron chrl3 47235657 - 0T12 (서열번호 31)

Dmd— AAcCCAGTTAgAAATTTt TATGG

Tnfrsf21 Intron chrl7 43052831 + 0T13 (서열번호 32)

D h AAGaCAGaTAAAAATTTGgAGGG

Aakl Intron chr6 86907351 - 0T14 (서열번호 33)

Dmd— AgGCCAGaTAAAMTTTGaAGGG

Gpm6b 3' UTR chrX 166385994 + 0T15 (서열번호 34)

[표 5]

마우스 게놈 내의 Tyr 표적 부위에 대한 비표적 부위 (Tyr— On: Tyr의 표적 (on-target) 부위 ; Tyr —0T: Tyr의 비표적 (of f-target ) 부위 )

No Direc

Gene Sequence Chromosome Position

t ion

Tyr- ACCTCAGTTCCCCTTCAAAGGGG

Tyr Exon chr7 87493130 - On (서열번호 35)

Tyr ¬ Zmat4 Intron cCCTCAGTTCCaCnCAgAGAGG chr8 23975596 ol! (서열번호 36)

Tyr- Intergenic ― ACCTCAcTTgCCCTTC t AAGTGG chr8 102059942 + Qll (서열번호 37)

Tyr ¬ 112 Intron ACCTCAGTcCCCCTTtAcAGAGG chr3 37123254 + ol?, (서열번호 38)

Tyr- Intergenic - ACCTCAGTTCCCCTaCAc t GGGG chr3 9150768 ― 0T4 (서열번호 39)

Tyr- Intergenic ACCTCAGTTCCCCTaCAc t GGGG chr3 81773804 0T5 (서열번호 40)

Tyr- Intergenic ― t CCTCAGTTCCCCTTCAc t GGGG chr7 11778250 0T6 (서열번호 41) Tyr- Intergeni c - cCCTCAGTTCCCCTaCAcAGAGG chr4 47766122 - 0T7 (서열번호 42)

Tyr- Intergenic - ACCTCAGTT t CCCTTCcAgGAGG chr4 54553337 - 0T8 (서열번호 43)

Tyr- 2810429I04Rik Intron cCCTCAGTTCCCCTTCAc t GGGG chrl3 3491261 + 0T9 (서열번호 44)

Tyr- Intergenic - cCCTCAGTTCCCCTaCAcAGGGG chrl3 . 74957186 + OT10 (서열번호 45)

Tyr- MGP_C57BL6NJ_G0 - cCCTCAGTTCCCCTaCAcAGGGG chr2 79031825 + 0T11 001126 (서열번호 46)

Tyr一 RaiU Intron ACCTCAGTT t CCCcTCAAAaTGG chrl5 10596653 + 0T12 (서열번호 47)

Tyr- Intergenic - ACCTCAGTTg t CCTTCAAAcAGG chr6 107384348 ―

0T13 (서열번호 48)

Tyr ¬ D6Ertd474e Intron cCCTCAGTTCCCCTaCAA t GGGG chr6 143247456 ― ol U (서열번호 49)

Tyr- Intergenic - AaCTCt GTTCCCCTTC t AAGTGG chrlS 23151245

0T15 (서열번호 50)

Tyr- Intergeni c - A t CTCAGTT t CCCHCAcAGGGG chrll 71708976 一

0T16 (서열번호 51)

Tyr- Foxk2 Intron ACCTtAGHCCCtTTCAAAcTGG chrll 121271649 + 0T17 (서열번호 52)

(상기 표 5 및 6에서, off-target 부위 중의 on— target 서열과 불일치하는 뉴클레오타이드는 소문자로 표시함; 3' 말단의 NGG는 PAM 서열을 나타냄)

표 4, 표 5, 도 4 및 도 5에 나타낸 바와 같이, 본 시험에서 사용된 표적 부위 (on target site)는 마우스 게놈 내에서 유의미한 off-target 변이를 유발하지 않음을 확인할 수 있으며, 이는 상기 표적 부위를 표적^로 하는 BE3 시스템이 생체 내에서 상당히 표적 특이적임을 보여준다.