Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
RECOMBINANT CELL AND METHOD FOR PRODUCING ENDOGENOUS POLYPEPTIDE
Document Type and Number:
WIPO Patent Application WO/2019/088496
Kind Code:
A2
Abstract:
Provided are a composition for expressing and/or producing a polypeptide of interest in an animal cell, comprising a target-specific endonuclease system or an encoding gene thereof and a donor DNA structure; a recombinant animal cell into which said composition is introduced and a manufacturing method thereof; and a method for expressing and/or producing a polypeptide of interest in an animal cell, comprising a step of introducing said composition into the animal cell and/or a step of culturing said animal cell.

Inventors:
BAE SANG SU (KR)
WOO JAE SUNG (KR)
YU JI HYEON (KR)
Application Number:
PCT/KR2018/012051
Publication Date:
May 09, 2019
Filing Date:
October 12, 2018
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
HUB BIOTECH CO LTD (KR)
Attorney, Agent or Firm:
PANKOREA PATENT AND LAW FIRM (KR)
Download PDF:
Claims:
【특허청구범위】

【청구항 1】

표적 특이적 엔도뉴클레아제 시스템 및 도너 DNA 구조체를 포함하는 는, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물로서,

상기 목적 폴리펩타이드는 상기 동물 세포의 유전체에 의하여 암호화되는 내인성 폴리펩타이드이고,

상기 표적 특이적 엔도뉴클레아제 시스템은 표적 특이적 엔도뉴클레아제 또는 이를 암호화하는 제 1 핵산 분자 또는 상기 제 1 핵산 분자를 포함하는 제 1 재조합 백터 및 상기 내인성 목적 폴리펩타이드 암호화 유전자의 5 ' 말단쪽에 인접한 표적 핵산 서열과 흔성화 가능한 핵산 분자 (제 2 핵산 분자) 또는 상기 제 2 핵산 분자를 포함하는 제 2 재조합 백터를 포함하고,

상기 도너 DNA 구조체는 상기 동물 세포와 이종 세포 유래의 외래 프로모터를 포함하는 것인,

동물 세포에서의 목적 폴리펩타이드 발현용 조성물.

【청구항 2]

제 1항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 TALEN (transcr ipt ion act ivator-1 ike ef fector nuclease) , 징크—핑거 뉴클레아제 (zinc-f inger nuclease , ZFN) , RNA—가이드 엔도뉴클레아제 (RNA-guided endonuc lease , RGEN) , 및 DNA-가이드 엔도뉴클레아제 (DNA-guided endonuclease)로 이루어진 군에서 선택된 1종 이상인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.

【청구항 3】

제 1항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 RNA-가이드 엔도뉴클레아제 (RNA— guided endonuclease , RGEN)이고, 상기 제 2 핵산 분자는 상기 내인성 목적 폴리펩타이드 암호화 유전자의 5 ' 말단쪽에 인접한 표적 핵산 서열과 흔성화 가능한 가이드 RNA인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.

【청구항 4】

제 3항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 스트 ¾토코커스 피요게네스 Streptococcus pyogenes) , 캄필로박터 제주니 ( Campylobacter jejuni) , 스트랩토코커스 써모필러스 ( Streptococcus thermophi les) , 스트렙토코커스 아우레우스 ( Streptocuccus aureus) , 네이세리아 메닝기디티스 [Neisseria meningitidis) , 파스테우렐라 물토시다 (Pasteurel la mul tocida) , 및 프란시셀라 노비시다 (Franc i sell a 에서 유래하는 Cas9 단백질로 이루어진 군에서 선택된 1종 이상인 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.

【청구항 5】

제 3항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 Parcubacteria bacterium, Lachnospiraceae bacterium, Butyri vibrio proteoclasi icus, Per eg r ini bacteria bacterium, Acidaminococcus sp . , Porphyromonas macacae, Lachnospiraceae bacterium, Porphyromonas crevioricanis, Prevotella disiens, Mo r axel la bovoculi , Smiihella sp . , Leptospira inadai , Lachnospiraceae bacterium, Francisel la novicida, Candidatus Methanoplasma termitum, Candidatus Paceibacter , 및 Eubacterium e// e/3s에서 유래하는 Cpf l 단백질로 이루어진 군에서 선택된 1종 이상인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.

【청구항 6】

제 1항에 있어서, 상기 도너 DNA 구조체는 태그 유전자를 추가로 포함하는 것인, 동물.세포에서의 목적 폴리펩타이드 발현용 조성물.

【청구항 7】

거 16항에 있어서, 상기 도너 DNA 구조체는 상기 태그 유전자의 5 ' 말단에 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 분자를 추가로 포함하는 것인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물. 【청구항 8】

제 1항에 있어서, 상기 목적 폴리펩타이드는 2 내지 10, 000개의 아미노산을 포함하는 것인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.

【청구항 9】

제 1항 내지 제 8항 중 어느 한 항에 있어서, 상기 표적 특이적 엔도뉴클레아제 시스템은 상기 목적 폴리펩타이드의 암호화 유전자의 시작 코돈과 내재 프로모터 또는 5 ' -UTR사이를 절단하는 것인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물.

【청구항 10】

거 U항 내지 게 8항 중 어느 한 항에 있어서, 상기 동물 세포는 포유 동물 세포인, 동물 세포에서의 목적 폴리펩타이드 발현용 조성물. 【청구항 11】

도너 DNA 구조체가 숙주 세포의 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자의 5 ' 말단쪽에 삽입되고,

상기 도너 DNA 구조체는 상기 숙주 세포와 이종 세포 유래의 외래 프로모터를 포함하고,

상기 숙주세포는 동물 세포인,

재조합 세포.

【청구항 12】

제 11항에 있어서, 상기 도너 DNA 구조체는 태그 유전자를 추가로 포함하는 것인, 재조합 세포.

【청구항 13】

제 12항에 있어서, 상기 도너 DNA 구조체는 상기 태그 유전자의 5 ' 말단에 상기 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 분자를 추가로 포함하는 것인, 재조합 세포.

【청구항 14】

제 11항에 있어서, 상기 내인성 목적 폴리펩타이드는 2 내지 10 , 000개의 아미노산을 포함하는 것인, 재조합 세포.

【청구항 15】

제 11항 내지 제 14항 중 어느 한 항에 있어서, 상기 도너 DNA 구조체는 상기 숙주 세포의 유전체 내의 목적 폴리펩타이드의 암호화 유전자의 시작 코돈과 내재 프로모터 또는 5 ' =UTR 사이에 삽입된 것인, 재조합 세포.

【청구항 16]

제 11항 내지 제 14항 중 어느 한 항에 있어서, 상기 숙주 세포는 포유 동물 세포인, 재조합 세포.

【청구항 17】

제 15항에 있어서, 상기 숙주 세포는 포유 동물 세포인, 재조합 세포. 【청구항 18】

거 U항 내지 제 8항 중 어느 한 항의 동물 세포에서의 목적 폴리펩타이드 발현용 조성물, 또는

제 11항 내지 제 14항중 어느 한 항의 재조합 세포 '

를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물. 【청구항 19】 제 18항에 있어서, 상기 재조합 세포는 상기 도너 DNA 구조체가 상기 숙주 세포의 유전체 내의 목적 폴리펩타이드의 암호화 유전자의 시작 코돈과 내재 프로모터 또는 5 ' -UTR 사이에 삽입된 것인, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물.

[청구항 20】

제 18항에 있어서, 상기 동물 세포는 포유 동물 세포인, 동물 세포에서의 목적 폴리펩타이드 생산용조성물.

【청구항 21]

제 19항에 있어서, 상기 동물 세포는 포유 동물 세포인, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물.

【청구항 22】

제 11항 내지 제 14항중 어느 한 항의 재조합 세포를 배양하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산 방법.

【청구항 23】

제 22항에 있어서, 상기 배양하는 단계 이후에, 목적 폴리펩타이드를 분리 또는 정제하는 단계를 추가로 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산 방법 .

【청구항 24]

도너 DNA 구조체를 숙주 세포의 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자의 51 말단쪽에 삽입하는 단계를 포함하고, 상기 도너 DNA 구조체는 상기 숙주 세포와 이종 세포 유래의 외래 프로모터를 포함하고,

상기 숙주세포는 동물 세포인,

동물 세포에서의 목적 폴리펩타이드 생산을 위한 재조합 세포의 제조 방법 .

【청구항 25】

제 24항에 있어서, 상기 도너 DNA 구조체를 숙주 세포의 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자의 5 ' 말단쪽에 삽입하는 단계는 표적 특이적 엔도뉴클레아제 시스템에 의하여 수행되는 것인, 제조 방법. 【청구항 26】

제 25항에 있어서, 상기 표적 특이적 엔도뉴클레아제 시스템은 표적 특이적 엔도뉴클레아제 또는 이를 암호화하는 제 1 핵산 분자 또는 상기 저 U 핵산 분자를 포함하는 제 1 재조합 백터 및 상기 내인성 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽에 인접한 표적 핵산 서열과 흔성화 가능한 핵산 분자 (제 2 핵산 분자) 또는 상기 제 2 핵산 분자를 포함하는 게 2 재조합 백터를 포함하는 것인, 제조 방법.

【청구항 27】

제 26항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 TALEN

(transcription activator-like effector nuclease) , 징크一핑거 뉴클레아제 (zinc-finger nuclease, ZFN), RNA-가이드 엔도뉴클레아제 (RNA-guided endonuc lease, RGEN) , 및 DNA-가이드 엔도뉴클레아제 (DNA-guided endonuclease)로 이루어진 군에서 선택된 1종 이상인, 제조 방법.

【청구항 28】

제 26항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 RNA-가이드 엔도뉴클레아제 (RNA-guided endonuclease, RGEN)이고, 상기 제 2 핵산 분자는 상기 내인성 목적 폴리펩타이드 암호화 유전자의 5' 말단쪽에 인접한 표적 핵산 서열과 흔성화 가능한 가이드 RNA인, 제조 방법 .

【청구항 29】

제 28항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 스트렙토코커스 피요게네스 Streptococcus pyogenes) , 캄필로박터 제주니 (Campylobacter jejuni), 스트렙토코커스 써모필러스 {Streptococcus thermophi les) , 스트렙토코커스 6·우레우스 (Streptocuccus aureus) , 네이세리아 메닝기디티스 Neisseria meningitidis), 파스테우렐라 물토시다 {Pasteur ell a multocida), 및 프란시셀라 노비시다 (Franci sella /30 c/i¾)에서 유래하는 Cas9 단백질로 이루어진 군에서 선택된 1종 이상인, 제조 방법 .

【청구항 30]

제 28항에 있어서, 상기 표적 특이적 엔도뉴클레아제는 Parcubacteria bacterium, Lachnospiraceae bacterium, Butyri vibrio proteoclasi icus, Peregrini bacteria bacterium, Acidaminococcus sp. , Porphyromonas macacae, Lachnospiraceae bacterium, Porphyromonas crevioricanis, Prevotella disiens, Mo r axel la bovoculi , Smiihella sp. , Leptospira inadai , Lachnospiraceae bacterium, Franci sella novicida, Candidatus Methanoplasma termitiun, Candidatus Paceibacter , 및 Eubacterium e/ e3s에서 유래하는 Cpfl 단백질로 이루어진 군에서 선택된 1종 이상인, 제조 방법 . 【청구항 31】

제 24항에 있어서, 상기 도너 DNA 구조체는 태그 유전자를 추가로 포함하는 것인, 제조 방법.

【청구항 32]

제 31항에 있어서, 상기 도너 DNA 구조체는 상기 태그 유전자의 5 ' 말단에 상기 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 분자를 추가로 포함하는 것인, 제조 방법.

【청구항 33]

제 24항에 있어서, 상기 도너 DNA 구조체는 상기 숙주 세포의 유전체 내의 목적 폴리펩타이드의 암호화 유전자의 시작 코돈과 내재 프로모터 또는 5 ' -UTR사이에 삽입된 것인, 제조 방법 .

【청구항 34】

제 24항에 있어서, 상기 숙주 세포는 포유 동물 세포인, 제조 방법 .

Description:
[명세서】

【발명의 명칭】

내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법 [기술분야]

표적특이적 엔도뉴클레아제 시스템 또는 이의 암호화 유전자 및 도너 DNA 구조체를 포함하는 동물 세포에서의 목적 폴리펩타이드 발현 및 /또는 생산용 조성물, 상기 조성물 또는 상기 도너 DNA 구조체가 도입된 재조합 동물 세포 및 이의 제조 방법, 및 상기 조성물을 동물 세포에 도입하는 단계 및 /또는 상기 동물 세포를 배양하는 단계를 포함하는 동물세포에서의 목적 폴리펩타이드의 발현 및 /또는 생산 방법이 제공된다.

【배경기술】

동물세포에서 생산되는 단백질을 대량으로 생산하기 위하여, 유전자 재조합을 통하여 원하는 목적 단백질을 암호화하는 유전자 서열 (Coding Sequence : CDS)을 삽입한 플라스미드 DNA를 만들고, 이를 세포 내에 주입 (transfect ion)하는 방식이 주로 사용된다. 이러한 방식은 목적 단백질을 암호화하는 raRNA로부터 역전사 효소 (Reverse transcr iptase)를 사용하여 cDNA( complementary DNA)를 합성하고, 이를 중폭하여, 인간 세포 등의 동물 세포에서 발현할 수 있는 플라스미드에 재조합적으로 삽입하는 단계를 수반한다. 또한, 세포에서 발현된 목적 단백질을 효율적으로 추출 /정제하기 위하여, 상기 플라스미드에 항체와 같은 태그를 함께 재조합하여 동물 세포에 주입하여, 태그가 연결된 단백질이 만들어지도록 할 수 있다.

그러나, 이와 같이 재조합 플라스미드를 세포에 주입하여 단백질을 제조하는 경우, 다음과 같은 문제점이 있다:

1) 세포 배양 규모와 세포 밀도를 높이기 어렵다;

2) 단백질이 세포 안에서 한시적으로 발현되기 때문에 특정시기에 단백질을 추출해야 하는 제한이 있다;

3) 이종 세포에 주입시 단백질의 접힘 ( folding) , 당화 (glycosylat ion) 둥의 전사 후 변형 (post-translat i onal modi f icat ion)이 원래의 세포에서와 달라져서 올바른 구조 및 /또는 기능을 갖지 못하게 될 수 있다;

4) 크기가 크거나 반복되는 서열이 존재하는 단백질들은 이를 암호화하는 CDS의 길이가 길어서 플라스미드에 클로닝하는데 곤란한 점이 있다.

따라서, 이러한 문제점을 극복하기 위하여 세포에서 올바른 구조 및 기능을 갖는 단백질 대량으로 생산하는 기술이 개발이 요구된다.

[선행기술문헌]

(비특허문헌 0001) Andr i anantoandro E et al . Mol Syst Bi ol . 2: 2006.0028 (2006) 【발명의 상세한 설명】

【기술적 과제】

일 예는 표적 특이적 엔도뉴클레아제 시스템 및 도너 DNA 구조체를 포함하는 동물 세포에서의 목적 폴리펩타이드 발현용 조성물을 제공한다. 다른 예는 상기 목적 폴리펩타이드 발현용 조성물이 동물세포에 도입되어 제조된 재조합 세포를 제공한다. 상기 재조합 세포는 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자의 5 ' 말단쪽에 상기 조성물에 포함된 도너 DNA 구조체가 삽입된 것일 수 있다. 상기 재조합 세포는 상기 목적 플리펩타이드의 생산에 사용될 수 있다.

다른 예는 상기 도너 DNA 구조체가 동물 세포 (숙주 세포)의 유전체 내의 목적 폴리펩타이드 암호화 유전자의 5 1 말단쪽 (예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5 ' -UTR 사이)에 도입 (삽입)된 재조합 세포를 제공한다. 상기 재조합 세포는 상기 목적 폴리펩타이드의 생산에 사용될 수 있다. 상기 상기 도너 DNA 구조체는 상기 숙주 세포와 이종 세포 유래의 외래 프로모터를 포함하는 것일 수 있다.

다른 예는 상기 동물 세포에서의 목적 폴리펩타이드 발현용 조성물, 또는 상기 재조합 세포를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물을 제공한다.

다른 예는 상기 목적 폴리펩타이드 생산용 조성물을 동물 세포에 도입하는 단계를 포함하는, 목적 폴리펩타이드 생산용 동물 세포의 제조 방법을 제공한다.

다른 예는 상기 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 발현 방법을 제공한다. 상기 발현 방법에 있어서, 상기 발현용 조성물이 도입된 동물세포의 상기 목적 폴리펩타이드의 발현량은 상기 발현용 조성물이 도입되지 않은 동물세포와 비교하여, 증가된 것을 특징으로 한다.

다른 예는 상기 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다. 상기 생산 방법에 있어서, 상기 발현용 조성물이 도입된 동물세포에서의 상기 목적 폴리펩타이드의 생산량은 상기 발현용 조성물이 도입되지 않은 동물세포와 비교하여, 증가된 것을 특징으로 한다.

다른 예는 상기 목적 폴리펩타이드 생산용 ' 재조합 동물 세포를 배양하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다.

상기 동물 세포에서의 목적 폴리펩타이드의 발현 및 /또는 생산 방법은 상기 동물세포에 상기 목적 폴리펩타이드의 암호화 유전자 (CDS)를 세포 외부에서 도입시키는 단계를 수행하지 않는 것을 특징으로 한다.

【기술적 해결방법】

본 명세서에서, 표적특이적 엔도뉴클레아제 시스템 또는 이의 암호화 유전자 및 도너 DNA 구조체를 포함하는 동물 세포에서의 목적 폴리펩타이드 생산용 조성물, 상기 조성물이 도입된 재조합 동물 세포, 및 상기 조성물을 동물세포에 도입하는 단계를 포함하는 동물세포에서의 목적 폴리펩타이드의 생산 방법이 제공된다. 상기 목적 폴리펩타이드는 상기 세포 내 유전체에서 암호화되는 내인성 폴리펩타이드일 수 있으며, 본 명세서에서 제공되는 목적 폴리펩타이드 생산용 조성물, 재조합 동물 세포, 및 목적 폴리펩타이드 생산 방법은 상기 내인성 폴리펩타이드를 이의 암호화 유전자 (Coding Sequence ; CDS)의 재조합적 도입 과정 없이 본래의 구조 및 /또는 기능을 유지한 상태로 동물 세포에서 대량으로 생산할 수 있도록 하는 것을 특징으로 할 수 있다.

본 명세서에서 다르게 언급되지 않는 한, 상기 '도너 DNA 구조체 '는 발현시키고자 하는 목적 폴리펩타이드의 암호화 핵산 서열 (CDS)을 포함하지 않는 것일 수 있다.

일 예는 표적 특이적 엔도뉴클레아제 시스템 및 도너 DNA 구조체를 포함하는 동물 세포에서의 목적 폴리펩타이드 발현용 조성물을 제공한다. 다른 예는 상기 목적 폴리펩타이드 발현용 조성물이 동물세포에 도입되어 제조된 재조합 세포를 제공한다. 상기 재조합 세포는 유전체 내의 내인성 목적 폴리펩타이드 암호화 유전자의 5 ' 말단쪽에 상기 조성물에 포함된 도너 DNA 구조체가 삽입된 것일 수 있다. 상기 재조합 세포는 상기 목적 폴리펩타이드의 생산에 사용될 수 있다.

다른 예는 상기 도너 DNA 구조체가 동물 세포 (숙주 세포)의 유전체 내의 목적 폴리펩타이드 암호화 유전자의 5 ' 말단쪽 (예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5 ' -UTR 사이)에 도입 (삽입)된 재조합 세포를 제공한다. 상기 재조합 세포는 상기 목적 폴리펩타이드의 생산에 사용될 수 있다. 상기 상기 도너 DNA 구조체는 상기 숙주 세포와 이종 세포 유래의 외래 프로모터를 포함하는 것일 수 있다.

다른 예는 상기 동물 세포에서의 목적 폴리펩타이드 발현용 조성물, 또는 상기 재조합 세포를 포함하는, 동물 세포에서의 목적 폴리펩타이드 생산용 조성물을 제공한다.

다른 예는 상기 목적 폴리펩타이드 생산용 조성물을 동물 세포에 도입하는 단계를 포함하는, 목적 폴리펩타이드 생산용 재조합 세포의 제조 방법을 제공한다.

다른 예는 상기 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 발현 방법을 제공한다. 상기 발현 방법에 있어서, 상기 발현용 조성물이 도입된 동물세포의 상기 목적 폴리펩타이드의 발현량은 상기 발현용 조성물이 도입되지 않은 동물세포와 비교하여, 증가된 것을 특징으로 한다.

다른 예는 상기 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다. 상기 생산 방법에 있어서, 상기 발현용 조성물이 도입된 동물세포의 상기 목적 폴리펩타이드의 생산량은 상기 발현용 조성물이 도입되지 않은 동물세포와 비교하여, 증가된 것을 특징으로 한다.

다른 예는 상기 목적 폴리펩타이드 생산용 재조합 세포를 배양하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다.

다른 예는 상기 목적 폴리펩타이드 발현용 조성물을. 동물세포에 도입하여, 목적 폴리펩타이드 발현용 조성물이 유전체 내의 목적 폴리펩타이드 암호화 유전자의 5 1 말단쪽 (예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5 ' -UTR 사이)에 도입 (삽입)된 재조합 세포를 준비하는 단계 및 상기 재조합 세포를 배양하는 단계를 포함하는, 동물 세포에서의 목적 폴리펩타이드의 생산 방법을 제공한다.

상기 동물 세포에서의 목적 폴리펩타이드의 발현 및 /또는 생산 방법은 상기 동물세포에 목적 폴리펩타이드의 암호화 유전자 (CDS)를 세포 외부에서 도입시키는 단계를 수행하지 않는 것을 특징으로 한다. 따라서, 상기 방법은 별도의 목적 폴리펩타이드의 암호화 유전자의 제작을 필요로 하지 않는다.

상기 동물 세포에서의 목적 폴리펩타이드의 생산 방법은, 목적 폴리펩타이드 발현용 조성물을 동물세포에 도입하는 단계 및 /또는 목적 폴리펩타이드 생산용 재조합 동물 세포를 배양하는 단계 이후에, 목적 폴리펩타이드를 통상의 방법으로 분리 (추출) 및 /또는 정제하는 단계를 추가로 포함할수 있다.

이하 본 발명을 보다 상세히 설명한다.

본 명세서에 사용된 바로서, 용어 "목적 폴리펩타이드 "는 생산하고자 하는 폴리펩타이드로서, 생체에서 목적하는 활성 (예컨대 특정 질병 또는 증상의 예방, 경감, 및 /또는 치료 활성 또는 생체 필요 물질을 대체하는 활성)을 갖는 단백질 및 /또는 펩타이드뿐 아니라, 활성이 알려지지 않은 폴리펩타이드를 포함하여, 숙주 세포 내의 유전체에서 암호화되고 발현되는 모든 단백질 및 펩타이드 중에서 선택된 1종 이상일 수 있다. 상기 목적 폴리펩타이드는 세포질 내에 위치하는 폴리펩타이드, 세포막 위치 폴리펩타이드, 및 세포외 분비 폴리펩타이드로 이루어진 군에서 선택된 1종 이상일 수 있다. 예컨대, 상기 목적 폴리펩타이드는 효소, 호르몬, 성장인자, 수용체, 수송 폴리펩타이드, 면역 폴리펩타이드 (면역 세포에서 만들어지는 폴리펩타이드들을 총칭함), 신호전달 폴리펩타이드, 생체 구성 폴리펩타이드 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.

일 구체예에서, 상기 목적 폴리펩타이드는,

가수분해효소 (예컨대, 단백질 분해효소, 인산분해효소 (phosphatase) 등), 산화환원효소, 메틸기, 인산기 등의 전달효소 (예컨대, 인산화효소 (kinase) 등) 등을 포함하는 효소,

인슐린, 성장호르몬, 성장호르몬 방출호르몬, 멜라토닌, 세로토닌, 갑상선호르몬, 갑상선자극호르몬, 갑상선자극호르몬 방출호르몬, 에피네프린, 노르에피네프린, 도파민, 아디포넥틴, 부신피질자극호르몬, 부신피질자극호르몬 방출호르몬, 바소프레신, 칼시토닌, 콜레시스토키닌, 여포자극호르몬, 가스티린, 그렐린, 글로카곤, 인간융모성성선자극호르몬, 황체형성호르몬 , 파라토르몬, 프로락틴 , 세크레틴, 리포트로핀, 히스타민 등을 포함하는 호르몬,

인슐린 -유사 성장인자 (insulin-Like growth factors, IGFs), 표피성장인자 (epidermal growth factor, EGF), 혈관성장인자 (VEGFCVascular endothelial growth factor), 안지오포이에틴 (Angiopoietin) 등), 신경성장인자 (nerve growth factor, NGF), 에리트로포이에틴 (Erythropoietin, EP0), 섬유아세포성장인자 (Fibroblast growth factor; FGF), 혈소판유래성장인자 (Platelet—derived growth factor, PDGF) , 형질전환성장인자 (Transforming growth factor; TGF), 성장 /분화 인자 (Growth/differentiation factor; GDF, 예컨대, GDF15) 등을 포함하는 성장인자,

G 단백질 결합 수용체 (G protein-coupled receptor, GPCR) , 타이로신 인산화효소 수용체 (receptor tyrosine kinase, RTK), 이온성 수용체 (ionotropic receptor) 등을 포함하는 수용체,

헤모글로빈, 트랜스페린 등의 수송 폴리펩타이드,

면역글로불린 (예컨대, IgG (IgGl, IgG2, IgG3, IgG4), IgA, IgD, IgM I E 등), 사이토카인 (예컨대, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL- 17, IL-18과 같은 인터루킨), 인터쩨론 (IFN)-알파, -베타, -감마, -오메가 또는 -타우, TNF-알파, 베타 또는 감마와 같은 종양 괴사 인자 (TNF), TRAIL(TNF ~ r elated a卿 tos is— inducing 1 igand) , 콜로니 자극인자 (colony stimulating factor (CSF); 예컨대, G— CSF (Gr ami locyte一 colony stimulating factor) , GM_CSF( Granulocyte— macrophage colony-st imulat ing factor) , M— CSF(macrophage colony-stimulating factor) 등) 등을 포함하는 면역 폴리펩타이드,

세포외기질 당단백잘 (예컨대, Reelin 등), 골형성 단백질 (Bone morphogenetic protein, BMP) 등의 각종 신호전달 폴리펩타이드,

그 외, 콜라겐, 엘라스틴, 케라틴, 류불린, 액틴, 피브린, 미오신, 알부민, 히스톤, 카제인, 오브알부민 등의 생체 구성 폴리펩타이드

등으로 이루어진 군에서 선택된 1종 이상일 수 있다.

상기 목적 폴리펩타이드를 암호화하는 유전자 (이하, 목적 유전자)는 상기와 같은 목적 폴리펩타이드 정의에 의하여 이 발명이 속하는 기술 분야의 통상의 지식을 가진 자가 그 구체적 사항 (예컨대, 핵산서열 둥)을 명확하게 알 수 있다 .

상기 목적 폴리펩타이드는 2개 이상의 아미노산이 펩타이드 결합으로 연결된 것일 수 있으몌 예컨대, 2 내지 10,000개, 2 내지 9,000개, 2 내지 8, 000개, 2 내지 7,000개, 2 내지 6ᅳ 000개, 2 내지 5,000개, 2 내지 4,000개, 2 내지 3,000개, 2 내지 2,000개, 2 내지 1,000개, 50 내지 10,000개, 50 내지 9, 000개, 50 내지 8,000개, 50 내지 7,000개, 50 내지 6, 000개, 50 내지 5, 000개, 50 내지 4 ,000개, 50 내지 3 ,000개, 50 내지 2, 000개, 50 내지 1,000개, 100 내지 10,000개, 100 내지 9, 000개, 100 내지 8,000개ᅳ 100 내지 7,000개, 100 내지 6,000개, 100 내지 5,000개, 100 내지 4, 000개, 100 내지 3 ,000개, 100 내지 2, 000개, 100 내지 1,000개, 500 내지 10 ,000개, 500 내지 9 ,000개, 500 내지 8, 000개, 500 내지 7, 000개 , 500 내지 6, 000개 , 500 내지 5 ,000개, 500 내지 4, 000개, 500 내지 3 ,000개, 500 내지 2 ,000개 , 500 내지 1,000개, 1000 내지 10 ,000개, 1000 내지 9, 000개, 1000 내지 8 ,000개, 1000 내지 7, 000개, 1000 내지 6 ,000개, 1000 내지 5 ,000개' 1000 내지 4, 000개, 1000 내지 3, 000개, 1000 내지 2, 000개, 2000 내지 10, 000개, 2000 내지 9, 000개, 2000 내지 8 ,000개, 2000 내지 7 ,000개, 2000 내지 6 ,000개, 2000 내지 5, 000개, 2000 내지 4, 000개, 2000 내지 3, 000개, 3000 내지 10 ,000개, 3000 내지 9 ,000개, 3000 내지 8 ,000개, 3000 내지 7, 000개, 3000 내지 6 ,000개, 3000 내지 5,000개, 또는 3000 내지 4,000개의 아미노산을 포함하는 폴리펩타이드일 수 있다.

상기 목적 폴리펩타이드는 숙주 세포에 의하여 생산되는 내인성 폴리펩타이드 (endogenous polypeptide)일 수 있다. 상기 내인성 폴리펩타이드는, 숙주 세포에 외래 유전자 도입 없이, 숙주 세포 내의 유전체 (genome) 중의 유전자에 의하여 암호화되고 상기 숙주 세포 내에서 발현되는 폴리펩타이드를 의미할 수 있다.

이와 같은 내인성 폴리펩타이드는 다음과 같은 이점을 갖는다: (1) 접힘 (folding), 당화 (glycosylation) 둥의 전사 후 변형 (post— translational modification) 과정이 본래의 세포에서 진행되므로, 본래의 세포의 genetic context를 그대로 이용할 수 있고, 외래의 암호화 유전자가 숙주 세포에 삽입되어 발현된 폴리펩타이드와 비교하여, 폴리펩타이드 본래의 2차 및 /또는 3차 구조, 및 /또는 기능을 유지하는데 유리하다. (2) 외래 유전자의 삽입을 필요로 하지 않으므로, 암호화 유전자 (CDS) 크가 한계 등의 이유로 플라스미드에 삽입하기 곤란한 폴리펩타이드의 경우에도 적용 가능하다.

상기 내인성 폴리펩타이드는 진핵 동물, 예컨대, 인간, 원숭이, 마모셋 등의 영장류, 개, 고양이 등의 식육목 동물, 돼지, 소, 양 둥의 우제목 동물 등을 포함하는 포유 동물 또는 닭, 오리 등의 조류에서 유래하는 폴리펩타이드일 수 있다. 또한, 상기 숙주 ' 세포는 생산하고자 하는 폴리펩타이드가 유래하는 진핵 동물 세포일 수 있으며, 예컨대, 인간, 원숭이, 마모셋 등의 영장류, 개, 고양이 등의 식육목 동물, 돼지, 소, 양 등의 우제목 동물 등을 포함하는 포유 동물 세포 또는 닭 오리 등의 조류 세포일 수 있다. 상기 세포는 생체로부터 분리된 것일 수 있다.

본 명세서에 사용된 바로서, 용어 "표적 특이적 엔도뉴클레아제 시스템 "은 특정 표적 핵산 서열을 인식하여 절단하는 기능적 단위체를 의미하는 것으로, 유전자 가위라고도 불리우며, 엔도뉴클레아제 또는 이를 암호화하는 핵산 분자 또는 상기 핵산 분자 (제 1 핵산 분자)를 포함하는 재조합 백터 (제 1 재조합 백터) 및 특정 표적 핵산 서열을 인식하는 핵산 분자 (DNA 또는 RNA; 제 2 핵산 분자) 또는 상기 핵산 분자를 포함하는 재조합 백터 (제 2 재조합 백터)를 포함할 수 있다.

상기 엔도뉴클레아제는 단일가닥 및 /또는 이중가닥의 특정 유전자 부위를 절단하는 활성을 가지며, 특정 표적 핵산 서열을 인식하는 핵산 분자와 함께 작용하여 특정 표적 유전자 서열을 절단할 수 있는 모든 표적 특이적 엔도뉴클레아제들 중에서 선택될 수 있다.

예컨대, 상기 표적 특이적 엔도뉴클레아제는

유전체 상의 특정 표적 서열을 인식하는 도메인인 식물 병원성 유전자에서 유래한 TAL 작동자 (transcr ipt ion act ivator-l ike ef fector ) 도메인과 절단 도메인이 융합된 TALEN (transcr ipt ion act ivator-l ike ef fector nuclease);

징크 -핑거 뉴클레아제 (zinc-f inger nuclease , ZFN);

미생물 면역체계인 CRISPR에서 유래한 RNA-가이드 엔도뉴클레아제

(RNA-guided endonuc lease , RGEN; 예컨대, Cas 단백질 (예컨대, Cas9 등),

Cpf l , 등) ;

DNA-가이드 엔도뉴클레아제 (DNA— guided endonuc lease ; 예컨대, 아고 호몰로그 (Ago homo log) 등)

등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.

상기 표적 특이적 엔도뉴클레아제는 원핵 세포, 및 /또는 인간 세포를 비롯한 동식물 세포 (예컨대, 진핵 세포)의 유전체에서 특정 염기서열을 인식해 이중나선절단 (double strand break, DSB) 또는 단일나선절단 (s ingle strand break, SSB)을 일으킬 수 있다. 이 중 상기 이중나선절단의 경우에는 DNA의 이중 나선을 잘라, 둔단 (blunt end) 또는 점착종단 (cohesive end)을 생성시킬 수 있다. DSB는 세포 내에서 히 7fl 2i¾ (homologous recombinat ion) ti l찌 (non ¬ homologous end-joining, NHEJ) 기작에 의해 효율적으로 수선될 수 있는데, 이 과정에 소망하는 변이 (유전자 전부 또는 일부의 치환, 결실, 삽입 등)를 표적 위치에 도입할수 있다.

일 예에서, 상기 표적특이적 엔도뉴클레아제는 CRISPR에서 유래한 RNA-가이드 엔도뉴클레아제 (RGEN)일 수 있다. 이 경우, 상기 표적 특이적 엔도뉴클레아제 시스템은,

( 1) RNA-가이드 엔도뉴클레아제 또는 이를 암호화하는 핵산 분자 또는 상기 핵산 분자를 포함하는 재조합 백터, 및

(2) 표적 핵산서열과 흔성화 가능한 (또는 상보적 핵산 서열을 갖는) 가이드 RNA또는 이의 암호화 DNA또는 상기 DNA를 포함하는 재조합 백터

를 포함하는 것일 수 있다.

일 구체예에서, 상기 RNA-가이드 엔도뉴클레아제는 Cas 단백질 (예컨대, Cas9 단백질 (CRISPR (Clustered regular ly interspaced short pal indromic repeats) associated protein 9) ), Cpf 1 단백질 (CRISPR from Prevotel la and Franc i sel l a 1) 등과 같은 타입 Π 및 /또는 타입 V의 CRISPR 시스템에 수반되는 엔도뉴클레아제들로 이루어진 군에서 선택된 1종 이상일 수 있다. 상기 가이드 RNA는 상기 표적 특이적 엔도뉴클레아제를 유전체 DNA의 특정 표적 부위로 안내하는 역할을 한다. 상기 RNA—가이드 엔도뉴클레아제와 가이드 RNA는 생체 (세포) 외에서 결합되어 리보핵산- 단백질 복합체를 형성 (RNA-Guided Engineered Nuclease)하여 리보핵산 단백질 (RNP) 형태로 세포 내에 도입되거나, 이들의 암호화 핵산분자 또는 DNA가 각각 별개의 플라스미드 또는 함께 하나의 플라스미드를 통하여 세포 내로 도입된 후 발현되어 세포 내에서 리보핵산 단백질을 형성하여 작용할 수 있다.

상기 Cas 단백질은 CRISPR/Cas 시스템의 주요 단백질 구성 요소로, 활성화된 엔도뉴클레아제 또는 nickase를 형성할 수 있는 단백질이다. Cas 단백질 또는 유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다. 예컨대, 상기 Cas 단백질은,

스트렙토코커스 sp. (Streptococcus s . ) , 예컨대, 스트렙토코커스 피요게네스 Streptococcus pyogenes) 유래의 Cas9 단백질 (예컨대, SwissProt Accession number Q99ZW2(NP_269215.1); 서열번호 4);

캄필로박터 속, 예컨대, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질;

스트렙토코커스 속, 예컨대, 스트랩토코커스 써모필러스 (Streptococcus thermophi les) 또는 스트렙토코커스 아우레우스 {Streptocuccus aureus) 유래의 Cas9 단백질.;

네이세리아 메닝기디티스 (Neisseria meningitidis) 유래의 Cas9 단백질;

파스테우렐라 Pasteurella) 속, 예컨대, 파스테우렐라 물토시다 {Pasteur el la multocida) 유래의 Cas9 단백질;

프란시셀라 (Francise a) 속, 예컨대, 프란시셀라 노비시다 (Franci sella novicida) 유래의 Cas9 단백질

둥으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.

일 예에서, 상기 Cas9 단백질이 스트렙토코커스 피요게네스 {Streptococcus pyogenes) 유래의 것인 경우, 상기 PAM 서열은 5'-NGG-3' (N은 A, T, G, 또는 C임)이고, 상기 PAM 서열의 5' 말단쪽으로 3번째 뉴클레오타이드와 4번째 뉴클레오타이드 사이가 절단되며, 가이드 RNA는 상기 PAM 서열 또는 상기 PAM 서열에 대웅하는 상보적 가닥의 서열의 5' 말단 및 /또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산 부위 (보다 구체적으로, PAM 서열이 위치하는 가닥과상보적 가닥의 상기 표적 핵산서열)와흔성화하는 것일 수 있다. 다른 예에서, 상기 Cas9 단백질이 캄필로박터 제주니 (Campylobacter jejuni) 유래의 것인 경우, 상기 PAM 서열은 5'-NNNNRYAC-3' (N은 각각 독립적으로 A, T, C 또는 G아고, R은 A또는 G이고, Y는 C 또는 T임)이고, 가이드 RNA는 상기 PAM 서열 또는 상기 PAM 서열에 대웅하는 상보적 가닥의 서열의 5' 말단 및 /또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산부위와흔성화하는 것일 수 있다.

다른 예에서, 상기 Cas9 단백질이 스트랩토코커스 써모필러스 (Streptococcus thermophi les) 유래의 것인 경우, 상기 PAM 서열은 5'- AGAAW-3 1 (N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임)이고, 가이드 RNA는 상기 PAM 서열 또는 상기 PAM 서열에 대웅하는 상보적 가닥의 서열의 5' 말단 및 /또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산 부위와 흔성화하는 것일 수 있다.

다른 예에서, 상기 Cas9 단백질이 네이세리아 메닝기디티스 (Neisseria meningitidis) 유래의 것인 경우, 상기 PAM 서열은 5'- NN GATT-3'(N은 각각 독립적으로 A, T, C 또는 G임)이고, 가이드 R A는 상기 PAM 서열 또는 상기 PAM 서열에 대웅하는 상보적 가닥의 서열의 5' 말단 및 /또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산서열 부위와흔성화하는 것일 수 있다.

다른 예에서, 상기 Cas9 단백질이 스트랩토코커스 아우레우스 (Streptocuccus aureus) 유래의 것인 경우, 상기 PAM 서열은 5'_NNGRR(T)_ 3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, (T)는 임의로 포함가능한 서열을 의미함)이고, 가이드 RNA는 상기 PAM 서열 또는 상기 PAM 서열에 대웅하는 상보적 가닥의 서열의 5' 말단 및 /또는 3' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp, 예컨대, 20bp의 표적 핵산부위와 흔성화하는 것일 수 있다.

Cpfl 단백질은 상기 CRISPR/Cas 시스템과는 구별되는 새로운 CRISPR 시스템의 엔도뉴클레아제로서, Cas9에 비해 상대적으로 크기가 작고 tracrRNA가 필요 없으며, 단일 가이드 RNA에 의해 작용할 수 있다. 또한, 티민 (thymine)이 풍부한 PAM (protospacer-adjacent motif) 서열을 인식하고 DNA의 이중 사슬을 잘라 점착종단 (cohesive end; cohesive double-strand break)을 생성한다.

예컨대, 상기 Cpfl 단백질은 캔디다투스 (Candidatus) 속, 라치노스피라 Lachnospira) 속, 뷰티리비브리오 Butyrivibrio) 속, 페레그리니박테리아 Peregrinibacteria) , 액시도미노코쿠스

(Acidominococcus) 속, 포르파이로모나스 Porphyroi mas) 속, 프레보텔라 (Prevotella) 속, 프란시셀라 {Franc isel la) 속, 캔디다투스 메타노플라스마 Candidatus Methanoplasma) , 또는 유박테리움 (Eubacterium) 속 유래의 것일 수 있고, 예컨대, Parcubacteria bacterium (GWC2011_GWC2_44_17) , Lachnospiraceae bacterium (MC2017) , Butyrivibrio proteoclasi icus, Per egrini bacteria bacterium (GW2011_GWA_33_10) , Acidaminococcus sp . (BV3L6) , Porphyromona s macacae, Lachnospiraceae bacterium (ND2006) , Porphyromonas crevioricanis, Prevotel la disiens, Moraxeila bovoculi (237) , Smiihella sp . (SC_K08D17) , Leptospira inadai Lachnospiraceae bacterium (MA2020) , Franc isel la novicida (U112) , Candidatus Methanoplasma termitum, Candidatus Paceibacter , Eubacterium el i gens 등으로부터 선택된 1종 이상의 미생물 유래의 것일 수 있으나, 이에 제한되는 것은 아니다 .

엔도뉴클레아제로 Cpf l 단백질이 사용되는 경우, 상기 PAM 서열은 5 ' -ΊΤΝ-3 ' (Ν은 A , Τ , C 또는 G임)이고, 절단되는 위치는 목적 유전자 내의 ΡΑΜ서열의 5 ' 말단 또는 3 ' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp , 예컨대, 21bp 내지 23bp의 염기서열 부위 내에 위치할 수 있고, 가이드 RNA는 상기 PAM 서열의 5 ' 말단 및 /또는 3 ' 말단에 인접하여 위치하는 연속하는 17bp 내지 23bp , 예컨대, 21bp 내지 23bp의 표적 핵산 부위와 흔성화하는 것일 수 있다.

상기 표적 특이적 엔도뉴클레아제는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법 등과 같이 인위적 또는 비자연적 생산된 것 (non-natural ly occurr ing)일 수 있다. 상기 표적 특이적 엔도뉴클레아제는 in vi tro에서 미리 전사된 mRNA 또는 미리 생산된 단백질 형태 또는 표적 세포 또는 생체 내에서 발현하기 위하여 재조합 백터에 포함된 형태로 사용될 수 있다. 일 예에서, 상기 표적 특이적 엔도뉴클레아제 (예컨대, Cas9 , Cpf l , 등)는 재조합 DNA(Recombinant DNA ; rDNA)에 의하여 만들어진 재조합 단백질일 수 있다. 재조합 DAN는 다양한 유기체로부터 얻어진 이종 또는 동종 유전 물질을 포함하기 위하여 분자 클로닝과 같은 유전자 재조합 방법에 의하여 인공적으로 만들어진 DNA 분자를 의미한다. 예컨대, 재조합 DNA를 적절한 유기체에서 발현시켜 표적 특이적 엔도뉴클레아제를 생산 ( in vivo 또는 in y/iro)하는 경우, 재조합 DNA는 제조하고자 하는 단백질을 코딩 하는 코돈들 중에서 상기 유기체에 발현하기에 최적화된 코돈을 선택하여 재구성된 뉴클레오타이드 서열을 갖는 것일 수 있다.

본 명세서에서 사용된 상기 표적 특이적 엔도뉴클레아제는 변이된 형태의 변이 표적 특이적 엔도뉴클레아제일 수 있다. 상기 변이 표적 특이적 엔도뉴클레아제는 DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실하도록 변이된 것을 의미할 수 있으며, 예컨대, 엔도뉴클레아제 활성을 상실하고 니카아제 활성을 갖도록 변이된 변이 표적 특이적 엔도뉴클레아제 및 엔도뉴클레아제 활성과 니카아제 활성을 모두 상실하도록 변이된 변이 표적 특이적 엔도뉴클레아제 중에서 선택된 1종 이상일 수 있다. 이와 같은 표적 특이적 엔도뉴클레아제의 변이 (예컨대, 아미노산 치환 등)는 적어도 뉴클레아제의 촉매 활성 도메인 (예컨대, Cas9의 경우 RuvC 촉매 도메인)에서 일어나는 것일 수 있다. 일 예에서, 상기 표적 특이적 엔도뉴클레아제가 스트렙토코커스 피요젠스 유래 Cas9 단백질 (Swi ssProt Access ion number Q99ZW2(NP_269215. 1); 서열번호 4)인 경우, 상기 변이는 촉매 활성을 갖는 아스파르트산 잔기 (catalyt i c aspartate residue ; 예컨대, 서열번호 4의 경우 10번째 위치의 아스파르트산 (D10) 등), 서열번호 4의 762번째 위치의 글루탐산 (E762) , 840번째 위치의 히스티딘 (H840) , 854번째 위치의 아스파라긴 (N854) , 863번째 위치의 아스파라긴 (N863) , 986번째 위치의 아스파르트산 (D986) 등으로 이루어진 군에서 선택된 하나 이상 임의의 다른 아미노산으로 치환된 돌연변이를 포함할 수 있다. 이 때, 치환되는 임의의 다른 아미노산은 알라닌 (alanine)일 수 있지만, 이에 제한되지 않는다.

다른 예에서, 상기 변이 표적 특이적 엔도뉴클레아제는 야생형 Cas9 단백질과 상이한 PAM 서열을 인식하도록 변이된 것일 수 있다. 예컨대, 상기 변이 표적 특이적 엔도뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 1135번째 위치의 아스파르트산 (D1135) , 1335번째 위치의 아르기닌 (R1335) , 및 1337번째 위치의 트레오닌 (T1337) 중 하나 이상, 예컨대 3개 모두가 다른 아미노산으로 치환되어, 야생형 Cas9의 PAM 서열 (NGG)와 상이한 NGA (N은 A, T, G, 및 C 중에서 선택된 임의의 염기임)을 인식하도록 변이된 것일 수 있다.

일 예에서, 상기 변이 표적 특이적 엔도뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 아미노산서열 (서열번호 4) 중,

(1) D10 , 또는 H840 ;

(2) D1135 , R1335 , T1337 , 또는 D1135 + R1335 + T1337 ; 또는 (3) ( 1)과 (2) 잔기 모두

에서 아미노산 치환이 일어난 것일 수 있다.

본 명세서에 사용된 바로서, 상기 '다른 아미노산 1 은, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 프를린, 트립토판, 발린, 아스파라긴산, 시스테인, 글루타민 글리신, 세린, 트레오닌, 티로신, 아스파르트산 글루탐산, 아르기닌, 히스티딘, 라이신, 상기 아미노산들의 공지된 모든 변형체 중에서, 야생형 단백질이 원래 변이 위치에 갖는 아미노산을 제외한 아미노산들 중에서 선택된 아미노산을 의미한다 . 일 예에서, 상기 '다른 아미노산 '은 알라닌, 발린, 글루타민, 또는 아르기닌일 수 있다.

또 다른 예에서, 상기 변이 표적 특이적 엔도뉴클레아제는 스트렙토코커스 피요젠스 유래 Cas9 단백질의 아미노산 서열 (Q99ZW2(NP— 269215. 1) )에 대하여 다음의 변이 (치환)를 갖는 것일 수 있다:

【표 1】

상기 "가이드 RNA (guide RNA) ' '는 세포 내 유전체의 특정 핵산 서열 (이하, 표적 핵산 서열)에 흔성화 가능한 표적화 서열을 포함하는 RNA를 의미하며, 생체 외 ( in vi tro) 또는 생체 (또는 세포) 내에서 Cas 단백질, Cpfl 등과 같은 RNA-가이드 엔도뉴클레아제와 결합하여 이를 목적 유전자 (또는 목적 유전자 내의 표적 부위 )로 인도하는 역할을 한다. 상기 가이드 RNA는 RNA 형태 또는 이를 암호화하는 DNA 형태로 RNA-가이드. 엔도뉴클레아제와 결합되거나 결합되지 않은 상태로 숙주 세포에 도입될 수 있다.

상기 가이드 RNA는 복합체를 형성할 엔도뉴클레아제의 종류 및 /또는 그 유래 미생물에 따라서 적절히 선택될 수 있다.

예컨대, 상기 가이드 RNA는,

표적 핵산 서열과 흔성화 가능한 부위 (표적화 서열)을 포함하는

CRISPR RNA (crRNA);

Cas 단백질 Cpfl 등과 같은 뉴클레아제와 상호작용하는 부위를 포함하는 ira^s-activating crRNA (tracrRNA); 및

상기 crRNA 및 tracrRNA의 주요 부위 (예컨대, 표적화 서열을 포함하는 crRNA 부위 및 뉴클레아제와 상호작용하는 tracrRNA의 부위)가 융합된 형태의 단일 가이드 RNA (single guide RNA; sgRNA)

로 이루어진 군에서 선택된 1종 이상일 수 있으며,

구체적으로 CRISPR RNA (crRNA) 및 ira/js—activating crRNA (tracrRNA)를 포함하는 이중 RNA (dual RNA), 또는 crRNA 및 tracrRNA의 주요 부위를 포함하는 단일 가이드 RNA (sgRNA)일 수 있다.

상기 sgRNA는 표적 핵산 서열과 상보적인 서열 (표적화 서열)을 가지는 부분 (이를 Spacer region, Target DNA recognition sequence , base pairing region 등으로도 명명함) 및 Cas 단백질과의 결합을 위한 hairpin 구조를 포함할 수 있다. 보다 구체적으로, 표적화 서열을 포함하는 부분, Cas 단백질 결합을 위한 hairpin 구조, 및 Terminator 서열을 포함할 수 있다. 상기 기술된 구조는 5'에서 3' 방향으로 순차적으로 존재하는 것일 수 있으나, 이에 제한되는 것은 아니다. 상기 가이드 NA가 crRNA 및 tracrRNA의 주요 부분 및 표적 DNA의 상보적인 부분을 포함하는 경우라면 어떠한 형태의 가이드 RNA도 본 발명에서 사용될 수 있다.

예컨대, Cas9 단백질은 표적 유전자 교정을 위하여 두 개의 가이드

RNA, 즉, 표적 유전자의 표적 부위와 흔성화 가능한 뉴클레오타이드 서열을 갖는 CRISPR RNA (crRNA)와 Cas9 단백질와 상호작용하는 ra/js-activating crRNA (tracrRNA; Cas9 단백질과 상호작용함)를 필요로 하며, 이들 crRNA와 tracrRNA는 서로 결합된 이중 가닥 crRNA: tracrRNA 복합체 형태, 또는 링커를 통하여 연결되어 단일 가이드 RNA (single guide RNA; sgRNA) 형태로 사용될 수 있다. 일 예에서, Streptococcus pyogenes 유래의 Cas9 단백질을 사용하는 경우, sgRNA는 적어도 상기 crRNA의 흔성화 가능한 뉴클레오타이드 서열을 포함하는 crRNA 일부 또는 전부와 상기 Cas9의 tracrRNA의 Cas9 단백질과 상호작용하는 부위를 적어도 포함하는 tracrRNA 일부 또는 전부가 뉴클레오타이드 링커를 통하여 헤어핀 구조 (stem-loop 구조)를 형성하는 것일 수 있다 (이 때 뉴클레오타이드 링커가 루프 구조에 해당할 수 있음).

상기 가이드 RNA, 구체적으로 crRNA 또는 sgRNA는 표적 핵산 서열과 상보적인 서열 (표적화 서열)을 포함하며, crRNA 또는 sgRNA의 업스트림 부위, 구체적으로 sgRNA 또는 dualRNA의 crRNA의 5' 말단에 하나 이상, 예컨대, 1-10개, 1-5개, 또는 1-3개의 추가의 뉴클레오티드를 포함할 수 있다. 상기 추가의 뉴클레오티드는 구아닌 (guanine, G)일 수 있으나, 이에 제한되는 것은 아니다.

다른 예에서, 상기 뉴클레아제가 Cpfl인 경우, 상기 가이드 RNA는 crRNA을 포함하는 것일 수 있으며, 복합체를 형성할 Cpfl 단백질 종류 및 /또는 그 유래 미생물에 따라서 적절히 선택될 수 있다.

상기 가이드 RNA의 구체적 서열은 뉴클레아제 (Cas9 또는 Cpfl)의 종류 (즉, 유래 미생물)에 따라서 적절히 선택할 수 있으며, 이는 이 발명이 속하는 기술 분야의 통상의 지식을 가진 자가 용이하게 알 수 있는 사항이다ᅳ

일 예에서, 표적 특이적 엔도뉴클레아제로서 Streptococcus pyogenes 유래의 Cas9 단백질을 사용하는 경우, crRNA는 다음의 일반식 1로 표현될 수 있다:

5'-(N cas9 ) 1 -(GUUUUAGAGCUA)-(X cas9 ) ra -3' (일반식 1: 서열번호 5) 상기 일반식 1에서ᅳ

N cas9 는 표적화 서열, 즉 표적 핵산 서열에 따라서 결정되는 부위 (표적 핵산 서열과 흔성화 가능)이며, 1은 상기 표적화 서열에 포함된 뉴클레오타이드 수를 나타내는 것으로 15 내지 30, 17 내지 23, 또는 18 내지 22의 정수, 예컨대 20일 수 있고,

상기 표적화 서열의 3' 방향으로 인접하여 위치하는 연속하는 12개의 뉴클레오타이드 (GUUUUAGAGCUA) (서열번호 1)를 포함하는 부위는 crRNA의 필수적 부분이고,

X cas9 는 crRNA의 3' 말단쪽에 위치하는 (즉, 상기 crRNA의 필수적 부분의 3' 방향으로 인접하여 위치하는) m개의 뉴클레오타이드를 포함하는 부위로, m은 8 내지 12의 정수, 예컨대 11일 수 있으며, 상기 m개의 뉴클레오타이드들은 서로 같거나 다를 수 있으며; 각각 독립적으로 A,. U, C 및 G로 이루어진 군에서 선택될 수 있다.

일 예에서, 상기 X cas9 는 UGCUGUUUUG (서열번호 2)를 포함할 수 있으나 이에 제한되지 않는다.

또한, 상기 tracrRNA는 다음의 일반식 2로 표현될 수 있다:

(UAGCMGUUAAMUM( :UAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC)-3 , (일반식 2 : 서열번호 6)

상기 일반식 2에서,

60개의 뉴클레오타이드 (UA( :MGUUAAMUM( :UAGUCCGUUAUCMCUUGAAAMGU( :ACCGAGUCGGUGC)

(서열번호 3)로 표시된 부위는 tracrRNA의 필수적 부분이고,

Y cas9 는 상기 tracrRNA의 필수적 부분의 5 ' 말단에 인접하여 위치하는 P개의 뉴클레오타이드를 포함하는 부위로, p는 6 내지 20의 정수, 예컨대 8 내지 19의 정수일 수 있으며, 상기 p개의 뉴클레오타이드들은 서로 같거나 다를 수 있고, A , U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.

또한, sgRNA는 상기 crRNA의 표적화 서열과 필수적 부위를 포함하는 crRNA 부분과 상기 tracrRNA의 필수적 부분 (60개 뉴클레오타이드)를 포함하는 tracrRNA 부분이 올리고뉴클레오타이드 링커를 통하여 헤어핀 구조 (stem-loop 구조)를 형성하는 것일 수 있다 (이 때, 올리고뉴클레오타이드 링커가 루프 구조에 해당함) . 보다 구체적으로, 상기 sgRNA는 crRNA의 표적화 서열과 필수적 부분을 포함하는 crRNA 부분과 tracrRNA의 필수적 부분을 포함하는 tracrRNA 부분이 서로 결합된 이중 가닥 RNA 분자에서, crRNA 부위의 3 ' 말단과 tracrRNA 부위의 5 ' 말단이 올리고뉴클레오타이드 링커를 통하여 연결된 헤어핀 구조를 갖는 것일 수 있다.

일 예에서, sgRNA는 다음의 일반식 3으로 표현될 수 있다:

5 ' _(N cas9 )厂 (GUUUUAGAGCUA)- (올리고뉴클레오타이드 링커) -

(UAα:MGlJUAAMU G( UAGUCCGUUAUC CUUGAAAMGUG( ACCGAGUCGGUGC)-3 , (일반식 3 : 서열번호 7)

상기 일반식 3에서, ^ 이는 표적화 서열로서 앞서 일반식 1에서 설명한 바와 같다.

상기 sgRNA에 포함되는 올리고뉴클레오타이드 링커는 3 내지 5개, 예컨대 4개의 뉴클레오타이드를 포함하는 것일 수 있으며, 상기 뉴클레오타이드들은 서로 같거나 다를 수 있고, A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있다.

상기 crRNA 또는 sgRNA는 5' 말단 (즉, crRNA와 타겟팅 서열 부위의 5' 말단)에 1 내지 3개의 구아닌 (G)을 추가로 포함할수 있다.

상기 tracrRNA 또는 sgRNA는 tracrRNA의 필수적 부분 (60nt)의 3 1 말단에 5개 내지 7개의 우라실 (U)을 포함하는 종결부위를 추가로 포함할 수 있다.

다른 예에서, 표적 특이적 엔도뉴클레아제가 Cpfl 시스템인 경우, 가이드 RNA (crRNA)는 다음의 일반식 4로 표현될 수 있다:

5 ' -nl-n2-A-U-n3-U-C-U-A-C-U-n4-n5-n6-n7-G-U-A-G-A-U- ( Ncp f 1 ) q-3 ' (일반식 4: 서열번호 8).

상기 일반식 4에서,

nl은 존재하지 않거나, U, A, 또는 G이고, n2는 A 또는 G이고, n3은 U, A, 또는 C이고, n4는 존재하지 않거나 G, C, 또는 A이고, n5는 A, U, C, G, 또는 존재하지 않고, n6은 U, G또는 C이고, n7은 U또는 G이며,

Ncpfl는 표적 핵산 부위와 흔성화 가능한 뉴클레오타이드 서열을 포함하는 표적화 서열로서 표적 핵산 서열에 따라서 결정되며, q는 포함된 뉴클레오타이드 수를 나타내는 것으로, 15 내지 30의 정수일 수 있다. 상기 표적 유전자의 표적 서열 (crRNA와 흔성화 하는 서열)은 P層 서열 (5'-ΤΤΝ-3' 또는 5'-ΤΤΤΝ-3'; Ν은 임의의 뉴클레오타이드로서., A, Τ, G, 또는 C의 염기를 갖는 뉴클레오타이드임)의 3' 방향으로 인접하여 위치하는 (예컨대, 연속하는) 15 내지 30개의 표적 유전자의 표적 부위의 뉴클레오타이드 서열이다.

상기 일반식 4에서 5' 말단에서 카운팅하여 6번째부터 10번째까지의

5개의 뉴클레오타이드 (5' 말단 스템 부위)와 15번째 (η4가 존재하는 경우 16번째)부터 19번째 (η4가 존재하는 경우 20번째)까지의 5개 뉴클레오타이드 (3 1 말단 스템 부위)은 서로 역평행 (antiparallel)하게 상보적 뉴클레오타이드로 이루어져 이중 가닥 구조 (스템 구조)를 형성하고, 상기 5' 말단 스템 부위와 3' 말단 스템 부위 사이의 3 내지 5개 뉴클레오타이드가 루프 구조를 형성할수 있다.

상기 Cpfl 단백질의 crRNA (예컨대, 일반식 4로 표현됨)는 5' 말단에 1 내지 3개의 구아닌 (G)을 추가로 포함할 수 있다. Cpfl 유래 미생물에 따라 사용 가능한 Cpfl 단백질의 crRNA 서열의 5' 말단 부위 서열 (표적화 서열 부위 제외한 부분)을 표 2에 예시적으로 기재하였다:

【표 2】

상기 가이드 RNA의 표적화 서열이 결합 (흔성화)하는 목적 유전자의 표적 핵산 서열은 목적 유전자 상의 PAM (Protospacer Adjacent Motif) 서열의 5' 및 /또는 3' 말단에 인접하여 위치하는 약 17개 내지 약 23개 또는 약 18개 내지 약 22개, 예컨대 20개의 연속하는 핵산 서열 (1) 또는 이의 상보적 서열 (2)로 표현될 수 있다. 이 때, 가이드 RNA의 표적화서열이 실제로 결합하는 서열은 상보적 서열 (2)일 수 있다.

상기 목적 유전자의 표적 핵산 서열은, 목적 유전자의 시작 코돈 부위 (예컨대, 시작 코돈의 5' 말단 부위) 중에서, 어느 하나의 핵산 서열에 흔성화 가능한 가이드 RNA (또는 표적화 서열)가 상기 핵산 서열과 비교하여 3개 이하, 2개 이하, 또는 1개의 불일치 서열 (mismatch)을 포함하는 다른 핵산 서열에 대하여 흔성화 정도가 현저히 낮거나 (예컨대, 상기 가이드 RNA를 사용한 유전자 교정시 DNA 변이 비율이 1% 미만, 0.5% 미만, 0J 미만, 0.05% 미만, 0.01% 미만, 0.005% 미만, 또는 0.001% 미만), 흔성화하지 않는 핵산서열들 중에서 선택된 것일 수 있다. 상기 가이드 RNA의 표적화 서열은 상기 표적 핵산 서열 (즉, PAM 서열이 위치하는 DNA 가닥의 표적 핵산 부위 또는 이의 상보적 가닥의 표적 핵산 부위의 핵산 서열)과 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 서열 상보성을 갖는 뉴클레오타이드 서열을 의미하는 것으로 상기 상보적 가닥의 뉴클레오타이드 서열과 상보적 결합이 가능하다. 이하, 특별한 언급이 없는 한 동일한 의미로 사용되며, 상기 서열 상동성은 통상적인 서열 비교 수단 (예컨대, BLAST, GCG (Genet ics Computer Group , Madi son Wi s . ) 프로그램 패키지 등)를사용하여 확인될 수 있다.

상기 방법에서, 상기 가이드 RNA와 RNA-가이드 엔도뉴클레아제

(예컨대, Cas9 단백질)의 세포 내로의 형질도입은 상기 가이드 RNA와 RNA- 가이드 엔도뉴클레아제를 통상적인 방법 (예컨대, 전기천공 등)으로 직접 세포에 도입하거나, 상기 가이드 RNA를 암호화하는 DNA 분자와 RNA-가이드 엔도뉴클레아제를 암호화하는 유전자를 하나의 백터 또는 각각 별개의 백터 (예컨대, 플라스미드, 바이러스 백터 등)에 포함된 상태로 세포에 도입하거나, mRNA del i very를 통하여 수행할수 있다.

상기 RNA-가이드 엔도뉴클레아제 (예컨대, Cas9 단백질) 또는 이의 암호화 핵산 분자, 가이드 RNA 또는 이의 암호화 DNA 분자, 또는 상기 핵산 분자 및 DNA 분자 증 하나 이상을 포함하는 백터는 각각 미세주입법 (microinj ect ion) , 전기천공법 (electroporat ion), DEAE-텍스트란 처리 (DEAE-dextran treatment ) , 리포펙션 ( l ipofect ion) , 나노파티클 -매개 형질주입, 단백질 전달 도메인 (Protein translocat ion domain, PTD) 매개 도입, 바이러스 -매개 유전자 전달, PEG-매개 트랜스펙션 등과 같은 당업계의 다양한 방법에 의해 세포로 도입 (전달)될 수 있으나, 이에 제한되는 것은 아니다.

또한, 숙주 세포의 핵내 전달을 위하여, 상기 RNA-가이드 엔도뉴클레아제 (예컨대, Cas9 단백질)는 적절한 핵 위치화 신호 (nuclear local i zat ion signal )를 추가로 포함할 수 있다.

상기 "절단 (cleavage) "은 핵산 서열의 covalent backbone의 파손 (breakage)을 의미한다. 상기 절단은 포스포다이에스터 (phosphodi ester ) 결합의 효소적 또는 화학적 가수분해를 포함하나, 이에 제한되지 않으며, 이외의 다양한 여러 가지 방법들에 의하여 수행될 수 있다. 단일-가닥의 절단 및 이중-가닥의 절단 모두 가능하며, 이중-가닥의 절단은 두 개의 구별되는 (di st inct ) 단일-가닥의 절단의 결과로서 발생할 수 있다. 이중 가닥의 절단은 blunt ends 또는 staggered end를 생성할수 있다.

본 명세서에 사용된 바로서, 용어 "도너 (donor ) DNA구조체 "는 숙주 세포의 유전체 내에 삽입하고자 하는 도너 DNA 분자 또는 상기 도너 DNA 분자를 포함하는 재조합 백터 (제 3 재조합 백터)일 수 있다.

상기 도너 DNA 분자는 프로모터를 포함한다. 상기 프로모터는 숙주 세포 이외의 세포 (숙주 세포와 이종 세포)에서 유래하는 외래 프로모터로서, 숙주 세포의 발현 시스템의 조절 하에서 이와 작동가능하게 연결된 유전자의 과발현을 유도할 수 있는 모든 프로모터들 중에서 선택된 1종 이상일 수 있다. 예컨대, 상기 프로모터는 CMV 프로모터 (예컨대, 인간 CMV i隱 ediate-ear ly 프로모터, 마우스 CMV immediate-ear ly 프로모터 등), T7 프로모터, SP6 프로모터, rpr-1 프로모터, rrk 프로모터, U6 프로모터, UBC 프로모터 , ACTB 프로모터, EF1A 프로모터, CAG 프로모터, SV40 프로모터, PGK 프로모터, TRE 프로모터 등으로 이루어진 군에서 선택된 1종 이상일 수 있다.

상기 프로모터는 숙주 세포의 유전체 내의 목적 폴리펩타이드를 암호화하는 목적 유전자의 시작 코돈의 5 ' 말단쪽 (예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5 ' -UTR사이 ; 상기 "시작 코돈"은 시그널 펩타이드를 포함한 폴리펩타이드 또는 시그널 펩타이드를 제외한 목적 폴리펩타이드의 첫 번째 아미노산을 암호화하는 코돈을 의미할 수 있음, 이하 동일함)에 상기 목적 유전자와 작동 가능하게 연결되도록 삽입될 수 있다. 상기 용어 "작동 가능하게 연결된다 (operat ively l inked) "고 함은 상기 프로모터와 목적 유전자 사이의 기능적인 결합 (ci s)을 의미한다. 상기 프로모터는 목적 유전자에 "작동 가능하게 연결 (operat ively l inked) "됨으로써 목적 유전자의 전사 및 /또는 해독을 조절할 수 있다. 상기 프로모터가 목적 유전자에 작동 가능하게 연결되기 위해서, 목적 유전자의 5 ' 말단 쪽에 연결된 것일 수 있다.

상기 프로모터는 앞서 설명한 표적 특이적 엔도뉴클레아제 시스템에 의하여 절단된 위치에 삽입될 수 있다. 따라서, 상기 표적 특이적 엔도뉴클레아제 시스템에 포함된 특정 표적 핵산 서열을 인식하는 핵산 분자 (예컨대, 가이드 RNA)는 상기 엔도뉴클레아제가 숙주 세포의 유전체 내의 목적 폴리펩타이드를 암호화하는 목적 유전자의 시작 코돈의 5 ' 말단쪽 (예컨대, 상기 목적 유전자의 시작 코돈과 원래의 내재 프로모터 또는 5 ' -UTR 사이)를 절단할 수 있도록 목적 유전자의 시작 코돈의 근처의 핵산 서열을 표적 핵산 서열로 인식하도록 (즉, 표적화 서열이 상기 표적 핵산 서열과 흔성화 가능한 (상보적인) 서열을 갖도록) 설계된 것일 수 있다.

상기 프로모터는 숙주 세포의 유전체 내의 목적 유전자의 시작 코돈의 5 ' 말단쪽의 소정의 위치에 삽입되어, 원래의 내재 프로모터를 대체 (치환)하여, 이와 작동가능하게 연결된 목적 유전자의 발현을 조절하는 것일 수 있다. 숙주 세포의 유전체 내의 목적 유전자의 시작 코돈의 5 ' 말단쪽의 소정의 위치에 삽입된 프로모터 (외래 프로모터)가 실제 숙주 세포 유전체 내의 내재 프로모터를 치환하는지 여부와 무관하게, 상기 내재 프로모터는 프로모터로서의 기능을 나타내지 않고, 목적 유전자는 삽입된 프로모터에만 의존적으로 발현하게 된다.

다른 예에서, 상기 도너 DNA 분자는 앞서 설명한 바와 같은 외래 프로모터 이외에, 적절한 태그 암호화 핵산 분자 (태그 유전자), 선별 마커, 리포터 유전자, 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열 (핵산 분자), 외래 인트론 (예컨대, SV40 인트론, CMV 인트론 Aᅳ 베타- 글로빈 인트론, 유비퀴틴 인트론 (UbC 인트론), hGH 인트론 등으로 이루어진 군에서 선택된 1종 이상) 등으로 이루어진 군에서 선택된 1종 이상을 추가로 포함할 수 있다.

일 예에서, 상기 도너 DNA 분자는 앞서 설명한 바와 같은 외래 프로모터를 필수적으로 포함하는 것일 수 있다. 다른 예에서, 상기 도너 DNA 분자는 외래 프로모터에 더하여, 태그 암호화 핵산 서열을 추가로 포함하는 것일 수 있다. 이 경우, 상기 외래 프로모터와 태그 암호화 핵산 서열은 하나의 DNA 구조체에 함께 포함되거나 각각 다른 DNA 구조체에 각각 포함될 수 있다. 상기 외래 프로모터와 태그 암호화 핵산 서열이 하나의 DNA 구조체에 함께 포함되는 경우, 상기 외래 DNA 분자는, 5 '에서 3 ' 방향으로, 외래 프로모터와 태그 암호화 핵산 서열 (유전자)을 순차적으로 포함할 수 있다. 또한, 상기 외래 프로모터와 태그 암호화 핵산 서열이 하나의 DNA 구조체에 함께 포함되는 경우, 상기 도너 DNA 분자는 외래 프로모터 및 태그 암호화 핵산 서열에 더하여, 상기 태그 암호화 핵산 서열의 5 ' 말단에 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열을 추가로 포함하는 것일 수 있다 (이 경우, 상기 도너 DNA 분자는 5 '에서 3 1 방향으로, 외래 프로모터, 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열, 및 태그 암호화 핵산 서열을 순차적으로 포함하는 것일 수 있다) . 다른 예에서, 상기 도너 DNA분자는, 외래 프로모터 및 태그 암호화 핵산 서열, 및 상기 태그 암호화 핵산 서열의 5 ' 말단에 연결된 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열에 더하여, 선별마커 및 외래 인트론 (예컨대, SV40 인트론)으로 이루어진 군에서 선택된 1종 이상을 추가로 포함할 수 있다. 일 구체예에서 , 상기 도너 DNA 분자는, 5 '에서 3 1 방향으로, ( 1) 선별 마커, (2) 외래 프로모터, (3) SV40 인트론, (4) 내인성 목적 폴리펩타이드의 시그널 펩타이드 암호화 핵산 서열, 및 (5) 태그 암호화 핵산 서열을 순차적으로 포함하는 것일 수 있다.

상기 태그는 숙주 세포에서 생산된 내인성 목적 폴리펩타이드의 분리 및 /또는 정제를 용이하게 위한 것으로, 상기 DNA 분자의 N-말단 암호화 부위 (5 ' 말단쪽), C-말단 암호화 부위 (3 ' 말단쪽), 또는 내인성 목적 폴리펩타이드의 시그널 펩타이드의 암호화 핵산 서열의 하류 (3 ' 말단쪽)에 연결된 것일 수 있다. 상기 태그가 내인성 목적 폴리펩타이드의 시그널 펩타이드의 암호화 핵산 서열의 하류에 연결되는 경우, 숙주 세포 내에서 목적 폴리펩타이드 발현시 시그널 펩타이드가 잘려나가면 태그의 N-말단이 노출되어 상기 태그에 특이적으로 결합 가능한 물질 (예컨대, 항체 등)에 의하여 용이하게 검출 및 /또는 정제할 수 있다. 상기 태그는 예컨대 항체와 결합할 수 있고 형광, 발광, 발색 등의 신호를 발생시킬 수 있는, 통상적으로 사용되는 모든 태그들 중에서 선택될 수 있으며, 예컨대, c-myc , 6x Hi s , FLAG , HA , V5 , TAP 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.

상기 내인성 목적 폴리펩타이드의 시그널 펩타이드의 암호화 핵산 서열은 세포 외에서 인위적으로 얻어진 (합성된) 핵산 서열일 수 있다. 상기 도너 DNA 구조체가 내인성 목적 폴리펩타이드의 시그널 펩타이드의 암호화 핵산 서열을 포함하는 경우, 표적 특이적 엔도뉴클레아제 시스템은 내인성 목적 폴리펩타이드의 아미노산 서열 중 시그널 펩타이드 암호화 핵산 서열의 3 1 말단 또는 내부를 절단하도록 설계된 것일 수 있고, 예컨대, 내인성 목적 폴리펩타이드의 아미노산 서열 중 시그널 펩타이드를 제외한 첫 번째 아미노산을 암호화하는 코돈의 5 ' 말단쪽 인접 부위를 절단하도록 설계된 것일 수 있다.

상기 선별 마커는 상기 도너 DNA 구조체가 삽입된 숙주 세포를 선별하기 위한 가이드 기능을 하는 유전자로서, 약물 내성 마커, 형광 마커, 발광 마커, 대사 관련 마커, 유전자 증폭 마커 둥으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다. 상기 형광 마커는 형광 단백질 (예를 들면 녹색 형광 단백질 (GFP) , 시안 형광 단백질 (CFP) , 황색 형광 단백질 (YFP) , 적색 형광 단백질 (dsRFP) 등)을 암호화하는 유전자들로 이루어진 군에서 선택된 1종 이상일 수 있지만, 이에 한정되지는 것은 아니다. 상기 발광 마커는 루시페라제 등의 발광 단백질을 암호화하는 유전자들로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 한정되는 것은 아니다. 상기 약물 내성 마커는 항생 물질 (예를 들면 암피실린, 스트랩토마이신 , 겐타마이신, 카나마이신, 하이그로마이신, 테트라사이클린, 클로람페니콜, 네오마이신, 블라스티시딘, 제오신, 퓨로마이신 등)에 대한 내성 유전자들로 이루어진 군에서 선택된

1종 이상일 수 있으나, 이에 한정되지는 것은 아니다. 상기 대사관련 마커는 티미딘 키나아제 (TK) 유전자, 디하이드로폴레이트 환원효소 (Dihydrofolate reductase , DHFR) 유전자, 글루타민 합성효소 (Glutamine synthetase , GS) 유전자 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다.

상기 리포터 유전자는 특정 DNA가 삽입된 세포의 선별에 통상적으로 사용되는 모든 유전자들 중에서 선텍될 수 있으며, 예컨대, 트랜스펙션된 콜로니의 블루 /화이트 선택을 용이하게 하기 위한 l acZ 리포터 유전자일 수 있으나, 이에 한정되는 것은 아니다.

일 예에서, 상기 도너 DNA 구조체는 5 1 에서 3 ' 방향으로 선별마커, 외래 프로모터, SV40 인트론, 시그널 펩타이드, 및 태그를 포함하는 것일 수 있다 (도 1 참조) . 도 1은 상기 도너 DNA 구조체가 표적 특이적 엔도뉴클레아제 시스템에 의하여 목적 유전자의 시작 코돈의 5 ' 말단쪽의 특정 위치에 삽입되는 과정을 모식적으로 보여준다.

다른 예에서, 상기 도너 DNA 분자는 외래 프로모터와 태그 유전자를 포함하는 것일 수 있고, 이 경우, 상기 외래 프로모터와 태그 유전자는 각각 별개의 재조합 백터에 포함하는 것일 수 있다 (즉, 상기 도너 DNA 구조체는 외래 프로모터 포함 재조합 백터와 태그 유전자 포함 재조합 백터를 포함하는 것일 수 있다) . 이 때, 상기 외래 프로모터와 태그 유전자는 숙주 세포의 유전체 내의 서로 다른 위치에 삽입될 수 있다. 예컨대, 외래 프로모터는 앞서 설명한 위치, 즉 숙주 세포의 유전체 내의 목적 유전자의 시작 코돈의 5 ' 말단쪽의 소정의 위치에 삽입되고, 태그 유전자는 목적 유전자의 시작 코돈, 종결 코돈 또는 내인성 펩타이드 절단 부위 (내인성 목적 폴리펩타이드의 시그널 펩타이드가 절단되어 목적 폴리펩타이드로부터 분리되는 부위 또는 자체적 프로세싱되어 절단되는 부위 )에 도입 (삽입 )될 수 있다. 이와 같은 외래 프로모터 및 태그 유전자의 삽입 위치는 목적 유전자의 종류와 목적에 따라 다양하게 선택할 수 있다. 예컨대, 상기 태그 유전자를 시작코돈 (5 ' UTR) 및 /또는 종결 코돈 (3 ' UTR) 에 도입하여 N-말단 및 /또는 C-말단에 태그를 삽입할 수 있으며, 또는 내인성 펩타이드 절단 부위에 도입하여 상기 목적 유전자에 의하여 발현된 목적 폴리펩타이드가 세포 내에서 분해효소에 의하여 절단되어 프로세싱되는 부위에 태그를 삽입할 수 있다. 본 발명의 일 구체예에 따르면, 태그 유전자를 RELN 유전자의 시작 코돈에서부터 시작하는 시그널 펩타이드 뒤쪽에 삽입할 수 있다. 이와 같이 외래 프로모터와 태그 유전자를 서로 숙주 세포의 유전체 내의 서로 다른 위치에 도입 (삽입)하기 위하여, 서로 다른 부위를 표적으로 하는 2개 이상의 표적 특이적 엔도뉴클레아제 시스템을사용할수 있다. _

상기 도너 DNA 구조체는 미세주입법 (mi croinject ion) , 전기천공법 (electroporat ion) , DEAE-덱스트란 처리 (DEAE-dextran treatment ) , 리포펙션 ( l ipofect ion), 나노파티클 -매개 형질주입, 단백질 전달 도메인 (Protein translocat ion domain, PTD) 매개 도입, 바이러스- 매개 유전자 전달, PEG-매개 트랜스펙션 등과 같은 당업계의 다양한 방법에 의해 숙주 세포에 도입 (전달)될 수 있으나, 이에 제한되는 것은 아니다. 일 예에서, 상기 표적 특이적 엔도뉴크레아제 시스템 및 /또는 도너 DNA 구조체는 통상의 백터를 통하여 숙주 세포에 도입될 수 있다. 상기 백터는 바이러스 백터일 수 있다. 상기 바이러스 백터는 레트로바이러스, 아데노바이러스 파보바이러스 (예컨대, 아데노관련 (adenoassociated) 바이러스 (AAV) ) , 코로나바이러스, 오르소믹소바이러스 (orthomyxovi rus)와 같은 음성 가닥 RNA 바이러스들 (예컨대 인플루엔자 바이러스), 랩도바이러스 (rhabdovirus) 예컨대, 광견병 및 소포성 구내염 바이러스), 파라믹소바이러스 (paramyxovi rus) (예컨대, 흥역 및 센다이 (Sendai ) , 알파바이러스 (alphavirus) 및 피코르나바이러스 (pi cornavi rus)와 같은 양성 가닥 RNA 바이러스들, 및 헤르페스바이러스 (예컨대, 단순포진 (Herpes Simplex) 바이러스 타입들 1 및 2 , 엡스타인 (Epstein)-바 (Barr ) 바이러스, 사이토메갈로바이러스 (cytomegalovirus) ) , 아데노바이러스를 포함하는 이중-가닥의 DNA 바이러스들, 폭스바이러스 (poxvirus) (예컨대, 우두 (vaccini a) , 계두 ( fowlpox) , 카나리아두창 (canarypox) ) 등으로 이루어진 군에서 선택된 1종 이상일 수 있으나, 이에 제한되는 것은 아니다. 본 명세서에 제공된 바와 같이, 숙주 세포의 유전체에 존재하는 내인성 목적 폴리펩타이드를 암호화하는 목적 유전자의 특정 위치에 외래 프로모터가 삽입됨으로써, 외래 프로모터가 삽입되지 않은 경우와 비교하여, 목적 폴리펩타이드의 발현량이 20% 이상 ( 1.2배 이상), 30% 이상 ( 1.3배 이상), 40% 이상 ( 1.4배 이상), 50% 이상 ( 1.5배 이상), 60% 이상 (1.6배 이상) , 70% 이상 ( 1.7배 이상), 80% 이상 ( 1.8배 이상) , 90% 이상 ( 1.9배 이상) 100% 이상 (2배 ' 이상), 110% 이상 (2. 1배 이상) , 120% 이상 (2.2배 이상) 130% 이상 (2.3배 이상), 140% 이상 (2.4배 이상), 150% 이상 (2.5배 이상) 200%(3배 이상) 이상, 300% 이상 ( . 4배 이상), 400% 이상 (5배 이상), 500% 이상 (6배 이상), 600% 이상 (7배 이상), 700% 이상 (8배 이상) , 800% 이상 (9배 이상), 900% 이상 (10배 이상), 또는 1000% 이상 (11배 이상) 증가할 수 있다.

【발명의 효과】

본 명세서에서 제공되는 표적 특이적 엔도뉴클레아제 시스템을 이용한 프로모터 교체 및 태그 삽입은 목적 폴리펩타이드의 크기에 따른 한계를 극복할 수 있는 방법으로, 표적 특이적 엔도뉴클레아제 (예컨대, Cas9)에 의해 유도되는 상동 의존성 복구 (HDR)을 통해 원하는 서열 (외래 프로모터 및 태그)을 원하는 위치에 정확하게 삽입할 수 있고, 내인성 유전자를 발현시키므로, 유전자의 크기나 반복서열의 존재와 같이 재조합에 어려움을 주는 요소들의 영향을 전혀 받지 않고, 목적 폴리펩타이드의 안정적인 과발현이 가능하고 정제가 용이하다는 이점이 있다. 또한 유전자의 발현에는 암호화 서열 (CDS) 뿐만 아니라 비암호화 서열 (UTR)이나 인트론도 영향을 끼치는 것으로 알려져 있는데, 본 명세서에서 제공되는 표적 특이적 엔도뉴클레아제 시스템을 이용한 유전자 태그 삽입은 이러한 단백질이 발현되는 본래의 세포의 genet i c context를 그대로 이용할 수 있으므로 유전자 발현을 위한 최적의 조건을 유지할 수 있다는 장점도 갖는다. 【도면의 간단한 설명】

도 1은 일 실시예에 따른 내인성 목적 폴리펩타이드의 과발현을 위하여 프로모터와 항체 태그를 숙주 세포의 유전체 내에 삽입하는 과정을 예시적으로 보여주는 모식도이다.

도 2는 Reel in 유전자 내의 특정 표적 핵산 서열에 특이적으로 결합하는 다양한 sgRNA를 사용한 유전자 교정 결과 얻어진 DNA 돌연변이 비율을 보여주는 결과이다.

도 3a 내지 3c는 유세포 분석을 통해 RELN 유전자에 외래 과발현 프로모터와 태그 유전자가삽입된 인간 세포의 분리 결과를 나타낸 것이다. 도 4a 및 4b는 RELN유전자에 외래 과발현 프로모터와 태그 유전자가 삽입된 인간 단일 세포주의 배양 배지에서의 Reel in 단백질의 검출 결과 (4a: western blott ing; 4b: 정량결과)를 나타낸 것이다.

도 5 RELN 유전자에 외래 과발현 프로모터와 태그 유전자가 삽입된 인간 세포의 배양 배지로부터의 Reel in 단백질의 검출 결과 ( i隱 une_ precipetat ion)를 나타낸 것이다.

도 6은 pAAY-hygro-sfGFP플라스미드의 개열지도이다.

【발명의 실시를 위한 형태】

이하에서는 실시예를 들어 본 발명을 더욱 구체적으로 설명하고자 하나, 이는 예시적인 것에 불과할 뿐 본 발명의 범위를 제한하고자 함이 아니다. 아래 기재된 실시예들은 발명의 본질적인 요지를 벗어나지 않는 범위에서 변형될 수 있음은 당 업자들에게 있어 자명하다. 실시예 1: 인간 세포의 내인성 RELN 유전자에 외래 프로모터 삽입을 위한도너 DNA구조체의 제작

인간의 Reel in 단백질 (NP— 005036.2)을 암호화는 RELN 유전자 (NG_011877.1)는 크기가 거대하고 (genomic 150 kb, cDNA 11 kb) .모들화된 반복서열이 유전자 내에 존재하여 유전자 재조합을 통해 인간세포에서 발현시키는 것이 불가능한 것으로 알려져 있다. 이러한 한계점을 극복하기 위하여 크리스퍼 유전자 가위를 이용하여 내인성 RELN 유전자에 태그와 과발현 프로모터를 삽입한 뒤 인간 세포주 (HEK293 세포)에서 Reel in 단백질의 분리 정제를 시도하였다.

도 1은 크리스퍼 유전자 가위를 이용한 과발현 프로모터와 항체 태그 삽입에 대한 모식도이다.

내인성의 RELN 유전자를 과발현 시키기 위하여, 과발현 프로모터인 CMV (Cytomegalovirus) 프로모터를 삽입하고 FLAG 항체 태그를 Reel in의 signal pept ides 암호화 서열 하튜 (3 ' 말단쪽)에 연결하여 세포 내에서 signal pept ide가 잘려 나가면 FLAG 태그의 N-말단이 노출되어 FLAG Ml 항체에 의하여 검출 및 정제가 용이하도록 하였다. 또한, 유전자 주입된 세포를 주입되지 않은 세포와 쉽게 구분해 낼 수 있게 하기 위하여 선택 마커로 하이그로마이신 저항 유전자 (하이그로마이신 포스포트랜스퍼레이즈 (Hygromycin phosphotransferase) 유전자)와 super - fold Green f luorescene protein(sfGFP)가 결합된 마커 (Hyg R -sfGFP)를 함께 삽입하였다. 이와 같이 제작한 주형 플라스미드를 Cas9 시스템을 이용하여 RELN 유전자의 시작 코돈에서부터 시작하는 시그널 펩타이드 뒤쪽에 삽입하였다. 주형 폴라스미드 제작에는 pRG2 플라스미드 (ADDGENE 구입)과 pAAY-hygro-sfGFP플라스미드 (서열번호 21 및 도 6)을사용하였다.

이와 같이 제작된 도너 DNA 구조체의 구성을 5 '에서 3 ' 순서로 하기의 표 3에 정리하였다:

【표 3】

nCATCTGCACCACCG( MGCTGCCCGTGCOT(^CTACCCTCGTGACCACACTGACCTACGG CGTGCAGTGCnCAGCAGATACCCCGACCACATG GCGGCACGATTTCTTCAAGAGCGCCATGC CCGAGimATGTGCAGGMCffiACCATCAGOTCMffiACGACffiCACCTACMGACCAGAG CC

GAAGTGMOTCGAG XGACACCCTCGTGAACCGGATCGAGCTGAA

GGAC( CAACATCCTGGGCCACMGCTGGAGTACMCTTCAACAGCCA^

CCGACM(X;AGMG C(^CATCM(^CCMCTTCAAGATCCGGCACAACGTGGAAGATGGCAGC

GTGCAGCTX^GCCGACCACTACCAGCAGAACACCCCCATCGGAGATGGCCCCGTGCT GCTGCCCGA

CMCCACTACCTGAO:ACCCAGAGCGTGCTGAGCAAGGACCCCAACGAGAAGCGGGAC CACATGG

TGCTGCTGGMMGTGACCGCCGCTGGCATCACCCACG ( ATGGACGA^

TGA (서열번호 9)

CMV(Cytome TAGmnMTAGTMTCAATTACGGGGTCATTAGnCATAGCCCATATATGGAGTTCCGCGnA 로 galovirus) CATMCnACO TAMT∞CCCGCCTG( TGACCGCCCAACGACCCCCGCCCAnGACGTCAATA 모 프로모터 ATGACGTATGTOCCATAGTMCGCCMTA^ACmCCAnGACGTCAATGGGTGGAGTATrr 터 ACffiTAMCTGCCCAOTGOAGTACATC CTGTATCATATGCCMGTACGCCCCCTATTGACG

TCMTGACGGTAMTGGCCCGCCTO^AnATGCCCAGTACATGACCmTGGGACmCCTACT

TGGCAGTACATCTACGTAmGTCATCGCTAnACCATGGTGATGCC^TmGGCAGTACAT CAA

TGGGCGTGGATA( mGACTCACGGGGAmCCAAGTCTCCACC

GmGTmGGCACCAAMTCMCG ( ACmCCAAMTGTCGTMC^

CAMTGGGCGGTAGGCGTGTACGGT^AGGTCTATATMGCAGAGCTGGTTTAGTGAACCGTC A

GAT (서열번호 10)

SV40 GTMGTATCMGGnACMGACAi^mAAGGAGACCAATAGAAACTGGGCTTGTCGAGACAGAG 트론 MGACTCTrGCGmCTGATAGGCACCTATTGGTCTTACTGACATCCAC^

CAG (서열번호 11)

시그널 ATGGAGCGCAGTGGCTG iCCCGi AGACTmCTCCTAGCGCTG^

펩타이드 AGCGCGCGCG (서열번호 12)

태 FLAG tag GAHACAAGGATGACGATGACAAG (서열번호 13)

그 실시예 2 : 인간 세포의 내인성 RELN 유전자에 외래 프로모터 삽입을 위한표적 핵산서열 선별

상기 실시예 1에서 준비된 도너 DNA 구조체를 인간 숙주 세포 (HEK293E 혹은 HEK293 cl8 세포; ATCC #CRL-10852의 유전체 내에 삽입하기 위하여, Reel in의 N-말단 암호화 부위를 표적화하는 6종의 단일 가이드 RNA(sgRNA)를 포함하는 Cas9 시스템을 구축하여, 이 증에서 효율이 높은 sgRNA를 선정하였다. 상기 sgRNA는 RELN 유전자의 시작 코돈 근처의 핵산 부위 중에서 인간 유전체에서 두 개까지 미스매치를 허용하였을 때 of f-targets이 존재하지 않는 핵산 서열을 표적 핵산 서열로 하여 선정하여 아래의 표 4에 나타내었다.

【표 4]

상기 sgRNA는 다음의 핵산서열을 갖는다:

5'- (표적화 서열) -(GUUUUAGAGCUA; 서열번호 1)- (뉴클레오타이드 링커) -(UA(X GUUAAMUM(¾CUAGUCCGUUAUCMCUUGAAAAAGUGGCACCGAGUCGGUGC; 서열번호 3)-3'

(상기 표적화 서열은 PAM 서열이 위치하는 가닥의 상보적 가닥의 표적 핵산서열과상보적인 서열을 갖는 것으로, 상기의 표 3에 기재된 RGEN Target sequence 중 3' 말단의 PAM 서열 ("NGG"; N은 임의의 뉴클레오타이드로서, A, T, G, 또는 C의 염기를 갖는 뉴클레오타이드임)를 제외한 핵산 서열에서 'Τ'를 "U 1 '로 변환한 서열이며, 상기 뉴클레오타이드 링커는 GAM의 뉴클레오타이드 서열을 가짐).

상기 선정한 표적 핵산 서열의 효율을 검증하기 위하여 상기 표적 핵산 서열을 표적화하는 표적화 서열을 포함하는 sgRNA (RELN_sgl 내지 RELN— sg7)의 암호화 DNA를 pRG2. 플라스미드 (ADDGENE 구입)에 삽입하여 sgRNA 발현 플라스미드를 준비하고, sgRNA 발현 플라스미드 250 ng을 Cas9 발현 p3S-Cas9HC 플라스미드 (ADDGENE 구입) 750 ng와 함께 HEK293E 세포 (ATCC #CRL-10852) lxlO 5 개에 Lipofectatnine 2000 (Invitrogen)을 이용하여 lipofection방법으로 트랜스펙션하였다.

NGS를 이용한 targeted deep-sequencing (Jeongbin Park, ayeong

Lim, Jin-Soo Kim, Sangsu Bae; Cas一 analyzer : an online tool for assessing genome editing results using NGS data, Bioinformatics, Volume 33, Issue 2, 15 January 2017, Pages 286-288 참조)으로 표적화 부위의 DNA 변이율 (%; [mutated count/total count]*100)을 측정하여 도 2에 나타내었다. 도 2에 나타낸 바와 같이, 시험된 sgRNA 중, RELNᅳ sgl, RELN_sg5, 및 RELN_sg6가 높은 효율을 보임을 확인하였다. 이 중에서 RELN_sg5 및 RELNᅳ sg6를 선택하여 향후 실험에 사용하였다. 실시예 3: 인간세포의 내인성 RELN유전자에 외래 프로모터 삽입 상기 실시예 2에서 선정한 Cas9-sgRNA(RELN_sg5 , sg6)와 실시예 1에서 준비한 도너 DNA 구조체를 HEK293E 세포에 트랜스펙션하여 상동 의존성 복구 (HDR)에 의한 유전자 삽입을 유도하였다. 구체적으로, sgRNA 발현 플라스미드 250 ng, Cas9 발현 플라스미드 750 ng 및 실시예 1의 도너 DNA 구조체 1000 ng를 HEK293E 세포 (ATCC #CRL- 10852) Lipofect ion 방법으로 트랜스펙션하고, DMEM ( 10% FBS, 1 % ant ibiot i cs / WELGENE) 배지에서 37 ° C , 5% C02 조건으로 배양하였다. 트랜스펙션한 세포의 선별을 위하여 Hygromycin을 배양액에 첨가하여 유전자 삽입이 일어난 세포만 선택적으로 살아남도록 하였다. 약 2주간의 배양을 거친 세포들을 유세포 분석 (FACS: Flow Cytometry)으로 분석하여 형광 마커인 GFP 신호가 나오는 세포만 분리하고, 그 결과를 도 3a 내지 3c에 나타내었다. 도 3a 내지 3c에서, P1은 유세포 분석에 들어간 총 세포수, P2는 P1 증에서 세포의 크기 분석을 통해 정상적인 하나의 세포로 분석된 세포의 개수, P3는 P2 중에서 살아있는 세포로 분석된 세포의 개수, P4는 P3 중에서 GFP 형광을 나타내는 세포의 수 (즉, 원하는 donor가 삽입된 세포의 수), #Event는 분석한 개수 (세포수) , )arent는 Pn에 대한 Pn+1의 비율, Wotal은 al l events에 대한 Pn의 비율을 각각 의미한다. 일차적으로 Hygromycin에 의한 선별을 거쳤기 때문에 높은 효율 (P4(%Parent ) 약 87-88 로 형광 마커가 검출되는 세포 (외래 프로모터 삽입)를 분리하여, 외래 프로모터를 포함하는 도너 DNA구조체가삽입된 HEK293E 세포를 얻었다. 실시예 4. 외래 프로모터 삽입된 인간 세포에서 Reel in 단백질의 과발현 확인 및 균일 세포주 확립

상기 실시예 3에서 얻어진 외래 프로모터를 포함하는 도너 DNA 구조체가 삽입된 인간 세포들에서 태그가 포함된 Reel in 단백질이 발현되는지 여부를 확인하기 위하여, FLAG M2 항체를 이용하여 western blott ing을 진행하였다. 구체적으로, 실시예 3에서 얻어진 외래 프로모터를 포함하는 도너 DNA 구조체가 삽입된 HEK 293E 세포를 DMEM ( 10% FBS, 1 % ant ibiot i cs I WELGENE) 배지에서 37도, 5% C02 조건으로 배양하여 얻어진 배양 배지에 FLAG M2 (MERCK F3165) 항체를 처리하고 western blott ing을 수행하여 그 결과를 도 4에 나타내었다.

보다 구체적으로, 균일한 세포주를 확립하기 위하여, 상기 실시예 3에서 얻어진 외래 프로모터를 포함하는 도너 DNA 구조체가 삽입된 HEK293E 세포를 96-wel l plate의 각 웰에 1개씩 넣고 DMEM (10% FBS, 1 % ant ibiot ics/WELGENE) 배지에서 37도, 5% C0 2 조건으로 3주 동안 단일세포 배양하였다. 상기 배양 배지에 상기한 방법으로 FLAG M2 항체 (MERCK F3165)를 처리하고 western blott ing을 진행하여 그 결과를 도 4a에 나타내고 이를 정량한 결과를 도 4b에 나타내었다. 도 4a 및 4b에서 HT- 일련번호로 표시된 것은 각 웰에서 단일세포 배양된 단일 세포주를 나타내고, M은 배양 배지, Bulk는 실시예 3에서 얻어진 외래 프로모터를 포함하는 도너 DNA 구조체가 삽입된 HEK293E 세포 lxlO 6 개를 배양한 세포집락을 의미한다. 도 4a 및 4b에 나타난 바와 같이 RELN_sg5-HT6와 RELN_sg6-HT8 두 개 단일 세포주에서 bulk cel l과 비교하여 매우 높은 수준의 Reel in 발현 및 분비를 보이는 것을 확인할 수 있다. 도 4a 및 4b에 나타낸 바와 같이, 상기 세포들의 배양 배지에서 FLAG 태그가 포함된 Reel in 단백질이 비교적 많은 양으로 검출됨을 확인하였고, 이는 Reel in 단백질이 발현되어 세포 밖으로 잘 분비되고 있음을 보여주는 것이다

Reel in 단백질의 정제 가능성을 타진하기 위하여 면역침강법 ( i画 une- precipetat ion)을 이용하여 소량 정제를 시도하였다. RELN_sg5 Bulk와 RELN_sg6 Bulk 세포 배양액을 각각 1.4 mL씩 1.5 mL 튜브에 넣고 FLAG M2 항체 레진 10 ^와 섞어 1시간 동안 튜브를 천천히 회전하며 섞어주었다. 원심분리를 통해 레진 및 레진에 결합한 단백질 분획을 결합하지 않은 분획으로부터 분리한 후 SDS-PAGE를 이용하여 분석하여 그 결과를 도 5에 나타내었다. 도 5에서 나타낸 SDS-PAGE의 결과와 같이, 1) 세포배양액, 2) resin에 붙지 않은 단백질, 3) 레진 및 레진에 붙은 단백질을 순서대로 젤에 로딩하여 분석하였다. 이 결과로부터 RELN— sg5 Bulk와 RELN_sg6 Bulk 세포 배양액 모두에 대해 Reel in 단백질이 FLAG Ml 항체 레진에 잘 결합하여 순수하게 정제가가능하다는 것을 확인하였다.

추가적으로 RELN_sg5 Bulk 배양액으로부터 온 FLAG Ml 항체 레진 결합 단백질에 대해 질량분석 (LC-MS 분석)을 진행하였다. 상기 도 5에서 관찰된 두 개의 단백질 밴드 (Band A 및 Band B)에 대해 각각 분석을 진행하였으며, 정제된 단백질의 질량분석 결과를 하기의 표 5 및 표 6에 나타내었다: 【표 5】

Band A에서 정제된 단백질 질량 분석 결과

상기 표 5 및 표 6에서와 같이, 두 밴드 모두 인간의 단백질의 서열 (RELN_HUMAN)을 가지고 있음을 검증하였다. 상기와 같이 Reel in 발현이 높게 나타나는 단일 세포주들을 대량 배양으로 키워 Reel in 단백질의 대량 생산을 가능하게 할 수 있다.

Reel in은 뇌발달과 신경세포 조절에 관여하는 중요한 분비 단백질이다. 그 중요성에도 불구하고 거대한 유전자 크기와 반복서열의 존재 때문에 아직까지 재조합을 통한 단백질 생산 및 추출에 성공한 예가 없었다. 이 때문에 Reel in단백질의 정확한 구조도 알려지지 않았다.

본 명세서에서 제공되는 표적 특이적 엔도뉴클레아제 시스템을 이용한 프로모터 교체 및 내인성 유전자 태그 삽입은 이러한 어려움을 극복할 수 있는 방법이다. 표적 특이적 엔도뉴클레아제 (예컨대, Cas9)에 의해 유도되는 상동 의존성 복구 (HDR)을 통해 원하는 서열을 원하는 위치에 정확하게 삽입할 수 있다. 또한 내인성 유전자를 발현시키므로, 유전자의 크기나 반복서열의 존재와 같이 재조합에 어려움을 주는 요소들의 영향을 전혀 받지 않는다.

또한 유전자의 발현에는 암호화 서열 (CDS) 뿐만 아니라 비암호화 서열 (UTR)이나 인트론도 영향을 끼치는 것으로 알려져 있다. 본 명세서에서 제공되는 표적 특이적 엔도뉴클레아제 시스템을 이용한 유전자 태그 삽입은 이러한 단백질이 발현되는 본래의 세포의 genet ic context를 그대로 이용할 수 있으므로 유전자 발현을 위한 최적의 조건을 유지할 수 있다는 장점도 가지고 있다.