Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
GENOME-SCALE BUTANOL-PRODUCING MICROORGANISM METABOLIC NETWORK MODEL AND METHODS USING THE SAME FOR ANALYSIS OF METABOLIC CHARACTERISTICS OF BUTANOL-PRODUCING MICROORGANISMS AND FOR SCREENING DELETION TARGETS
Document Type and Number:
WIPO Patent Application WO/2009/128644
Kind Code:
A9
Abstract:
The present invention relates to a metabolic network model for analysis of metabolic characteristics of butanol-producing microorganisms and methods using the same for analysis of metabolic characteristics of butanol-producing microorganisms and for screening deletion targets; and, more particularly, to establishing a metabolic network model of butanol-producing microorganisms using gene-protein-biochemical reaction associations and methods for analysis of metabolic characteristics such as a metabolic flow, etc., using the established model and for screening deletion targets with a simulation based on the metabolic flow analysis to improve the productivity of a specific metabolic product during the deletion.  A metabolic network model according to the invention is useful for analysis of metabolic characteristics such as a metabolic flow, etc. of butanol-producing microorganisms and for screening a deletion target enzyme or a gene therefor to increase the production of a specific metabolic product.  Moreover, unlike conventional methods, a deletion target screening method according to the invention makes it possible to predict deletion targets in an efficient manner, to save time and costs and to provide mutant microorganisms capable of producing a specific metabolic product at a high efficiency.

Inventors:
LEE SANG YUP (KR)
LEE JOUNG MIN (KR)
YUN HONG SEOK (KR)
JUNG KWANG SEOP (KR)
Application Number:
PCT/KR2009/001923
Publication Date:
April 15, 2010
Filing Date:
April 14, 2009
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
KOREA ADVANCED INST SCI & TECH (KR)
BIOFUELCHEM CO (KR)
GS CALTEX CORP (KR)
LEE SANG YUP (KR)
LEE JOUNG MIN (KR)
YUN HONG SEOK (KR)
JUNG KWANG SEOP (KR)
International Classes:
C12Q1/32
Attorney, Agent or Firm:
LEE, Cheo Young (KR)
이처영 (KR)
Download PDF:
Claims:
다음 효소들이 관여하는 효소반응식을 포함하는, 부탄올 생성 미생물의 대사 특성 분석용 대사 네트워크 모델:

알코올 탈수소화 효소(alcohol dehydrogenase), 부탄올 탈수소화 효소(butanol dehydrogenase), 부티릴 조효소 A 탈수소화 효소(butyryl-CoA dehydrogenase), 크로토네이즈(crotonase), 아세틸 조효소 A 아세틸전달효소(acetyl-CoA acetyltransferase), 3-하이드록시부티릴 조효소 A 탈수소화 효소(3-hydroxybutyryl-CoA dehydrogenase) 및 수소화 효소(hydrogenase).

제1항에 있어서, 다음 효소들이 관여하는 효소반응식을 포함하는, 부탄올 생성 미생물의 대사 특성 분석용 대사 네트워크 모델:

D-3-phosphoglycerate dehydrogenase, aspartate-semialdehyde dehydrogenase, deoxycytidine triphosphate deaminase, orotate phosphoribosyltransferase, phosphatidylserine decarboxylase, D-3-phosphoglycerate dehydrogenase, ketol-acid reductoisomerase, ferredoxin-nitrite reductase, O-acetylhomoserine (thiol)-lyase, adenylylsulfate kinase, sulfate adenylyltransferase subunit 2, adenylylsulfate kinase / sulfate adenylyltransferase subunit 1, PTS system, mannitol-specific IIBC component (gene MtlA), PTS system, mannitol-specific IIA domain (Ntr-type) (gene MltF), mannitol-1-phosphate 5-dehydrogenase, glucosamine--fructose-6-phosphate aminotransferase (isomerizing), glucosamine-6-phosphate isomerase (glucosamine-6-phosphate), N-acetylglucosamine-6-phosphate deacetylase (gene nagA), prephenate dehydrotase (pheA), 1-phosphofructokinase (fructoso 1-phosphate kinase), nitrogenase iron protein (nitrogenase component II) gene nifH, nitrogenase molybdenum-iron protein, alpha chain (nitrogenase component I) gene nifD, nitrogenase molibdenum-iron protein, beta chain, gene nifK, phosphoserine phosphatase related protein, L-lactate dehydrogenase, 2-isopropylmalate synthase, aspartate ammonia-lyase (aspartase) gene ansB(aspA), aspartate kinase, cytosine/guanine deaminase related protein, ornithine carbomoyltransferase, PTS cellobiose-specific component IIA, PTS system, cellobiose-specific component BII, beta-glucosidase, PTS cellobiose-specific component IIC, cystathionine gamma-synthase, cystathionine beta-lyase, deoxyphosphogluconate aldolase (gene kdgA), 2-keto-3-deoxygluconate kinase (gene kdgK), fusion: PTS system, beta-glucosides specific IIABC component, Fructokinase, sucrase-6-phosphate hydrolase (gene sacA), oxygen-sensitive ribonucleoside-triphosphate reductase nrdD, Phosphomannomutase, alanine racemase, UDP-N-acetylenolpyruvoylglucosamine reductase (murB), 6-phosphofructokinase, pyruvate kinase (pykA), Dihydroorotase, PTS system, maltose-specific enzyme IIBC component, maltose-6'-phosphate glucosidase (glvA), phosphoenolpyruvate synthase (gene pps), malate dehydrogenase, aspartate semialdehyde dehydrogenase (gene asd), PTS system, glucose-specific IIABC component, cobalamine-dependent methionine synthase I (methyltransferase andcobalamine-binding domain), diaminohydroxyphosphoribosylaminopyrimidine deaminase / 5-amino-6-(5-phosphoribosylamino)uracil reductase, riboflavin synthase alpha chain, riboflavin biosynthes protein RIBA (GTPcyclohydrolase/3,4-dihydroxy-2-butanone 4-phosphate synthase), riboflavin synthase beta chain, diaminopimelate decarboxilase (lisA), L-serine dehydratase, beta chain, L-serine dehydratase, alpha chain, phosphatidylserine synthase, ammonium transporter (membrane protein nrgA), serine acetyltransferase, glyceraldehyde 3-phosphate dehydrogenase, gene gapC, phosphoglycerate kinase, triosephosphate isomerase (TIM), 2,3-bisphosphoglycerate-independent phosphoglycerate mutase gene, Enolase, ribose 5-phosphate isomerase RpiB, NADP-specific glutamate dehydrogenase, NADPH-dependent glutamate synthase beta chain, glycerol uptake facilitator protein (permease), phosphatidylserine synthase, nucleoside-diphosphate-sugar epimerase (UDP-glucose 4-epimerase), phosphatidylserine decarboxylase, 3-oxoacyl-[acyl-carrier-protein] synthase III, phosphoribosylpyrophosphate synthetase, fructose-bisphosphate aldolase, glucan phosphorylase, thioredoxine reductase, adenine deaminase, phospho-2-dehydro-3-deoxyheptonate aldolase, prephenate dehydrogenase, 3-dehydroquinate synthetase, 5-enolpyruvylshikimate-3-phosphate synthase, chorismate synthase, fusion: chorismate mutase and shikimate 5-dehydrogenase, shikimate kinase, 3-dehydroquinate dehydratase II, cystathionine gamma-synthase, cysteine synthase, ATP phosphoribosyltransferase, histidinol dehydrogenase, imidazoleglycerol-phosphate dehydratase, glutamine amidotransferase, phosphoribosylformimino-5-aminoimidazole carboxamide ribonucleotide(ProFAR) isomerase, imidazoleglycerol-phosphate synthase cyclase, phosphoribosyl-AMP cyclohydrolase, phosphoribosyl-ATP pyrophosphohydrolase, Transketolase, aconitase A, isocitrate dehydrogenase, argininosuccinate synthase, argininosuccinate lyase, pyruvate-formate lyase, 1-acyl-sn-glycerol-3-phosphate acyltransferase, homoserine dehydrogenase, threonine synthase, aspartate aminotransferase, nicotinic acid phosphoribosyltransferase, superfamily I DNA helicase (rep-like helicase), P-loop kinase (uridine kinase family), nicotinate-nucleotide pyrophosphorylase, aspartate oxidase, quinolinate synthase, pyruvate kinase, ribonucleotide reductase, vitamin B12-dependent, NH(3)-dependent NAD(+) synthetase, Arginase, beta-glucosidase family protein, beta-glucosidase family protein, GlpX-like protein (Fructose-1,6-bisphosphatase related protein), 5-formyltetrahydrofolate cyclo-ligase, anaerobic ribonucleotide reductase, deoxyuridine 5'triphosphate nucleotidohydrolase (DUPTase), chorismate mutase PheB of B.subtilis ortholog, homoserine kinase (thrB), predicted nucleotidyltransferases of NarD/TagD family (N-term. domain) (yqeJ ortholog), diacylglycerol kinase (dgkA) fused to phosphatase B domain (pgpB), glycerol uptake facilitator protein(GLPF), glycerol kinase (GLPK), ribulose-5-phosphate 4-epimerase family protein, L-arabinose isomerase, sugar kinase, possible xylulose kinase, L-arabinose isomerase, Transaldolase, Transketolase (TKT), aldose-1-epimerase, phosphotransferase system IIC component (possibly N-acetylglucosamine-specific), PTS system (N-acetylglucosamine-specific IIA component, putative), histidinol-phosphate aminotransferase, cobalamin biosynthesis enzyme CobT, phosphoribosylcarboxyaminoimidazole (NCAIR) mutase , phosphoribosylaminoimidazolesuccinocarboxamide (SAICAR) synthase, glutamine phosphoribosylpyrophosphate amidotransferase, phosphoribosylaminoimidazol (AIR) synthetase, folate-dependent phosphoribosylglycinamide formyltransferase, AICAR transformylase/IMP cyclohydrolase, phosphoribosylamine-glycine ligase, beta-glucosidase, UDP-glucose 4-epimerase , ribose 5-phosphate isomerase, PTS system, fructose(mannose)-specific IIA component, PTS system, fructose(mannose)-specific IIB, PTS system, fructose(mannose)-specific IIC, PTS system, fructose(mannose)-specific IID, branched-chain-amino-acid transaminase (ilvE), Fructokinase, fructose-1,6-bisphosphatase, malic enzyme, malate dehydrogenase (oxaloacetate-decarboxylating), phosphoserine phosphatase family enzyme, bifunctional enzyme phosphoribosylformylglycinamidine (FGAM) synthase (synthetase domain/glutamine amidotransferase domain), aspartate ammonia-lyase, glycogen phosphorylase, large subunit of NADH-dependent glutamate synthase, small subunit of NADPH-dependent glutamate synthase, periplasmic phosphate-binding protein, phosphate permease, permease component of ATP-dependent phosphate uptake system, ATPase component of ABC-type phosphate transport system, glycerol 3-phosphate dehydrogenase, L-asparaginase, guanylate kinase, YLOD B.subtilis ortholog, flavoprotein involved in panthothenate metabolism, YLOI B.subtilis ortholog, pentose-5-phosphate-3-epimerase, phosphopantetheine adenylyltransferase, phosphate acetyltransferase, acetate kinase, nicotinic acid phosphoribosyltransferase, NH(3)-dependent NAD(+) synthase (nadE) fused to amidohydrolasedomain, uridylate kinase, CDP-diglyceride synthetase, riboflavin kinase/FAD synthase, Aspartokinase, phosphatidylglycerophosphate synthase , aspartate aminotransferase , phosphocarrier protein (Hpr), adenylosuccinate lyase, homoserine trans-succinylase, cytidylate kinase, 3-oxoacyl-(acyl-carrier-protein) synthase, purine nucleoside phosphorylase, Phosphopentomutase, predicted kinase, tetrahydrofolate dehydrogenase/cyclohydrolase (FolD), nucleoside phosphorylase, cation transport P-type ATPase, phosphoserine phosphatase family enzyme, pyruvate:ferredoxin oxidoreductase, cysteine synthase/cystathionine beta-synthase (CysK), ADP-glucose pyrophosphorylase, ADP-glucose pyrophosphorylase, glycogen synthase (glgA), N-terminal domain of asparagine synthase, UDP-glucose pyrophosphorylase, glycine hydroxymethyltransferase, adenine phosphoribosyltransferase (Apt), UDP-glucose 4-epimerase, UTP-glucose-1-phosphate uridylyltransferase, dihydrodipicolinate synthase, dihydrodipicolinate reductase, PLP-dependent aminotransferase, tetrahydrodipicolinate N-succinyltransferase, N-acetylornithine aminotransferase, acetylglutamate kinase, N-acetyl-gamma-glutamyl-phosphate reductase, amino-acid N-acetyltransferase / glutamate N-acetyltransferase, folylpolyglutamate synthase, 2-oxoacid ferredoxin oxidoreductase beta subunit, 2-oxoacid ferredoxin oxidoreductase alpha subunit, xylulose kinase, transcriptional regulators of NagC/XylR family, beta-phosphoglucomutase, diaminopimelate epimerase, possible 3-ketoacyl-acyl carrier protein reductase, carbamoylphosphate synthase large subunit, carbamoylphosphate synthase small subunit, dihydroorotate dehydrogenase, orotidine-5'-phosphate decarboxylase, aspartate carbamoyltransferase regulatory subunit, aspartate carbamoyltransferase catalytic subunit, glutamine synthetase type III, pyruvate carboxylase (PYKA ), glucose-6-phosphate isomerase, sugar kinase, ribokinase family, trehalose/maltose hydrolase (phosphorylase), GMP synthase, IMP dehydrogenase, 3-hydroxybutyryl-CoA dehydrogenase, electron transfer flavoprotein alpha-subunit, electron transfer flavoprotein beta-subunit, butyryl-CoA dehydrogenase, 3-hydroxybutyryl-CoA dehydratase, deacethylase/dipeptidase/desuccinylase family of Zn-dependenthydrolases, putative histidinol-phosphatase, O-acetylhomoserine (thiol)-lyase , Acylphosphatases (ACYP), PLP-dependent aminotransferase, glycerate kinase, galactose-1-phosphate uridylyltransferase, S-adenosylmethionine synthetase, UDP-N-acetylglucosamine 1-carboxyvinyltransferase, acetyl-CoA acetyltransferase, deoxycytidylate deaminase, ribose 5-phosphate isomerase (RpiB), fusion of alpha-glucosidase (family 31 glycosyl hydrolase), CTP synthase (UTP-ammonia lyase), D-alanine-D-alanine ligase, ketopantoate hydroxymethyltransferase, pantoate--beta-alanine ligase, aspartate 1-decarboxylase, mannose-6 phospate isomerase, dihydropteroate synthase, dihydroneopterin aldolase fused to 7,8-dihydro-6-hydroxymethylpterin-pyrophosphokinase, ketopantoate reductase PanE/ApbA, uncharacterized conserved protein fron YGAG family, predictedmetal-dependent enzyme, 3-phosphoserine aminotransferase (Possible phosphoglycerate dehydrogenase), tagatose-6-phosphate kinase, galactose-6-phosphate isomerase, galactose-6-phosphate isomerase, PTS system galactitol-specific IIC component, PTS system galactitol-specific IIB component, PTS system galactitol-specific IIA component putative, Galactokinase, UDP-galactose 4-epimerase, 6-phospho-beta-D-galactosidase, PTS system lactose-specific enzyme IIBC, PTS system lactose-specific enzyme IIA, alpha-acetolactate decarboxylase, 2-keto-3-deoxy-6-phosphogluconate aldolase (eda/kdgA), PTS system (Glucose-specific) component IIA, thymidylate synthase, dihydrofolate reductase, adenosine deaminase, amino-acid N-acetyltransferase / glutamate N-acetyltransferase, histidinol-phosphate aminotransferase, butyrate kinase (BUK), phosphate butyryltransferase, phosphoenolpyruvate-protein kinase (PTS system enzyme I), fumarate hydratase, subunit B (C-terminal domain of FumA E.coli), fumarate hydratase, subunit A (N-terminal domain of FumA E.coli), adenylate kinase , tryptophan synthase alpha chain, tryptophan synthase beta chain, phosphoribosylanthranilate isomerase, indole-3-glycerol phosphate synthase, anthranilate phosphoribosyltransferase, putative anthranilate synthase component II, para-aminobenzoate synthase component I, acetolactate synthase large subunit, dihydroxyacid dehydratase, isopropylmalate dehydrogenase , 3-isopropylmalate dehydratase, small subunit, 3-isopropylmalate dehydratase, large subunit, 2-isopropylmalate synthase , acetolactate synthase small subunit, predicted transcriptional regulator, homolog of Bvg accessory factor, formate--tetrahydrofolate ligase, hypoxanthine-guanine phosphoribosyltransferase, phosphoribosylpyrophosphate synthetase, glucosamine-1-phosphate N-acetyltransferase , possible glutamate racemase , pyrroline-5-carboxylate reductase, glutamate 5-kinase , gamma-glutamyl phosphate reductase , ribonucleotide reductase beta subunit , ribonucleotide reductase alpha subunit, NADH-dependent butanol dehydrogenase B (BDH II), NADH-dependent butanol dehydrogenase A (BDH I), possible cardiolipin synthase (phospholipase D family), alanine racemase , possible homocysteine S-methyltransferase , alcohol dehydrogenase, low specificity L-threonine aldolase, PTS system, (possibly glucose-specific) IIBC component , 6-phospho-alpha-glucosidase, PTS system, (possibly glucose-specific) IIA component, 3-oxoacyl-acyl carrier protein reductase, GMP reductase , UDP-N-acetylglucosamine enolpyruvyl transferase, lactate dehydrogenase, acetyl-CoA carboxylase alpha subunit, acetyl-CoA carboxylase beta subunit, biotin carboxylase, hydroxymyristoyl-(acyl carrier protein) dehydratase, biotin carboxyl carrier protein of acetyl-CoA carboxylase, 3-oxoacyl-(acyl-carrier-protein) synthase I , 3-ketoacyl-acyl carrier protein reductase, malonyl CoA-acyl carrier protein transacylase, trans-2-enoyl-ACP reductase II, 3-oxoacyl-[acyl-carrier-protein] synthase III, adenylosuccinate synthase, phosphatidylglycerophosphate synthase, dihydrodipicolinate synthase , dihydroxy-acid dehydratase , GTP cyclohydrolase I, acetolactate synthase large subunit, beta-glucosidase, pyruvate decarboxylase, alcohol dehydrogenase / acetaldehyde dehydrogenase, fructose-bisphosphate aldolase class I , mannose-specific phosphotransferase system component IIAB, mannose/fructose-specific phosphotransferase system component IIC, mannose-specific phosphotransferase system component IID, acetyl coenzyme A acetyltransferase (thiolase), 3-oxoacyl-acyl-carrier protein synthase, alcohol dehydrogenase / acetaldehyde dehydrogenase, butyrate-acetoacetate CoA-transferase subunit A, butyrate-acetoacetate CoA-transferase subunit B 및 acetoacetate decarboxylase.

제1항에 있어서, 상기 부탄올 생성 미생물의 대사특성 분석용 대사 네트워크 모델은 하기 표 1의 유전자-단백질-반응식 (Gene-Protein-Reaction: GPR)관계를 포함하는 것을 특징으로 하는 대사 특성 분석용 대사 네트워크 모델:

표 1

제1항에 있어서, 상기 부탄올 생성 미생물은 클로스트리듐( Clostridium ) 속 미생물임을 특징으로 하는 대사 특성 분석용 대사 네트워크 모델.
제1항 또는 제4항 중 어느 한 항의 대사 네트워크 모델을 이용하는 것을 특징으로 하는 부탄올 생성 미생물의 대사특성 분석방법.
제5항에 있어서, 상기 대사특성은 대사흐름인 것을 특징으로 하는 방법.
제6항에 있어서, 다음 단계를 포함하는 것을 특징으로 하는 방법:

(a) 상기 대사 네트워크 모델 중 사용가능한 탄소원 및 질소원에 대한 수송 반응식을 보정하는 단계; 및

(b) 상기 탄소원 및 질소원을 이용하여 대사흐름분석하는 단계.

제1항 또는 제4항 중 어느 한 항의 대사 네트워크 모델의 토폴로지(topology)를 분석하는 방법.
제8항에 있어서, 상기 토폴로지의 분석은 다음의 클로스터 계수 Cn 을 이용하는 것을 특징으로 하는 방법:

Cn = N/M

N : n 번째 노드와 이웃한 노드간의 연결된 선의 개수

M : n 번째 노드와 이웃한 노드간의 최대한으로 연결 가능한 선의 개수

여기서, 상기 노드는 상기 대사 네트워크의 대사산물을 나타내고, 2개의 노드를 연결하는 상기 선은 두 대사산물을 매개하는 효소반응식임.

제8항에 있어서, 상기 토폴로지의 분석은 다음의 클로스터 계수 Cn 을 이용하는 것을 특징으로 하는 방법:

n = 2en/(kn(kn-1)) (단일방향으로 구성된 네트워크의 경우)

Cn = en/(kn(kn-1)) (양방향으로 구성된 네트워크의 경우)

kn : n 번째 노드의 인접한 연결된 노드의 개수

en : n 번째 노드의 모든 이웃 중 연결된 쌍의 수

여기서, 상기 노드는 상기 대사 네트워크의 대사산물을 나타내고, 2개의 노드를 연결하는 상기 선은 두 대사산물을 매개하는 효소반응식임.

제1항 또는 제4항 중 어느 한 항의 대사 네트워크 모델에서 효소반응식들을 하나 또는 둘 이상씩 차단하며 선형계획법을 적용하되, 특정 대사산물의 생성능이 증가하는 경우 차단된 효소 반응식의 효소를 결실 표적효소로 선정하거나, 이를 코딩하는 유전자를 결실 표적유전자로 선정하는 것을 특징으로 하는 부탄올 생성 미생물의 특정 대사산물의 생산을 증가시키기 위한 결실 표적 효소 또는 그 유전자의 스크리닝 방법.
제11항에 있어서, 성장 반응식의 반응속도 또는 대사흐름값이 양수인 조건에서 특정 대사산물의 생성능이 증가하는 경우에 차단된 효소 반응식의 효소를 결실 표적효소로 선정하거나, 이를 코딩하는 유전자를 결실 표적유전자로 선정하는 것을 특징으로 하는 방법.
제12항에 있어서, 부탄올 생산 미생물의 대사 네트워크 모델에서 효소반응식들을 하나 또는 둘 이상씩 차단하며 선형계획법을 적용하는 단계를 추가로 수행하되, 성장 반응식의 반응속도 또는 대사흐름값이 0인 조건에서 특정 대사산물의 생성능이 증가하는 경우에 차단된 효소 반응식의 효소를 2차 결실 표적효소 후보로 선정한 후, 상기 성장 반응식의 반응속도 또는 대사흐름값이 양수인 조건의 결실 표적효소와 중복되는 경우에만 결실 표적효소로 선정하거나, 이를 코딩하는 유전자를 결실 표적유전자로 선정하는 것을 특징으로 하는 방법.
제12항에 있어서, 상기 성장 반응식은 반응식 Ⅰ인 것을 특징으로 하는 방법:

반응식 I

0.5284 PROTEIN + 0.0655 RNA + 0.026 DNA + 0.076 PHOSPHOLIPID + 0.1009 PEPTIDOGLYCAN + 0.08 TEICH + 0.0432 CARBOHYDRATE + 0.0494 TRACE + 85 ATP -> BIOMASS + 85 ADP + 85 Pi

제11항에 있어서, 상기 특정 대사산물은 부탄올, 아세트산, 부틸레이트(butyrate), 에탄올 및 아세트산으로 구성된 군에서 선택되는 것임을 특징으로 하는 방법.
부탄올 생성 미생물에서 제11항의 방법에 의하여 스크리닝된 결실 표적유전자를 결실시키는 것을 특징으로 하는 특정 대사산물의 생성능이 증가된 변이 미생물의 제조방법.
제16항의 방법으로 제조된 특정 대사산물의 생성능이 증가된 변이 미생물.
제17항의 변이 미생물을 배양하는 단계; 및 상기 배양액으로부터 특정 대사산물을 회수하는 단계를 포함하는 특정 대사산물의 제조방법.
제1항 또는 제4항 중 어느 한 항의 대사 네트워크 모델을 이용한 부탄올 생성 미생물의 대사흐름 예측방법.
제19항에 있어서, 기질의 흡수속도를 선행 입력값으로 한 선행계획법 또는 이차계획법을 이용하는 것을 특징으로 하는 부탄올 생성 미생물의 대사흐름 예측방법.
제20항에 있어서, 다음의 반응식 Ⅱ을 이용하는 것을 특징으로 하는 방법:

반응식 II

제한 조건:

S · ν =0, ν minνν max

여기서, ν acid 는 산 생성기에서의 대사흐름 벡터이고; ν sol 는 용매 생성기에서의 대사흐름 벡터이고; 는 용매 생성기에서 조효소 A 전달 효소에 의한 부티르산의 흡수 속도이고; 는 용매 생성기에서 조효소 A 전달 효소에 의한 아세트산의 흡수 속도이고; 는 산 생성기에서 부티르산의 생성 속도이고; 는 산 생성기에서 아세트산의 생성 속도임.

Description:
게놈 수준에서의 부탄올 생산 미생물의 대사 네트워크 모델 및 이를 이용한 부탄올 생성 미생물의 대사특성분석 및 결실 표적 스크리닝 방법

본 발명은 부탄올 생성 미생물의 대사 특성 분석용 대사 네트워크 모델 및 이를 이용한 부탄올 생성 미생물의 대사특성분석 및 결실 표적 스크리닝 방법에 관한 것이다.

최근 유가의 상승으로 인하여 바이오연료와 같은 대체 에너지에 대한 관심이 증가하며, 에탄올보다 가솔린 대체재로서의 물성이 더 뛰어난 부탄올에 대한 관심이 증가하고 있으며, 이에 따라 부탄올 등 용매를 대사산물로서 생성하는 클로스트리듐( Clostridium) 속 균주에 대한 관심도 증가하고 있다.

클로스트리듐 속의 미생물은 그람 양성(Gram-positive), 완전 혐기성이며 내생포자를 형성하는 간균으로서, 대부분이 발효 산물로 초산(acetic acid)과 낙산(butyric acid)을 생산하는 것으로 잘 알려져 있다. 이 중의 일부 균주는 위의 유기산 외에도 아세톤, 부탄올, 에탄올을 생산하는 아세톤-부탄올-에탄올 발효(Acetone-Butanol-Ethanol fermentation, 이하 ABE 발효)를 일으킨다.

실제로 20세기 초에 이러한 균주 중 하나인 Clostridium acetobutylicum 을 이용하여 아세톤 및 부탄올을 대량으로 생산하였으며, 이러한 대량 생산은 1960~70년대까지 지속되었으나, 화학 공정의 발달로 원유를 원료로 한 아세톤과 부탄올의 화학적 합성 원가가 저렴해지고, 기질 수급의 어려움 등으로 인하여 일부 국가를 제외하고는 사장되었다.

현재까지 클로스트리듐 속 균주를 이용한 바이오 부탄올의 생산은 다음과 같은 문제점들을 내포하고 있다. 첫째로, 효모를 기반으로 하는 바이오에탄올에 비하여 수율 및 생산성이 모두 현저하게 떨어진다는 문제점이 있다. 둘째로, 클로스트리듐 속 균주는 바이오연료로서의 가치가 높은 부탄올 외에도 아세톤, 초산, 낙산 등의 부산물을 생산하게 되고, 이는 분리 비용을 증가시키는 단점이 있다.

용매를 생성하는 클로스트리듐 속 균주의 경우, 지수 성장기(exponential growth phase)에서는 일반적인 미생물의 발효와 같이 유기산의 생성이 일어난다. 이를 산 생성기(acidogenic phase)라 한다. 안정기에 접어들면서 세포의 대사는 유기산의 재흡수가 일어나고 아세톤(또는 이소프로판올), 부탄올, 에탄올의 용매를 생성하는 용매 생성기(solventogenic phase)로 전환된다. 이는 다음과 같이 해석이 가능하다. 안정기에 접어들면서 pH가 낮아지고 이에 따라 해리되지 않은 유기산의 농도가 증가한다. 그 중에서 특히 해리되지 않은 낙산은 세포에 큰 독성을 나타내며, 이러한 유기산의 재흡수 및 용매로의 전환을 통하여 세포는 가혹한 환경에서 오랫동안 생존할 수 있는 내생포자(endospore)를 형성할 시간을 벌게 되는 것이다.

최근에는 유전 공학적인 지식과 도구를 바탕으로 대사 경로를 인간이 원하는 대로 조작하는 대사 공학적 접근 방법을 이용하여 개량된 균주를 만들고자 하는 노력이 지속되고 있다.

그러나 클로스트리듐 속의 균주들은 전통적으로 상동재조합(homologous recombination)에 의한 유전자 결실이 쉽게 일어나지 않는 것으로 알려져 있다. 단일교차(single crossover)에 의하여 유전자 사이에 DNA 가닥이 삽입되어 유전자의 기능을 불활성화시킨 사례가 몇 보고되어 있으나, 이러한 단일교차에 의한 유전자 결실은 삽입 부위 근처에 상동적인 서열이 두 개가 존재하게 되고 따라서 다시 상동재조합이 일어나 삽입된 DNA 부분이 빠져나가는 불안정성을 야기시키게 된다. 이중교차(double crossover)에 의한 유전자 결실 사례는 병원균인 C. perfringens 에 대해서만 보고되어 있다(Awad et al., Mol. Microbiol ., 16:535-51, 1995). 이러한 유전자 결실의 문제는 최근에 Lactococcus lactis 에 존재하는 group II intron을 이용하여 부위특이적(site-specific) 삽입을 일으키는 방법론이 개발됨으로써 어느 정도 해결되었다고 볼 수 있다(Heap et al., J. Microbiol. Methods., 70:452-64, 2007).

또한, 용매 생성에 관련된 유전자들의 발현은 내생 포자의 형성과 맞물려 있다. 일례로, C. acetobutylicum 이나 C. beijerinckii 에서 내생 포자의 형성 신호 전달과 관련된 spo0A 유전자를 결실시킨 경우, 용매의 생성이 현저하게 감소되었다는 결과가 보고된 바 있다(Harris et al., J. bacteriol. , 184:3586-97, 2002; Ravagnani et al., Mol. Microbiol ., 37:1172-85, 2000). 클로스트리듐의 경우 내생 포자를 형성하는 또 다른 속인 Bacillus 속에 비하여 상대적으로 유전학적 연구 결과가 부족하며, 이는 균주 개량에 있어서 단점으로 작용하고 있다.

따라서, 클로스트리듐을 이용하지 않고, 부탄올 생성 관련 유전자들을 Escherichia coli 와 같은 유전학적 도구가 잘 발달되어 있는 균주에 클로닝, 발현하여 부탄올을 생산하려는 시도가 있었으나, 이 역시 수율 및 최종 농도가 야생형 클로스트리듐보다 현저히 낮다는 문제가 있었다 (Atsumi et al., Metab. Eng. , in press, 2007; Inui et al., Appl. Microbiol. Biotechnol. , 77:1305-16, 2008).

위의 문제점이 해결된다 하더라도 용매 생성 관련 경로만 놓고 유전자 결실 표적을 찾아내는 것은 한계가 있으며, 인간의 직관으로 대사 경로 전체를 통찰하여 유전자 결실 표적을 찾아내는 것은 어려운 일이다. 적게는 수백에서 많게는 수천 개의 유전자를 일일이 실험적으로 결실시켜 형질을 확인하는 것도 금전적, 시간적으로 불가능에 가깝다고 할 수 있다. 또한, 이러한 대사의 흐름은 단일 유전자가 아닌 복잡한 세포 구성 요소간의 상호작용에 의해서 나타나는 것이므로 단일 유전자 결실만으로는 만족할 만한 개량 균주를 얻기가 어렵다. 가령, 우리가 개량하고자 하는 균주의 유전자가 4,000개인 경우, 단일 유전자 결실 균주들의 형질을 모두 파악하기 위해서는 4,000번의 실험을 하여야 하며, 이중 유전자 결실들의 형질까지 파악하고자 한다면 4,000×3,999≒(4,000) 2 =16,000,000번의 실험을 진행하여야 한다.

따라서, 부탄올 등 생산 증대를 원하는 특정 대사산물을 효율적으로 생산하는 균주를 개발하기 위해서는 미생물 세포 구성 요소들 간의 세포 기작과 상호작용을 이해하는 것이 매우 중요하다. 이에 게놈 정보와 기능 유전체학의 발전을 통한 대사 산물과 대사 네트워크의 구축은 세포 구성 요소를 구성하기 위한 유전자와 단백질들의 상호 작용을 이해하고 대사 네트워크를 구성하여 대사산물의 생산 증대를 위한 효과적인 결실표적을 스크리닝하는 데 있어 그 중요성을 더하고 있다.

실제로 게놈 정보를 이용하여 대사 네트워크 정보를 구축한 뒤, 이를 이용하여 야생형 균주 및 유전자 결실 균주들의 대사 흐름을 모사하여 볼 수 있으며, 이 중에서 좋은 결과를 보인 유전자들만을 추려 실제로 실험을 진행하여 결과를 확인한다면 모든 경우에 대하여 일일이 실험을 통하여 확인하는 방법에 비하여 시간과 비용을 획기적으로 절약할 수 있게 된다.

대사 네트워크를 통한 분석 및 예측기술은 최근에야 급속하게 증가하는 게놈정보와 함께 그 가능성을 보이고 있다. 특히 각 미생물의 대사 네트워크 모델들이 수학적 모델 및 최적화 기술 등과 결합되어 유전자의 제거 또는 추가 후에 일어나는 대사 네트워크의 반응을 예측하는 것이 가능해지고 있다 (Lee et al., Trends Biotechnol ., 23:349 , 2005). 또한 대사 네트워크를 이용한 대사흐름분석 기법은 동적 정보를 필요로 하지 않음에도 세포의 이상적인 대사 흐름을 보여주며 실제적으로 세포의 행동을 정확히 모사하고 예측할 수 있는 것으로 알려져 있다 (Papin, J. et al., Nat. Rev. Mol. Cell Biol. , 6:99, 2005).

대사흐름분석은 생화학 반응식의 질량수지와 세포 조성 정보만을 이용하여 세포가 도달 가능한 이상적인 대사 흐름 공간을 구하며 특정한 목적함수를 최적화 방법을 통하여 최대화 하거나 최소화 하는 것을 목적으로 한다(세포성장속도 최대화 또는 특정 섭동에 의한 대사 조절의 최소화 등). 그 밖에, 대사흐름분석은 일반적으로 균주 개량을 통하여 원하는 대사 산물의 특정 유전자의 치사성을 확인하기 위하여 사용될 수 있으며, 이를 이용하여 균주내부의 대사 네트워크 특성을 파악할 수 있다. 또한, 유전자의 제거 또는 추가에 의해 일어나는 대사 네트워크의 흐름변화 등을 예측하기 위해 대사흐름분석 방법을 응용한 다양한 연구가 보고되고 있다. 실제로 고수율 아미노산 균주의 개발에 있어서 이러한 대사흐름분석이 유전자 결실 표적을 찾는데 이용된바 있다(Park et al., Proc. Natl. Acad. Sci. , 104:7797-802., 2007; Lee et al., Mol. Syst. Biol., 3:149, 2007).

이에 본 발명자들은 특정 대사산물을 효율적으로 생산하는 균주를 개발하기 위한 부탄올 생성 미생물의 대사특성분석용 대사네트워크를 개발하고자 예의노력한 결과, 부탄올 생성 미생물의 대사 네트워크 모델을 새로이 개발한 다음, 개발된 대사 네트워크 모델이 부탄올 생성 미생물의 대사특성 분석에 유용함을 확인하고, 대사흐름분석을 통하여 결실 표적유전자들을 스크리닝하여 부탄올 생성 미생물의 부탄올 생성능을 향상시킬 수 있는 이상적인 결실 조합을 만들 수 있음을 이론적으로 발견하고, 본 발명을 완성하였다.

발명의 요약

본 발명의 목적은 부탄올 생성 미생물의 대사 특성을 분석하기 위한 대사 네트워크 모델을 제공하는 데 있다.

본 발명의 다른 목적은 구축된 부탄올 생성 미생물의 대사 네트워크 모델을 기반으로, 부탄올 생성 미생물에서 대사 특성을 분석하는 방법 및 특정 대사산물의 생산을 증가시키기 위한 결실 표적 효소 또는 그 유전자의 스크리닝 방법을 제공하는 데 있다.

상기 목적을 달성하기 위하여, 본 발명은 다음 효소들이 관여하는 효소반응식을 포함하는, 부탄올 생성 미생물의 대사 특성 분석용 대사 네트워크 모델을 제공한다:

알코올 탈수소화 효소(alcohol dehydrogenase), 부탄올 탈수소화 효소(butanol dehydrogenase), 부티릴 조효소 A 탈수소화 효소(butyryl-CoA dehydrogenase), 크로토네이즈(crotonase), 아세틸 조효소 A 아세틸전달효소(acetyl-CoA acetyltransferase), 3-하이드록시부티릴 조효소 A 탈수소화 효소(3-hydroxybutyryl-CoA dehydrogenase) 및 수소화 효소(hydrogenase).

본 발명은 또한, 상기 대사 네트워크 모델을 이용하는 것을 특징으로 하는 부탄올 생성 미생물의 대사특성분석방법을 제공한다.

본 발명은 또한, 상기 대사 네트워크 모델의 토폴로지를 분석하는 방법을 제공한다.

본 발명은 또한, 상기 대사 네트워크 모델에서 효소반응식들을 하나 또는 둘 이상씩 차단하며 선형계획법을 적용하되, 특정 대사산물의 생성능이 증가하는 경우 차단된 효소 반응식의 효소를 결실 표적효소로 선정하거나, 이를 코딩하는 유전자를 결실 표적유전자로 선정하는 것을 특징으로 하는 부탄올 생성 미생물의 특정 대사산물의 생산을 증가시키기 위한 결실 표적 효소 또는 그 유전자의 스크리닝 방법을 제공한다.

본 발명은 또한, 부탄올 생성 미생물에서 상기 방법에 의하여 스크리닝된 결실 표적유전자를 결실시키는 것을 특징으로 하는 특정 대사산물의 생성능이 증가된 변이 미생물의 제조방법을 제공한다.

본 발명은 또한, 상기 변이 미생물의 제조방법으로 제조된 특정 대사산물의 생성능이 증가된 변이 미생물을 제공한다.

본 발명은 또한, 상기 제조된 변이 미생물을 배양하는 단계; 및 상기 배양액으로부터 특정 대사산물을 회수하는 단계를 포함하는 특정 대사산물의 제조방법을 제공한다.

본 발명은 또한, 상기 대사 네트워크 모델을 이용한 부탄올 생성 미생물의 대사흐름 예측방법을 제공한다.

본 발명의 다른 특징 및 구현예는 다음의 상세한 설명 및 첨부된 특허청구범위로부터 더욱 명백해 질 것이다.

도 1은 게놈 정보에 기반한 대사흐름분석을 수행하기 위해 균주의 게놈 정보로부터 대사 네트워크를 구축하고, 이를 이용하여 유전자 결실 모사를 통해 결실 표적 유전자 또는 결실 표적 효소를 탐색하는 과정을 나타낸 개략도이다.

도 2는 자일로오스 대사를 하기 위해 필요한 자일로오스 이성질화 효소(xylose isomerase)가 KEGG 상에서 C. acetobutylicum 에 존재하지 않음을 보여주는 도식이다.

도 3은 구축된 대사 네트워크를 이용하여 대사흐름분석을 한 결과로 포도당의 섭취 속도(uptake rate)가 주어졌을 때, 주요 대사 경로의 반응 속도를 나타낸 도식이다.

도 4는 구축된 대사 네트워크를 분석하여 얻은 단일 파라미터 값을 나타낸다.

도 5는 구축된 대사 네트워크를 이용하여 용매 생성기 및 산생성기의 대사흐름을 예측한 결과이다.

발명의 상세한 설명 및 바람직한 구현예

다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술 분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술 분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.

본 발명은 일 관점에서, 효소반응식을 포함하는 부탄올 생성 미생물의 대사특성 분석용 대사 네트워크 모델에 관한 것이다.

먼저 부탄올 생성 미생물의 대사특성 분석용 대사 네트워크 모델은 다음과 같이 구축한다. 본 발명의 일 실시예에서는 부탄올 생성 미생물 중 클로스트리듐( Clostridium ) 속 미생물을 이용하였는데, 게놈 서열 분석이 완료된 Clostridium acetobutylicum ATCC 824의 게놈 정보를 이용하였다. 이하, C. acetobutylicum 의 대사 네트워크 모델을 구축한 경우로 설명한다.

(1) 우선 게놈 정보 및 각 유전자 주석(annotation)에 대한 정보를 수집하고, 다음으로, 게놈 서열 정보를 바탕으로 하여 C. acetobutylicum 에 존재하는 효소 반응식들을 정리하고 이 효소 반응식을 촉매하는 효소 및 이를 코딩하는 유전자의 관계, 즉 GPR 관계를 정리한다. 이때, 수집한 유전자 주석 정보를 직접 분석하는 것보다는, 대사 경로 관련 정보를 분석 및 정리해 놓은 대사 관련 데이터베이스의 정보를 이용한 뒤, 수집된 정보는 보정 과정에서 사용되는 기준으로 삼는 것이 바람직하다.

본원에서 "GPR 관계"란, 유전자-단백질-반응식 관계(Gene-Protein-Reaction Relationship)이며, 유전자와 그 산물, 그리고 그 산물이 촉매하는 효소 반응식과의 관계를 말한다.

상기에서 정리한 GPR 관계를 바탕으로 초벌 모델(draft model)을 구축한다. 일반적으로 대사 관련 데이터베이스에는 DNA 복제, 전사(transcription), 번역(translation) 및 세포를 구성하는 각종 요소(이를테면 세포막을 구성하는 인지질, 세포벽, 세포 내 모든 단백질의 아미노산 함량 및 세포 전체적인 고분자 조성)의 합성식, 그리고 세포 전체의 생장식은 정리되어 있지 않다. 그러나 이 식들은 세포의 생장을 모사하기 위한 모델 구축에 필수적이라 할 수 있으며, 이러한 식들을 만들기 위해서는 세포를 구성하는 각 성분들의 조성 비율을 알아야 한다. 이는 참고 문헌을 통하여 얻거나 실제 발효를 통하여 얻은 시료를 분석함으로써 알아낼 수 있다.

이때, 발효 조건은 실제 보정 과정에서 사용되는 발효의 조건과 동일하게 하는 것이 바람직하다.

상기에서 구축한 초벌 모델을 검토하여 보정 작업을 수행한다. 대사 관련 데이터베이스는 생물정보학적 기법을 통하여 유전자 주석 정보를 컴퓨터 프로그램으로 분석하여 데이터베이스화한 것이다. 따라서, 이러한 데이터베이스는 불완전하거나 잘못된 대사 정보를 내포할 가능성이 매우 높은데, 이는 다음과 같은 원인에 기인한다.

첫째로, 유전자 주석 정보 자체가 불완전할 가능성이 있다. 이는 대부분의 유전자 주석 작업이 기존에 기능이 규명된 유전자 서열 및 효소의 아미노산 서열과 분석하고자 하는 서열을 통계적인 기법으로 비교함으로써 상동성을 바탕으로 수행되기 때문이다. 어떤 균주에 규명이 되지 않은 유전자가 존재한다면 이러한 유전자의 기능을 생물정보학 기법만을 이용하여서는 명확히 기능을 밝히기 어렵게 된다.

둘째로, 이러한 유전자 주석 정보를 자동으로 해석하여 대사 경로로 데이터베이스화하는 과정에서 오류가 일어날 가능성이 있다. 가령, 어떤 균주의 유전자 중 하나의 아미노산 서열을 BLAST 분석을 통하여 상동성을 분석하였을 때, 다른 균주의 단백질과 높은 상동성을 보이지만 실제로 그 데이터베이스에서는 이 유전자의 기능이 없는 것으로 지정되는 경우가 존재한다.

따라서 이 단계에서는 생물정보학적 기법을 통하여 얻어낸 정보보다는 실제로 발표된 균주 관련 논문, 생화학 관련 교재 및 문헌, 실제 발효를 통하여 파악된 형질을 바탕으로 보정 작업을 수행한다.

이 과정에서는 주로 다음과 같은 부분을 중점으로 보정한다.

1) 효소 반응식에서 대사 산물 계수의 오류

2) 상기에서 분석한 세포의 구성 요소를 만드는 대사 경로가 끊어진 경우

3) 세포의 생명 유지 활동 및 생장에 사용되는 유지 에너지

4) 그 외의 각종 오타

여기서 3)의 유지 에너지는 연속 항성분 배양(continuous chemostat culture) 을 통하여 얻게 된다. 연속 항성분 배양에서는 세포의 농도를 일정하게 유지할 수 있으며, 희석률(dilution rate)을 조절함으로써 세포의 생장도 인위적으로 통제할 수 있다는 것이 특징이다. 이 경우에 비(比)생장률(specific growth rate)은 희석률과 일치하게 되며, 희석률을 조절함으로써 희석률과 그 때의 세포의 건조 중량당 기질 흡수 속도를 구할 수 있다. 이를 바탕으로 세포가 생장에 사용하는 생장 관련 유지 에너지(growth-associated maintenance energy)와 생장에 관계 없는 생명 유지 현상에 사용되는 비생장-관련 유지 에너지(non-growth-associated maintenance energy)를 구할 수 있다.

위와 같은 연속 배양이 부득이한 경우에는 다른 균주의 정보를 사용할 수도 있다. 그러나 균주에 따라 유지 에너지의 크기가 차이를 보일 수 있으므로, 가급적이면 유연 관계가 가까운 균주의 것을 사용하는 것이 바람직하다. 그렇지 않으면 실제 결과와 대사흐름분석 결과가 부정확하게 될 가능성이 높기 때문이다.

본 발명에서 상기 구축된 부탄올 생성 미생물의 대사특성 분석용 대사 네트워크 모델은 다음 효소들이 관여하는 효소반응식을 포함함을 특징으로 한다:

알코올 탈수소화 효소(alcohol dehydrogenase), 부탄올 탈수소화 효소(butanol dehydrogenase), 부티릴 조효소 A 탈수소화 효소(butyryl-CoA dehydrogenase), 크로토네이즈(crotonase), 아세틸 조효소 A 아세틸전달효소(acetyl-CoA acetyltransferase), 3-하이드록시부티릴 조효소 A 탈수소화 효소(3-hydroxybutyryl-CoA dehydrogenase) 및 수소화 효소(hydrogenase).

본 발명에 있어서, 상기 부탄올 생성 미생물의 대사특성 분석용 대사 네트워크 모델은 다음 효소들이 관여하는 효소반응식을 포함함을 특징으로 할 수 있으나, 대사특성 분석을 위하여 수 개 내지 수십 개의 효소반응식이 가감될 수 있음은 당업계에서 통상의 지식을 지니는 자에게 있어 자명한 사항일 것이다:

D-3-phosphoglycerate dehydrogenase, aspartate-semialdehyde dehydrogenase, deoxycytidine triphosphate deaminase, orotate phosphoribosyltransferase, phosphatidylserine decarboxylase, D-3-phosphoglycerate dehydrogenase, ketol-acid reductoisomerase, ferredoxin-nitrite reductase, O-acetylhomoserine (thiol)-lyase, adenylylsulfate kinase, sulfate adenylyltransferase subunit 2, adenylylsulfate kinase / sulfate adenylyltransferase subunit 1, PTS system, mannitol-specific IIBC component (gene MtlA), PTS system, mannitol-specific IIA domain (Ntr-type) (gene MltF), mannitol-1-phosphate 5-dehydrogenase, glucosamine--fructose-6-phosphate aminotransferase (isomerizing), glucosamine-6-phosphate isomerase (glucosamine-6-phosphate), N-acetylglucosamine-6-phosphate deacetylase (gene nagA), prephenate dehydrotase (pheA), 1-phosphofructokinase (fructoso 1-phosphate kinase), nitrogenase iron protein (nitrogenase component II) gene nifH, nitrogenase molybdenum-iron protein, alpha chain (nitrogenase component I) gene nifD, nitrogenase molibdenum-iron protein, beta chain, gene nifK, phosphoserine phosphatase related protein, L-lactate dehydrogenase, 2-isopropylmalate synthase, aspartate ammonia-lyase (aspartase) gene ansB(aspA), aspartate kinase, cytosine/guanine deaminase related protein, ornithine carbomoyltransferase, PTS cellobiose-specific component IIA, PTS system, cellobiose-specific component BII, beta-glucosidase, PTS cellobiose-specific component IIC, cystathionine gamma-synthase, cystathionine beta-lyase, deoxyphosphogluconate aldolase (gene kdgA), 2-keto-3-deoxygluconate kinase (gene kdgK), fusion: PTS system, beta-glucosides specific IIABC component, Fructokinase, sucrase-6-phosphate hydrolase (gene sacA), oxygen-sensitive ribonucleoside-triphosphate reductase nrdD, Phosphomannomutase, alanine racemase, UDP-N-acetylenolpyruvoylglucosamine reductase (murB), 6-phosphofructokinase, pyruvate kinase (pykA), Dihydroorotase, PTS system, maltose-specific enzyme IIBC component, maltose-6'-phosphate glucosidase (glvA), phosphoenolpyruvate synthase (gene pps), malate dehydrogenase, aspartate semialdehyde dehydrogenase (gene asd), PTS system, glucose-specific IIABC component, cobalamine-dependent methionine synthase I (methyltransferase andcobalamine-binding domain), diaminohydroxyphosphoribosylaminopyrimidine deaminase / 5-amino-6-(5-phosphoribosylamino)uracil reductase, riboflavin synthase alpha chain, riboflavin biosynthes protein RIBA (GTPcyclohydrolase/3,4-dihydroxy-2-butanone 4-phosphate synthase), riboflavin synthase beta chain, diaminopimelate decarboxilase (lisA), L-serine dehydratase, beta chain, L-serine dehydratase, alpha chain, phosphatidylserine synthase, ammonium transporter (membrane protein nrgA), serine acetyltransferase, glyceraldehyde 3-phosphate dehydrogenase, gene gapC, phosphoglycerate kinase, triosephosphate isomerase (TIM), 2,3-bisphosphoglycerate-independent phosphoglycerate mutase gene, Enolase, ribose 5-phosphate isomerase RpiB, NADP-specific glutamate dehydrogenase, NADPH-dependent glutamate synthase beta chain, glycerol uptake facilitator protein (permease), phosphatidylserine synthase, nucleoside-diphosphate-sugar epimerase (UDP-glucose 4-epimerase), phosphatidylserine decarboxylase, 3-oxoacyl-[acyl-carrier-protein] synthase III, phosphoribosylpyrophosphate synthetase, fructose-bisphosphate aldolase, glucan phosphorylase, thioredoxine reductase, adenine deaminase, phospho-2-dehydro-3-deoxyheptonate aldolase, prephenate dehydrogenase, 3-dehydroquinate synthetase, 5-enolpyruvylshikimate-3-phosphate synthase, chorismate synthase, fusion: chorismate mutase and shikimate 5-dehydrogenase, shikimate kinase, 3-dehydroquinate dehydratase II, cystathionine gamma-synthase, cysteine synthase, ATP phosphoribosyltransferase, histidinol dehydrogenase, imidazoleglycerol-phosphate dehydratase, glutamine amidotransferase, phosphoribosylformimino-5-aminoimidazole carboxamide ribonucleotide(ProFAR) isomerase, imidazoleglycerol-phosphate synthase cyclase, phosphoribosyl-AMP cyclohydrolase, phosphoribosyl-ATP pyrophosphohydrolase, Transketolase, aconitase A, isocitrate dehydrogenase, argininosuccinate synthase, argininosuccinate lyase, pyruvate-formate lyase, 1-acyl-sn-glycerol-3-phosphate acyltransferase, homoserine dehydrogenase, threonine synthase, aspartate aminotransferase, nicotinic acid phosphoribosyltransferase, superfamily I DNA helicase (rep-like helicase), P-loop kinase (uridine kinase family), nicotinate-nucleotide pyrophosphorylase, aspartate oxidase, quinolinate synthase, pyruvate kinase, ribonucleotide reductase, vitamin B12-dependent, NH(3)-dependent NAD(+) synthetase, Arginase, beta-glucosidase family protein, beta-glucosidase family protein, GlpX-like protein (Fructose-1,6-bisphosphatase related protein), 5-formyltetrahydrofolate cyclo-ligase, anaerobic ribonucleotide reductase, deoxyuridine 5'triphosphate nucleotidohydrolase (DUPTase), chorismate mutase PheB of B.subtilis ortholog, homoserine kinase (thrB), predicted nucleotidyltransferases of NarD/TagD family (N-term. domain) (yqeJ ortholog), diacylglycerol kinase (dgkA) fused to phosphatase B domain (pgpB), glycerol uptake facilitator protein(GLPF), glycerol kinase (GLPK), ribulose-5-phosphate 4-epimerase family protein, L-arabinose isomerase, sugar kinase, possible xylulose kinase, L-arabinose isomerase, Transaldolase, Transketolase (TKT), aldose-1-epimerase, phosphotransferase system IIC component (possibly N-acetylglucosamine-specific), PTS system (N-acetylglucosamine-specific IIA component, putative), histidinol-phosphate aminotransferase, cobalamin biosynthesis enzyme CobT, phosphoribosylcarboxyaminoimidazole (NCAIR) mutase , phosphoribosylaminoimidazolesuccinocarboxamide (SAICAR) synthase, glutamine phosphoribosylpyrophosphate amidotransferase, phosphoribosylaminoimidazol (AIR) synthetase, folate-dependent phosphoribosylglycinamide formyltransferase, AICAR transformylase/IMP cyclohydrolase, phosphoribosylamine-glycine ligase, beta-glucosidase, UDP-glucose 4-epimerase , ribose 5-phosphate isomerase, PTS system, fructose(mannose)-specific IIA component, PTS system, fructose(mannose)-specific IIB, PTS system, fructose(mannose)-specific IIC, PTS system, fructose(mannose)-specific IID, branched-chain-amino-acid transaminase (ilvE), Fructokinase, fructose-1,6-bisphosphatase, malic enzyme, malate dehydrogenase (oxaloacetate-decarboxylating), phosphoserine phosphatase family enzyme, bifunctional enzyme phosphoribosylformylglycinamidine (FGAM) synthase (synthetase domain/glutamine amidotransferase domain), aspartate ammonia-lyase, glycogen phosphorylase, large subunit of NADH-dependent glutamate synthase, small subunit of NADPH-dependent glutamate synthase, periplasmic phosphate-binding protein, phosphate permease, permease component of ATP-dependent phosphate uptake system, ATPase component of ABC-type phosphate transport system, glycerol 3-phosphate dehydrogenase, L-asparaginase, guanylate kinase, YLOD B.subtilis ortholog, flavoprotein involved in panthothenate metabolism, YLOI B.subtilis ortholog, pentose-5-phosphate-3-epimerase, phosphopantetheine adenylyltransferase, phosphate acetyltransferase, acetate kinase, nicotinic acid phosphoribosyltransferase, NH(3)-dependent NAD(+) synthase (nadE) fused to amidohydrolasedomain, uridylate kinase, CDP-diglyceride synthetase, riboflavin kinase/FAD synthase, Aspartokinase, phosphatidylglycerophosphate synthase , aspartate aminotransferase , phosphocarrier protein (Hpr), adenylosuccinate lyase, homoserine trans-succinylase, cytidylate kinase, 3-oxoacyl-(acyl-carrier-protein) synthase, purine nucleoside phosphorylase, Phosphopentomutase, predicted kinase, tetrahydrofolate dehydrogenase/cyclohydrolase (FolD), nucleoside phosphorylase, cation transport P-type ATPase, phosphoserine phosphatase family enzyme, pyruvate:ferredoxin oxidoreductase, cysteine synthase/cystathionine beta-synthase (CysK), ADP-glucose pyrophosphorylase, ADP-glucose pyrophosphorylase, glycogen synthase (glgA), N-terminal domain of asparagine synthase, UDP-glucose pyrophosphorylase, glycine hydroxymethyltransferase, adenine phosphoribosyltransferase (Apt), UDP-glucose 4-epimerase, UTP-glucose-1-phosphate uridylyltransferase, dihydrodipicolinate synthase, dihydrodipicolinate reductase, PLP-dependent aminotransferase, tetrahydrodipicolinate N-succinyltransferase, N-acetylornithine aminotransferase, acetylglutamate kinase, N-acetyl-gamma-glutamyl-phosphate reductase, amino-acid N-acetyltransferase / glutamate N-acetyltransferase, folylpolyglutamate synthase, 2-oxoacid ferredoxin oxidoreductase beta subunit, 2-oxoacid ferredoxin oxidoreductase alpha subunit, xylulose kinase, transcriptional regulators of NagC/XylR family, beta-phosphoglucomutase, diaminopimelate epimerase, possible 3-ketoacyl-acyl carrier protein reductase, carbamoylphosphate synthase large subunit, carbamoylphosphate synthase small subunit, dihydroorotate dehydrogenase, orotidine-5'-phosphate decarboxylase, aspartate carbamoyltransferase regulatory subunit, aspartate carbamoyltransferase catalytic subunit, glutamine synthetase type III, pyruvate carboxylase (PYKA ), glucose-6-phosphate isomerase, sugar kinase, ribokinase family, trehalose/maltose hydrolase (phosphorylase), GMP synthase, IMP dehydrogenase, 3-hydroxybutyryl-CoA dehydrogenase, electron transfer flavoprotein alpha-subunit, electron transfer flavoprotein beta-subunit, butyryl-CoA dehydrogenase, 3-hydroxybutyryl-CoA dehydratase, deacethylase/dipeptidase/desuccinylase family of Zn-dependenthydrolases, putative histidinol-phosphatase, O-acetylhomoserine (thiol)-lyase , Acylphosphatases (ACYP), PLP-dependent aminotransferase, glycerate kinase, galactose-1-phosphate uridylyltransferase, S-adenosylmethionine synthetase, UDP-N-acetylglucosamine 1-carboxyvinyltransferase, acetyl-CoA acetyltransferase, deoxycytidylate deaminase, ribose 5-phosphate isomerase (RpiB), fusion of alpha-glucosidase (family 31 glycosyl hydrolase), CTP synthase (UTP-ammonia lyase), D-alanine-D-alanine ligase, ketopantoate hydroxymethyltransferase, pantoate--beta-alanine ligase, aspartate 1-decarboxylase, mannose-6 phospate isomerase, dihydropteroate synthase, dihydroneopterin aldolase fused to 7,8-dihydro-6-hydroxymethylpterin-pyrophosphokinase, ketopantoate reductase PanE/ApbA, uncharacterized conserved protein fron YGAG family, predictedmetal-dependent enzyme, 3-phosphoserine aminotransferase (Possible phosphoglycerate dehydrogenase), tagatose-6-phosphate kinase, galactose-6-phosphate isomerase, galactose-6-phosphate isomerase, PTS system galactitol-specific IIC component, PTS system galactitol-specific IIB component, PTS system galactitol-specific IIA component putative, Galactokinase, UDP-galactose 4-epimerase, 6-phospho-beta-D-galactosidase, PTS system lactose-specific enzyme IIBC, PTS system lactose-specific enzyme IIA, alpha-acetolactate decarboxylase, 2-keto-3-deoxy-6-phosphogluconate aldolase (eda/kdgA), PTS system (Glucose-specific) component IIA, thymidylate synthase, dihydrofolate reductase, adenosine deaminase, amino-acid N-acetyltransferase / glutamate N-acetyltransferase, histidinol-phosphate aminotransferase, butyrate kinase (BUK), phosphate butyryltransferase, phosphoenolpyruvate-protein kinase (PTS system enzyme I), fumarate hydratase, subunit B (C-terminal domain of FumA E.coli), fumarate hydratase, subunit A (N-terminal domain of FumA E.coli), adenylate kinase , tryptophan synthase alpha chain, tryptophan synthase beta chain, phosphoribosylanthranilate isomerase, indole-3-glycerol phosphate synthase, anthranilate phosphoribosyltransferase, putative anthranilate synthase component II, para-aminobenzoate synthase component I, acetolactate synthase large subunit, dihydroxyacid dehydratase, isopropylmalate dehydrogenase , 3-isopropylmalate dehydratase, small subunit, 3-isopropylmalate dehydratase, large subunit, 2-isopropylmalate synthase , acetolactate synthase small subunit, predicted transcriptional regulator, homolog of Bvg accessory factor, formate--tetrahydrofolate ligase, hypoxanthine-guanine phosphoribosyltransferase, phosphoribosylpyrophosphate synthetase, glucosamine-1-phosphate N-acetyltransferase , possible glutamate racemase , pyrroline-5-carboxylate reductase, glutamate 5-kinase , gamma-glutamyl phosphate reductase , ribonucleotide reductase beta subunit , ribonucleotide reductase alpha subunit, NADH-dependent butanol dehydrogenase B (BDH II), NADH-dependent butanol dehydrogenase A (BDH I), possible cardiolipin synthase (phospholipase D family), alanine racemase , possible homocysteine S-methyltransferase , alcohol dehydrogenase, low specificity L-threonine aldolase, PTS system, (possibly glucose-specific) IIBC component , 6-phospho-alpha-glucosidase, PTS system, (possibly glucose-specific) IIA component, 3-oxoacyl-acyl carrier protein reductase, GMP reductase , UDP-N-acetylglucosamine enolpyruvyl transferase, lactate dehydrogenase, acetyl-CoA carboxylase alpha subunit, acetyl-CoA carboxylase beta subunit, biotin carboxylase, hydroxymyristoyl-(acyl carrier protein) dehydratase, biotin carboxyl carrier protein of acetyl-CoA carboxylase, 3-oxoacyl-(acyl-carrier-protein) synthase I , 3-ketoacyl-acyl carrier protein reductase, malonyl CoA-acyl carrier protein transacylase, trans-2-enoyl-ACP reductase II, 3-oxoacyl-[acyl-carrier-protein] synthase III, adenylosuccinate synthase, phosphatidylglycerophosphate synthase, dihydrodipicolinate synthase , dihydroxy-acid dehydratase , GTP cyclohydrolase I, acetolactate synthase large subunit, beta-glucosidase, pyruvate decarboxylase, alcohol dehydrogenase / acetaldehyde dehydrogenase, fructose-bisphosphate aldolase class I , mannose-specific phosphotransferase system component IIAB, mannose/fructose-specific phosphotransferase system component IIC, mannose-specific phosphotransferase system component IID, acetyl coenzyme A acetyltransferase (thiolase), 3-oxoacyl-acyl-carrier protein synthase, alcohol dehydrogenase / acetaldehyde dehydrogenase, butyrate-acetoacetate CoA-transferase subunit A, butyrate-acetoacetate CoA-transferase subunit B 및 acetoacetate decarboxylase.

본 발명에 있어서 또한, 상기 부탄올 생성 미생물의 대사특성 분석용 대사 네트워크 모델은 하기 표 1의 유전자-단백질-반응식 (Gene-Protein-Reaction: GPR)관계를 포함하는 것을 특징으로 할 수 있다:

표 1

본 발명은 다른 관점에서, 상기 대사 네트워크 모델을 이용하는 것을 특징으로 하는 부탄올 생성 미생물의 대사특성분석방법에 관한 것이다. 상기 부탄올 생성 미생물은 클로스트리듐 속임을 특징으로 할 수 있다. 상기 대사특성은 대사흐름인 것을 특징으로 할 수 있으며, 이때 다음 단계를 포함하는 것을 특징으로 할 수 있다:

(a) 상기 대사 네트워크 모델 중 사용가능한 탄소원 및 질소원에 대한 수송 반응식을 보정하는 단계; 및

(b) 상기 탄소원 및 질소원을 이용하여 대사흐름분석하는 단계.

본 발명은 다른 관점에서, 상기 대사 네트워크 모델의 토폴로지(topology)를 분석하는 방법에 관한 것이다.

본원에서, 대사 네트워크의 토폴로지 분석이란, 대사 네트워크를 대사산물은 노드(node)로, 두 대사 산물을 매개하는 효소반응식을 에지(edge)로 표현하고, 그래프 이론에서 사용되는 토폴로지(topology) 분석방법을 이용하여 대사 네트워크의 특징을 알아내는 방법이다. 에지와 노드는 그래프 이론(graph theory)에서 사용되는 용어로, 노드(node)는 네트워크를 구성하는 일련의 점을 나타내며, 에지(edge)는 두 개의 node를 연결하는 선을 나타낸다.

본 발명에 따른 대사 네트워크의 토폴로지 분석을 통하여 다음과 같은 정보를 얻을 수 있다.

커넥티비티(Connectivity): 노드(node)가 다른 노드(node)와 에지(edge)로 연결된 개수를 의미하며, 이값이 클수록 이 대사 산물이 대사 네트워크에서 많이 이용된다는 것을 의미하므로 추후 실제 미생물에서 대사 경로를 조작할 때 유용한 정보로 사용될 수 있다.

네트워크 지름(Network diameter): 임의의 두 노드(node)를 잇는데 사용된 에지(edge)의 개수 중 최대값을 나타내는 것으로, 대사 네트워크의 크기를 나타내는 정보이다.

평균 경로 길이(Average path length): 한 노드(node)에서 다른 노드(node)로 가는 데 사용되는 에지(edge)의 개수는 다양할 수가 있으므로, 대사 네트워크의 노드(node) 중에서 2개를 뽑아 가장 에지(edge)가 적게 들어가는 경로를 찾을 수가 있다. 이때, 평균 경로 길이(average path length)란 임의의 두 개의 노드(node)에서 이러한 값들을 모두 계산하여 평균을 낸 것을 의미하며, 이값이 크면 클수록 한 대사 산물을 다른 대사 산물로 전환하는데 있어서 많은 단계를 거쳐야 한다는 것을 의미한다.

본 발명에 있어서, 상기 토폴로지의 분석은 다음의 클로스터 계수 Cn 을 이용하는 것을 특징으로 할 수 있다:

Cn = N/M

N : n 번째 노드와 이웃한 노드간의 연결된 선의 개수

M : n 번째 노드와 이웃한 노드간의 최대한으로 연결 가능한 선의 개수

또는, 다음의 클로스터 계수 Cn 을 이용할 수 있다.

Cn = 2en/(kn(kn-1)) (단일방향으로 구성된 네트워크의 경우)

Cn = en/(kn(kn-1)) (양방향으로 구성된 네트워크의 경우)

kn : n 번째 노드의 인접한 연결된 노드의 개수

en : n 번째 노드의 모든 이웃 중 연결된 쌍의 수.

본 발명은 다른 관점에서, 상기 대사네트워크 모델을 이용하는 것을 특징으로 하는 부탄올 생성 미생물의 특정 대사산물의 생산을 증가시키기 위한 결실 표적 효소 또는 그 유전자의 스크리닝 방법에 관한 것이다. 본 발명의 일 구체예에서는 부탄올 생성 미생물 중 클로스트리듐( Clostridium ) 속 미생물인 C. acetobutylicum 의 대사 네트워크 모델을 이용하였다. 개략적인 과정은 도 1에 도시하고 있으며, 각 단계에 대한 구체적인 설명은 이하와 같다.

구축된 C. acetobutylicum 의 대사 네트워크 모델에서 효소반응식들을 하나 또는 둘 이상씩 차단하며 선형계획법을 적용하되, 특정 대사산물의 생성능이 증가하는 경우 차단된 효소 반응식의 효소를 결실 표적효소로 선정하거나, 이를 코딩하는 유전자를 결실 표적유전자로 선정한다. 이때, 상기 특정 대사산물은 부탄올, 아세트산, 부틸레이트(butyrate), 에탄올 및 아세트산으로 구성된 군에서 선택되는 것일 수 있으나, 다음에서는 부탄올 생산능을 증가시키기 위한 경우로 설명한다. 본 발명은 상세하게는 다음의 단계를 포함할 수 있다.

(1) 상기의 보정된 대사 네트워크를 구성하고 있는 효소 반응식들에 대하여 세포 성장 반응식의 반응속도 또는 대사흐름값은 양이 되도록 초기 조건을 설정하고 상기 효소 반응식들을 한 개씩 또는 둘 이상의 조합을 구성하여 차단시키면서 선형계획법을 적용하였을 때, 차단하지 않았을 때에 비하여 부탄올 생성능을 증가시키는 경우의 차단된 효소 반응식들을 결실 표적 효소 후보(I)로 선정한다.

이때, 상기 구축된 대사 네트워크를 수학적으로 표현하기 위하여, 구축된 대사 네트워크 모델을 구성하고 있는 모든 대사산물, 상기 대사산물의 대사경로 및 상기 대사경로에서의 화학양론 매트릭스 S (stoichiometric matrix)( Sij, j 번째 반응에서 i 번째 대사산물의 시간에 따른 화학양론 계수)를 이용하여, 대사흐름 벡터( ν , j 번째 대사반응의 대사흐름)를 계산할 수 있다.

여기서, 시간에 따른 대사산물 농도 X 의 변화는 모든 대사 반응의 흐름의 합으로 나타낼 수 있다. 시간에 따른 X 의 농도 변화량이 없다고 가정하면, 즉 준정상 상태의 가정 하에서, 시간에 따른 대사산물 농도의 변화량은 아래의 수학식 1로 정의될 수 있다.

수학식 1

(여기서, : 시간에 따른 X 의 변화량, X : 대사산물의 농도, t: 시간)

상기 구성된 화학량론 행렬에서 최적화, 즉 최대화 또는 최소화 하고자 하는 반응식을 목적함수로 설정하고 선형계획법(Linear programming)을 이용하여 세포 내의 대사흐름을 예측한다(Kim et al., Mol Biosyst. 4(2):113, 2008). 본 발명의 일 구현예에서는 행렬 S 에서 세포의 구성성분을 나타내는 효소 반응식을 목적함수로서 설정함으로써, 세포 생장 속도를 최적화 하였다.

그리고, 상기 대사흐름분석을 위한 선형계획법을 적용함에 있어서는, 실제 이 균주의 발효에서 사용된 영양분만이 공급된다는 가정 하에 실행해야 한다. 일반적으로 사용하는 복합 배지(complex medium)은 그 각각의 구성 성분을 정량적으로 파악하는 것이 매우 어려우므로, 본 발명에서는 기존에 최적화된 합성 배지(synthetic medium)를 이용하여 발효하였고, 이 결과를 모델의 검증에 사용하였다.

본 발명에서, 상기 구축된 대사 네트워크 모델에서 효소 반응식 차단 시뮬레이션은 상기 대사흐름 벡터( ν )에서 차단시키고자 하는 효소 반응식의 해당 대사흐름을 0(= νj )으로 고정시킨 상태에서 세포 생장 속도를 목적함수로 설정하고 이를 최대화하도록 선형계획법을 실행한다.

(2) 상기 C. acetobutylicum 대사 네트워크를 구성하고 있는 효소 반응식들에 대하여 세포 성장 반응식의 대사속도 또는 대사흐름값을 0으로 고정하고 상기 효소 반응식들을 한 개씩 또는 여러 개의 조합을 구성하여 차단시키면서 용매 생성식의 흐름값을 최대화하는 선형계획법을 적용하였을 때, 차단하지 않았을 때에 비해 부탄올 생성능을 증가시키는 경우의 차단된 효소 반응식들을 2차 결실 표적효소 후보(II)로 선정한다. 이는 용매 생성이 안정기에서 활발히 일어난다는 기존의 실험 결과들을 모델에 반영하기 위함이다.

(3) 상기 (1) 및 (2) 단계에서 얻은 결과들인 결실 표적 후보(I) 및 2차 결실 표적효소(II)을 비교하여 중복되는 결실 표적 효소 후보들을 최종 결실 표적 효소군으로 선정하거나, 이를 코딩하는 유전자를 결실 표적유전자로 선정한다. 이 단계는 대사흐름분석을 통하여 전체적인 산 생성기와 용매 생성기의 대사 흐름을 살펴봄으로써 부탄올 생산에 가장 적합한 결실 표적 후보군을 통합하는 단계이다. 다만, 상기에서 (1) 단계만을 수행하여 결실 표적을 수득하는 것도 가능하다.

본 발명은 다른 관점에서, 부탄올 생성 미생물에서 상기 방법에 의하여 스크리닝된 결실 표적유전자를 결실시키는 것을 특징으로 하는 특정 대사산물의 생성능이 증가된 변이 미생물의 제조방법 및 이에 의하여 제조된 변이 미생물에 관한 것이다.

상기 결실 표적유전자의 결실은 상동성 재조합(homologous recombination)에 의해 수행되는 것을 특징으로 할 수 있고, 상기 상동성 재조합은 결실된 표적유전자를 포함하는 유전자 교환벡터를 사용하여 수행되는 것을 특징으로 할 수 있다.

본 발명은 또 다른 관점에서, 상기 변이 미생물을 이용한 특정 대사산물의 제조방법에 관한 것이다. 이는 상기 변이 미생물을 배양하는 단계; 및 상기 배양액으로부터 특정 대사산물을 회수하는 단계를 포함하는 것을 특징으로 할 수 있다.

한편, 본 발명의 일 실시예에서는, 상기 구축된 대사 네트워크 모델을 이용하여 유전자 결실 균주의 대사흐름을 예측한 결과, 실제 실험치에 거의 근접하게 나타났으며, 이에 본 발명에 따른 대사 네트워크 모델은 부탄올 생성 미생물의 대사 흐름예측에 유용한 것을 확인하였다.

이에 본 발명은 다른 관점에서, 상기 대사 네트워크 모델을 이용한 부탄올 생성 미생물의 대사흐름 예측방법에 관한 것이다. 이때, 바람직하게는 기질의 흡수속도를 선행 입력값으로 한 선행계획법 또는 이차계획법을 이용하는 것을 특징으로 할 수 있다.

아울러, 상기 대사 네트워크 모델을 이용하여 부탄올 생성 미생물의 용매생성기의 대사흐름을 예측하는 경우, 다음의 반응식 Ⅱ을 이용할 수 있다:

반응식 II

제한 조건:

S · ν =0, ν min ν ν max

여기서, ν acid 는 산 생성기에서의 대사흐름 벡터이고; ν sol 는 용매 생성기에서의 대사흐름 벡터이고; 는 용매 생성기에서 조효소 A 전달 효소에 의한 부티르산의 흡수 속도이고; 는 용매 생성기에서 조효소 A 전달 효소에 의한 아세트산의 흡수 속도이고; 는 산 생성기에서 부티르산의 생성 속도이고; 는 산 생성기에서 아세트산의 생성 속도임.

실시예

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 하기 실시예들은 여러가지 다른 형태로 변형될 수 있으므로, 본 발명의 범위가 이들 실시 예에 의해 제한되는 것으로 해석되지는 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.

특히, 하기 실시예에서는 C. acetobutylicum 를 모델 시스템으로 이용한 방법에 대하여만 예시되어 있으나, C. acetobutylicum 이외의 다른 부탄올 생성 미생물의 경우에도 적용된다는 것은 본 명세서에 개시된 내용으로부터 당업자에게 자명하다.

실시예 1: C. acetobutylicum 의 세포 조성 분석

각종 문헌의 정보와, 문헌 정보가 없는 부분들은 실제 발효로 얻은 시료를 직접 분석하거나 유연 관계가 가까운 균주로부터 참조하여 얻은 정보를 이용하여 대사 네트워크에 필수적인 세포의 생장식을 구성하였다.

첫째로, 세포를 구성하는 거대 분자의 조성(macromolecular composition)은 클로스트리듐 속과 유연 관계가 가깝고 외양도 유사한 바실러스( Bacillus ) 속 미생물 중 B. subtilis 의 조성을 차용하였다(Oh et al., J. Biol. Chem. , 282:28791-9, 2007). 여기에서는 세포는 단백질, RNA, DNA, 인지질(phospholipids), 리포테이코산(lipoteichoic acid), 세포벽(peptidoglycan 및 다당류), 기타 미량 성분으로 나뉜다고 가정하였다.

단백질의 아미노산 조성 분석은 실제로 C. acetobutylicum 을 발효하여 얻은 시료를 기초과학지원연구원 프로테오믹스팀에 분석을 의뢰하여 얻었다.

DNA를 구성하는 뉴클레오티드(nucleotide)의 조성 분석은 이미 염기 서열이 완료되었기 때문에 상대적으로 쉽다. 그러나 C. acetobutylicum 의 경우 염색체 DNA 외에도 거대 플라스미드(megaplasmid)를 가지고 있으며, 개수(copy number)는 일정하지 않다. 그러나 실제로 계산해 보면 거대 플라스미드 수가 DNA 조성에 미치는 영향은 미미하다고 볼 수 있다. 따라서, DNA의 조성은 염색체 DNA+거대 플라스미드 1개를 기준으로 계산하였다.

RNA는 mRNA, tRNA, rRNA의 비율을 문헌상에 표기된 비율이라 가정하였다. mRNA의 뉴클레오티드 조성은 DNA의 그것과 같다고 가정하고, tRNA와 rRNA는 해당 유전자의 염기 서열을 분석하여 평균값을 취하였다.

인지질의 지방산 조성 및 극성기의 조성은 문헌을 참조하였다(Durre, Taylor & Francis, 2005). C. acetobutylicum 은 다른 미생물과 달리 plasmalogen이라는 지방 알데히드와 alk-1-enyl 결합을 이룬 지질이 존재한다. 고등 생물에서는 이의 생합성 과정이 잘 알려져 있으나, 세균류에서는 이것이 알려져 있지 않으므로 여기에서는 탄소의 개수와 이중 결합의 개수만 고려하고, 나머지는 일반적인 인지질과 같다고 가정하였다.

세포벽의 조성은 직접 발효하여 얻은 시료를 독일 DSMZ에 분석을 의뢰하여 구하였으며, 기타 성분들은 대사 네트워크에 큰 영향을 미치는 부분이 아니므로 다른 균주에서 차용하였다.

상기의 방법을 통하여 얻은 정보로부터 하기의 세포 조성을 구하였다.

표 2

거대분자 조성 구성요소 비율 (% g/g) 단백질 52.84 RNA 6.55 DNA 2.6 인지질 7.6 테이코산 3.04 세포벽 22.42 미량 성분 4.04

표 3

DNA (chromosomal + pSOL) 뉴클레오티드 조성 (mol/mol DNA) 분자량 (g/mol) mmol/gDNA A 0.345 313.2 1.118 G 0.155 329.2 0.501 T 0.345 304.2 1.118 C 0.155 289.2 0.501

표 4

표 5

인지질 내 전체 지방산 조성(mol/total fatty acid or aldehyde) in phospholipids C14 0.073 C16 0.521 C16:1 0.065 C18 0.036 C18:1 0.102 C17:cyc 0.022 C19:cyc 0.182

표 6

아미노산 조성 아미노산 mmol/g 단백질 gly 1.078 ala 0.775 val 1.172 leu 0.429 ile 0.436 met 0.783 pro 0.457 phe 0.185 tyr 0.801 trp 0.043 ser 0.427 thr 0.410 asn 0.156 asp 0.156 gln 0.127 glu 0.127 cys 1.216 lys 0.336 arg 0.133 his 0.146

표 7

세포벽 구성 구성 성분 mmol/g 펩티도글리칸 N-acetylmuramate 1.152 N-acetylglucosamine 1.152 alanine 1.727 diaminopimelic acid 1.152 glutamate 1.152

표 8

테이코산 성분 구성 성분 mmol/g teichoic acid Polyglycerophosphate chain 0.518 Lysine 0.129 N-acetylglucosamine 0.129

표 9

세포벽 내 탄수화물 조성 구성 성분 mmol/g carbohydrate Glucose 2.058 Galactose 4.115

상기 조성을 바탕으로 다음과 같은 생장 관련식을 만들었다.

DNA: 1.118 dATP + 0.501 dCTP + 1.118 dTTP + 0.501 dGTP + 4.403 ATP -> 4.403 ADP + 4.403 Pi + 3.236 PPi + DNA

RNA: 1.05 ATP + 1.124 CTP + 0.873 UTP + 0.832 GTP -> 1.554 ADP + 1.554 Pi + 3.879 PPi + RNA

단백질(PROTEIN): 0.775 LALA + 0.133 LARG + 0.156 LASN + 0.156 LASP + 1.216 LCYS + 0.127 LGLN + 0.127 LGLU + 1.078 GLY + 0.146 LHIS + 0.436 LILE + 0.429 LLEU + 0.336 LLYS + 0.783 LMET + 0.185 LPHE + 0.457 LPRO + 0.427 LSER + 0.41 LTHR + 0.043 LTRP + 0.801 LTYR + 1.172 LVAL + 37.195 ATP -> 37.195 ADP + 37.195 Pi + PROTEIN

인지질(PHOSPHOLIPID): 0.8 PE + 0.397 PG + 0.109 CDL -> PHOSPHOLIPID

테이코산(TEICHOIC ACID): 0.518 POLYGP + 0.129 LLYS + 0.129 UACGAM + 0.129 ATP -> TEICH + 0.129 UDP + 0.129 ADP + 0.129 Pi

TRACE: 0.215 NAD + 0.192 NADP + 0.199 COA + 0.321 THF + 0.313 FMN + 0.182 FAD -> TRACE

펩티도글리칸(PEPTIDOGLYCAN): 1.064 UAMR + 1.064 UACGAM + 1.106 LALA + 1.106 LGLU + 1.106 DALADALA + 1.106 26DAP-M + 4.425 ATP -> PEPTIDOGLYCAN + 1.106 DALA + 1.106 UDP + 1.106 UMP + 4.425 ADP + 4.425 Pi

탄수화물(CARBOHYDRATE): 2.058 UDPGLC + 4.115 UDPGAL -> 6.173 UDP + CARBOHYDRATE

또한, 상기 조성으로부터 얻은 세포 성장 반응식은 다음과 같으며, 이를 본 발명에 따른 스크리닝 방법에 적용하였다.

생장량(BIOMASS): 0.5284 단백질(PROTEIN) + 0.0655 RNA + 0.026 DNA + 0.076 인지질(PHOSPHOLIPID) + 0.1009 펩티도글리칸(PEPTIDOGLYCAN) + 0.08 테이코산(TEICH) + 0.0432 탄수화물(CARBOHYDRATE) + 0.0494 미량성분(TRACE) + 85 ATP -> 생물량(BIOMASS) + 85 ADP + 85 Pi

실시예 2: C. acetobutylicum 의 대사 네트워크 구축 및 대사흐름분석

컴퓨터를 이용하여 대사산물의 생성능 증대를 위한 C. acetobutylicum 의 결실 표적을 예측하기 위하여 다양한 데이터베이스 및 실험결과를 이용하여 게놈 수준의 대사 네트워크를 구축하였다.

KEGG(Kanehisa et al.. Nucleic Acids Res , 34:D354, 2006), TransportDB(Ren et al., PLoS Comput. Biol. , 1:e27, 2005), MetaCyc(Caspi et al. Nucleic Acids Res. , 36:D623, 2008)을 토대로 초기 버전의 대사 네트워크를 구축하였으며 게놈 정보를 토대로 효소 반응식의 방향성, 유전자·단백질의 상관관계를 명확히 하였다.

상기 내용에서 이러한 데이터베이스의 내용이 불완전할 수 있음을 밝혔다. 이는 C. acetobutylicum 의 경우에도 나타나는데, 몇 가지 예를 들어 설명하고자 한다.

첫째로, 대사 데이터베이스상에서는 특정 물질을 대사할 수 없다고 판단되지만 문헌상으로는 이 물질을 기질로 정상적으로 대사하는 경우인데 대표적으로 자일로오스(xylose)의 경우를 들 수 있다. 도 2에 나타난 바와 같이 KEGG에서 C. acetobutylicum 의 자당 대사 경로를 살펴보면 자일로오스 섭취하지 못하는 것으로 되어 있다. 그러나 C. acetobutylicum 는 자일로오스를 탄소원으로 사용할 수 있음이 실험적으로 밝혀져 있다(Ounine et al., Biotechnol. Lett. , 5:605-610, 1983). 따라서 이러한 경우에는 GPR 관계가 명확하지 않더라도 자일로오스의 대사를 위해 필요할 것이라고 생각되는 반응식을 대사 네트워크에 추가하였다.

둘째로, GPR 관계는 존재하지 않으나 자체 실험 결과상으로 미루어 볼 때, 그 반응식 또는 유사 반응식이 존재하는 것이 너무나 명확한 경우이다. 아미노산 생합성 경로에서 그러한 경우가 많이 발견된다. 발효에 사용된 배지는 기존에 발표된 최적화된 합성 배지로서(Monot et al., Appl. Environ. Microbiol. , 44:1318-1324, 1982), 이는 질소원으로 오로지 암모늄 이온만 사용하는데, 이 때에도 균주의 생장이 정상적으로 일어난다. 따라서 암모늄으로부터 모든 아미노산의 생성이 가능함을 알 수 있으며, 아미노산 생합성 경로의 부족한 반응식들을 추가하였다.

C. acetobutylicum 의 대사 네트워크는 502개의 생화학 반응식과 479개의 대사 산물로 구성되어 있다. 상기 대사 네트워크의 정보에는 하기 432개의 유전자 정보가 담겨 있다. 구축된 대사 네트워크의 GPR 관계는 상기 표 1과 같다. 하기 예측되는 결실 표적은 이들 유전자로부터 선별하였다.

아울러, 목적함수로 사용되는 반응식은 다음과 같다.

성장 반응식: 0.5284 PROTEIN + 0.0655 RNA + 0.026 DNA + 0.076 PHOSPHOLIPID + 0.1009 PEPTIDOGLYCAN + 0.08 TEICH + 0.0432 CARBOHYDRATE + 0.0494 TRACE + 85 ATP -> BIOMASS + 85 ADP + 85 Pi

용매 생성식: 2.379568182 ACTAC + 3.729151017 BUAL + ACAL + 4.729151016 NADH -> 2.379568182 ACETONE + 2.379568182 CO2 + 3.729151017 BUOH + ETOH + 4.729151016 NAD (단, 개별적인 아세톤, 부탄올, 에탄올 생성식은 제외함)

한편, 본 발명의 대사 네트워크에서 사용된 대사산물의 약어 및 이의 정식명칭을 정리하면 하기 표 10과 같다.

표 10

상기에서 구축한 대사 네트워크에서, C. acetobutylicum 의 765개의 대사산물을 대상으로 MetaFluxNet(Lee et al., Bioinformatics , 19:2144, 2003) 및 GAMS를 이용하여 대사흐름분석을 수행하였다.

C. acetobutylicum 의 주요 대사 경로에 대한 대사흐름분석 결과는 도 3에 나타난 바와 같다.

실시예 3:  구축된 대사 네트워크의 전반적인 특성 분석

상기 구축된 대사 네트워크를 네트워크의 특성 분석 도구인 NetworkAnalyzer를 이용하여 분석하였다. 이러한 대사 특성을 분석함으로써 대사흐름분석으로 찾은 결실 표적 후보군 외에도 다른 부분이 있는가를 파악할 수 있다. 이 도구를 이용함으로써 다양한 분석이 가능한데, 본 실시예는 그 중 단일 파라미터(single parameter) 분석 결과에 대해서 설명하고자 한다. 결과는 도 4에 나타나 있으며, 이 중 클러스터 계수(clustering coefficient)에 대한 설명은 다음과 같다.

클러스터 계수: 단일 방향으로 구성된 네트워크의 경우, n 번째의 노드(node)에 대한 클러스터 계수 Cn 은 다음과 같이 정의된다.

Cn = 2en/(kn(kn-1))

kn : n 번째 노드의 인접한 연결된 노드의 개수

en : n 번째 노드의 모든 이웃 중 연결된 쌍의 수

여기서 노드는 대사 네트워크에 포함된 대사 산물로서, 도 4에서는 모사에 필요한 탄소원과 질소원으로만 구성된 대사 네트워크를 분석한 것으로 상기 실시예 2의 대사 네트워크에 비해 그 수가 적다.

양방향으로 구성된 네트워크의 경우, 다음과 같은 정의를 사용한다.

Cn = en/(kn(kn-1))

두 경우 모두에 대하여, 클러스터 계수는 다음과 같이 나타낼 수 있다.

N/M

N : n 번째 노드와 이웃한 노드간의 연결된 선의 개수

M : n 번째 노드와 이웃한 노드간의 최대한으로 연결 가능한 선의 개수

따라서 클러스터 계수는 항상 0보다 크거나 같고 1보다 작거나 같은 값을 갖는다.

실시예 4: 게놈 수준 대사 네트워크를 이용한 유전자 결실 균주의 대사흐름 예측

상기 구축된 대사 네트워크를 이용하여 야생형 균주의 대사 흐름과 부티르산 인산화 효소(butyrate kinase)를 결실시킨 균주인 PJC4BK 균주의 대사 흐름을 모사하고, 실제 실험치와 비교하여 보았다.

용매 생성 균주의 특성인 산 생성기와 용매 생성기가 구분된다는 점을 더욱 정밀하게 모사하기 위해 기존에 발표되었던 MOMA(minimazation of metabolic adjustment)를 변형하여 도입하였다. 일단 산 생성기의 대사 흐름은 기존의 선형계획법을 이용하여 세포 생장을 최대화하여 구하였으며, 용매 생성기의 대사 흐름은 용매 생성기의 세포가 산 생성기 세포의 유전자 결실 균주와 같다는 가정을 하고, MOMA를 변형한 이차계획법을 도입함으로써 구하였다 (Segre et al. Proc. Nat.l Acad. Sci . 99: 15112-15117. 2002) 이 때, 용매 생성기에서는 세포의 생장이 거의 일어나지 않으므로 세포의 생장 속도는 0으로 가정한다.

또한 용매 생성기에서는 산 생성기에서 생성된 유기산들이 조효소 A 전달 효소(coenzyme A transferase, Ctf)에 의해 재흡수되어 용매 생성에 이용되는데, 아세트산과 부티르산의 흡수 속도를 더욱 정확하게 모사하기 위한 항을 도입하였다 (Desai et al. Metab. Eng. 1:206-213. 1999). 전체적인 과정을 식으로 표현하면 다음과 같다.

최소화:

제한 조건:

S · ν =0, ν min ν ν max

각 항의 정의는 다음과 같다.

ν acid : 산 생성기에서의 대사흐름 벡터

ν sol : 용매 생성기에서의 대사흐름 벡터

: 용매 생성기에서 조효소 A 전달 효소에 의한 부티르산의 흡수 속도

: 용매 생성기에서 조효소 A 전달 효소에 의한 아세트산의 흡수 속도

: 산 생성기에서 부티르산의 생성 속도

: 산 생성기에서 아세트산의 생성 속도

본 발명의 대사 네트워크 모델을 이용하여 야생형 균주의 대사 흐름과 부티르산 인산화 효소(butyrate kinase)를 결실시킨 균주인 PJC4BK 균주의 대사 흐름을 모사하여, 실제 실험치와 비교한 결과, 도 5에 나타난 바와 같이, 본 발명에 따른 대사 네트워크 모델을 이용하여 예측한 결과는 실제 실험치에 거의 근접한 것으로 나타났다. 즉, 본 발명에 따른 대사 네트워크 모델은 부탄올 생성 미생물의 대사 흐름예측에 유용한 것을 확인할 수 있었다.

이상 설명한 바와 같이, 본 발명에 따른 대사 네트워크 모델은 부탄올 생성 미생물의 대사 흐름 등 대사특성 분석 및 특정 대사산물의 생산을 증가시키기 위한 결실 표적 효소 또는 그 유전자의 스크리닝에 유용하며, 본 발명에 따른 부탄올 생성 미생물의 대사 네트워크 모델에 기반한 결실 표적의 스크리닝 방법은 인간의 직관과 추론에 의한 결실 유전자 탐색과는 달리, 빠른 시간 내에 시스템 수준에서 유전자 결실 표적들을 예측할 수 있게 한다. 또한, 상기 방법에 따라 스크리닝된 결실 표적 유전자를 부탄올 생성 균주에서 결실시킴으로써 시간 및 비용을 절약하고 부탄올 등 특정 대사산물을 고효율로 생산할 수 있는 변이 미생물을 얻을 수 있게 하므로 유용하다.

이상으로 본 발명의 내용의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적 기술은 단지 바람직한 실시양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.