Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
GENETICALLY MODIFIED MICROORGANISMS THAT CARRY OUT THE HETEROLOGOUS PRODUCTION OF MODIFIED VERSIONS OF THE SURFACTANT PROTEIN LV-RANASPUMIN-1 (LV-RSN-1), THE MODIFIED VERSIONS OF SAID SURFACTANT PROTEIN, THE SYNTHETIC GENES ENCODING SAID SURFACTANT PROTEIN, THE EXPRESSION CASSETTES CONTAINING SAID SYNTHETIC GENES, AND THE EXPRESSION VECTORS CONTAINING SAID SYNTHETIC GENES
Document Type and Number:
WIPO Patent Application WO/2021/119782
Kind Code:
A1
Abstract:
The present invention relates to the heterologous production in microorganisms of modified versions of a predicted isoform of the surfactant protein Lv-ranaspumin-1 (Lv-Rsn-1), the sequence of which was deduced from analyses of the protein extract of foam from nests of the Northeastern pepper frog (Leptodactylus vastus). More specifically, the present invention relates to two surfactant proteins that consist of modified versions of the predicted isoform of Lv-Rsn-1; two synthetic genes, each encoding one of said modified versions of the predicted isoform of Lv-Rsn-1; two expression cassettes, each containing one of the synthetic genes encoding one of the modified versions of the predicted isoform of Lv-Rsn-1; two expression vectors, each containing one of the synthetic genes encoding the modified versions of the predicted isoform of Lv-Rsn-1; and two transgenic microorganisms, a bacterium and a yeast, each transformed with one of said synthetic genes and heterologously producing one of the modified versions of the predicted isoform of Lv-Rsn-1. Lv-Rsn-1 has surfactant, emulsifying and dispersing properties, inter alia, and heterologous production thereof enables it to be used in various applications and industrial products, without needing to be extracted from foam from frog's nests.

Inventors:
MACIEL MELO VÂNIA MARIA (BR)
DE ABREU WALDOW VINICIUS (BR)
NOGUEIRA MOYSES DANUZA (BR)
CAVALCANTE HISSA DENISE (BR)
DE SOUSA MAIRA PAULA (BR)
Application Number:
PCT/BR2020/050541
Publication Date:
June 24, 2021
Filing Date:
December 14, 2020
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
PETROLEO BRASILEIRO SA PETROBRAS (BR)
International Classes:
C07K14/46; C02F3/00; C12N1/19; C12N1/21; C12N15/12; C12N15/63; C02F101/32
Domestic Patent References:
WO2019094913A22019-05-16
Foreign References:
EP3483248A12019-05-15
Other References:
VANCE, S. J.: "The relationship between structure and function in natural surfactant proteins", TESE, 2012, Glasgow, pages 1 - 294, XP055836367, Retrieved from the Internet
COOPER, A. ET AL.: "Frog foams and natural protein surfactants", COLLOIDS AND SURFACES A, PHYSICOCHEMICAL AND ENGINEERING ASPECTS, vol. 534, 2017, pages 120 - 129, XP085279333, DOI: 10.1016/j.colsurfa. 2017.01.04 9
COOPER, A. ET AL.: "Biofoams and natural protein surfactants", BIOPHYSICAL CHEMISTRY, vol. 151, no. 3, 2010, pages 96 - 104, XP027400151, DOI: 10.1016/j.bpc. 2010.06.00 6
HISSA DENISE CAVALCANTE, BEZERRA GUSTAVO ARRUDA, OBRIST BRITTA, BIRNER-GRÜNBERGER RUTH, MELO VÂNIA MARIA MACIEL, GRUBER KARL: "Crystallization and preliminary X-ray diffraction of the surfactant protein Lv -ranaspumin from the frog Leptodactylus vastus", ACTA CRYSTALLOGRAPHICA, vol. 68, no. 3, 1 March 2012 (2012-03-01), pages 321 - 323, XP055946924, DOI: 10.1107/S1744309112002679
HISSA, D. C. ET AL.: "Unique Crystal Structure of a Novel Surfactant Protein from the Foam Nest of the Frog Leptodactylus vastus", CHEMBIOCHEM, vol. 15, 2014, pages 393 - 398, XP055836372, DOI: https://doi.org/10.1002/cbic.201300726
"GenBank", Database accession no. AAP48831
See also references of EP 4105230A4
Attorney, Agent or Firm:
RODRIGUES SILVA, Francisco Carlos et al. (BR)
Download PDF:
Claims:
Quadro Reivindicatório

1. POLINUCLEOTÍDEO caracterizado por codificar a sequência predita de uma isoforma da proteína surfactante Lv-ranaspumina-1 (Lv-Rsn-1) e consistindo de SEQ ID NO:2.

2. POLINUCLEOTÍDEO caracterizado por codificar a sequência predita de uma isoforma da proteína surfactante Lv-ranaspumina-1 (Lv-Rsn-1) e por ter a frequência de códons otimizada para expressão em bactérias, consistindo de SEQ ID NO:3.

3. POLINUCLEOTÍDEO caracterizado por codificar a sequência predita de uma isoforma da proteína surfactante Lv-ranaspumina-1 (Lv-Rsn-1) e por ter a frequência de códons otimizada para expressão em leveduras, consistindo de SEQ ID NO:7.

4. POLIPEPTÍDEO caracterizado por ser uma versão modificada de uma isoforma da proteína surfactante Lv-ranaspumina-1 (Lv-Rsn-1) e consistindo de SEQ ID NO:6.

5. POLIPEPTÍDEO caracterizado por ser uma versão modificada de uma isoforma da proteína surfactante Lv-ranaspumina-1 (Lv-Rsn-1) e consistindo de SEQ ID NO:10.

6. CASSETE DE EXPRESSÃO caracterizado por compreender um polinucleotídeo de acordo com a reivindicação 2 operacionalmente ligado a um promotor que direcione a expressão em bactéria.

7. CASSETE DE EXPRESSÃO caracterizado por compreender um polinucleotídeo de acordo com a reivindicação 3 operacionalmente ligado a um promotor que direcione a expressão em fungos, preferencialmente em levedura.

8. VETOR DE EXPRESSÃO caracterizado por compreender um cassete de expressão de acordo com a reivindicação 6.

9. VETOR DE EXPRESSÃO e TRANSFORMAÇÃO caracterizado por compreender um cassete de expressão de acordo com a reivindicação 7.

10. MICRORGANISMO GENETICAMENTE MODIFICADO caracterizado por ser uma bactéria que produz uma proteína cuja sequência codificadora compreende o polinucleotídeo de acordo com a reivindicação 6.

11. MICRORGANISMO GENETICAMENTE MODIFICADO caracterizado por ser uma levedura que produz uma proteína cuja sequência codificadora compreende o polinucleotídeo de acordo com a reivindicação 7.

12. PROCESSO DE PRODUÇÃO DE ORGANISMO GENETICAMENTE MODIFICADO caracterizado por resultar em uma bactéria conforme a reivindicação 10 e compreender: a) transformar uma linhagem de bactéria com o cassete de expressão de acordo com a reivindicação 6; b) selecionar as bactérias transformadas.

13. PROCESSO DE PRODUÇÃO DE ORGANISMO GENETICAMENTE MODIFICADO caracterizado por resultar em uma levedura conforme a reivindicação 11 e compreender: a) transformar uma linhagem de levedura com o cassete de expressão de acordo com a reivindicação 7; b) selecionar as leveduras transformadas.

14. PRODUTO caracterizado por compreender um polipeptídeo conforme a reivindicação 4.

15. PRODUTO caracterizado por compreender um polipeptídeo conforme a reivindicação 5.

16. PROCESSO DE RECUPERAÇÃO AVANÇADA DE PETRÓLEO E MELHORA DE FLUIDODINÂMICA DE RESERVATÓRIO, utilizando uma proteína biossurfactante obtida de organismo geneticamente modificado, conforme reivindicações 1 a 15, caracterizada pelo fato de que o organismo geneticamente modificado é capaz de sintetizar a proteína biossurfactante Lv- ranaspumina-1.

17. PROCESSO DE BIORREMEDIAÇÃO DE PETRÓLEO, utilizando uma proteína biossurfactante obtida de organismo geneticamente modificado, conforme reivindicações 1 a 15, caracterizada pelo fato de que o organismo geneticamente modificado é capaz de sintetizar a proteína biossurfactante Lv- ranaspumina-1.

18. PROCESSO DE LIMPEZA DE TANQUES NA INDÚSTRIA DE ÓLEO E GÁS, utilizando uma proteína biossurfactante obtida de organismo geneticamente modificado, conforme reivindicações 1 a 15, caracterizada pelo fato de que o organismo geneticamente modificado é capaz de sintetizar a proteína biossurfactante Lv-ranaspumina-1.

Description:
“MICRORGANISMOS GENETICAMENTE MODIFICADOS QUE REALIZAM A PRODUÇÃO HETERÓLOGA DE VERSÕES MODIFICADAS DA PROTEÍNA SURFACTANTE LV-RANASPUMINA-1 (LV-RSN-1), AS VERSÕES MODIFICADAS DESSA PROTEÍNA SURFACTANTE, OS GENES SINTÉTICOS QUE CODIFICAM ESSA PROTEÍNA SURFACTANTE, OS CASSETES DE EXPRESSÃO CONTENDO ESSES GENES SINTÉTICOS, E OS VETORES DE EXPRESSÃO CONTENDO ESSES GENES SINTÉTICOS”

Campo Técnico da Invenção

[001] O presente pedido de patente se relaciona à produção heteróloga em microrganismos de versões modificadas de uma isoforma predita da proteína surfactante Lv-ranaspumina-1 (Lv-Rsn-1 ). Essa proteína surfactante foi isolada e descoberta no ninho de espuma da rã-pimenta-do-Nordeste ( Leptodactylus vastus), de modo que sua obtenção por extrativismo é inviável e impede sua utilização em diferentes aplicações. Mais especificamente, o presente pedido de patente se refere à invenção de dois genes sintéticos, cada um codificando uma versão modificada da sequência de aminoácidos predita de uma isoforma de Lv- Rsn-1 ; de dois cassetes de expressão cada um contendo um desses genes sintéticos; de dois vetores de expressão cada um contendo um desses genes sintéticos inseridos num cassete de expressão; de dois microrganismos geneticamente modificados (uma bactéria e uma levedura) que produzem de maneira heteróloga uma das versões modificadas da Lv-Rsn-1 ; e de duas proteínas que consistem em versões modificadas da proteína surfactante Lv- Rsn-1. A Lv-Rsn-1 apresenta propriedades de tensoatividade, emulsificação, dispersância, entre outras, e a sua produção heteróloga viabiliza a sua utilização em diversas aplicações e produtos.

Estado da Técnica

[002] Surfactantes constituem uma classe de moléculas anfifílicas, isto é: a sua estrutura molecular apresenta simultaneamente uma porção polar (hidrofílica e lipofóbica) e uma porção apoiar (hidrofóbica e lipofílica), e por essa razão essas moléculas apresentam a propriedade de se acumular nas superfícies e interfaces de um sistema, reduzindo a energia livre dessas superfícies e interfaces. Nesse contexto, “superfície” costuma se referir ao limite entre líquido/sólido ou líquido/gás, enquanto que “interface” costuma se referir ao limite entre dois líquidos imiscíveis.

[003] Os surfactantes possuem diversas aplicações nas indústrias agrícola, alimentícia, têxtil, farmacêutica, cosmética, de higiene doméstica, de petróleo e gás, entre outras. Essas aplicações exploram as diferentes atividades dessas moléculas tensoativas, sendo as principais delas: a emulsificação, a desemulsificação, a solubilização e a detergência (atividades relacionadas a interações líquido-líquido); a alteração da molhabilidade e a dispersância (atividades relacionadas a interações sólido-líquido); e a espumância (atividades relacionada a interações líquido-gás).

[004] Na indústria de petróleo e gás, por exemplo, os surfactantes podem ser utilizados para finalidades como: (1 ) a biorremediação de áreas contaminadas, quando são utilizados para mobilizar e biodisponibilizar os hidrocarbonetos para os organismos biodegradadores; (2) a limpeza de derramamentos de petróleo, quando são utilizados para dispersar manchas de óleo; (3) a remoção de resíduos oleosos do interior de tanques de armazenamento; (4) o controle de microrganismos nocivos, quando são utilizados como biocidas e agentes anti- incrustrantes; (5) a limpeza de membranas de filtração, quando são utilizados para remover depósitos minerais e biofilmes que ficam nelas impregnados; e (6) a recuperação avançada de petróleo, quando são utilizados para mobilizar o petróleo residual no interior de reservatórios e aumentar o fator de recuperação. [005] Os chamados surfactantes químicos são aqueles sintetizados artificialmente a partir de precursores fósseis (os petroquímicos) ou vegetais (os oleoquímicos), em contraste com os biossurfactantes, que são aqueles sintetizados pelo metabolismo de organismos vivos. Os surfactantes químicos atualmente dominam o mercado de tensoativos, mas nos últimos anos o uso de biossurfactantes tem sido considerado como uma alternativa cada vez mais atraente devido a propriedades como: (1 ) maior tensoatividade; (2) menor concentração necessária para atingir seu grau máximo de tensoatividade (isto é, apresenta baixa concentração micelar crítica, ou CMC); (3) menor ecotoxicidade; (4) maior biodegradabilidade; (5) maior estabilidade da tensoatividade sob faixas mais amplas de pH, salinidade e temperatura; (6) condições de produção mais brandas; e (7) possibilidade de serem fabricados a partir de matérias-primas renováveis.

[006] O mercado global de surfactantes foi estimado em US$ 30,6 bilhões no ano de 2016, e a previsão é que ele aumente para US$ 39,8 bilhões até 2021 , com uma taxa composta de crescimento anual (CAGR) de 5,4 % entre 2016 e 2021 . Dentro deste universo, os biossurfactantes representaram US$ 4,2 bilhões no ano de 2017, e a previsão é que aumente para US$ 5,5 bilhões até 2022, com uma CAGR de 5,6 % entre 2017 e 2022.

[007] Apesar de todas as propriedades interessantes e das inúmeras vantagens relatadas em relação aos surfactantes químicos, a produção industrial de biossurfactantes ainda padece com um alto custo de fabricação, o que configura atualmente o maior obstáculo para uma utilização mais disseminada dos biossurfactantes nas diferentes áreas de aplicação para tensoativos. Esse alto custo de fabricação se deve principalmente: (1 ) ao alto custo das matérias- primas, (2) ao baixo rendimento dos processos produtivos, e (3) aos custos associados à purificação dos biossurfactantes.

[008] A produção industrial de biossurfactantes pode ser realizada por meio de duas abordagens distintas. A primeira abordagem consiste em utilizar como plataforma de produção as próprias espécies nas quais o biossurfactante foi descoberto. Essa tem sido a abordagem hegemónica atualmente na indústria de biossurfactantes, que é dominada por dois tipos de biossurfactantes, ambos da classe dos glicolipídios: (1 ) os ramnolipídios (RLs) produzidos por bactérias da espécie Pseudomonas aeruginosa e (2) os soforolipídios (SLs) produzidos por leveduras da espécie Starmerella ( Candida ) bombicola. Em menores quantidades, também são produzidos comercialmente outros dois tipos de biossurfactantes da classe dos glicolipídios: (1 ) os manosil eritritol lipídios (MELs) produzidos por leveduras do gênero Pseudozyma, e (2) os celobiose lipídios (CLs) produzidos por leveduras das espécies Ustilago maydis e Pseudozyma flocculosa. Por fim, também há a produção comercial de misturas de lipopeptídeos (dentre os quais: fengicinas, iturinas, liquenisinas, micosubtilinas e surfactinas) ou as surfactinas isoladas, ambos produzidos por bactérias da espécie Bacillus subtilis.

[009] Contudo, nem sempre é possível utilizar organismos da própria espécie no qual o biossurfactante foi descoberto, e nesses caso a segunda abordagem que pode ser adotada consiste na transformação genética de algum microrganismo para que ele produza de maneira heteróloga o biossurfactante de interesse. As linhagens microbianas mais utilizadas industrialmente como plataformas de produção heteróloga de bioprodutos em geral são aquelas para as quais o cultivo industrial em grande escala e as técnicas de transformação genética já são bem dominados, sendo as principais delas: bactérias das espécies Bacillus subtilis, Corynebacterium ( Micrococcus ) glutamicum e Escherichia coli, leveduras das espécies Candida albicans, Kluyveromyces lactis, Komagataella phaffii ( Pichia pastoris), Saccharomyces cerevisiae e Yarrowia lipolytica, e fungos filamentosos das espécies Aspergillus oryzae, Aspergillus niger, Penicillium chrysogenume e Trichoderma reesei.

[010] Contudo, a produção heteróloga de biossurfactantes nessas espécies apresenta dificuldades. Os biossurfactantes mais bem conhecidos cientificamente e que são atualmente produzidos em escala industrial pertencem às classes dos glicolipídios e dos lipopeptídeos, os quais possuem uma porção apoiar composta por ácidos graxos, e uma porção polar composta respectivamente por carboidratos e peptídeos. A biossíntese desses biossurfactantes depende de rotas metabólicas complexas, as quais envolvem diversos genes, e de forma a se ter uma ideia da complexidade dessa biossíntese, os genes envolvidos podem ser agrupados em quatro conjuntos principais: (1 ) genes envolvidos na biossíntese da porção hidrofílica, que consiste em um peptídeo ou carboidrato; (2) genes envolvidos na biossíntese da porção hidrofóbica, que consiste em um ácido graxo; (3) genes envolvidos na ligação covalente da porção hidrofílica à porção hidrofóbica; e (4) genes envolvidos na regulação da expressão dos genes pertencentes aos outros três grupos.

[011] Diante disso, é possível se dimensionar o desafio de engenharia genética e metabólica relacionado à produção heteróloga de biossurfactantes dos tipos glicolipídios e lipopeptídeos nas espécies tradicionalmente utilizadas em processos produtivos biotecnológicos. Isso porque a produção heteróloga nessas espécies demanda a inserção de um grande número de genes, bem como a correta regulação da expressão dos genes inseridos e o suprimento adequado de precursores a essas rotas metabólicas. Essas dificuldades têm comprometido a utilização das espécies citadas anteriormente, tanto que a produção industrial de biossurfactantes é atualmente restrita às espécies que produzem naturalmente esses biossurfactantes.

[012] Além da limitação de terem que ser produzidos pelos microrganismos que naturalmente os sintetizam, esses biossurfactantes também sofrem com a dificuldade adicional de que são produzidos como misturas de diferentes isoformas (ou congéneres), e essas isoformas apresentam diferenças nas suas propriedades devido a variações na composição tanto das suas porções hidrofóbicas, quanto das suas porções hidrofílicas. Os ramnolipídios, por exemplo, podem apresentar na sua porção polar um ou dois açúcares do tipo L- ramnose, e na sua porção apoiar um ou dois ácidos graxos b-hidroxilados contendo um número par de carbonos entre 8 e 16. A composição da mistura de biossurfactantes em termos da proporção de cada isoforma é bastante variável, mesmo entre bateladas produzidas com a mesma linhagem microbiana e sob as mesmas condições de cultivo. E como há variações nas propriedades das diferentes isoformas, a proporção das diferentes isoformas presentes na mistura produzida afeta as propriedades do produto final, dificultando a sua padronização.

[013] Contudo, há uma outra classe de biossurfactantes, as chamadas proteínas surfactantes, cujos membros apresentam a dupla vantagem tanto de contornar a necessidade de inserção de diversos genes, quanto de ser mais fácil realizar a produção de uma única isoforma. As proteínas surfactantes são polímeros de aminoácidos codificados por um único gene, o qual é expresso pela via canónica de transcrição de uma sequência de DNA em mRNA e tradução no ribossomo do mRNA em proteína, conforme o código genético. Dessa forma, é possível inserir um único gene em um microrganismo hospedeiro (o que facilita a tarefa de transformação genética) e assim realizar a produção heteróloga de uma única isoforma (o que facilita a padronização do produto final). [014] Dentre as fontes naturais conhecidas de proteínas surfactantes, uma que tem sido explorada em anos recentes é a espuma de ninhos de rãs, que se notabilizam pela sua persistência no ambiente. A primeira proteína surfactante isolada a partir dessa fonte foi uma produzida pela espécie rã-túngara ( Physalaemus (= Engystomops) pustulosus). Das seis proteínas que foram isoladas da espuma do ninho dessa rã (as quais foram batizadas de ranaspuminas e numeradas de 1 a 6), a Ep-ranaspumina-2 (Ep-Rsn-2) foi a única que apresentou atividade surfactante, sendo composta por 97 aminoácidos e apresentando uma massa molecular de 11 ,0 kDa (GenBank AAP48831 ). A Ep- Rsn-2 foi capaz de reduzir a tensão superficial água/ar de 72 para 50 nM/m numa concentração de 10 pg/rmL.

[015] Um segundo tipo de proteína surfactante foi isolado a partir da espuma do ninho da rã-pimenta-do-Nordeste ( Leptodactylus vastus) pelos requerentes da presente invenção. Essa proteína foi isolada do fluido da espuma por técnicas cromatográficas, e numa das duas frações obtidas foi detectada uma banda densa e bem definida com aproximadamente 20 kDa de massa molecular e que apresentou atividade emulsificante (índice de emulsificação de 57 %) a 0,1 mg/mL. Essa proteína foi batizada de Lv-ranaspumina-1 (Lv-Rsn-1 ).

[016] A proteína Lv-Rsn-1 isolada do fluido da espuma teve a sua sequência de aminoácidos inferida a partir do cruzamento de informações relativas à massa molecular de 23,5 kDa da sua respectiva banda numa eletroforese em gel desnaturante, ao sequenciamento por espectrometria de massa de 36 fragmentos peptídicos obtidos por digestão enzimática dessa banda, e ao mapa de densidade eletrónica obtido por cristalografia de raio X, resultando numa sequência predita de 217 aminoácidos. Duas estruturas tridimensionais preditas para o cristal dessa proteína Lv-Rsn-1 foram depositadas no RCSB PDB (https://www.rcsb.org/) sob os códigos de acesso 4K82 e 4K83.

[017] Comparando-se as duas isoformas de Ep-Rsn-2 e Lv-Rsn-1 cujas estruturas tridimensionais já foram publicadas, elas apresentam uma similaridade na sequência de aminoácidos de somente 38 %, e suas estruturas tridimensionais são bem diferentes: Lv-Rsn-1 apresenta 13 feixes de a-hélices e duas folhas-b antiparalelas constituindo um grampo, enquanto que Ep-Rsn-2 é composta por quatro folhas-b antiparalelas com uma a-hélice circundando perpendicularmente uma de suas faces. Portanto, apesar de ambas terem sido batizadas de ranaspumina por serem provenientes de espumas do ninho de rãs, trata-se de duas proteínas claramente distintas.

[018] Os resultados obtidos ao se analisar a fração da espuma do ninho de L. vastus contendo a Lv-Rsn-1 por eletroforese em gel de poliacrilamida e por sequenciamento de fragmentos peptídicos sugerem a ocorrência de outras isoformas com sequências de aminoácidos de tamanho e composição diferentes. Contudo, nem o genoma de L. vastus e nem algum gene que codifica alguma isoforma da Lv-Rsn-1 foram sequenciados até o presente momento, de modo que a sequência dessas outras isoformas ainda são desconhecidas.

[019] A Lv-Rsn-1 é um tipo de proteína surfactante com excelente potencial para diferentes aplicações, e viabilizar a sua produção industrial é um obstáculo que precisa ser superado a fim de concretizar a sua comercialização e aplicação para diversos fins. Contudo, considerando-se que a Lv-Rsn-1 é um biossurfactante proveniente de um organismo animal, multicelular, senciente e protegido pela legislação ambiental, a abordagem de se utilizar o próprio organismo produtor é inviável tanto por questões técnico-econômicas, quanto por questões ético- legais. Por razões similares, a obtenção da Lv-Rsn-1 por extrativismo a partir das espumas do ninho da rã-pimenta-do-Nordeste também é inviável. Até onde foi possível verificar, não há nenhuma patente referente à produção heteróloga de proteínas surfactantes da espuma do ninho de rãs de qualquer espécie.

[020] Frente ao exposto, a presente invenção consiste em dois microrganismos geneticamente modificados (uma bactéria e uma levedura) com a capacidade de produzir, de maneira heteróloga, uma versão modificada da proteína surfactante Lv-Rsn-1 . Além dos dois microrganismos geneticamente modificados, a presente invenção também contempla as seguintes outras invenções: (1 ) duas proteínas consistindo em versões modificada de uma isoforma predita da proteína surfactante Lv-ranaspumina-1 (Lv-Rsn-1 ); (2) dois genes sintéticos cuja sequência foi otimizada para expressão em bactérias e leveduras, respectivamente, e que codificam uma das duas versões modificadas de uma isoforma predita da proteína surfactante Lv-Rsn-1 ; (3) dois cassetes de expressão em bactérias e leveduras, respectivamente, contendo um dos genes sintéticos que codificam uma das versões modificadas de uma isoforma predita da proteína surfactante Lv-Rsn-1 ; e (4) dois vetores de expressão para expressão em bactérias e leveduras, respectivamente, contendo um dos genes sintéticos que codificam uma das duas versões modificadas de uma isoforma predita da proteína surfactante Lv-Rsn-1.

Sumário da Invenção

[021] A presente invenção baseia-se na identificação da atividade surfactante da proteína Lv-ranaspumina-1 (Lv-Rsn-1) produzida pela rã-pimenta-do- Nordeste ( Leptodactylus vastus), a qual apresenta potencial para diversas aplicações industriais. Dessa forma, a presente invenção contempla duas proteínas que consistem em versões modificadas da sequência predita de uma das isoformas da proteína surfactante Lv-Rsn-1 , sendo que nenhuma das duas ocorre na Natureza.

[022] Outro elemento da presente invenção se refere a dois genes sintéticos que codificam, cada um, uma das versões modificadas da sequência predita de uma isoforma da proteína surfactante Lv-Rsn-1 , e cujas sequências foram otimizadas quanto à frequência do uso de códons visando a expressão, respectivamente, em microrganismos bacterianos e eucarióticos geneticamente modificados.

[023] Outro elemento da presente invenção se refere a dois cassetes de expressão cada um contendo um dos genes sintéticos que codificam versões modificadas da sequência predita da proteína surfactante Lv-Rsn-1 operacionalmente ligado a um promotor ativo, visando a inserção em vetores de expressão para replicação e expressão, respectivamente, em bactérias e leveduras geneticamente modificadas.

[024] Outro elemento da presente invenção se refere a dois vetores de expressão, cada um contendo um dos genes sintéticos que codificam versões modificadas da sequência predita de uma isoforma da proteína surfactante Lv- Rsn-1 , visando a replicação e a expressão, respectivamente, em bactérias e leveduras geneticamente modificadas.

[025] Outro elemento da presente invenção se refere a dois microrganismos geneticamente modificados, uma bactéria e uma levedura, cada um transformado com o respectivo vetor de expressão contendo o cassete de expressão com um gene sintético que codifica a versão da sequência predita de uma isoforma da proteína surfactante Lv-Rsn-1 , visando a expressão desse gene e a produção heteróloga dessa proteína surfactante.

[026] Outros objetivos, detalhes e vantagens da presente invenção se tornarão evidentes a partir das seguintes figuras, sequências, descrições e exemplos.

Breve Descrição das Figuras

[027] A Figura 1 mostra o mapa do vetor para expressão em bactérias pPBUFCBac-LvRsnl (SEQ ID NO:5) contendo o gene que codifica a versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 (SEQ ID NO:3). No mapa, estão representados: a sequência promotora T7 (T7 promoter); a sequência do operador lacO (lac operator); dois sítios de restrição para a endonuclease Ndel (Ndel) e um sítio de restrição para a endonuclease EcoRI (EcoRI); a sequência codificadora da etiqueta de poli-histidina (6xHis); a sequência codificadora do sítio para clivagem pela protease TEV (TEV site); a sequência codificadora da proteína Lv-ranaspumina-1 com frequência de códons otimizada para expressão em E. coli (Lv-Rsn-1); o sítio de restrição para a endonuclease Xhol; sequência terminadora T7 (T7 terminator); as sequências promotora (AmpR promoter) e codificadora (AmpR) para um gene marcador para resistência à ampicilina; a sequência da origem de replicação do plasmídeo pBR322 (ori); um elemento basis of mobility (bom); a sequência codificadora da proteína repressor of primer { rop); e as sequências promotora (lacl promoter) e codificadora (lacl) para o gene da proteína reguladora lacl.

[028] A Figura 2 mostra o mapa do vetor para expressão em leveduras pPBUFCYea-LvRsnl (SEQ ID NO:9) contendo o gene da versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 (SEQ ID NO:7). No mapa, estão representados: a sequência promotora AOX1 (AOX1 promoter); um sítio de restrição para a endonuclease Saci (Saci); a sequência codificadora do fator de secreção alfa (a-factor secrection signal); um sítio de restrição para a endonuclease Pstl (Pstl); a sequência codificadora da proteína Lv-ranaspumina- 1 com frequência de códons otimizada para expressão em K. phaffii (Lv-Rsn-1 ); a sequência codificadora do sítio para clivagem pela protease TEV (TEV site); um sítio de restrição para a endonuclease Notl (Notl); a sequência codificadora da etiqueta c-Myc (Myc); a sequência codificadora da etiqueta de poli-histidina (6xHis); a sequência terminadora AOX1 (AOX1 terminator); a sequência promotora TEF1 (TEF1 promoter); a sequência promotora EM7 (EM7 promoter); a sequência codificadora para um gene marcador para resistência à zeocina (BleoR); a sequência terminadora CYC1 (CYC1 terminator); e a sequência da origem de replicação do plasmídeo pUC (ori).

[029] A Figura 3 mostra a foto da eletroforese de proteínas em gel de poliacrilamida com dodecil sulfato de sódio (SDS-PAGE) realizada para avaliar a presença da versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 após a ressolubilização dos corpos de inclusão produzidos pela bactéria geneticamente modificada e a purificação com coluna de níquel. A amostra “ Pós-Lavagem” se refere a fração insolúvel com tampão contendo detergente Triton-X-100 e Ureia; a amostra “Lavagens” se refere as lavagens do pico não retido e “MM” se refere ao marcador de massa molecular. A seta indica a banda que corresponde à proteína surfactante Lv-Rsn-1.

[030] A Figura 4 mostra a foto do ensaio de emulsificação água/querosene com 0,1 mg/mL da versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 produzida em E. coli.

[031] A Figura 5 mostra o gráfico do efeito tensoativo sobre a tensão superficial água/ar (em mN/m) promovida pela versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 expressa na bactéria E. coli em diferentes concentrações (em ppm).

[032] A Figura 6 mostra as fotos dos ensaios de dispersão de óleo em água do mar por 1 ,0 mg/L da versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 expressa em bactéria (e 1 ,0 mg/L da proteína albumina do soro bovino - BSA - foi utilizada como referência).

[033] A Figura 7 mostra a foto do ensaio de inversão da molhabilidade do pó de calcita impregnado com ácido ciclohexanopentanóico por 50 mg/L da versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 expressa em bactéria. Água do mar foi utilizada como controle negativo, e 25 mg/L do surfactante catiônico Arquad C-50 foi utilizado como controle positivo. [034] A Figura 8 mostra a foto da eletroforese de proteínas em gel de poliacrilamida com dodecil sulfato de sódio e tricina (Tricine-SDS-PAGE) para avaliar a presença da versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 no sobrenadante da dorna e na espuma do cultivo de K. phaffii geneticamente modificada em biorreator de 5 litros após 24, 48, 72 e 96 horas da adição de 0,5 % (v/v) de metanol. MM = marcador molecular; C+ = versão da proteína Lv-Rsn-1 produzida por E. coli; e a seta vermelha aponta para a banda correspondente versão modificada de uma das isoformas da proteína Lv-Rsn-1 produzida por K. phaffii.

[035] A Figura 9 mostra a foto do ensaio de emulsificação água/querosene com diferentes concentrações da versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 produzida em K. phaffii; o controle negativo consiste no meio BMMH a pH 6,0.

[036] A Figura 10 mostra o gráfico do efeito tensoativo sobre a tensão superficial água/ar (em mN/m) promovida pela versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 expressa na levedura K. phaffii em diferentes concentrações (em mg/mL).

[037] A Figura 11 mostra a foto do ensaio de inversão da molhabilidade do pó de calcita impregnado com ácido ciclohexanopentanóico por 50 mg/L da versão modificada de uma das isoformas preditas da proteína surfactante Lv-Rsn-1 expressa em bactéria. Água do mar foi utilizada como controle negativo, e 25 mg/L do surfactante aniônico dodecil sulfato de sódio (SDS) foi utilizado como controle positivo.

Breve Descrição da Sequência de Listagem Biológica [038] A SEQ ID NO:1 é a sequência de aminoácidos predita de uma das isoformas da proteína surfactante Lv-Rsn-1 presentes na espuma do ninho da rã-pimenta-do-Nordeste ( Leptodactylus vastus).

[039] A SEQ ID NO:2 é a sequência de nucleotídeos resultante da tradução reversa da SEQ ID NO:1 .

[040] A SEQ ID NO:3 é a sequência de nucleotídeos resultante da SEQ ID NO:2 após ter a frequência do uso de códons otimizada para expressão em bactéria, utilizando Escherichia coli como espécie de referência.

[041] A SEQ ID NO:4 é a sequência de nucleotídeos que contém a SEQ ID NO:3 com a adição de sítios de restrição para endonucleases, da sequência codificadora de uma etiqueta de poli-histidina e da sequência codificadora de um sítio de clivagem pela protease TEV.

[042] A SEQ ID NO:5 é a sequência de nucleotídeos do vetor para expressão em bactérias batizado de pPBUFCBac-LvRsnl , o qual inclui o cassete de expressão contendo SEQ ID NO:3.

[043] A SEQ ID NO:6 é a sequência de aminoácidos da versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 codificada por SEQ ID NO:4.

[044] A SEQ ID NO:7 é a sequência de nucleotídeos resultante da SEQ ID NO:2 após ter a frequência do uso de códons otimizada para expressão em levedura, utilizando Komagataella phaffii ( Pichia pastoris) como espécie de referência. [045] A SEQ ID NO:8 é a sequência de nucleotídeos que contém a SEQ ID NO:7 com adição da sequência codificadora do fator de secreção alfa, da sequência codificadora do sítio de clivagem pela protease TEV, da sequência codificadora da etiqueta Myc e da sequência codificadora de uma etiqueta de poli-histidina.

[046] A SEQ ID NO:9 é a sequência de nucleotídeos do vetor para expressão em leveduras batizado de pPBUFCYea-LvRsnl , o qual inclui o cassete de expressão contendo SEQ ID NO:7.

[047] A SEQ ID NO:10 é a sequência de aminoácidos da versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 codificada por SEQ ID NO:8.

Descrição da Invenção

[048] A presente invenção se refere à construção de dois microrganismos geneticamente modificados que produzem de maneira heteróloga versões modificadas de uma das isoformas preditas da proteína surfactante Lv- ranaspumina-1 (Lv-Rsn-1 ), sendo um deles uma bactéria e o outro uma levedura. Adicionalmente, a presente invenção se refere às duas versões modificadas da Lv-Rsn-1 ; a dois genes sintéticos que respectivamente codificam essas versões modificadas da Lv-Rsn-1 ; a dois cassetes de expressão que respectivamente contêm esses genes sintéticos que codificam essas versões modificadas da Lv- Rsn-1 ; e a dois vetores de expressão cada um contendo um desses genes sintéticos que codificam essas versões modificadas da Lv-Rsn-1 .

[049] A sequência de aminoácidos (SEQ ID NO:1 ) utilizada na presente invenção corresponde à sequência de uma isoforma da proteína Lv-Rsn-1 predita com base na análise do extrato proteico da espuma do ninho de Leptodactylus vastus por eletroforese em gel de poliacrilamida e por sequenciamento de fragmentos peptídicos. A sequência predita de 216 aminoácidos e massa molecular de 23,3 kDa dessa isoforma da proteína surfactante Lv-Rsn-1 foi submetida a uma tradução reversa por meio da ferramenta Reverse Translation do Sequence Manipulation Suite (http://www.bioinformatics.org/sms2/rev_trans.html) a fim de se obter uma sequência de nucleotídeos que codificasse sua sequência de aminoácidos (SEQ ID NO:2).

[050] A sequência de nucleotídeos assim obtida foi então otimizada, com a ferramenta Codon Optimization Tool da Integrated DNA Technologies (http://www.idtdna.com), quanto à frequência do uso de códons tanto para expressão em bactérias, utilizando Escherichia coli como espécie de referência (SEQ ID NO:3), quanto para expressão em leveduras, utilizando Komagataella phaffii {Pichia pastoris) como espécie de referência (SEQ ID NO:7).

[051] A sequência de nucleotídeos otimizada para expressão em bactérias (SEQ ID NO:3) foi utilizada para se desenhar um gene com nucleotídeos adicionados à jusante e à montante de SEQ ID NO:3, os quais consistem em sítios para endonucleases (que facilitam a sua inserção em vetores de expressão) e sequências codificadoras de sequências de aminoácidos adicionais (que facilitam a purificação da proteína expressa).

[052] Esse gene foi sintetizado artificialmente, e tanto esse gene sintético quanto um vetor para expressão em bactérias foram digeridos com duas endonucleases (a fim de que o gene fosse inserido na orientação correta em relação ao promotor no cassete de expressão) e depois unidos por uma DNA ligase. O vetor de expressão assim obtido compreende um cassete de expressão com o gene sintético operacionalmente ligado a um promotor ativo em bactérias, e esse cassete de expressão pode ser removido desse vetor e inserido em outros vetores para expressão em bactérias por meio da digestão com endonucleases e ligação com uma DNA ligase.

[053] Uma linhagem de bactéria foi transformada geneticamente com o vetor de expressão contendo o gene sintético que codifica uma versão modificada da isoforma predita da proteína surfactante Lv-Rsn-1. A bactéria geneticamente modificada foi cultivada em meio de cultura apropriado para sua reprodução e para expressão dessa versão da Lv-Rsn-1 .

[054] Quanto à levedura, a sequência de nucleotídeos otimizada para expressão em leveduras (SEQ ID NO:7) foi utilizada para se desenhar um gene com nucleotídeos adicionados à jusante e à montante de SEQ ID NO:3, os quais consistem em sítios para endonucleases (que facilitam a sua inserção em vetores de expressão) e sequências codificadoras de sequências de aminoácidos adicionais (que facilitam a purificação da proteína expressa).

[055] Esse gene foi sintetizado artificialmente, e tanto esse gene sintético quanto um vetor para expressão em leveduras foram digeridos com duas endonucleases (a fim de que o gene fosse inserido na orientação correta em relação ao promotor no cassete de expressão) e depois unidos por uma DNA ligase. O vetor de expressão assim obtido compreende um cassete de expressão com o gene sintético operacionalmente ligado a um promotor ativo em bactérias, e esse cassete de expressão pode ser removido desse vetor e inserido em outros vetores para expressão em leveduras por meio da digestão com endonucleases e ligação com uma DNA ligase.

[056] Uma linhagem de levedura foi transformada geneticamente com o vetor de expressão contendo o gene sintético que codifica uma versão modificada da isoforma predita da proteína surfactante Lv-Rsn-1. A levedura geneticamente modificada foi cultivada em meio de cultura apropriado para sua reprodução e para expressão dessa versão da Lv-Rsn-1 .

Exemplos

[057] A presente invenção poderá ser melhor compreendida por meio dos exemplos abaixo. Ressalta-se que a presente invenção não se limita aos exemplos citados, podendo ser utilizada em todas as aplicações descritas ou em quaisquer outras variações equivalentes.

Exemplo 1 : Obtenção de vetor para produção de Lv-Rsn-1 em bactéria [058] A sequência de nucleotídeos que codifica a sequência de aminoácidos de uma isoforma da proteína surfactante Lv-Rsn-1 e que foi otimizada para expressão em bactérias (SEQ ID NO:3) teve nucleotídeos adicionados, resultando em um gene sintético (SEQ ID NO:4) que apresenta a seguinte composição quando lida na orientação 5’ para 3’: (1 ) a sequência do sítio de restrição para a endonuclease EcoRI com adição de uma timina na extremidade 3’ (5'-GAATTCT-3'); (2) a sequência (5'-GAAAACTTGTATTTCCAGGGCAGC-3') que codifica o sítio de clivagem pela protease TEV (ENLYFQGS); (3) a sequência do sítio de restrição para a endonuclease Ndel (5’-CATATG-3’); (4) um códon de iniciação (5'-ATG-3'); (5) a sequência que codifica a sequência de aminoácidos para uma isoforma predita da proteína surfactante Lv-Rsn-1 com frequência de códons otimizada para expressão em bactérias (SEQ ID NO:3); (6) um códon de terminação (5'-TAA-3'); e (7) a sequência do sítio de restrição para a endonuclease Xhol (5’-CTCGAG-3’).

[059] Esse gene sintético (SEQ ID NO:4) e um vetor para expressão em bactérias foram ambos digeridos com as endonucleases EcoRI e Xhol, e depois unidos por uma DNA ligase. A sequência final do vetor de expressão batizado de pPBUFCBac-LvRsnl (SEQ ID NO:5) está representada na Figura 2.

[060] A versão modificada de uma isoforma predita da proteína surfactante Lv- Rsn-1 que é codificada pelo gene presente no vetor de expressão pPBUFCYea- LvRsnl (SEQ ID NO:5) possui 236 aminoácidos e uma massa molecular de 25,8 kDa (SEQ ID NO:6), diferindo da isoforma predita pela adição de uma sequência de vinte aminoácidos na sua porção N-terminal, a qual contém uma cauda de poli-histidina (HHHHHH) e um sítio para clivagem pela protease TEV (ENLYFQG). Quando essa versão modificada de uma isoforma da proteína surfactante Lv-Rsn-1 é digerida pela protease TEV, ela difere da isoforma predita pela presença de cinco aminoácidos (GSHMM) na sua porção N-terminal. Exemplo 2: Obtenção de bactéria geneticamente modificada [061] Uma linhagem de bactéria da espécie Escherichia coli foi geneticamente transformada com o vetor pPBUFCBac-LvRsnl (SEQ ID NO:5) por eletroporação. A linhagem utilizada foi uma derivada da estirpe E. coli K-12, sendo que essa linhagem derivada é: (1 ) auxotrófica para o aminoácido leucina e sensível ao antibiótico canamicina; (2) apresenta mutações nos genes da glutationa redutase (gor) e da tiorredoxina redutase ( trxB ); e (3) possui um gene para resistência ao antibiótico tetraciclina.

[062] As células de E. coli foram lavadas 3 vezes com solução de glicerol 10 % (m/v) para tornarem-se eletrocompetentes, e então adicionou-se 1 ,0 pL da solução com o vetor pPBUFCBac-LvRsnl (50 qg/pL). Após manter a mistura de células com o vetor por 1 min em gelo, a mistura foi transferida para uma cubeta de eletroporação de 0,2 cm, sendo submetida a um choque de 2,5 kV. Após a eletroporação, adicionou-se 960 pL de meio SOC (20 g/L de triptona; 5 g/L de extrato de levedura; 10 mM de NaCI; 2,5 mM de KCI; 10 mM de MgC ; 10 mM de MgSC>4; e 20 mM de glicose), e a mistura foi incubada sob 150 rpm e 37 °C por 1 h. Decorrido o tempo de incubação, 50 pL da cultura foram inoculados em uma placa de Petri contendo meio LB ágar (10 g/L de triptona; 5 g/L de extrato de levedura; 5 g/L de NaCI; e 15 g/L de ágar).

[063] As colónias obtidas foram subsequentemente cultivadas em meio LB suplementado com 12,5 pg/mL de tetraciclina (a fim de selecionar somente as células dessa linhagem e impedir o crescimento de bactérias contaminantes) e 100 pg/mL de ampicilina (a fim de selecionar somente as células transformadas e impedir o crescimento das células não-transformadas).

[064] A transformação genética com o vetor de expressão pPBUFCBac-LvRsnl das colónias obtidas foi avaliada por meio da extração do DNA dessas colónias, digestão do DNA extraído com enzimas de restrição EcoRI e Xhol, e eletroforese em gel de agarose 1 % (m/v) para verificação da presença do fragmento esperado de 692 pb. A transformação genética de E. coli com o vetor de expressão pPBUFCBac-LvRsnl foi confirmada para diversas colónias, bem como a replicação e herança estável de pPBUFCBac-LvRsnl ao longo de gerações.

Exemplo 3: Produção de Lv-Rsn-1 por bactéria geneticamente modificada [065] As células de E. coli transformadas com o vetor pPBUFCBac-LvRsnl foram cultivadas em meio LB suplementado com isopropil-p-D-1 - tiogalactopiranosídeo (IPTG), um análogo estrutural da alolactose que interage com a proteína lacl, fazendo com que ela se desprenda do operador lacO e, consequentemente, induza a expressão do gene codificando a versão modificada de uma isoforma da proteína surfactante Lv-Rsn-1 .

[066] Um pré-inóculo das células transformadas geneticamente foi obtido por meio da transferência de uma colónia isolada para 10 mL de caldo LB suplementado com dois antibióticos (12,5 pg/mL de tetraciclina e 100 pg/mL de ampicilina) e então incubada sob 250 rpm e 37 °C por 16 h. Em seguida, um volume de 1 mL do cultivo foi transferido para frascos contendo 100 mL de meio LB suplementado com 100 pg/mL de ampicilina e incubado sob 37 °C e 250 rpm até atingir a fase exponencial do crescimento (densidade óptica a 600 nm entre 0,5 e 0,7). Os frascos foram deixados descansando sob temperatura ambiente por 15 min. Em seguida, adicionou-se IPTG para uma concentração final de 0,5 mM, e o cultivo foi incubado sob 200 rpm e 37 °C por 3 h. Após esse período, a cultura foi centrifugada a 7.800 g sob 4 °C por 13 min, o sobrenadante foi descartado, e o precipitado foi lavado com 0,1 M de NaCI e centrifugado a 7.800 g sob 4 °C por 1 h.

[067] A fim de se purificar a versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 cuja expressão foi induzida por IPTG, as células foram ressuspendidas em 5 mL do tampão de ressuspensão (50 mM Tris-HCI pH 8,0 e 150 mM NaCI) e submetidas à sonicação em banho de gelo por três ciclos de 5 min e uma amplitude de 40 %. Após a sonicação, as células foram centrifugadas a 15.000 g sob 4 °C por 45 min para a separação das frações solúvel (sobrenadante) e insolúvel (precipitado).

[068] A purificação da versão modificada da isoforma predita da proteína surfactante Lv-Rsn-1 a partir da fração insolúvel (precipitado contendo os corpos de inclusão) foi realizada por meio de um protocolo de ressolubilização e renaturação. Para tanto, a fração insolúvel foi ressuspendida no tampão de lavagem (100 mM Tris-HCI pH 8,0, 5 mM EDTA, 5 mM DTT, 2 M ureia e 2 % de TritonX-100) e centrifugada a 22.000 g sob 4 °C por 30 min. Essa preparação foi analisada por SDS-PAGE 15 % para verificar se as duas lavagens com o tampão contendo o detergente Triton X-100 e ureia foram suficientes para extrair dos corpos de inclusão a maior parte da versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 .

[069] A purificação da versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 a partir dos sobrenadantes das lavagens com Triton X-100 e ureia foi realizada por meio da diálise contra água ultrapura seguida de aplicação em coluna de níquel contendo resina de sílica previamente equilibrada com 50 mM de Tris-HCI pH 8,0 e 100 mM de NaCI. A eluição da Lv-Rsn-1 foi realizada utilizando o tampão de eluição correspondendo a 50 mM de Tris-HCI pH 8,0; 500 mM de NaCI; e 250 mM de imidazol.

[070] Análises por meio de SDS-PAGE indicaram que a versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 foi de fato expressa em E. coli. A Figura 3 mostra o resultado de uma eletroforese de extratos proteicos após a ressolubilização dos corpos de inclusão e processo de purificação em coluna de níquel (por meio da interação com a cauda de poli-histidina presente na versão modificada da Lv-Rsn-1 ). “ Pós-Lavagem” se refere a fração insolúvel com tampão contendo detergente Triton-X-100 e ureia; “Lavagens” se refere as lavagens do pico não-retido; e “MM” se refere ao marcado molecular. A seta indica a banda que corresponde à Lv-Rsn-1 .

[071] O cultivo das bactérias geneticamente transformadas com o vetor pPBUFCBac-LvRsnl (SEQ ID NO:5) demonstrou que esse vetor foi herdado de maneira estável ao longo de várias gerações de células, as quais passaram a replicar o vetor e, sob a presença de IPTG, expressar o gene que codifica a versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 , sendo que essa proteína se concentrou nos corpos de inclusão.

[072] Pelo acima exposto, fica claro que a invenção em voga viabiliza tecnicamente a produção heteróloga em bactéria de uma versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 , apresentando uma solução para o atual estado da técnica, uma vez que permite a produção dessa proteína surfactante de origem animal sem a necessidade de coleta e extração da espuma do ninho da rã-pimenta-do-Nordeste ( Leptodactylus vastus), com todos os custos e impactos ambientais decorrentes dessa coleta e extração. Exemplo 4: Atividades da Lv-Rsn-1 produzida por bactéria [073] A versão modificada de uma isoforma predita da proteína surfactante Lv- Rsn-1 expressa em células de E. coli geneticamente transformadas foi purificada e submetida a diferentes ensaios a fim de avaliar as suas atividades de emulsificação, redução da tensão superficial água/ar, dispersão de óleo, e inversão da molhabilidade.

[074] O efeito emulsificante sobre uma mistura água/querosene da versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 expressa em E. coli a concentrações entre 0,01 a 10,0 mg/mL está mostrado na Figura 4. [075] A redução de tensão superficial água/ar pela versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 expressa em E. coli. Lv-Rsn- 1 a uma concentração de 0,15 mg/mL reduz a tensão superficial da água de 72 mN/m para 39 mN/m, conforme mostrado na Figura 5.

[076] A dispersão de uma camada de óleo derramado na água do mar pela versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 expressa em E. coli na concentração de 1 ,0 mg/L está mostrada na Figura 6. A mesma Figura 6 também mostra a camada de óleo antes da adição da Lv-Rsn- 1 e a ausência de atividade dispersante da proteína albumina do soro bovino (BSA), usada como referência, também na concentração de 1 mg/L.

[077] A inversão da molhabilidade de um pó de calcita (CaCC>3) impregnado com ácido ciclohexanopentanóico pela versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 expressa em E. coli na concentração de 50 mg/L está mostrada na Figura 7. A inversão da molhabilidade é aferida por meio da presença de uma quantidade maior de pó de calcita no fundo do tubo de ensaio em comparação com o controle negativo (água do mar).

[078] Pelo acima exposto, fica claro que a versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 expressa em E. coli atua como surfactante, emulsificante, dispersante e inversor de molhabilidade, podendo ser aplicada às diferentes finalidades associadas a essas atividades.

Exemplo 5: Obtenção de vetor para produção de Lv-Rsn-1 em levedura [079] A sequência de nucleotídeos otimizada para expressão em leveduras (SEQ ID NO:7) teve nucleotídeos adicionados, resultando em um gene sintético (SEQ ID NO:8) que apresenta a seguinte composição quando lida na orientação 5’ para 3’: (1 ) o sítio de restrição para a endonuclease Pstl (5'-CTGCAG-3'); (2) dois nucleotídeos (5'-GN-3') para colocar a sequência codificadora da Lv-Rsn-1 no mesmo quadro de tradução do fator de secreção alfa; (3) a sequência que codifica a proteína surfactante Lv-Rsn-1 com frequência de códons otimizada para expressão em leveduras (SEQ ID NO:7); (4) a sequência (5'- GAGAACCTTTACTTTCAGGGA-3') que codifica o sítio de clivagem pela protease TEV (ENLYFQG); e (5) o sítio de restrição para a endonuclease Notl (5'-GCGGCCGC-3').

[080] Esse gene sintético (SEQ ID N079) e um vetor para expressão em bactérias foram ambos foram digeridos com as endonucleases Pstl e Notl, e depois unidos por uma DNA ligase. A sequência final do vetor de expressão batizado de pPBUFCYea-LvRsnl (SEQ ID NO:9) está representada na Figura 3. [081] A versão modificada de uma isoforma predita da proteína surfactante Lv- Rsn-1 que é codificada pelo gene presente no vetor de expressão pPBUFCYea- LvRsnl (SEQ ID NO:9) possui 341 aminoácidos e uma massa molecular de 36,7 kDa (SEQ ID NO:10), diferindo da isoforma predita pela adição do fator de secreção alfa mais dois aminoácidos na sua porção N-terminal, e o sítio para clivagem pela protease TEV, mais seis aminoácidos, a etiqueta c-Myc, mais cinco aminoácidos e uma cauda de poli-histidina na porção C-terminal. Quando essa versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn- 1 é digerida pela protease TEV, ela difere da isoforma predita pela presença de 91 aminoácidos na sua porção N-terminal e 6 aminoácidos na sua porção C- terminal.

Exemplo 6: Obtenção de levedura geneticamente modificada [082] Uma linhagem de levedura da espécie Komagataella phaffii foi geneticamente transformada com o vetor pPBUFCYea-LvRsnl (SEQ ID NO:9) por eletroporação. A linhagem utilizada é a estirpe Komagataella phaffii GS115 / ATCC 20864, sendo que essa linhagem é auxotrófica para o aminoácido histidina (FHS4-) e possui genes ativos para AOX1 e AOX2 (Mut + ), de modo que conseguem utilizar metanol como nutriente.

[083] As células de K. phaffii foram preparadas ao se inocular uma colónia isolada em 5,0 ml_ de meio YPD (10 g/L de extrato de levedura; 20 g/L de peptona; e 20 g/L de glicose) e incubando-as a 30 °C por 16 h a 250 rpm. Em seguida, 250 pL das culturas foram transferidos para 500 mL de caldo YPD em um recipiente de 2,0 L e incubados sob 250 rpm a 30 °C por aproximadamente 16 h, até obtenção de uma densidade óptica a 600 nm entre 1 ,3 e 1 ,6. Em seguida, as culturas foram centrifugadas a 1.500 g por 5 min a 4 °C. Os sobrenadantes foram descartados, e os precipitados contendo as células foram gentilmente ressuspendidos em 500 mL de água ultrapura gelada. Em seguida, as células foram novamente centrifugadas e os precipitados ressuspendidos em 250 mL de água ultrapura gelada. As células foram centrifugadas, e os precipitados foram ressuspendidos em 20 mL de D-sorbitol 1 ,0 M gelado. Finalmente, as células foram centrifugadas e ressuspendidas em 1 ,0 mL de D- sorbitol 1 ,0 M gelado, resultando assim nas células eletrocompetentes que foram utilizadas para a transformação genética.

[084] Em preparo para a transformação genética, o vetor pPBUFCYea-LvRsnl (SEQ ID NO:9) foi linearizado com a endonuclease Saci, e o vetor linearizado foi então purificado através de protocolo de precipitação com acetato de potássio. Para tanto, adicionou-se acetato de potássio 3,0 M pH 5,5 para a concentração final de 0,3 M, seguido da adição de 2 volumes de etanol 100 % e incubação a - 20 °C por 30 min. Em seguida, a mistura foi centrifugada por 12.000 g por 10 min a 4 °C, o precipitado foi lavado com etanol 70 % e novamente centrifugado. Após secagem do plasmídeo a 37 °C por 10 min, o mesmo foi ressuspendido em água ultrapura, quantificado por espectrofotometria, e armazenado no freezer a -20 °C.

[085] Para a transformação genética, um volume de 90 pL da solução contendo células eletrocompetentes de K. phaffii ío\ misturado com 5 a 10 pg de DNA do vetor pPBUFCYea-LvRsnl (SEQ ID NO:9) linearizado em um microtubo de 600 pL, e o volume final foi transferido para uma cubeta de eletroporação de 0,2 cm previamente resfriada no gelo. A cubeta contendo as células e o vetor linearizado foi incubada no gelo por 5 min e em seguida submetida ao pulso de 2,5 kV em um eletroporador. De imediato, adicionou-se 1 ,0 mL de D-sorbitol 1 ,0 M gelado à cubeta, e o conteúdo foi então transferido para um tubo de 15 mL. O tubo foi incubado à 30 °C por 2 h sem agitação. Em seguida, um volume de 200 mI_ do conteúdo do tubo foi inoculado em placa contendo meio YDPS Ágar (10 g/L de extrato de levedura; 20 g/L de peptona, 20 g/L de glicose; 182,2 g/L de D-sorbitol e 15 g/L de ágar) suplementado com 100 pg/mL do antibiótico zeocina. As placas foram incubadas a 30 °C na estufa por 3 a 10 dias, até se observar o surgimento de colónias. Os clones transformados foram crescidos em meio YPD e estocados a -80 °C após suplementação com 20 % (v/v) de glicerol. Os clones transformados foram submetidos sequencialmente a concentrações crescentes de zeocina (500, 1 .000 e 2.000 pg/mL) em meio YPD Ágar a fim de se selecionar os transformantes contendo múltiplas cópias do vetor pPBUFCYea-LvRsnl (SEQ ID NO:9).

[086] A fim de confirmar o sucesso da transformação genética, o DNA genômico das colónias de células resistentes a 2.000 pg/mL de zeocina foi extraído usando o protocolo do brometo de cetil trimetilamônio (CTAB). Ao final da extração, o DNA obtido foi eluído em 50 pl de Tris-HC1 10 mM pH 8.0 suplementado com 20 pg/pL de RNAse. Amostras foram quantificadas e avaliadas por medidas da absorbância a 230, 260 e 280 nm em espectrofotômetro e posteriormente armazenadas no freezer a -20 °C. A detecção da presença do gene que codifica a versão modificada da proteína surfactante Lv-Rsn-1 nos clones transformados foi feita através da técnica de reação em cadeia da polimerase (PCR) utilizando- se os iniciadores AOX1 -fwd (5’-GACTGGTTCCAATTGACAAGC-3’) e AOX1 -rev (5’-GCAAATGGCATTCTGACATCC-3’). As reações de PCR foram realizadas em um volume final de 25 pL, contendo 50 ng de DNA genômico; 20 mM Tris- HCI (pH 8,4); 3,0 mM MgC ; 0,2 mM de cada dNTP; 0,5 pM de cada iniciador; e 1 ,0 unidade de Taq DNA polimerase. As reações foram feitas em termociclador programado para uma etapa de desnaturação inicial (5 min a 94 °C), seguida por 30 ciclos de 1 min 94 °C, 1 min a 52 °C e 1 ,5 min a 72 °C. O último ciclo foi seguido por uma extensão final de 10 min a 72 °C. Os produtos de PCR foram visualizados em eletroforese em gel de agarose 1 ,0 % (m/v), corados com SYBR Green e tendo um marcador de 1 kb como referência. A transformação genética de K. phaffii com o vetor de expressão pPBUFCYea-LvRsnl (SEQ ID NO:9) foi confirmada, bem como a herança estável dessa transformação ao longo de gerações.

Exemplo 7: Confirmação da produção de Lv-Rsn-1 por levedura [087] As células de K. phaffii transformadas com o vetor pPBUFCYea-LvRsnl (SEQ ID NO:9) foram cultivadas sob 30 °C em placas contendo o meio YPD Ágar (10 g/L de extrato de levedura; 20 g/L de peptona; 20 g/L de glicose; e 15 g/L de ágar) suplementado com 100 pg/mL do antibiótico zeocina. Para o pré-inóculo, colónias puras foram cultivadas em 200 mL do meio BMGH (13,4 g/L de extrato de levedura com sulfato de amónio e sem aminoácidos; 10 mL/L de glicerol; 100 mL/L de tampão fosfato 1 ,0 M pH 6,0; 2,0 mL/L de biotina 0,02 %; 10 mL/L de histidina 0,4%; e 100 pg/mL de zeocina) a 29 °C por 16 h a 250 rpm até atingir uma densidade óptica a 600 nm de aproximadamente 2,0. A seguir, a cultura foi centrifugada a 3.500 rpm por 5 min, e o precipitado foi lavado duas vezes com o meio BMMH (13,4 g/L de extrato de levedura com sulfato de amónio e sem aminoácidos; 100 mL/L de tampão fosfato 1 ,0 M pH 6,0; 2,0 mL/L de biotina 0,02 %; 10 mL/L de histidina 0,4 %; e 0,5 % v/v de metanol) para retirar o glicerol presente no meio BMGH utilizado no pré-inóculo.

[088] Após essa etapa, as células foram ressuspendidas e inoculadas em um frasco de 500 mL contendo 50 mL de BMMH com uma densidade óptica a 600 nm de 1 ,0. As culturas foram incubadas sob agitação de 250 rpm a 29 °C por 96 h, sendo a densidade óptica a 600 nm monitorada a cada 24 h, quando a cultura suplementada com 0,5% (v/v) de metanol. Ao final de 96 h, a cultura foi centrifugada a 3.000 g por 5 min.

[089] A expressão da versão modificada da isoforma predita da proteína surfactante Lv-Rsn-1 por K. phaffiiío\ monitorada através de Tricina-SDS-PAGE. Antes de serem aplicadas nos géis de eletroforese, as amostras dos sobrenadantes foram precipitadas com acetona e as amostras do precipitado (0,3 mg) foram misturadas a 0,3 mL de tampão de amostra (2 mL de SDS; 1 ,2 mL de glicerol; 0,2 mL de b-mercaptoetanol; 1 ,0 mg de Coomassie Brilliant Blue G-250; e 0,5 mL de Tris-HCI pH 6,8 para volume final de 10 mL) e incubadas a 100 °C por 10 min. Os resultados obtidos indicaram que a versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 foi expressa por K. phaffii, e essa característica se manteve ao longo das gerações. [090] Posteriormente, as mesmas células de K. phaffii transformadas com o vetor pPBUFCYea-LvRsnl foram cultivadas em biorreatores com volume de 5,0 L. Para o pré-inóculo, colónias puras foram cultivadas em seis frascos de 2,0 L contendo 200 ml_ do meio BMGH suplementado com 100 pg/mL de ampicilina sob 29 °C e 250 rpm por 16 h a até atingir a densidade óptica a 600 nm de aproximadamente 2,0. Essas culturas foram reunidas, o volume final foi centrifugado a 3.000 rpm por 5 min, e o precipitado lavado duas vezes com o meio de expressão BMMH para retirada do glicerol remanescente. Posteriormente, as células foram ressuspendidas em 100 mL de meio BMMH e esse volume foi transferido para o biorreator resultando numa densidade óptica a 600 nm de aproximadamente 1 ,5.

[091] Os cultivos foram realizados em batelada com volume máximo de 3,0 L de meio de expressão BMMH suplementado com 100 pg/mL de zeocina sob 29 °C, 500 rpm e aeração de 1 vvm. A densidade óptica a 600 nm inicial foi registrada, e a cultura recebeu 0,5% (v/v) de metanol. Este procedimento se repetiu a cada 24 h até 96 h. A cada 24 h, coletou-se o volume de espuma transbordado no frasco Mariotte, o qual foi conectado ao biorreator para a coleta da espuma que transbordava da dorna. Essa espuma liquefeita foi centrifugada a 9.000 rpm por 10 min a 4 °C. A concentração de proteínas da espuma foi quantificada, e o perfil de proteínas analisado por Tricina-SDS-PAGE 15 %. Os resultados obtidos indicaram que a versão modificada da Lv-Rsn-1 produzida por K, phaffii em biorreatores de 5,0 L concentrou-se na espuma, conforme pode ser observado na Figura 8.

Exemplo 8: Atividades da Lv-Rsn-1 produzida por levedura [092] A versão modificada da isoforma predita da proteína surfactante Lv-Rsn- 1 expressa em células de K. phaffii geneticamente transformadas cultivadas no biorreator de 5,0 L foi purificada e submetida a diferentes ensaios a fim de avaliar as suas atividades de emulsificação, redução da tensão superficial água/ar, e inversão de molhabilidade.

[093] O efeito emulsificante sobre uma mistura água/querosene da versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 expressa em K. phaffii a concentrações entre 0,03 a 0,24 mg/mL está mostrado na Figura 9.

[094] A redução de tensão superficial água/ar pela versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 expressa em K. phaffii. Lv- Rsn-1 a uma concentração de 0,24 mg/mL reduz a tensão superficial da água de 72 mN/m para 35 mN/m, conforme mostrado na Figura 10.

[095] A inversão da molhabilidade de um pó de calcita (CaCC>3) impregnado com ácido ciclohexanopentanóico pela versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 expressa em K. phaffii na concentração de 50 mg/L está mostrada na Figura 11 . A inversão da molhabilidade é aferida por meio da presença de uma quantidade maior de pó de calcita no fundo do tubo de ensaio em comparação com o controle negativo (água do mar). Como controle positivo, foi utilizado o dodecil sulfato de sódio (SDS) numa concentração de 2.500 mg/L.

[096] Pelo acima exposto, fica claro que a versão modificada de uma isoforma predita da proteína surfactante Lv-Rsn-1 expressa em K. phaffii atua como surfactante, emulsificante, dispersante e inversor de molhabilidade, podendo ser aplicada às diferentes finalidades associadas a essas atividades.

[097] Os técnicos versados no assunto apreciarão que inúmeras variações incidindo no escopo de proteção do pedido são permitidas e, dessa forma, reforça-se o fato de que a presente invenção não está limitada às configurações e concretizações particulares acima descritas.

Listagem de Sequências Biológicas <110> Petróleo Brasileiro S.A. - Petrobras

<120> MICRORGANISMOS GENETICAMENTE MODIFICADOS QUE REALIZAM A PRODUÇÃO HETERÓLOGA DE VERSÕES MODIFICADAS DA PROTEÍNA SURFACTANTE LV-RANASPUMINA-1 (LV-RSN-1), AS VERSÕES MODIFICADAS DESSA PROTEÍNA SURFACTANTE, OS GENES SINTÉTICOS QUE CODIFICAM ESSA PROTEÍNA SURFACTANTE, OS CASSETES DE EXPRESSÃO CONTENDO ESSES GENES SINTÉTICOS, E OS VETORES DE EXPRESSÃO CONTENDO ESSES GENES SINTÉTICOS

<160> 10

<210> 1 <211> 216 <212> PRT

<213> Leptodactylus vastus

<223> sequência predita para uma das isoformas da Lv-ranaspumina- 1

<400> 1

Leu Leu Glu Gly Phe Leu Vai Gly Gly Gly Vai Pro Gly Pro Gly Thr 1 5 10 15

Ala Cys Leu Thr Lys Ala Leu Lys Asp Ser Gly Asp Leu Leu Vai Glu 20 25 30

Leu Ala Vai Ile Ile Cys Ala Tyr Gin Asn Gly Lys Asp Leu Gin Glu 35 40 45

Gin Asp Phe Lys Glu Leu Lys Glu Leu Leu Glu Arg Thr Leu Glu Arg

50 55 60

Ala Gly Cys Ala Leu Asp Asp Ile Vai Ala Asp Leu Gly Leu Glu Glu 65 70 75 80

Leu Leu Gly Ser Ile Gly Vai Ser Thr Gly Asp Ile Ile Gin Gly Leu 85 90 95 Tyr Lys Leu Leu Lys Glu Leu Lys Ile Asp Glu Thr Val Phe Asn Ala 100 105 110

Val Cys Asp Val Thr Lys Lys Met Leu Asp Asn Lys Cys Leu Pro Lys 115 120 125

Ile Leu Gln Gly Asp Leu Val Lys Phe Leu Asp Leu Lys Tyr Lys Val 130 135 140

Cys Ile Glu Gly Gly Asp Pro Glu Leu Ile Ile Lys Asp Leu Lys Ile 145 150 155 160

Ile Leu Glu Arg Leu Pro Cys Val Leu Gly Gly Val Gly Leu Asp Asp 165 170 175

Leu Phe Lys Asn Ile Phe Val Lys Asp Gly Ile Leu Ser Phe Glu Gly 180 185 190

Ile Ala Lys Pro Leu Gly Asp Leu Leu Ile Leu Val Leu Cys Pro Asn 195 200 205

Val Lys Asn Ile Asn Val Ser Ser 210 215

<210> 2

<211> 648

<212> DNA

<213> Artificial Sequence <220>

<221> CDS <222> (1)...(648)

<223> sequência codificadora de uma das isoformas da Lv- ranaspumina-1 após tradução reversa da sequência predita de aminoácidos <400> 2 ctg ctg gaa ggc ttt ctg gtg ggc ggc ggc gtg ccg ggc ccg ggc acc 48

Leu Leu Glu Gly Phe Leu Val Gly Gly Gly Val Pro Gly Pro Gly Thr 1 5 10 15 gcg tgc ctg acc aaa gcg ctg aaa gat age ggc gat ctg ctg gtg gaa 96 Ala Cys Leu Thr Lys Ala Leu Lys Asp Ser Gly Asp Leu Leu Val Glu 20 25 30 ctg gcg gtg att att tgc gcg tat cag aac ggc aaa gat ctg cag gaa 144

Leu Ala Val Ile Ile Cys Ala Tyr Gln Asn Gly Lys Asp Leu Gln Glu 35 40 45 cag gat ttt aaa gaa ctg aaa gaa ctg ctg gaa cgc acc ctg gaa cgc 192

Gln Asp Phe Lys Glu Leu Lys Glu Leu Leu Glu Arg Thr Leu Glu Arg 50 55 60 gcg ggc tgc gcg ctg gat gat att gtg gcg gat ctg ggc ctg gaa gaa 240

Ala Gly Cys Ala Leu Asp Asp Ile Val Ala Asp Leu Gly Leu Glu Glu 65 70 75 80 ctg ctg ggc agc att ggc gtg agc acc ggc gat att att cag ggc ctg 288

Leu Leu Gly Ser Ile Gly Val Ser Thr Gly Asp Ile Ile Gln Gly Leu 85 90 95 tat aaa ctg ctg aaa gaa ctg aaa att gat gaa acc gtg ttt aac gcg 336

Tyr Lys Leu Leu Lys Glu Leu Lys Ile Asp Glu Thr Val Phe Asn Ala 100 105 110 gtg tgc gat gtg acc aaa aaa atg ctg gat aac aaa tgc ctg ccg aaa 384

Val Cys Asp Val Thr Lys Lys Met Leu Asp Asn Lys Cys Leu Pro Lys 115 120 125 att ctg cag ggc gat ctg gtg aaa ttt ctg gat ctg aaa tat aaa gtg 432

Ile Leu Gln Gly Asp Leu Val Lys Phe Leu Asp Leu Lys Tyr Lys Val 130 135 140 tgc att gaa ggc ggc gat ccg gaa ctg att att aaa gat ctg aaa att 480

Cys Ile Glu Gly Gly Asp Pro Glu Leu Ile Ile Lys Asp Leu Lys Ile 145 150 155 160 att ctg gaa cgc ctg ccg tgc gtg ctg ggc ggc gtg ggc ctg gat gat 528

Ile Leu Glu Arg Leu Pro Cys Val Leu Gly Gly Val Gly Leu Asp Asp 165 170 175 ctg ttt aaa aac att ttt gtg aaa gat ggc att ctg agc ttt gaa ggc 576

Leu Phe Lys Asn Ile Phe Val Lys Asp Gly Ile Leu Ser Phe Glu Gly 180 185 190 att gcg aaa ccg ctg ggc gat ctg ctg att ctg gtg ctg tgc ccg aac 624

Ile Ala Lys Pro Leu Gly Asp Leu Leu Ile Leu Val Leu Cys Pro Asn 195 200 205 gtg aaa aac att aac gtg agc agc 648

Val Lys Asn Ile Asn Val Ser Ser 210 215

<210> 3 <211> 651 <212> DNA

<213> Artificial Sequence <220>

<221> CDS <222> (1)...(651)

<223> otimização da frequência de códons da SEQ ID NO:2 para expressão em bactérias e adição do códon de iniciação ATG <400> 3 atg ctg ctg gaa ggt ttt ctg gtt ggg ggc ggt gtt ccg ggt cca ggc 48 Met Leu Leu Glu Gly Phe Leu Vai Gly Gly Gly Vai Pro Gly Pro Gly 1 5 10 15 acg gcc tgc ttg acg aag gct ctg aaa gat age ggt gac ctg ctg gtg 96

Thr Ala Cys Leu Thr Lys Ala Leu Lys Asp Ser Gly Asp Leu Leu Vai 20 25 30 gag tta gcg gtt att att tgt gea tac cag aat ggc aaa gac ctt cag 144

Glu Leu Ala Vai Ile Ile Cys Ala Tyr Gin Asn Gly Lys Asp Leu Gin 35 40 45 gag cag gac ttc aaa gaa ctg aag gaa ttg ctg gaa cgt aca ttg gaa 192

Glu Gin Asp Phe Lys Glu Leu Lys Glu Leu Leu Glu Arg Thr Leu Glu 50 55 60 cgt gcc ggt tgt gcc ctc gat gat att gtg gcc gat tta ggt ctg gaa 240

Arg Ala Gly Cys Ala Leu Asp Asp Ile Vai Ala Asp Leu Gly Leu Glu 65 70 75 80 gaa ctg ctg ggc tcc ate ggc gtt agt acc ggc gat att ate cag ggt 288

Glu Leu Leu Gly Ser Ile Gly Vai Ser Thr Gly Asp Ile Ile Gin Gly 85 90 95 ctg tat aaa ctg ttg aag gag tta aaa ate gac gag acc gtc ttt aat 336

Leu Tyr Lys Leu Leu Lys Glu Leu Lys Ile Asp Glu Thr Vai Phe Asn 100 105 110 gcg gtc tgc gat gtg acc aaa aaa atg ctg gat aac aag tgc tta ccg 384

Ala Vai Cys Asp Vai Thr Lys Lys Met Leu Asp Asn Lys Cys Leu Pro 115 120 125 aaa att ctg caa gga gat ctg gta aag ttc ctt gat ctg aag tat aaa 432

Lys Ile Leu Gln Gly Asp Leu Val Lys Phe Leu Asp Leu Lys Tyr Lys 130 135 140 gtt tgt att gaa ggt ggc gat cca gaa ctg att att aag gat ctg aaa 480

Val Cys Ile Glu Gly Gly Asp Pro Glu Leu Ile Ile Lys Asp Leu Lys 145 150 155 160 atc atc ctg gaa cgg ctt ccg tgt gtg ttg ggt gga gtc ggt ttg gat 528

Ile Ile Leu Glu Arg Leu Pro Cys Val Leu Gly Gly Val Gly Leu Asp 165 170 175 gat ctc ttt aag aac att ttt gtt aag gat ggg att ctg tcc ttc gaa 576

Asp Leu Phe Lys Asn Ile Phe Val Lys Asp Gly Ile Leu Ser Phe Glu 180 185 190 ggt att gcg aaa cct ctt ggt gac ctt ctc atc ctt gtc tta tgc ccg 624

Gly Ile Ala Lys Pro Leu Gly Asp Leu Leu Ile Leu Val Leu Cys Pro 195 200 205 aac gtc aag aat atc aat gta tcc tct 651

Asn Val Lys Asn Ile Asn Val Ser Ser 210 215

<210> 4 <211> 697

<212> DNA

<213> Artificial Sequence <220> CDS

<223> a SEQ ID NO:3 incluindo o sitio de restrição para Ndel, da sequência codificadora da etiqueta de poli-histidina, do sitio de restrição para EcoRI, da sequência que codifica o sitio de clivagem para TEV, do sitio de restrição para Ndel, e do sitio de restrição para Xhol <400> 4 g aat tct gaa aac ttg tat ttc cag ggc age cat atg atg ctg ctg 46

Asn Ser Glu Asn Leu Tyr Phe Gin Gly Ser His Met Met Leu Leu 1 5 10 15 gaa ggt ttt ctg gtt ggg ggc ggt gtt ccg ggt cca ggc acg gee tgc 94

Glu Gly Phe Leu Vai Gly Gly Gly Vai Pro Gly Pro Gly Thr Ala Cys 20 25 30 ttg acg aag gct ctg aaa gat age ggt gac ctg ctg gtg gag tta gcg 142

Leu Thr Lys Ala Leu Lys Asp Ser Gly Asp Leu Leu Vai Glu Leu Ala 35 40 45 gtt att att tgt gea tac cag aat ggc aaa gac ctt cag gag cag gac 190

Vai lie lie Cys Ala Tyr Gin Asn Gly Lys Asp Leu Gin Glu Gin Asp 50 55 60 ttc aaa gaa ctg aag gaa ttg ctg gaa cgt aca ttg gaa cgt gee ggt 238

Phe Lys Glu Leu Lys Glu Leu Leu Glu Arg Thr Leu Glu Arg Ala Gly 65 70 75 tgt gcc ctc gat gat att gtg gcc gat tta ggt ctg gaa gaa ctg ctg 286

Cys Ala Leu Asp Asp Ile Val Ala Asp Leu Gly Leu Glu Glu Leu Leu 80 85 90 95 ggc tcc atc ggc gtt agt acc ggc gat att atc cag ggt ctg tat aaa 334

Gly Ser Ile Gly Val Ser Thr Gly Asp Ile Ile Gln Gly Leu Tyr Lys 100 105 110 ctg ttg aag gag tta aaa atc gac gag acc gtc ttt aat gcg gtc tgc 382

Leu Leu Lys Glu Leu Lys Ile Asp Glu Thr Val Phe Asn Ala Val Cys 115 120 125 gat gtg acc aaa aaa atg ctg gat aac aag tgc tta ccg aaa att ctg 430

Asp Val Thr Lys Lys Met Leu Asp Asn Lys Cys Leu Pro Lys Ile Leu 130 135 140 caa gga gat ctg gta aag ttc ctt gat ctg aag tat aaa gtt tgt att 478

Gln Gly Asp Leu Val Lys Phe Leu Asp Leu Lys Tyr Lys Val Cys Ile 145 150 155 gaa ggt ggc gat cca gaa ctg att att aag gat ctg aaa atc atc ctg 526

Glu Gly Gly Asp Pro Glu Leu Ile Ile Lys Asp Leu Lys Ile Ile Leu 160 165 170 175 gaa cgg ctt ccg tgt gtg ttg ggt gga gtc ggt ttg gat gat ctc ttt 574

Glu Arg Leu Pro Cys Val Leu Gly Gly Val Gly Leu Asp Asp Leu Phe 180 185 190 aag aac att ttt gtt aag gat ggg att ctg tcc ttc gaa ggt att gcg 622

Lys Asn Ile Phe Val Lys Asp Gly Ile Leu Ser Phe Glu Gly Ile Ala 195 200 205 aaa cct ctt ggt gac ctt ctc atc ctt gtc tta tgc ccg aac gtc aag 670

Lys Pro Leu Gly Asp Leu Leu Ile Leu Val Leu Cys Pro Asn Val Lys 210 215 220 aat atc aat gta tcc tct taactcgag 697

Asn Ile Asn Val Ser Ser 225

<210> 5 <211> 6395 <212> DNA

<213> Artificial Sequence <220>

<223> vetor de expressão pPBUFCBac-LvRsnl resultante da inserção da SEQ ID NO:4 na SEQ ID NO:5 <400> 5 gatctcgatc ccgcgaaatt aatacgactc actatagggg aattgtgagc ggataacaat 60 tcccctctag aaataatttt gtttaaactt taagaaggag atatacatat g cat cat 117

His His

1 cat cat cat cac gtg aat tct gaa aac ttg tat ttc cag ggc agc cat 165 His His His His Val Asn Ser Glu Asn Leu Tyr Phe Gln GlySer His 5 10 15 atg atg ctg ctg gaa ggt ttt ctg gtt ggg ggc ggt gtt ccg ggt cca 213 Met Met Leu Leu Glu Gly Phe Leu Val Gly Gly Gly Val Pro Gly Pro 20 25 30 ggc acg gcc tgc ttg acg aag gct ctg aaa gat agc ggt gac ctg ctg 261 Gly Thr Ala Cys Leu Thr Lys Ala Leu Lys Asp Ser Gly Asp Leu Leu 35 40 45 50 gtg gag tta gcg gtt att att tgt gca tac cag aat ggc aaa gac ctt 309 Val Glu Leu Ala Val Ile Ile Cys Ala Tyr Gln Asn Gly Lys Asp Leu 55 60 65 cag gag cag gac ttc aaa gaa ctg aag gaa ttg ctg gaa cgt aca ttg 357 Gln Glu Gln Asp Phe Lys Glu Leu Lys Glu Leu Leu Glu Arg Thr Leu 70 75 80 gaa cgt gcc ggt tgt gcc ctc gat gat att gtg gcc gat tta ggt ctg 405 Glu Arg Ala Gly Cys Ala Leu Asp Asp Ile Val Ala Asp Leu Gly Leu 85 90 95 gaa gaa ctg ctg ggc tcc atc ggc gtt agt acc ggc gat att atc cag 453 Glu Glu Leu Leu Gly Ser Ile Gly Val Ser Thr Gly Asp Ile Ile Gln 100 105 110 ggt ctg tat aaa ctg ttg aag gag tta aaa atc gac gag acc gtc ttt 501

Gly Leu Tyr Lys Leu Leu Lys Glu Leu Lys Ile Asp Glu Thr Val Phe

115 120 125 130 aat gcg gtc tgc gat gtg acc aaa aaa atg ctg gat aac aag tgc tta 549 Asn Ala Val Cys Asp Val Thr Lys Lys Met Leu Asp Asn Lys Cys Leu 135 140 145 ccg aaa att ctg caa gga gat ctg gta aag ttc ctt gat ctg aag tat 597 Pro Lys Ile Leu Gln Gly Asp Leu Val Lys Phe Leu Asp LeuLys Tyr 150 155 160 aaa gtt tgt att gaa ggt ggc gat cca gaa ctg att att aag gat ctg 645

Lys Val Cys Ile Glu Gly Gly Asp Pro Glu Leu Ile Ile Lys Asp Leu

165 170 175 aaa atc atc ctg gaa cgg ctt ccg tgt gtg ttg ggt gga gtc ggt ttg 693

Lys Ile Ile Leu Glu Arg Leu Pro Cys Val Leu Gly Gly Val Gly Leu

180 185 190 gat gat ctc ttt aag aac att ttt gtt aag gat ggg att ctg tcc ttc 741

Asp Asp Leu Phe Lys Asn Ile Phe Val Lys Asp Gly Ile Leu Ser Phe

195 200 205 210 gaa ggt att gcg aaa cct ctt ggt gac ctt ctc atc ctt gtc tta tgc 789

Glu Gly Ile Ala Lys Pro Leu Gly Asp Leu Leu Ile Leu Val Leu Cys

215 220 225 ccg aac gtc aag aat atc aat gta tcc tct taactcgaga tcgatgatat 819

Pro Asn Val Lys Asn Ile Asn Val Ser Ser 230 235 tcgagcctag gtataatcgg atccggctgc taacaaagcc cgaaaggaag ctgagttggc 879 tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac gggtcttgag 939 gggttttttg ctgaaaggag gaactatatc cggatatccc gcaagaggcc cggcagtacc 999 ggcataacca agcctatgcc tacagcatcc agggtgacgg tgccgaggat gacgatgagc 1059 gcattgttag atttcataca cggtgcctga ctgcgttagc aatttaactg tgataaacta 1119 ccgcattaaa gctagcttat cgatgataag ctgtcaaaca tgagaattaa ttcttgaaga 1179 cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 1239 tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 1299 taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 1359 tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1419 gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 1479 gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 1539 cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 1599 tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 1659 tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 1719 atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 1779 ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 1839 gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 1899 gagcgtgaca ccacgatgcc tgcagcaatg gcaacaacgt tgcgcaaact attaactggc 1959 gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 2019 gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 2079 gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 2139 cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 2199 atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 2259 tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 2319 ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 2379 gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 2439 tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 2499 ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 2559 ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 2619 gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 2679 ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 2739 tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 2799 ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 2859 agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 2919 agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 2979 gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 3039 tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 3099 accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 3159 gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt 3219 atttcacacc gcaatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc 3279 agtatacact ccgctatcgc tacgtgactg ggtcatggct gcgccccgac acccgccaac 3339 acccgctgac gcgccctgac gggcttgtct gctcccggca tccgcttaca gacaagctgt 3399 gaccgtctcc gggagctgca tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag 3459 gcagctgcgg taaagctcat cagcgtggtc gtgaagcgat tcacagatgt ctgcctgttc 3519 atccgcgtcc agctcgttga gtttctccag aagcgttaat gtctggcttc tgataaagcg 3579 ggccatgtta agggcggttt tttcctgttt ggtcactgat gcctccgtgt aagggggatt 3639 tctgttcatg ggggtaatga taccgatgaa acgagagagg atgctcacga tacgggttac 3699 tgatgatgaa catgcccggt tactggaacg ttgtgagggt aaacaactgg cggtatggat 3759 gcggcgggac cagagaaaaa tcactcaggg tcaatgccag cgcttcgtta atacagatgt 3819 aggtgttcca cagggtagcc agcagcatcc tgcgatgcag atccggaaca taatggtgca 3879 gggcgctgac ttccgcgttt ccagacttta cgaaacacgg aaaccgaaga ccattcatgt 3939 tgttgctcag gtcgcagacg ttttgcagca gcagtcgctt cacgttcgct cgcgtatcgg 3999 tgattcattc tgctaaccag taaggcaacc ccgccagcct agccgggtcc tcaacgacag 4059 gagcacgatc atgcgcaccc gtggccagga cccaacgctg cccgagatgc gccgcgtgcg 4119 gctgctggag atggcggacg cgatggatat gttctgccaa gggttggttt gcgcattcac 4179 agttctccgc aagaattgat tggctccaat tcttggagtg gtgaatccgt tagcgaggtg 4239 ccgccggctt ccattcaggt cgaggtggcc cggctccatg caccgcgacg caacgcgggg 4299 aggcagacaa ggtatagggc ggcgcctaca atccatgcca acccgttcca tgtgctcgcc 4359 gaggcggcat aaatcgccgt gacgatcagc ggtccaatga tcgaagttag gctggtaaga 4419 gccgcgagcg atccttgaag ctgtccctga tggtcgtcat ctacctgcct ggacagcatg 4479 gcctgcaacg cgggcatccc gatgccgccg gaagcgagaa gaatcataat ggggaaggcc 4539 atccagcctc gcgtcgcgaa cgccagcaag acgtagccca gcgcgtcggc cgccatgccg 4599 gcgataatgg cctgcttctc gccgaaacgt ttggtggcgg gaccagtgac gaaggcttga 4659 gcgagggcgt gcaagattcc gaataccgca agcgacaggc cgatcatcgt cgcgctccag 4719 cgaaagcggt cctcgccgaa aatgacccag agcgctgccg gcacctgtcc tacgagttgc 4779 atgataaaga agacagtcat aagtgcggcg acgatagtca tgccccgcgc ccaccggaag 4839 gagctgactg ggttgaaggc tctcaagggc atcggtcgag atcccggtgc ctaatgagtg 4899 agctaactta cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 4959 tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 5019 cagggtggtt tttcttttca ccagtgagac gggcaacagc tgattgccct tcaccgcctg 5079 gccctgagag agttgcagca agcggtccac gctggtttgc cccagcaggc gaaaatcctg 5139 tttgatggtg gttaacggcg ggatataaca tgagctgtct tcggtatcgt cgtatcccac 5199 taccgagata tccgcaccaa cgcgcagccc ggactcggta atggcgcgca ttgcgcccag 5259 cgccatctga tcgttggcaa ccagcatcgc agtgggaacg atgccctcat tcagcatttg 5319 catggtttgt tgaaaccgga catggcactc cagtcgcctt cccgttccgc tatcggctga 5379 atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc cgagacagaa 5439 cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag atgctccacg 5499 cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt ctggtcagag 5559 acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat ggcatcctgg 5619 tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag attgtgcacc 5679 gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac gctggcaccc 5739 agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg cagggccaga 5799 ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg tgccacgcgg 5859 ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt tttcgcagaa 5919 acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc ggcatactct 5979 gcgacatcgt ataacgttac tggtttcaca ttcaccaccc tgaattgact ctcttccggg 6039 cgctatcatg ccataccgcg aaaggttttg cgccattcga tggtgtccgg gatctcgacg 6099 ctctccctta tgcgactcct gcattaggaa gcagcccagt agtaggttga ggccgttgag 6159 caccgccgcc gcaaggaatg gtgcatgcaa ggagatggcg cccaacagtc ccccggccac 6219 ggggcctgcc accataccca cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg 6279 atcttcccca tcggtgatgt cggcgatata ggcgccagca accgcacctg tggcgccggt 6339 gatgccggcc acgatgcgtc cggcgtagag gatcga 6375

<210> 6 <211> 236 <212> PRT

<213> Artificial Sequence <220>

<223> sequência de aminoácidos da versão modificada da proteina surfactante Lv-Rsn-1 codificada pela sequência de nucleotideos SEQ ID NO:4, que compreende a SEQ ID NO:3

<400> 6

His His His His His His Vai Asn Ser Glu Asn Leu Tyr Phe Gin Gly 1 5 10 15

Ser His Met Met Leu Leu Glu Gly Phe Leu Vai Gly Gly Gly Vai Pro 20 25 30

Gly Pro Gly Thr Ala Cys Leu Thr Lys Ala Leu Lys Asp Ser Gly Asp 35 40 45

Leu Leu Vai Glu Leu Ala Vai lie Ile Cys Ala Tyr Gin Asn Gly Lys 50 55 60

Asp Leu Gin Glu Gin Asp Phe Lys Glu Leu Lys Glu Leu Leu Glu Arg 65 70 75 80

Thr Leu Glu Arg Ala Gly Cys Ala Leu Asp Asp Ile Vai Ala Asp Leu 85 90 95

Gly Leu Glu Glu Leu Leu Gly Ser Ile Gly Vai Ser Thr Gly Asp Ile 100 105 110

Ile Gin Gly Leu Tyr Lys Leu Leu Lys Glu Leu Lys Ile Asp Glu Thr 115 120 125

Vai Phe Asn Ala Vai Cys Asp Vai Thr Lys Lys Met Leu Asp Asn Lys 130 135 140

Cys Leu Pro Lys Ile Leu Gin Gly Asp Leu Vai Lys Phe Leu Asp Leu 145 150 155 160

Lys Tyr Lys Vai Cys Ile Glu Gly Gly Asp Pro Glu Leu Ile Ile Lys

165 170 175

Asp Leu Lys Ile Ile Leu Glu Arg Leu Pro Cys Vai Leu Gly Gly Vai 180 185 190

Gly Leu Asp Asp Leu Phe Lys Asn Ile Phe Vai Lys Asp Gly Ile Leu 195 200 205 Ser Phe Glu Gly Ile Ala Lys Pro Leu Gly Asp Leu Leu Ile Leu Val 210 215 220

Leu Cys Pro Asn Val Lys Asn Ile Asn Val Ser Ser 225 230 235

<210> 7 <211> 648 <212> DNA

<213> Artificial Sequence <220>

<221> CDS <222> (1)...(648)

<223> otimização da frequência de códons da SEQ ID NO:2 para expressão em leveduras <400> 7 ttg ttg gaa gga ttt ttg gtc gga ggt ggt gtc cct ggt cct ggt aca 48

Leu Leu Glu Gly Phe Leu Val Gly Gly Gly Val Pro Gly Pro Gly Thr 1 5 10 15 gca tgt ttg act aag gca ttg aaa gac agt gga gac ttg ttg gtt gag 96

Ala Cys Leu Thr Lys Ala Leu Lys Asp Ser Gly Asp Leu Leu Val Glu 20 25 30 ttg gct gtt att att tgt gct tac caa aac ggt aaa gat ttg caa gag 144

Leu Ala Val Ile Ile Cys Ala Tyr Gln Asn Gly Lys Asp Leu Gln Glu

35 40 45 caa gat ttc aag gaa ttg aag gag ttg ttg gaa aga act ttg gaa aga 192

Gln Asp Phe Lys Glu Leu Lys Glu Leu Leu Glu Arg Thr Leu Glu Arg 50 55 60 gct ggt tgt gct ttg gat gat att gtt gct gat ttg ggt ttg gaa gag 240

Ala Gly Cys Ala Leu Asp Asp Ile Val Ala Asp Leu Gly Leu Glu Glu 65 70 75 80 ttg ttg ggt tct att ggt gtt tct act gga gat atc atc caa ggt ttg 288

Leu Leu Gly Ser Ile Gly Val Ser Thr Gly Asp Ile Ile Gln Gly Leu 85 90 95 tac aag ttg ttg aag gag ttg aag atc gat gaa act gtt ttt aac gct 336

Tyr Lys Leu Leu Lys Glu Leu Lys Ile Asp Glu Thr Val Phe Asn Ala 100 105 110 gtt tgt gat gtt act aag aaa atg ttg gat aac aag tgt ttg cca aag 384

Val Cys Asp Val Thr Lys Lys Met Leu Asp Asn Lys Cys Leu Pro Lys 115 120 125 atc ttg caa gga gat ttg gtt aag ttc ttg gat ttg aag tac aag gtt 432

Ile Leu Gln Gly Asp Leu Val Lys Phe Leu Asp Leu Lys Tyr Lys Val 130 135 140 tgt atc gaa ggt gga gat cca gaa ttg att att aag gat ttg aag atc 480

Cys Ile Glu Gly Gly Asp Pro Glu Leu Ile Ile Lys Asp Leu Lys Ile 145 150 155 160 atc ttg gag aga ttg cct tgt gtt ttg ggt ggt gtt ggt ttg gat gat 528

Ile Leu Glu Arg Leu Pro Cys Val Leu Gly Gly Val Gly Leu Asp Asp 165 170 175 ttg ttt aaa aac atc ttc gtt aag gat ggt att ttg tct ttc gaa ggt 576

Leu Phe Lys Asn Ile Phe Val Lys Asp Gly Ile Leu Ser Phe Glu Gly 180 185 190 att gct aag cct ttg gga gat ttg ttg att ttg gtt ttg tgt cct aat 624

Ile Ala Lys Pro Leu Gly Asp Leu Leu Ile Leu Val Leu Cys Pro Asn 195 200 205 gtc aag aat atc aat gtt tca tca 648

Val Lys Asn Ile Asn Val Ser Ser 210 215

<210> 8 <211> 685 <212> DNA

<213> Artificial Sequence <220>

<221> CDS <222> (1)...(648)

<223> a SEQ ID NO:8 após a adição do sitio de restrição para a endonuclease Pstl, de dois nucleotideos para colocar a sequência codificadora no mesmo quadro de tradução do fator de secreção alfa, e do sitio de restrição para a endonuclease Notl <400> 8 ct gca gga ttg ttg gaa gga ttt ttg gtc gga ggt ggt gtc cct ggt 47

Ala Gly Leu Leu Glu Gly Phe Leu Val Gly Gly Gly Val Pro Gly 1 5 10 15 cct ggt aca gca tgt ttg act aag gca ttg aaa gac agt gga gac ttg 95

Pro Gly Thr Ala Cys Leu Thr Lys Ala Leu Lys Asp Ser Gly Asp Leu 20 25 30 ttg gtt gag ttg gct gtt att att tgt gct tac caa aac ggt aaa gat 143

Leu Val Glu Leu Ala Val Ile Ile Cys Ala Tyr Gln Asn Gly Lys Asp 35 40 45 ttg caa gag caa gat ttc aag gaa ttg aag gag ttg ttg gaa aga act 191

Leu Gln Glu Gln Asp Phe Lys Glu Leu Lys Glu Leu Leu Glu Arg Thr 50 55 60 ttg gaa aga gct ggt tgt gct ttg gat gat att gtt gct gat ttg ggt 239

Leu Glu Arg Ala Gly Cys Ala Leu Asp Asp Ile Val Ala Asp Leu Gly 65 70 75 ttg gaa gag ttg ttg ggt tct att ggt gtt tct act gga gat atc atc 287

Leu Glu Glu Leu Leu Gly Ser Ile Gly Val Ser Thr Gly Asp Ile Ile 80 85 90 95 caa ggt ttg tac aag ttg ttg aag gag ttg aag atc gat gaa act gtt 335

Gln Gly Leu Tyr Lys Leu Leu Lys Glu Leu Lys Ile Asp Glu Thr Val 100 105 110 ttt aac gct gtt tgt gat gtt act aag aaa atg ttg gat aac aag tgt 383

Phe Asn Ala Val Cys Asp Val Thr Lys Lys Met Leu Asp Asn Lys Cys 115 120 125 ttg cca aag atc ttg caa gga gat ttg gtt aag ttc ttg gat ttg aag 431

Leu Pro Lys Ile Leu Gln Gly Asp Leu Val Lys Phe Leu Asp Leu Lys 130 135 140 tac aag gtt tgt atc gaa ggt gga gat cca gaa ttg att att aag gat 479

Tyr Lys Val Cys Ile Glu Gly Gly Asp Pro Glu Leu Ile Ile Lys Asp 145 150 155 ttg aag atc atc ttg gag aga ttg cct tgt gtt ttg ggt ggt gtt ggt 527

Leu Lys Ile Ile Leu Glu Arg Leu Pro Cys Val Leu Gly Gly Val Gly 160 165 170 175 ttg gat gat ttg ttt aaa aac atc ttc gtt aag gat ggt att ttg tct 575

Leu Asp Asp Leu Phe Lys Asn Ile Phe Val Lys Asp Gly Ile Leu Ser 180 185 190 ttc gaa ggt att gct aag cct ttg gga gat ttg ttg att ttg gtt ttg 623

Phe Glu Gly Ile Ala Lys Pro Leu Gly Asp Leu Leu Ile Leu Val Leu 195 200 205 tgt cct aat gtc aag aat atc aat gtt tca tca gag aac ctt tac ttt 671

Cys Pro Asn Val Lys Asn Ile Asn Val Ser Ser Glu Asn Leu Tyr Phe 210 215 220 cag gga gcg gcc gc 685

Gln Gly Ala Ala 225

<210> 9

<211> 4219

<212> DNA

<213> Artificial Sequence <220>

<223> vetor de expressão pPBUFCYea-LvRsnl resultante da inserção da SEQ ID NO:9 na SEQ ID NO:10 <400> 9 agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60 gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120 tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180 agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240 acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300 tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360 agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420 gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480 ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540 cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600 ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660 ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720 gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780 atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840 actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900 caacttgaga agatcaaaaa acaactaatt attcgaaacg atg aga ttt cct tca 955 Met Arg Phe Pro Ser 1 5 att ttt act gct gtt tta ttc gca gca tcc tcc gca tta gct gct cca 1003 Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser Ala Leu Ala Ala Pro 10 15 20 gtc aac act aca aca gaa gat gaa acg gca caa att ccg gct gaa gct 1051 Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln Ile Pro Ala Glu Ala 25 30 35 gtc atc ggt tac tca gat tta gaa ggg gat ttc gat gtt gct gtt ttg 1099 Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe Asp Val Ala Val Leu 40 45 50 cca ttt tcc aac agc aca aat aac ggg tta ttg ttt ata aat act act 1147 Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe Ile Asn Thr Thr 55 60 65 att gcc agc att gct gct aaa gaa gaa ggg gta tct ctc gag aaa aga 1195 11e AIa Ser 11e Ala Ala Lys Glu Glu Gly ValSer Leu Glu Lys Arg 70 75 80 85 gag gct gaa gct gca gga ttg ttg gaa gga ttt ttg gtc gga ggt ggt 1243 Glu Ala Glu Ala Ala Gly Leu Leu Glu Gly Phe Leu Val Gly Gly Gly 90 95 100 gtc cct ggt cct ggt aca gca tgt ttg act aag gca ttg aaa gac agt 1291 Val Pro Gly Pro Gly Thr Ala Cys Leu Thr Lys Ala Leu Lys Asp Ser 105 110 115 gga gac ttg ttg gtt gag ttg gct gtt att att tgt gct tac caa aac 1339 Gly Asp Leu Leu Val Glu Leu Ala Val Ile Ile Cys Ala Tyr Gln Asn 120 125 130 ggt aaa gat ttg caa gag caa gat ttc aag gaa ttg aag gag ttg ttg 1387 Gly Lys Asp Leu Gln Glu Gln Asp Phe Lys Glu Leu Lys Glu Leu Leu 135 140 145 gaa aga act ttg gaa aga gct ggt tgt gct ttg gat gat att gtt gct 1435 Glu Arg Thr Leu Glu Arg Ala Gly Cys Ala Leu Asp Asp Ile Val Ala 150 155 160 165 gat ttg ggt ttg gaa gag ttg ttg ggt tct att ggt gtt tct act gga 1483 Asp Leu Gly Leu Glu Glu Leu Leu Gly Ser Ile Gly Val Ser Thr Gly 170 175 180 gat atc atc caa ggt ttg tac aag ttg ttg aag gag ttg aag atc gat 1531 Asp Ile Ile Gln Gly Leu Tyr Lys Leu Leu Lys Glu Leu Lys Ile Asp 185 190 195 gaa act gtt ttt aac gct gtt tgt gat gtt act aag aaa atg ttg gat 1579 Glu Thr Val Phe Asn Ala Val Cys Asp Val Thr Lys Lys Met Leu Asp 200 205 210 aac aag tgt ttg cca aag atc ttg caa gga gat ttg gtt aag ttc ttg 1627 Asn Lys Cys Leu Pro Lys Ile Leu Gln Gly Asp Leu Val Lys Phe Leu 215 220 225 gat ttg aag tac aag gtt tgt atc gaa ggt gga gat cca gaa ttg att 1675 Asp Leu Lys Tyr Lys Val Cys Ile Glu Gly Gly Asp Pro Glu Leu Ile 230 235 240 245 att aag gat ttg aag atc atc ttg gag aga ttg cct tgt gtt ttg ggt 1723 Ile Lys Asp Leu Lys Ile Ile Leu Glu Arg Leu Pro Cys Val Leu Gly 250 255 260 ggt gtt ggt ttg gat gat ttg ttt aaa aac atc ttc gtt aag gat ggt 1771 Gly Val Gly Leu Asp Asp Leu Phe Lys Asn Ile Phe Val Lys Asp Gly 265 270 275 att ttg tct ttc gaa ggt att gct aag cct ttg gga gat ttg ttg att 1819 Ile Leu Ser Phe Glu Gly Ile Ala Lys Pro Leu Gly Asp Leu Leu Ile 280 285 290 ttg gtt ttg tgt cct aat gtc aag aat atc aat gtt tca tca gag aac 1867 Leu Val Leu Cys Pro Asn Val Lys Asn Ile Asn Val Ser Ser Glu Asn

295 300 305 ctt tac ttt cag gga gcg gcc gcc agc ttt cta gaa caa aaa ctc atc 1915 Leu Tyr Phe Gln Gly Ala Ala Ala Ser Phe Leu Glu Gln Lys Leu Ile

310 315 320 325 tca gaa gag gat ctg aat agc gcc gtc gac cat cat cat cat cat cat 1963 Ser Glu Glu Asp Leu Asn Ser Ala Val Asp His His His His His His 330 335 340 tgagtttgta gccttagaca tgactgttcc tcagttcaag ttgggcactt acgagaagac 2023 cggtcttgct agattctaat caagaggatg tcagaatgcc atttgcctga gagatgcagg 2083 cttcattttt gatacttttt tatttgtaac ctatatagta taggattttt tttgtcattt 2143 tgtttcttct cgtacgagct tgctcctgat cagcctatct cgcagctgat gaatatcttg 2203 tggtaggggt ttgggaaaat cattcgagtt tgatgttttt cttggtattt cccactcctc 2263 ttcagagtac agaagattaa gtgagacctt cgtttgtgcg gatcccccac acaccatagc 2323 ttcaaaatgt ttctactcct tttttactct tccagatttt ctcggactcc gcgcatcgcc 2383 gtaccacttc aaaacaccca agcacagcat actaaatttt ccctctttct tcctctaggg 2443 tgtcgttaat tacccgtact aaaggtttgg aaaagaaaaa agagaccgcc tcgtttcttt 2503 ttcttcgtcg aaaaaggcaa taaaaatttt tatcacgttt ctttttcttg aaattttttt 2563 ttttagtttt tttctctttc agtgacctcc attgatattt aagttaataa acggtcttca 2623 atttctcaag tttcagtttc atttttcttg ttctattaca acttttttta cttcttgttc 2683 attagaaaga aagcatagca atctaatcta aggggeggtg ttgacaatta atcatcggca 2743 tagtatatcg gcatagtata atacgacaag gtgaggaact aaaccatggc caagttgacc 2803 agtgccgttc cggtgctcac cgcgcgcgac gtcgccggag cggtcgagtt ctggaccgac 2863 cggctcgggt tctcccggga cttcgtggag gacgacttcg ccggtgtggt ccgggacgac 2923 gtgaccctgt tcatcagcgc ggtccaggac caggtggtgc cggacaacac cctggcctgg 2983 gtgtgggtgc gcggcctgga cgagctgtac gccgagtggt cggaggtcgt gtccacgaac 3043 ttccgggacg cctccgggcc ggccatgacc gagatcggcg agcagccgtg ggggcgggag 3103 ttcgccctgc gcgacccggc cggcaactgc gtgcacttcg tggccgagga gcaggactga 3163 cacgtccgac ggcggcccac gggtcccagg cctcggagat ccgtccccct tttcctttgt 3223 cgatatcatg taattagtta tgtcacgctt acattcacgc cctcccccca catccgctct 3283 aaccgaaaag gaaggagtta gacaacctga agtctaggtc cctatttatt tttttatagt 3343 tatgttagta ttaagaacgt tatttatatt tcaaattttt cttttttttc tgtacagacg 3403 cgtgtacgca tgtaacatta tactgaaaac cttgcttgag aaggttttgg gacgctcgaa 3463 ggctttaatt tgcaagctgg agaccaacat gtgagcaaaa ggccagcaaa aggccaggaa 3523 ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 3583 caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 3643 gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 3703 cctgtccgcc tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta 3763 tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 3823 gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 3883 cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 3943 tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 4003 tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 4063 caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 4123 aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 4183 cgaaaactca cgttaaggga ttttggtcat gagatc 4219

<210> 10 <211> 341 <212> PRT

<213> Artificial Sequence <220>

<223> sequência de aminoácidos da versão modificada da proteina surfactante Lv-Rsn-1 codificada pela sequência de nucleotideos SEQ ID NO:9, que por sua vez está contida na SEQ ID NO:11.

<400> 10

Met Arg Phe Pro Ser Ile Phe Thr Ala Vai Leu Phe Ala Ala Ser Ser 1 5 10 15

Ala Leu Ala Ala Pro Vai Asn Thr Thr Thr Glu Asp Glu Thr Ala Gin 20 25 30

Ile Pro Ala Glu Ala Vai Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45

Asp Vai Ala Vai Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Vai 65 70 75 80

Ser Leu Glu Lys Arg Glu Ala Glu Ala Ala Gly Leu Leu Glu Gly Phe 85 90 95 Leu Val Gly Gly Gly Val Pro Gly Pro Gly Thr Ala Cys Leu Thr Lys 100 105 110

Ala Leu Lys Asp Ser Gly Asp Leu Leu Val Glu Leu Ala Val Ile Ile 115 120 125

Cys Ala Tyr Gln Asn Gly Lys Asp Leu Gln Glu Gln Asp Phe Lys Glu 130 135 140

Leu Lys Glu Leu Leu Glu Arg Thr Leu Glu Arg Ala Gly Cys Ala Leu 145 150 155 160

Asp Asp Ile Val Ala Asp Leu Gly Leu Glu Glu Leu Leu Gly Ser Ile 165 170 175

Gly Val Ser Thr Gly Asp Ile Ile Gln Gly Leu Tyr Lys Leu Leu Lys 180 185 190

Glu Leu Lys Ile Asp Glu Thr Val Phe Asn Ala Val Cys Asp Val Thr 195 200 205

Lys Lys Met Leu Asp Asn Lys Cys Leu Pro Lys Ile Leu Gln Gly Asp 210 215 220

Leu Val Lys Phe Leu Asp Leu Lys Tyr Lys Val Cys Ile Glu Gly Gly 225 230 235 240

Asp Pro Glu Leu Ile Ile Lys Asp Leu Lys Ile Ile Leu Glu Arg Leu 245 250 255

Pro Cys Val Leu Gly Gly Val Gly Leu Asp Asp Leu Phe Lys Asn Ile 260 265 270

Phe Val Lys Asp Gly Ile Leu Ser Phe Glu Gly Ile Ala Lys Pro Leu 275 280 285

Gly Asp Leu Leu Ile Leu Val Leu Cys Pro Asn Val Lys Asn Ile Asn 290 295 300

Val Ser Ser Glu Asn Leu Tyr Phe Gln Gly Ala Ala Ala Ser Phe Leu 305 310 315 320

Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser Ala Val Asp His 325 330 335

His His His His His 340