Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SUBSTANCES FOR INHIBITING POLYGALACTURONASE ENZYMES OF PHYTOPATHOGENIC FUNGI
Document Type and Number:
WIPO Patent Application WO/2013/097012
Kind Code:
A1
Abstract:
The present invention relates to a method for computationally designing new compounds that can potentially function as inhibitors of the endopolygalacturonase enzyme involved in plant-cell-invasion processes. Notably, one of the main uses of this technology lies in the development of substances for inhibiting enzymes of pathogenic soil fungi of the genus Fusarium, which are involved in a series of phytopathogenic processes responsible for high levels of loss in agriculture.

Inventors:
NESHICH GORAN (BR)
Application Number:
PCT/BR2012/000540
Publication Date:
July 04, 2013
Filing Date:
December 27, 2012
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
EMBRAPA PESQUISA AGROPECUARIA (BR)
International Classes:
C07H3/06; C12N9/26; G16B15/30
Domestic Patent References:
WO2012031343A22012-03-15
Foreign References:
US20050004766A12005-01-06
US20010000807A12001-05-03
Other References:
MAULIK, A ET AL.: "Comparative study of protein-protein interaction Observed in Polygalacturonase-Inhibiting Proteins from Phaseolus vulgaris and Glycine max and polygalacturonase from Fusarium moniliforme.", BMC GENOMICS, vol. 10, no. 3, 2009, pages S19
BERENDSEN, HJC ET AL.: "GROMACS: A message-passing parallel molecular dyhamics implemeiitation.", COMPUTER PHYSICS COMMUNICATIONS, vol. 91, 1995, pages 43 - 56
NESHICH, G ET AL.: "The Star STING server: a multiplataform environment is Protein structure analysis.", GENETICS AND MOLECULAR RESEARCH, vol. 5, no. 4, 2006, pages 717 - 722
ROCCHIA W ET AL.: "Electrostatic potential calculation is biomolecules - creating a database of pre-calculated values Reported on the per residue basis is there PDB protein structures.", GENET. MOL RES, vol. 6, no. 4, 2007, pages 923 - 936
FEDERICI, L ET AL.: "Structural of endopolygalacturonase for the requirerrients interaction with PGIP (polygalacturonase-inhibiting protein).", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED-STATES OF AMERICA, vol. 98, no. 23, 2001, pages 13425 - 13430
ANDERSON, AC.: "The Process of Structure-Based Drug Design.", CHEMISTRY & BIOLOGY, vol. 10, no. 9, September 2003 (2003-09-01), pages 787 - 797
CHO, SW ET AL.: "The (. X-ray Structure of Aspergillus aculeatus Modeled polygalacturonase and the structure of the polygalacturonase- Octagalacturonate Complex", J. MOL., vol. 314, 2001, pages 863 - 878
YAMAMOTO K ET AL.: "Synthesis of the analogue mimicking trigalacturonic acid the expected transition state in the glycosidases.", CARBOHYDRATE RESEARCH, vol. 345, 2010, pages 572 - 585
Attorney, Agent or Firm:
DANNEMANN SIEMSEN BIGLER & IPANEMA MOREIRA (BR)
Download PDF:
Claims:
REIVINDICAÇÕES

01. Método para desenhar computacionalmente novos compostos com potencial função inibitória da enzima endopoligalacturonase caracterizado pelas seguintes etapas: (i) obtenção de arquivos de coordenadas re- ferentes às estruturas tridimensionais, a partir do banco PDB, da estrutura da enzima endopoligalacturonase (PG); (ii) busca por sequências homólogas, que também possuam estrutura depositada no PDB, às estruturas primárias das enzimas dos organismos de interesse usando o BLASTp contra o banco de dados de sequências primárias do PDB; (iii) predição de modelos de estruturas tridimensionais das PGs que não possuírem estrutura depositada nos bancos públicos utilizando as sequências primárias das enzimas dos organismos de interesse e como molde (template) as estruturas cujas sequências primárias são homólogas à sequência de interesse; (iv) edição das estruturas otimizando a numeração de resíduos na sequência primaria usando o programa Deep-View, minimização da energia dos modelos gerados através do programa GROMACS, visualizadas das estruturas terciárias para análise da sobreposição das estruturas terciárias através do PyMol, avaliação da qualidade dos modelos gerados através da análise de gráficos Ramachandran, gerados através da utilização do Java Protein Dossier e da plataforma STING, e analise dos modelos em relação a erros na estrutura tridimensional pelo ProSa-web; (v) alinhar a FmPG (1 HG8.pdb) às estruturas depositadas no PDB com o TM-align; (vi) fazer alinhamentos entre a estrutura primária de proteínas homólogas à proteína de interesse através do programa ClustalW 2.0 e incluir proteínas de outros organismos, evidenciando as similaridades e diferenças entre estes dois conjuntos de proteínas e buscando as correspondências no alinhamento de estrutura primária dos resíduos importantes, seguindo certos critérios como: presença exclusivamente nas sequências de fungos fitopatogênicos; (vii) buscar estruturas de compostos no PubChem por similaridade maior que 90% com o ligante natural e proceder simulações de docking empregando o programa Molegro Virtual Docker (MVD); (viii) analisar detalhadamente o nano-ambiente do sitio alvo usando-se o programa STING Java Protein Dossier e a ferramenta "select"; (ix) modificar computacionalmente através do programa ChemBioDraw as estruturas selecionadas na etapa vii de acordo com as características físico- químicas e estruturais encontradas na etapa viii a fim de aumentar os valores de afinidade de ligação e buscar por ligantes baseados na forma da cavidade criada pelo MVD na região dos resíduos de interesse; e (x) realizar predição de parâmetros moleculares que interferem na Absorção, Distribuição, Metabolismo, Excreção e Toxicidade utilizando a ferrametna online Osíris Property Explorer.

02. Método de inibição ou inativação das enzimas poligalacturo- nases por meio de ligação parcial ou total de inibidor desenvolvido de acordo com a reivindicação 1.

03. Método de prevenção ou tratamento contra microrganismos que utilizam as enzimas poligalacturonases para invadir os tecidos do hospedeiro utilizando-se compostos de acordo com a reivindicação 2.

Description:
Relatório Descritivo de Patente de Invenção: "INIBIDORES DAS ENZIMAS POLIGALACTURONASES DE FUNGOS FITOPATOGÊNICOS".

CAMPO DA INVENÇÃO

O presente documento de patente refere-se a um método para desenhar computacionalmente novos compostos com potencial função inibitória da enzima endopoligalacturonase produzida por fungos fitopatogênicos e envolvida em processos de invasão destes fungos em células vegetais. Um enfoque especial é dado às enzimas de fungos patogênicos de solo do género Fusarium, envolvidos em uma série de fitopatogenias e responsáveis por amplo espectro de prejuízos à Agricultura.

ESTADO DA TÉCNICA

Grande parte das doenças de plantas que causam prejuízos para a agricultura brasileira e mundial é causada por fungos fitopatogênicos, e a maioria deles de solo. Seria ideal a redução do potencial patogênico des- tes fungos em áreas infestadas de forma a permitir o plantio. Uma medida que tem sido utilizada é a de incorporação de matéria orgânica no solo, já que a introdução de antagonistas é uma medida de controle biológico. Entretanto, os índices de controle obtido com este método, isoladamente, podem estar abaixo do necessário para impedir danos à cultura (W. Bettiol, R. Ghini, Controle Biológico. In: A. ergamim Filho, Kimati, L. Amorin, Manual de Fito- patologia - Princípios e Conceitos. 3 edição. São Paulo: Agronómica Ceres, 1995. p. 717-728).

O uso e desenvolvimento de cultivares resistentes seria uma melhor opção de controle destas doenças, todavia, muitos hospedeiros não apresentam resistência a esses patógenos. A funcionalidade nem sempre é possível, devido à inexistência no mercado, de cultivares com todas as características desejadas (M.M.Q. Ambrósio, Sobrevivência em microcosmo e em campo solarizado de fitopatógenos submetidos à fermentação acelerada de diferentes materiais orgânicos. Tese (Doutorado em Agronomia) Faculda- de de Ciências Agronómicas da UNESP, Botucatu-SP, 2006).

Existem métodos de controle químico contra os fungos fitopatógenos, como por exemplo, o realizado, até há pouco tempo, com um agrotó- xico de amplo espectro, o brometo de metila utilizado nos últimos 60 anos como fumigante de solo em pré-plantio. Embora altamente eficaz, rápido, fácil penetração no solo, amplo espectro e baixa resistência dos fungos foi comprovado que este confere riscos para o ambiente, para o homem e para a camada de ozônio (R. Ghini, Alternativas para substituir o brometo de metila na agricultura. Summa Phytopathologica, Jaboticabal, v. 27, n. 1 , p. 162, 2001).

Os membros do género Fusanum são fungos que podem provocar doenças em plantas, humanos e animais, sendo que nesses dois últimos provocam doenças atuando como patógenos oportunistas ou através de suas toxinas (metabólitos secundários) causando problemas de crescimento, dentre outros. São conhecidos desastres agrícolas causados por fungos desse género, como a queda em produção da banana no Panamá, na década de 60 e bilhões de dólares perdidos em trigo e cevada no meio-oeste nor- te-americano. Muitas plantas têm pelo menos uma doença associada ao Fusanum; segundo o American Phytopathological Society, em 2006, das 101 plantas listadas como economicamente importantes pelo menos 81 delas têm alguma doença associada a esse patógeno. Os fungos desse género atacam plantas em qualquer estágio de desenvolvimento causando podridão de caules, raízes, sementes e frutos, doenças de folhas, gangrenas e mur- chamentos (J.F. Leslie, B.A. Summerell e S. Bullock. The Fusarium labora- tory manual, Wiley-Blackwell, 2006). Segundo a Food and Agriculture Orga- nization of the United Nations, estima-se que cerca de 50% das perdas agrícolas no mundo se devem ao Fusarium (L. Gilchrist, H.J. Dubin, Fusarium Head Blight, http://www.fao.org/docrep/006/y4011e/y4011e0j.htm, acessado em janeiro de 2010). A fitopatogenicidade se dá pela penetração de hifas modificadas para invasão de tecido vegetal através da parede celular, propiciando crescimento intra e intercelular. Esta penetração das hifas só se faz possível devido à secreção de enzimas {Celi wall-degrading enzymes - CW- DE) pelo fungo que hidrolisam moléculas estruturais que constituem a parede celular. Essas enzimas são cutinases, proteases, celulases, quitina deacetilases, aminoácido permeases e poligalacturonases (K. Mandgen, M. Hahn e H. Deising, Morphogenesis and mechanisms of penetration by plant pathogenic fungi, Annu. Rev. Phytopahol, 1996 34:367-86). Fusarium é o nome dado a forma assexuada (anamorfo) dos fungos desse género e às formas sexuadas (teleomorfos) são distribuídas nos géneros Gibberella, Ha- ematonectria e Albonectria, sendo o género Gibberella o mais comum por estar relacionado a maioria das espécies de Fusarium. O International Code of Botanical Nomenclature recomenda que seja utilizado o nome do teleo- morfo, sendo permitido empregar o nome do anamorfo sob certas condições. Porém, os teleomorfos de Fusarium não são comumente encontrados em campo, então é mais empregado o uso da nomenclatura do anamorfo (J.F. Leslie, B.A. Summerell, The Fusarium Laboratory, Blackwell Publishing, capítulos 8-10, págs. 81-100, 2006).

As poligalacturonases são de grande importância para a penetração do microrganismo nos tecidos vegetais, pois agem catalisando a cli- vagem dos polímeros de ácido galacturonico que formam a região lisa, sem ramificações, da pectina. Sendo a pectina o maior componente da parede celular vegetal, a ação de enzimas que agem quebrando sua estrutura é bastante deletéria para a estrutura da parede celular como um todo (N.C. Carpita e D.M. Gibeaut, Structucral models of primary cell walls in flowering plans-consistency molecular structure with the physical properties of the walls during growth, Plant J. 3, 1-31 , 1993). As poligalacturonases agem catalisando a hidrólise das ligações alfa-1 ,4 entre os resíduos do polímero de ga- lacturonato, transformando-o em fragmentos menores e desestruturando o arcabouço de pectina da lamela média e da parede celular primária favore- cendo o crescimento de hifas do fungo dentro dos tecidos da planta (R. D'0- vidio, B. Mattei, S. Roberti, D. Bellincampi, Polygalacturonases, polygalactu- ronase-inhibiting proteins and pectic oligomers in plant-pathogen interacti- ons, Biochim. Biophys. Acta 1696, 237-244, 2004). Há três tipos de poligalacturonases: endopoligalacturonase (PG), exopoligalacturonase (EPG) e a exopoli-alfa-galacturonosidase (EPGD), que diferem no modo de ação na catálise da hidrólise da pectina. A PG catalisa randomicamente os resíduos de ácido galacturonico gerando fragmentos de oligogalacturonato, enquanto que a EPG remove um único resíduo de ácido galacturônico da extremidade não redutora do fragmento, completando dessa forma a quebra do oligômero em monômeros de galacturonato; a EPGD catalisa a hidrólise de dois resíduos de galacturonato a partir da extremidade não redutora do polímero (O. Markovic e S. Janecek, Pectin degrading glycoside hydorlases of family 28: sequence-structural features, spefcificities and evolution, Protein Eng. 14, 615-631 , 2001).

Contudo, as poligalacturonases não estão presentes apenas em microrganismos fitopatogênicos, como também são produzidas pelas plantas e participam no processo de crescimento e desenvolvimento da planta, utilizando o mesmo mecanismo de quebra dos polímeros de ácido galacturônico e sua expressão é controlada conforme a necessidade da planta. A diferença entre as poligalacturonases vegetais e as de fitopatógenos é pouca, mas reside em particularidades estruturais como demonstrado por Federici et al em um estudo sobre os requisitos para que ocorra a ligação entre poligalac- turonase de F. moniliforme e PGIP {polygalacturonase-inhibiting protein) de Phaseolus vulgaris. Nesse trabalho, Federici e colaboradores resolveram a estrutura tridimensional da poligalacturonase do F. moniliforme e também analisaram as diferenças de interação entre PGIP e PG com resíduos do sítio catalítico e ligante modificados. Foram mais relevantes para a interação os resíduos do sítio de ligação His 88, Arg267 e Lys269. Além desses resíduos também se notou diferença em um aminoácido estrutural: em fitopatógenos geralmente ocorrem aminoácidos com resíduos hidrofóbicos e de pequeno volume na posição 270, porém em vegetais encontra-se aminoácidos com resíduos hidrofóbicos volumosos, o que pode interferir na interação do PGIP com a PG vegetal, de forma a não ser por ele inibida (L. Federici, C. Caprari, B. Mattei, C. Savino, A. di Mateo, G. De Lorenzo, F. Cervone, D. Tsernoglou, Structural requirements of endopolygalacturonase for the inte- raction with PGIP, PNAS, 98(23), 13425-13430, 2001). No trabalho citado, foi feita ainda uma troca de aminoácidos (não volumoso por um volumoso - serina por triptofano) nessa posição da sequência do F. moniliforme e obser- vou-se que com a troca não houve interação com o PGIP, o que reforça a idéia de que o tamanho do resíduo do aminoácido na posição 270 interfere na interação entre PG e PGIP.

As PGIPs são glicoproteínas localizadas na parede celular que reduzem a atividade catalítica das PGs e podem desencadear respostas de defesa das plantas. Pertencem à família de proteínas com sequência rica em repetições de leucina (leucine-rich repeat - LRR), relacionadas a genes de resistência. A produção de PGIP é desencadeada pela ação de patógenos e moléculas como salicilato, jasmonato, oligogalacturonatos, e fatores físicos como baixa temperatura e estabelecimento de lesões nos tecidos da planta. A inibição da PG pelo PGIP pode ser competitiva ou não competitiva (Cuixia Di, Manxiao Zhang, Shijian Xu, Tuo Cheng, Lizhe An, Role of polygalacturo- nase-inhibiting protein in plant defense, Criticai Review in Microbiology, 32, 91-100, 2006). Um PGIP produzido naturalmente por determinada planta não é capaz de inibir todas as formas de poligalacturonases produzidas pe- los diversos tipos de fitopatógenos e por isso a transgênese da sequência dessa proteína inibidora em outras plantas não assegura proteção efetiva. Não obstante, é interessante utilizar os PGIPs disponíveis para se estudar os tipos de interações que diferenciam enzimas vegetais das de fitopatógenos para a modelagem de estruturas com o intuito de criar inibidores que não afetem o funcionamento da enzima das plantas e o desenvolvimento vegetal, mas que ao mesmo tempo possam ser capazes de inibir um espectro maior de fitopatógenos do que o fazem os PGIPs naturais. Além disso, um PGIP é uma proteína de grande peso molecular, que interage entrando em contato com grande área superficial da PG, na maior parte com intera- ções fracas, exceto a região carregada negativamente que interage com os resíduos no 267_RIK das PGs (A. Di Matteo, L. Fedreici, B. Mattel, G. Salvi, K.A. Johnson, C. Savino, G. De Lorenzo, D. Tsernoglou, F. Cervone, The crystal structure of polyglacturonase-inhibiting protein (PGIP), a leucine-rich repeat protein involved in plant defense, PNAS, 100(17):10124-10128, 2003), o que faz com que qualquer sensível diferença de superfície que as enzimas de fitopatógenos tiverem já não as deixam ser inibidas pelo PGIP e, por essa razão, as diferenças que as PGs têm entre si, mesmo que fora do sítio ligante, podem interferir na interação com o PGIP. A vantagem de um ligante relativamente pequeno e que explore apenas as áreas conservadas que existem nas PGs é a de que este pode interagir com várias PGs diferentes, pois mesmo as PGs produzidas por microrganismos de espécies e gê- neros diferentes mantêm bastante conservados os resíduos envolvidos na ligação com o substrato.

Até o presente momento, no que diz respeito à inibição da enzima poligalacturonase, há apenas trabalhos voltados para a engenharia genética publicados na literatura científica. A expressão de PGIP de pêra em tomate transgênico limita a colonização pelo fungo Botrytis cinema, o que evidencia a importância da enzima na atividade patogênica (A.L.T. Powell, J. van Kan, A. ten Have, J. Visser, L.C. Greve, A.B. Bennet, J.M. Labavitch, Transgenic expression of pear PGIP in tomato limits fungai colonization, ASP Journals, 13(9), 942-950, 2000). Em outro notável trabalho, a expressão de PGIP de feijão em trigo transgênico conferiu resistência a fungos fitopatogê- nicos F. moniliforme e Bipolaris sorokiniana (M. Janni, L. Sella, F. Favaron, A.E. Blechl, G. De Lorenzo, R. DOvidio, The expression of a bean PGIP in transgenic wheat confers increased resistance to the fungai pathogen Bipolaris sorokiniana, MPMI, 21 (2), 171-199, 2008). Portanto, a inibição bem suce- dida das poligalacturonases afeta a invasão do microrganismo nos tecidos vegetais. Porém, apesar de efetivo por um tempo, é sabido que as pestes podem desenvolver resistência mesmo aos organismos transgênicos, cujas PGIPs não interagem apenas com o sítio ligante do substrato natural, mas com uma região menos conservada e por isso mais susceptível a variações. A vantagem de uma molécula menor capaz de se ligar com maior afinidade ao sítio ligante, que compreende a região com resíduos conservados, do que o ligante natural (galacturonato), mas sendo ao mesmo tempo estruturalmente semelhante ao ligante natural, é a de que pode ser eficaz contra uma grande variedade de enzimas sem sofrer grandes variações de afinidade, pois não interage com as regiões não conservadas da proteína assim como o faz o PGIP

A expressão de genes de endopoligalacturonase (PG) em Fusa- rium moniliforme na ocasião da infecção em cana-de-açúcar foi avaliada por recentes trabalhos (R. Mendes, Diversidade e caracterização genética de comunidades microbianas endofíticas associadas à cana-de-açúcar. 119p. Tese - Doutorado em Genética e Melhoramento de Plantas - Escola Superi- or de Agricultura "Luiz de Queiroz", Universidade de São Paulo, Piracicaba- SP, 2008) e verificou-se que a enzima está presente neste fungo em todos os estágios da infecção: desde o contato inicial com a planta hospedeira até a aquisição de nutrientes e fase necrótica. Interessantemente, este fungo expressou a PG mesmo na fase de resposta à defesa da planta, o que refor- ça a importância desta enzima durante a infecção deste fungo, e sugere que esta seja indispensável para romper as barreiras celulares da planta (R. Kahmann, C. Basse, Fungai gene expression during pathogenesis-related development and host plant colonization. Current Opinion in Microbiology, London, v. 4, p. 374-380, 2001).

Outros fungos fitopatogênicos de importância económica mencionados neste documento, com a finalidade de estabelecer semelhanças que possibilitem o emprego das moléculas propostas em tratamento anti- fúngico de amplo espectro, são: Fusarium graminearum, Fusarium oxyspo- rum f. sp. lycopersici, Botrytis cinerea (Botryotinia fuckeliana), Colletotrichum lupini, Cryphonectria parasitica Sclerotinia sclerotiorum, Aspergillus niger, A. Aculeatus, A. flavus e Stereum purpureum.

O Fusarium graminearum é um fungo filamentoso amplamente distribuído em plantas e solo e o maior patógeno de grãos cultivados, sendo o causador do Fusarium head blight (FHB - conhecido também como "scab", ou sarna) no trigo e na cevada, e lidera como causa de prejuízos nestas plantações (J.F. Leslie e B.A. Summerell, The fusarium laboratory manual, Blackwell, Ames, lowa, 2006). Em publicação da Food and Agriculture Orga- nization of The United Nations (FAO) estima-se de que o FHB seja responsável por cerca de 50% das perdas agrícolas mundiais (L. Gilchrist, H.J. Du- bin, Fusarium head blight, em Bread Wheat, FAO Plant Production and Pro- tection Series n°30, 2002, http://www.fao.org/docrep/006/y4011e/y4011e0j.htm). Trinta e dois genes desse fungo codificam para enzimas envolvidas na degradação de parede celular vegetal (Cell wall-degrading enzymes - CDWE) que ocorre durante a invasão pelo fungo. Esses genes, dentre outros, são expressos exclusivamente durante a infecção (CA. Cuomo, U. Gulgener, Jin-Rong Xu, F. Trail, B. Gillian Turgeon, A. Di Pietro, J.D. Wallow, Li-Jun Ma, S.E. Baker, M. Rep,

G. Adam, J. Antoni, T. Baldwin, S. Calvo, Yueh-Long Chang, D. DeCaprio, L.R. Gale, S. Gnerre, R.S. Gaswani, K. Hammond-Kosack, L.J. Harris, K. Hilburn, J.C. Kennell, S. Kroken, J.K. Magnuson, G. Mannhaupt, E. Mauceli,

H. W. Mewes, R. Mitterbauer, G. Muehlbauer, M. Miinsterkõtter, D. Nelson, K. 0'Donnell, T. Ouellet, W. Qi, H. Quenesville, M.I.G. Roncero, Kye-Yong Se- ong, I.V. Tetko, M. Urban, C. Waalwijk, T.J. Ward, Jiqiang Yao, B.W. Birren, H.C. Kistler, The Fusarium graminearum genome reveals a link between lo- calized polymorphism and pathogen specialization, Science 317, 1400, 2007). A redução de secreção das CDWE retarda o crescimento do fungo no hospedeiro e o estabelecimento da infecção (Gisele Eleonora Kikot, Roque Alberto Hours e Teresa Maria Alconada, Contribution of cell wall-degrading enzymes to pathogenesis of fusarium graminearum: a review, Journal of Basic Microbiology, 49, 231-241 , 2009).

O fungo Fusarium oxysporum f. sp. lycopersici, agente causador da murcha de Fusarium, uma doença extremamente frequente em todas as regiões onde há cultivo de tomate e é favorecida por temperaturas entre 21 e 33°C (sendo ótimo a 28°C). Produz macroconídios hialinos e microconídios hialinos, além de clamidósporos, estruturas de resistência, que permitem a sobrevivência do fungo no solo por mais de 10 anos (C. Kurozawa, M.A. Pa- van, Doenças do tomateiro, in: H. Kimati, L. Amorim, A. Bergami Filho, L. Camargo, J. Rezende, Manual de fitopatologia, ed. Ceres, 690-719, 1997). Este fungo invade sua planta hospedeira através das raízes e coloniza o sistema vascular. Vários estudos já foram conduzidos sobre as doenças causadas por este fungo que tem demonstrado a participação da PG no estabele- cimento das fitopatogenias. Um destes estudos foi realizado por Huertas- González e colaboradores sobre o patossistema tomate e Fusarium oxysporum, confirmando o uso de poligalacturonases, especialmente a endopoliga- lacturonase I (com os maiores níveis de expressão e secreção) na penetração e colonização da planta hospedeira (Roncero Ml, Di Pietro A, Ruiz- Roldán MC, Huertas-González MD, Garcia-Maceira Fl, Méglecz E, Jiménez A, Caracuel Z, Sancho-Zapatero R, Hera C, Gómez-Gómez E, Ruiz-Rubio M, González- Verdejo Cl, Páez MJ. Role of cell wall-degrading enzymes in pathogenicity of Fusarium oxysporum. Rev Iberoam Micol. 2000 Mar;17(1):S47-53).

O fungo Botrytis cine a (Botryotinia fuckeliana) causa o "mofo cinzento" em mais de 200 espécies de plantas, podendo causar danos em temperaturas menores que 2°C o que afeta vegetais estocados. A infecção se dá na sequência: penetração pela superfície do hospedeiro, formação de lesão primária por morte do tecido vegetal, expansão da lesão com maceração dos tecidos vegetais e esporulação. O fungo expressa poligalacturona- ses durante a infecção para penetração e para criar espaço para a coloniza- ção na lamela média (M. Choquer, E. Fournier, C. Kunz, C. Levis, J.M. Pra- dier, A. Simon, M. Viaud, Botrytus cinerea virulence factors: new insights into a necrotrophic and polyphageous pathogen, minireview, Federation of Euro- pean Microbiological Letters, 277, 1-10, 2007). No tomate, a PG fúngica precisa estar presente para que ocorra infecção plena, porém na sua ausência a infecção ainda pode ocorrer, contudo com expansão muito mais lenta, (Have A, Mulder W, Visser J, van Kan JA. The endopolygalacturonase gene Bcpgl is required for full virulence of Botrytis cinerea. Mol Plant Microbe Inte- ract. 1998 Oct;11 (10):1009-16).

O Colletotrichum lupini é agente causador da antracnose, doen- ça favorecida pelo clima quente e úmido típico dos trópicos afetando as agriculturas que crescem nesse ambiente, como as mangueiras e pupunheira, por exemplo. Nas regiões temperadas é mais conhecido como patógeno do lupino. Infecta as plantas em todos os estágios de desenvolvimento, causando necrose de seus tecidos. Também produz enzimas poligalacturonases que colaboram na penetração da parede celular (H.l. Nirenberg, U. Feiler, G. Hagedorn, Description of Colletotrichum lupini comb. nov. in modern terms, Mycologia, 94(2), 307-320, 2002). O Cryphonectria parasitica afeta principalmente as castanheiras estando presente na maior parte dos países europeus, asiáticos, EUA e Canadá. Atinge os hospedeiros por meio do vento e da chuva e também é transmitido por besouros e pássaros. Causa gangrenas no caule e ferrugem nas castanhas, evidenciadas por alteração da coloração. Entre 1904 e 1950, esse fungo quase dizimou as castanheiras dos EUA. É considerado pelos European and Medierranean Plant Protection Organization (EPPO), North American Plant Protection Organization (NAPPO) e Interafrican Phytosanitary Council (IAPSC) como organismo de quarentena (EPPO quarantine pest, Cryphonectria parasitica, Datasheets on Quarantine Pests, www.eppo.org/QUARANTINE/fungi/Cryphonectria_parasitica/ENDOP A_ds. p df ).

O fitopatógeno Sclerotinia sclerotiorum, também conhecido por mofo branco, é o causador da doença "podridão branca", que acomete mui- tas espécies de plantas de interesse agrícola. Dentre as principais enzimas produzidas na ocasião da infecção da planta, para transpassar a barreira da parede celular está a endopoligalacturonase (K. Mendgen, M. Hahn e H. Deising, Morphogenesis and echanisms of Penetration by plant pathogenic fungi, Annul Reviews on Phytopathology, 34, 367-386, 1996).

O Aspergillus niger tem principal aplicação na indústria de alimentos e bebidas utilizando-se da ação de suas pectinases, endo e exopoli- galacturonases, metil e acetilesterases, pectinases e pectatoliases, ramno- galacturonases e liases. Bussink e colaboradores demonstraram em quatro estudos a presença de sete diferentes genes para poligalacturonases no Aspergillus niger N400, o que leva a crer que essas enzimas têm grande demanda e são de grande importância no processo de quebra da parede celular vegetal (Bussink, Kester e Visser, Molecular clonning, nucleotide se- quence and expression of the gene eonconding pre-pro-polygalacturonase II of Aspergillus niger, FEBS Lett. 273, 127-130, 1990; Bussink, Brouwer, de Graaf, Kester e Visser, Identification and characterization of a second polyga- lacturonase gene of Aspergillu niger, Curr. Genet., 20, 301-307, 1991 ; Bussink, van den Homberg, van den Ijssel e Visser, Characterization of polygalacturonase-overprocing Aspergillus niger transformants, Appl. Microbiol. Biotechnol. 37, 324-329; Bussink, Buxton, Fraaye, de Graaf e Visser, The polygalacturonases of Aspergillus niger are encoded by a family of diverged genes, eur. J. Biochem. 208, 83-90). Outros estudos conduzidos demonstraram que a PG foi requerida para a completa virulência de Aspergillus flavus nas infecções no algodão (Shieh MT, Brown RL, Whitehead MP, Cary JW, Cotty PJ, Cleveland TE, Dean RA. Molecular genetic evidence for the involvement of a specific polygalacturonase, P2c, in the invasion and spread of Aspergillus flavus in cotton bolls. Appl EnvironMicrobiol 1997; 63:3548-3552).

Com o intuito de se combater as fitopatogenias causadas pelos fungos, principalmente os supracitados, através do desenvolvimento e produção de estruturas com potenciais para inibição dessas enzimas, ao longo do trabalho foram utilizadas técnicas computacionais para desenho de com- postos ("computer-aided drug design" - CADD), através do desenho computacional de fármacos baseado na estrutura do ligante ("Ligand-Based Drug Design"-LBDD), sendo o ligante o Ácido Galacturônico. Avanços importantes na produção de fármacos já foram obtidos por meio de abordagens computacionais. O CADD pode predizer resultados experimentais com razoável precisão em tempo reduzido se comparado com os métodos mais clássicos. Métodos de CADD já são amplamente utilizados pela indústria farmacêutica com a finalidade de identificar novos compostos ou aperfeiçoar compostos já existentes que apresentam atividade contra um alvo biológico. Através de simulações de docking, que propõem predizer as interações proteína-ligante de interesse levando em consideração parâmetros físico-químicos que interferem na ligação (D.B. Kitchen, H. Decornez, J.R. Furr, J. Bajorath, Docking and scoring in virtual screening for drug discovery: methods and applications, Nature Reviews - Drug Discovery, 3, 935-949, 2004) é possível identificar compostos que potencialmente servirão como ligantes na proteína alvo.

O documento WO2001097098 descreve um método para obtenção de moléculas com potencial inibitório a partir de bancos de dados contendo as estruturas dos compostos químicos (PubChem), potenciais efetores da função das enzimas cuja atividade deve ser alterada, inibição ou potenci- alização, utilizando docking para selecionar entre as moléculas encontradas no PubChem, baseando-se em scores fornecidos pelos programas, tais como GOLD, que simulam o atracamento do ligante em sitio de ligação - alvo escolhido.

O documento RPI 2036 descreve o desenvolvimento de herbicidas contra uma enzima específica através da técnica de docking seguido de modificação molecular dos ligantes selecionados com melhores scores, considerando propriedades esféricas e eletrostáticas na interação ligante- proteína. Por fim, os resultados de docking foram corroborados pelos resultados experimentais.

O documento US2002/01509061 refere-se à utilização de método computacional para determinar homologia entre proteínas através de alinhamento de estruturas primárias entre pelo menos duas proteínas e deter- minação da estrutura terciária de uma delas a partir do alinhamento com a sequência de uma proteína molde com estrutura tridimensional já resolvida utilizando o programa MODELLER.

O documento US7383135 refere-se ao desenvolvimento de inibidores que agem em uma determinada região conservada entre as proteí- nas de uma família de quinases. O trabalho utiliza uma isoforma com estrutura tridimensional resolvida como molde para resolver a estrutura tridimensional de proteínas homólogas e para o desenho de compostos com potencial para se ligarem à isoforma ou aos homólogos.

Na presente patente, foi selecionada a estrutura tridimensional da enzima Endopoligalacturonase do fungo Fusarium moniliforme como alvo terapêutico para o desenho de novos compostos que atuariam como inibidores (código PDB: 1 HG8, cadeia A). Esta estrutura, publicada no Protein Data Bank foi resolvida através de cristalografia e difração de raios X, com resolução de 1 ,73 Â por Federici et al, 2001 (L. Federici, C. Caprari, B. Mattei, C. Savino, A. di Mateo, G. De Lorenzo, F. Cervone, D. Tsemoglou, Structural requirements of endopolygalacturonase for the interaction with PGIP, PNAS, 98(23), 13425-13430, 2001). A numeração dos aminoácidos adotada é a mesma usada pelos autores da estrutura de código 1 HG8. Foi escolhida a PG do F moniliforme (FmPG) por ser o único do género Fusarium com estrutura tridimensional resolvida além de apresentar identidade e similaridade maiores que 90% na análise do BLASTp (SF Altschul, TL Madden, AA Schãffer, Z Zhang, W Miller, DJ Lipman. 1997. Gapped BLAST and PSI- BLAST: a new generation of protein database search programs. Nucleic Acid Res. 1997 Sep 1 ;25(17):3389-402) com vários fungos do mesmo género e maiores que 66% para identidade e 78% para similaridade com a PG3 de Botrytionia fuckeliana (Botrytis cinerea) e Sclerotium sclerotiorum. Algumas PGs fúngicas são mais similares à outra enzima com estrutura resolvida e depositada no PDB, a PG de Colletotrichum lupini (CIPG), portanto esta foi usada como molde, "template", para a modelagem por homologia destas PGs.

O desafio do presente trabalho não reside apenas em produzir moléculas com potencial inibitório das Endopoligalacturonases de fungos fitopatogenos, mas também em produzir compostos de baixo risco para a população exposta e para o meio ambiente. Isso se deve principalmente à semelhança dos fungos com os tecidos de plantas e animais, também euca- riotos. Por essa razão, sempre foi bastante difícil o tratamento contra infec- ções causadas por fungos tanto no ambiente agrícola como na saúde humana e animal, já que os medicamentos geralmente empregados causam vários efeitos colaterais indesejáveis de grau moderado a grave. Portanto, é difícil realizar um controle eficaz destes fungos fitopatogenos para que estes não representem grande prejuízo para a agricultura e animais, incluindo o homem. Dessa forma, é proposto o desenho de novos compostos que atua- riam como inibidores da enzima Endopoligalacturonase destes fungos, descrita como essencial para o estabelecimento de suas patogenias e basean- do-se no fato de que experimentos que demonstraram a inibição desta enzima, ou deleção ou mutação para formas não ativas, indicaram expressiva redução na capacidade patogênica destes fungos. A presente patente apresenta uma solução na busca por novas possibilidades de transformar este conhecimento em inovação e em um produto por consequência. SUMÁRIO DA INVENÇÃO

A invenção refere-se ao desenho computacional de novos compostos com potencial inibitório para enzimas Endopoligalacturonases (PG) de fungos fitopatogênicos com o intuito de evitar ou diminuir a colonização desses microrganismos nos tecidos vegetais. A PG integra um grupo de enzimas secretadas por microrganismos fitopatogênicos durante o processo de invasão dos tecidos vegetais, participando na catálise da hidrólise da pectina, o que culmina na desestrutu ração do arcabouço da parede celular, o que favorece a invasão de hifas dos fungos. Uma gama de microrganismos fito- patogênicos utiliza essas enzimas como fatores de patogenicidade que levam a doenças em uma grande variedade de plantas de interesse económico como o trigo, a cevada, o tomate, o morango, a manga, o arroz, a cana- de-açúcar, dentre outros. Com o objetivo de minimizar as perdas causadas por estes patógenos, são desenhadas pequenas moléculas planejadas para se ligarem com alta afinidade aos resíduos do sítio de ligação ao substrato.

Assim sendo, o presente trabalho consistiu no desenho computacional de novos compostos com base em metodologias de "Ligand-Based Drug Design", onde o ligante natural (o substrato Galacturonato) é utilizado como referência para o desenho de compostos similares para atuação como inibidor competitivo das PGs. Além disso, metodologias de "Structure-Based Drug Design" são utilizadas, nas quais as interações das moléculas desenhadas com a proteína em sua região alvo são avaliadas por meio de doc- king e novos compostos são desenhados a partir destes resultados com o intuito de otimizar a ligação com os resíduos conservados do sítio catalítico. Estruturas similares ao ligante natural também são utilizadas para rodadas de docking. Adicionalmente, a estrutura de PGs de outros fungos é analisada para verificar se estruturalmente, a região-alvo é conservada.

BREVE DESCRIÇÃO DAS FIGURAS

Figura 1. Alinhamento das estruturas primárias das enzimas po- ligalacturonases usadas neste trabalho. As sequências de fungos usadas neste alinhamento (com fundo cinza), com seus respectivos identificadores do NCBI GenPept e códigos, foram: PG de Fusarium moniliforme, 17942538, FmPGA; hipotética proteína de Fusaríum graminearum, 46138993, FgPG; de Aspergillus niger, 39654258, AnPGAI e 6435555, AnPGA2; de Fusaríum oxysporum f. sp. lycopersici, 3348099, FoPG; Cryphonectria parasitica, 1208810, CpPGA; de Cochliobolus carbonum, 167221 , CcPG; de Sclerotinia sclerotiorum, 156044128, SsPG; de Botrytis cinerea (Botrytinia fuckeliana), 125629516, BfPG1 ; de Aspergillus flavus, 238490452, AfPG; de Stereum purpureum, 21465803, SpPG1 ; de Colletotridhum lupini, 159794838, CIPGA; e de Aspergillus aculeatus, 15988279, AaPGA. Além das sequências fúngicas, sequências de PGs de plantas (com fundo em branco) foram usadas com o intuito de verificar a conservação dos resíduos mais importantes envolvidos na catálise e a existência de outros resíduos que sejam exclusivos de PGs fúngicas e estejam espacialmente próximos ao sítio catalítico/ligante, o que poderia indicar a existência de alvos adicionais e preferenciais, pois um composto que se ligue fortemente a um resíduo específico de fungos provavelmente não causará efeitos quanto à ligação na PG de planta. As PGs vegetais usadas foram: de Arabidopsis thaliana, 15230328, AtPG_Plant; de Brassica rubra, 21530799, BrPG_Plant e de Solanum lycopersicum, 7381227, SIPG_Plant. Nota-se que os resíduos N189, D191 , D212, D213, H234.G235, R267, K269 e T302 apresentam-se bem conservados. Os resí- duos mais importantes na ligação ao substrato, altamente conservados dentre as diversas espécies de fungos fitopatogênicos e plantas estão destacados em barras longas em cinzas claro e escuro, sendo os cinza escuro a tríade catalítica composta pelos Aspartatos 191 , 212 e 213. Os resíduos destacados por barras transparentes com contorno preto (H188, D 194 e G305) são os resíduos considerados "alvos-preferenciais", uma vez que estão próximos aos resíduos catalíticos e de ligação ao substrato, porém possuem ocorrência restrita às PGs de fungos fitopatogênicos, não existindo em PGs de plantas.

Figuras 2 A e B. Alinhamento da estrutura da enzima do F. mo- niliforme (1 HG8) (em cinza) as enzimas dos fungos (em preto) Stereum purpureum ( K5C, figura 2a) e Colletotrichum lupini (2IQ7, figura 2b) obtidas do Protein Data Bank. Os alinhamentos foram feitos com o programa PyMol, também usado para gerar as imagens moleculares (W.L Delano, The PyMol molecular graphics system Delano Scientific, San Carlos, CA, USA, http://www.pymol.com.org) e TM-align, usado também para fornecer dados de RMSD e TM-score sobre a qualidade dos alinhamentos (Yang Zhang, J. Skolnick, TM-align: a protein structure alignment algorithm based on th TM- score, Nucleic Acid Research, 33(7): 2302-2309, 2005). Nas estruturas foram selecionados os resíduos H234, K244, R267, K269 e Y302 para mostrar a posição de cada um nas enzimas (cada resíduo está da mesma cor de sua enzima correspondente). O alinhamento demonstra alta similaridade estrutu- ral no que diz respeito às posições dos resíduos do sítio ligante, o que está de acordo com os resultados mostrados na tabela 6 (TM-Scores próximos de 1 e baixos RMSDs).

Figura 3. Alinhamento da estrutura terciária das enzimas FmPG (1 HG8.pdb) e SpPG (I KCD.pdb) feito no PyMol e importado pelo MVD para geração de imagem. Figura 3 A) apresenta em destaque o resíduo de mono- galacturonato posicionado no sitio catalítico (D191 , D213 e D213 aparecem como traços finos) e dos resíduos que fazem parte do sitio ligante (H234, R267 e K269, não mostrados na figura), estes últimos adotados como alvos para inibição. O monogalacturonato da SpPG (I KCD.pdb) é resultante da clivagem de oligogalacturonato (em preto) co-cristalizado com a enzima. Na FmPG (1 HG8.pdb), as moléculas de tri e mono galacturonato foram introduzidas na estrutura por docking (mostrado em cinza claro) e observa-se que os resíduos encontram-se em posição muito similar em ambas as enzimas. Essa constatação valida a técnica de docking para os resíduos de aminoáci- dos da região em que se encontram os monogalacturonatos.

Figura 4. Representação estrutural das moléculas desenhadas computacionalmente que obtiveram melhores resultados nos dockings com 1 HG8 e 2IQ7 (tabelas 6 e 7) e que provavelmente possuirão caráter inibitório para as PGs.

Figura 5. Ligante dh321 posicionado no sítio alvo da 1 HG8.pdb.

A figura, em escala de cinza, representa as regiões catalítica e ligante da enzima FmPG (1 HG8.pdb). Esse é o ligante que apresentou melhor resulta- do de interação entre os resíduos específicos de PGs fúngicas: D194, H188 e G305, tanto na 1 HG8 quanto na 2IQ7 (tabelas 6 e 7). Possui grupos químicos que conferem polaridades diferentes para cada extremidade da estrutura desta molécula o que o faz encaixar na região do sítio ligante e do cata- lítico através de complementaridade eletrostática. A região catalítica é predominantemente negativa e na imagem aparece como cinza de tonalidade média; a região ligante, majoritariamente positiva, aparece na imagem como o cinza de tonalidade mais escura; as regiões em cinza claro são apoiares.

Figura 6. Ligante 602 posicionado no sítio alvo da 1 HG8. Esse é o ligante que apresentou melhores resultados de interação com os resíduos conservados do sítio de ligação ao substrato: H234, R267, K 269 e Y302, apresentando energias bastante negativas com esses resíduos tanto no docking com a 1 HG8 quanto com a 2IQ7 (tabelas 6 e 7). Esse ligante também se destacou na análise de ADMET (tabela 8), apresentando bons valo- res de cLogP, solubilidade, Druglikeness, Drug-score e, principalmente, ausência de risco de efeito tóxico.

DESCRIÇÃO DETALHADA DA INVENÇÃO

A presente invenção refere-se a um método para desenhar com- putacionalmente novos compostos com potencial função inibitória da enzima endopoligalacturonase produzida por fungos fitopatgênicos e envolvida em processos de invasão destes fungos em células vegetais. Um enfoque especial é dado às enzimas de fungos patogênicos de solo envolvidos em uma série de fitopatogenias e responsáveis por amplo espectro de prejuízos à Agricultura.

O método proposto consiste das seguintes etapas:

1- Obter arquivos de coordenadas referentes às estruturas tridimensionais (a partir do banco PDB) da estrutura da PG do F. moniliforme e das PGs de outros fungos mencionados.

2- Fazer busca por sequências homólogas (que também possu- am estrutura depositada no PDB) às estruturas primárias das enzimas dos organismos de interesse usando o BLASTp contra o banco de dados de sequências primárias do PDB. O BLAST fornece os dados referentes às carac- terísticas do alinhamento de sequência primária, como: identidades (porcentagem de aminoácidos idênticos em posições correspondentes), positivos (são o número aminoácidos idênticos somado ao número de aminoácidos não são idênticos entre duas sequências numa determinada posição, mas que possuem propriedades similares, considerado como um "Positivo" por indicar substituições nas quais a matriz BLOSUM-62 pontua positivamente segundo Altshul e colaboradores (1997). Os gaps indicam o número de regiões que representam lacunas no alinhamento (seja devido a inserções e de- leções no histórico evolutivo dos genes) e, por último, a coluna e-value (Ex- pect Value) representa um parâmetro estatístico do programa BLAST que indica o número de diferentes alinhamentos que ocorreriam em um banco de dados por mero acaso com Score equivalentes ou melhores que o obtido para um determinado alinhamento. Quanto menor o e-value, mais significante é o score obtido no alinhamento em questão (S.F. Altschul, T.L. Madden, A.A. Schãffer, Z. Zhang, W. Miller, D.J. Lipman, Gapped BLAST and PSI- BLAST: a new generation of protein database search programs, Nucleic Acid Res, 25(17):3389-3402, 1997) para análise de homologia e com o programa ClustalW (M.A Larkin, G. Blackshields, N.P. Brown, R. Chenna, PA. McGet- tingan, H. McWillian, F. Valentin, I.M. Wallace, A. Wilm, R. Lopez, J.D. Thompson, T.J. Gibson, D.G. Higgins, Clustal W and Clustal X version 2.0, Bioinformatics, 23, 2947-2948, 2007).

3- Predizer modelos de estruturas tridimensionais das PGs que não possuírem estrutura depositada nos bancos públicos utilizando as sequências primárias das enzimas dos organismos de interesse e como molde (template) as estruturas cujas sequências primárias são homólogas à sequência de interesse e foram identificadas usando o BLASTp (como descrito no item 2). Programas como o Swiss-MODEL (Guex, N. e Peitsch, M. C. SWISS-MODEL and the Swiss-Pdb-Viewer: An environment for comparative protein modelling. Electrophoresis 18:2714-2723, 1997.) e o programa MODELLER 9v8 (N. Eswar, M.A. Marti-Renom, B. Webb, M.S. Madhusudhan, D. Eramian, M. Shen, U. Pieper, A. Sali, Comparative protein structure modeling with MODELLER, Current Protocols in Bioinformatics, John Wiley & Sons, Inc. Supp 15, 5.6.1-5.6.30, 2006) podem ser usados para a modelagem das proteínas de interesse. A finalidade dos modelos seria de comparar as posições dos aminoácidos de interesse nas estruturas terciárias. A partir do alinhamento entre a sequência a ser modelada e uma estru- tura conhecida similar a ela em termos de sequência primaria, o programa gera um modelo tridimensional (num procedimento de modelagem por ho- mologia).

4- Em seguida, usando o programa Deep-View, realiza-se a edição das estruturas otimizando a numeração de resíduos na sequência pri- maria, dentre outras ações (Guex, N. e Peitsch, M. C. SWISS-MODEL and the Swiss-Pdb-Viewer: An environment for comparative protein modelling. Electrophoresis 18:2714-2723, 1997). Adicionalmente, utiliza-se o GRO- MACS para minimizar energia dos modelos gerados. Com a minimização de energia os aminoácidos dos modelos adotam conformações mais favoráveis energeticamente, o que torna o modelo mais próximo de uma conformação real (D. Van Der Spoel, E. Lindhal, B. Hess, G. Groenhof, A.E. Mark, H.J Be- rendsen, GROMACS: fast, flexible, and free, J Comput Chem, 26(16), 1701- 18, 2005). As estruturas terciárias são visualizadas através do PyMol para análise da sobreposição das estruturas terciárias (W.L Delano, The PyMol molecular graphics system Delano Scientific, San Carlos, CA, USA, http://www.pymol.com.org), a avaliação da qualidade dos modelos gerados é feita pela análise de gráficos Ramachandran, que fornece o percentual de aminoácidos que possuem ângulos de torção aceitáveis (ψ e φ). Os dados de cada aminoácido são distribuídos em um gráfico subdividido em regiões. Isso é importante na análise dos modelos uma vez que durante a modelagem alguns aminoácidos podem adotar conformações teoricamente não permitidas (Ramachandran, G. N., Ramarkrishnan, C, Sasisekharan, V. Ste- reochemistry of polypeptide chain conformations. J. Mol Biol 7:95-99, 1963). Os dados do Ramachandran são gerados através do Java Protein Dossier da plataforma STING (Neshich, G., Togawa, R., Mancini, A. L, Kuser, P. R., Yamagishi, M. E. B., Pappas Jr., G., Torres, W. V., Campos, T R, Ferreira, L. L, Luna, R M., Oliveira, A. G., Miura, R. T, Inoue, M. K., Horita, L. G., de Souza, D. R, Dominiquini, R, Álvaro, A., Lima, C. S., Ogawa, R O., Gomes, B. G., Palandrani, J. C. R, dos Santos, G. R, de Freitas, E. M., Mattiuz, A. R., Costa, I. C, de Almeida, C. L, Souza, S., Baudet, C. and Higa, R. H. STING Millennium: a Web based suite of programs for comprehensive and simulta- neous analysis of protein structure and sêquence. Nucleic Acids Research, 31 :13, 3386-3392, 2003). Os modelos são analisados em relação a erros na estrutura tridimensional pelo ProSa-web, que calcula um valor (z-score) referente à qualidade geral de uma estrutura específica comparado com os valores de todas as cadeias de proteínas experimentalmente determinadas e depositadas no PDB (M. Wiederstein, MJ. Sippl, ProSa-web: interactive web service for the recognition of errors in three-dimensional structures of prote- ins, Nucleic acids Research, 35, 407-410, 2007).

5- Alinhar a FmPG (1 HG8.pdb) às estruturas depositadas no PDB com o TM-align para análise da sobreposição das estruturas terciárias e para analisar os desvios (RMSD - root-mean-square deviation) e TM- score. O RMSD fornece em A a média quadrática das distâncias entre pares de resíduos correspondentes, depois da sobreposição de uma estrutura sobre a outra. O TM-score utiliza o fator de Levitt-Gerstein que considera os pares de resíduos em menores distâncias como mais relevantes do que a- queles a maiores distâncias e também é mais sensível à topologia geral do que a variações estruturais localizadas. O TM-score é normalizado de forma a não ser dependente do tamanho da proteína, seu valor pode ir de 0.0 a 1.0, sendo valores maiores que 0.17 indicativos de similaridade estrutural elevada (Yang Zhang, J. Skolnick, TM-align: a protein structure alignment algorithm based on th TM-score, Nucleic Acid Research, 33(7): 2302-2309, 2005).

6- Fazer alinhamentos entre a estrutura primária de proteínas homólogas à proteína de interesse através do programa ClustalW 2.0 (Lar- kin, M. A., Blackshields, G., Brown, N. P, Chenna, R., McGettigan, P. A., McWillian, H., Valentin, F, Wallace, I. M., Wilm, A., Lopez, R., Thompson, J., D., Gibson, T J., Higgins, D. G. 2007. Clustal W and Clustal X version 2.0. Bioinformatics, 23, 2947-2948) e incluir proteínas de outros organismos, evi- denciando as similaridades e diferenças entre estes dois conjuntos de proteínas e buscando as correspondências no alinhamento de estrutura primária dos resíduos importantes. Seguindo certos critérios como: presença exclusivamente nas sequências de fungos fitopatogênicos, escolher os alvos tera- pêuticos preferenciais.

7- Buscar estruturas de compostos no PubChem (http://pubchem.ncbi.nlm.nih.gov/) por similaridade maior que 90% com o ligante natural (galacturonato) e proceder simulações de docking empregando o programa Molegro Virtual Docker (MVD). O docking consiste na predi- ção da orientação de uma molécula em relação a uma segunda quando elas se ligam para formar um complexo ligante-proteína. Há vários programas que realizam docking molecular, tais como DOCK, AUTODOCK, GOLD, FLEXX, ZDOCK, M-ZDOCK, MS-DOCK, Surflex, MCDOCK, MolDock, GemDock, entre outros. Os métodos usados por cada programa diferem ba- sicamente na busca pela conformação que melhor se liga a proteína. Há três principais tipos: Estocástico e Sistemático, por Dinâmica Molecular e Algoritmos Genéticos/Evolucionários. O método de busca Estocástica e Sistemática por ligantes é bastante empregado e variado. O programa DOCK, por exemplo, utiliza um método baseado em conformações randômicas; FLEXX é baseado no espaço conformacional do sítio ativo. O método por Dinâmica Molecular, utilizado pelo AUTODOCK, calcula as várias conformações que a proteína alvo pode adotar durante a interação com o ligante. O MVD utiliza o algoritmo MolDcok que é baseado em Algoritmo Evolucionário (uma variedade de Método Estocástico e Sistemático) para simular as interações ligante- proteína. Os algoritmos evolucionários podem ser definidos como um grupo de aproximações computacionais baseadas nos conceitos da Teoria da Evolução de Darwin. O MolDock é uma implementação do algoritmo evolucionário focado em simulações de docking molecular, onde aproximações computacionais de um processo evolutivo são aplicadas para simular a permanên- cia das características mais favoráveis (Thomsen R, Christensen MH.: MolDock: a new technique for high-accuracy molecular docking. J Med Chem. 2006 Jun 1 ;49(11):3315-21.;W.F. De Azevedo Jr, MolDock applied to struc- ture-based virtual screening, Current Drug Targets, 11 (3):327-334, 2010). Trabalhos que comparam os programas mais utilizados indicam que programas baseados em algoritmo evolucionário tais como GemDock e Mol- Dock apresentam melhor performance geral do que Flexx, GOLD e Surflex (R. Thomsen, M.H. Christensen, MolDock: a new technique for high-accuracy molecular docking, J Med Chem, 49, 3315-21 , 2006; J.M. Yang, C.C. Chen, GemDock: a generic evolutionary method for molecular docking, Proteins, 55, 288-304, 2004). Neste trabalho, os dockings foram feitos entre os ligan- tes obtidos no PubChem e a enzima do F. moniliforme para seleção de es- truturas com melhor afinidade com os resíduos do sítio alvo principalmente em relação aos aminoácidos conservados.

8- Uma análise detalhada do nano-ambiente do sitio alvo é realizada usando-se o programa STING Java Protein Dossier (Neshich G., Roc- chia W., Mancini A.L., Yamagishi M.E., Kuser P.R., Fileto R., Baudet C, Pinto I.P., Montagner A.J., Palandrani J.F., Krauchenco J.N., Torres R.C., Souza S-, Togawa R.C., Higa R.H. 2004. JavaProtein Dossier: a novel web-based data visualization tool for comprehensive analysis of protein structure. Nucle- ic Acids Res. Jul 1 ; 32 (Web Server issue):W595-601 , 2004) e a ferramenta "select". Desta forma, são determinados conjuntos de parâmetros físico- químicos e estruturais que descrevem o nano-ambiente que é composto pelos resíduos que compõem o sítio-alvo, no qual se espera que os ligantes atraquem. Estes conjuntos são usados não apenas para identificação nas estruturas estudadas, como também para melhor compreender o ambiente para qual o inibidor seria construído, tendo a eficácia necessária para sua aplicação final. Portando estes parâmetros indicam as características físico- químicas do alvo terapêutico para o adequado desenho computacional e modificação dos novos compostos.

9- As estruturas selecionadas no item "7" são modificadas racionalmente, de acordo com as características físico-químicas e estruturais en- contradas no item "8" (por exemplo, se o potencial eletrostático local é alto, adicionam-se os átomos adequados para diminuir este potencial no composto inicial), a fim de aumentar os valores de afinidade de ligação. As altera- ções nos compostos são feitas computacionalmente através do programa ChemBioDraw, no qual também são feitas minimização de energia e dinâmica das estruturas de ligantes desenhadas (Zhenjiang Li, Honggui Wan, Yuhu Shi, Pingkai Ouyang, Personal experience with four kinds of chemical struc- ture drawing software: review on ChemDraw, ChemWindows, ISIS/Draw, and ChemSketch, J. Chem. Inf. Comput. Sei., 44, 1886-1890, 2004). Além da busca por ligantes baseados na estrutura de galacturonatos no PubChem, também é realizada busca por ligantes baseados na forma da cavidade criada pelo MVD na região dos resíduos de interesse. Os demais passos de docking e modificações estruturais também são aplicados a esses ligantes.

10- Realizar predição de parâmetros moleculares que interferem na Absorção, Distribuição, Metabolismo, Excreção e Toxicidade utilizando a ferrametna online Osíris Property Explorer (Thomas Sander, Actelion Phar- maceuticals Ltd., http://www.organic-chemistry.org/prog/peo/) para orientar no desenho dos compostos. O programa Osiris fornece dados de risco de toxicidade: mutageninicade, tumorogenicidade, irritante e com efeito reprodutivo, baseados em fragmentos de moléculas conhecidas depositados no banco de dados RTECS. Também prediz valores de cLogP, solubilidade em água, peso molecular e fornece o Drug-score que é um valor geral resultante da combinação de todos os parâmetros anteriores mais o Druglikeness, que compara fragmentos do composto desenhado com base de dados de compostos comercializados e com base de dados de compostos que não servem como fármacos (Fluka).

EXEMPLO

A invenção será agora descrita em maiores detalhes por meio do exemplo a seguir, o qual não deve ser interpretado como limitativo do escopo da invenção.

Foram obtidos os arquivos de coordenadas referentes às estruturas tridimensionais existentes de fungos fitopatogênicos através do Protein Data Bank (http://www.pdb.org). As PGs fúngicas, cujas estruturas tridimensionais estão resolvidas e depositadas no PDB, são: Fusarium moniliforme (1 HG8), Aspergillus aculeatus (1AI5), Aspergillus niger (1 NHC, PG1 ; 1 CZF, PG2), Colletotrichum lupini (2IQ7) e Stereum purpureum (1 K5C; 1 KCD - PG em complexo com dois resíduos de galacturonato). Como o trabalho tem como alvo principal o estudo de PGs do género Fusarium para o desenvolvimento de drogas, foi executado o programa BLASTp usando como query a sequência da PG de F. moniliforme (FmPG) contra a database NR do NCBI filtrada para proteínas de outros fungos Ascomicetos. Foram evidenciados altos valores de identidade e similaridade, ambos acima de 90%, para a maioria das sequências de Fusarium obtidas como "hits" no BLASTp (Tabela 1), o que sugere alta conservação entre estas PGs. No entanto, foi obser- vado que sequências de PGs de alguns dos fungos discutidos anteriormente exibem valores de identidades baixos em relação à PG de Fusarium moniliforme e que estas sequências eram mais similares à PG de Colletotríchum lupini (CIPG). Os resultados de BLAST usando-se como query a CIPG contra o NR filtrado para Ascomicetos demonstram que os alinhamentos da CIPG com PGs de fungos como Gibberella zeae, Aspergillus niger, Fusarium oxysporum f. sp. lycopersici, Cryphonectria parasitica, Cochliobolus carbo- num, Sclerotinia sclerotiorum e Botrytis cinerea possuem maiores valores de identidade e positivos em relação ao alinhamento destes com a FmPG (Tabela 2). Foi também feito o BLASTp com enzimas de plantas (Tabela 3) cu- jos alinhamentos com as sequências "queries" FmPG (1 HG8_A) e CIPG (2iq7_A) apresentaram valores de similaridade e identidade menores. Além disso, não foi encontrada nenhuma estrutura disponível no PDB de poliga- lacturonase vegetal.

Tabela 1 : Resultados obtidos com o BLASTp entre a FmPG (1 HG8) e se- quências do banco NR do NCBI (www.ncbi.nlm.nih.gov), sendo reportados os hits obtidos contra Gibberella e outros Fusarium. São fornecidos os dados referentes às características do alinhamento de sequência primária realizado pelo BLAST, como: identidades (porcentagem de aminoácidos idênticos em posições correspondentes), positivos (são o número aminoácidos idênticos somado ao número de aminoácidos não idênticos entre duas sequências numa determinada posição, mas que possuem propriedades similares, considerado como um "Positivo" por indicar substituições nas quais a matriz BLOSUM-62 pontua positivamente segundo Altshul e colaboradores 1997; SF Altschul, TL Madden, AA Schãffer, Z Zhang, W Miller, DJ Lipman. 1997; Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acid Res. 1997 Sep 1 ;25(17):3389-402), a coluna gaps indica o número de regiões que representam lacunas no alinhamento (seja devido a inserções e deleções no histórico evolutivo dos genes) e, por último, a coluna e-value (Expect Value) que representa um parâmetro estatístico do programa BLAST que indica o número de diferentes alinhamentos que ocorreriam em um banco de dados por mero acaso com Score equiva- lentes ou melhores que o obtido para um determinado alinhamento. Quanto menor o e-value, mais significante é o score obtido no alinhamento em questão.

Tabela 2: Resultados de BLASTp contra o banco de sequências protéicas NR do NCBI usando-se como sequência de busca ("query sequen- ce") a sequência da PG de Colletotríchum lupini (CIPGA, PDB 2IQ7_A). São mostrados os resultados "hits" encontrados para as sequências de PGs dos fungos de importância económica descritos na seção "Estado da Técnica", sendo que alguns estão anotados com códigos PDB, o que indica que sua estrutura já foi resolvida. A descrição das colunas segue o padrão da tabela 1.

'

Tabela 3: Resultados obtidos com o programa BLASTp usando- se como sequência de busca a estrutura primária da FmPG (1 HG8.pdb) e da CIPGA (2IQ7.pdb) contra o banco de sequências protéicas NR do NCBI filtrado para sequências de Viridiplantae (taxid 33090).

Sabendo-se da importância destes fungos patogênicos na pro- dução agrícola e pensando-se no desenho de um fármaco de alta abrangência, foi feito um alinhamento de sequência primária usando o programa Clus- talW (Larkin, M. A., Blackshields, G., Brown, N. R, Chenna, R., McGettigan, P. A., McWillian, H., Valentin, F., Wallace, I. ., Wilm, A., Lopez, R., Thompson, J., D., Gibson, T. J., Higgins, D. G. Clustal W and Clustal X version 2.0. Bioinformatics, 23, 2947-2948, 2007) incluindo todos os fungos patogênicos citados anteriormente e este está mostrado na figura 1. Nesta figura também estão alinhadas três sequências de PGs vegetais (de Arabidopsis thaliana, Ricinus comunis e Brassica rubra) com o intuito de compará-las com sequências de PGs fúngicas e buscar por aminoácidos que sejam específicos de fungos em relação às plantas e que estejam envolvidos na ligação com o substrato estando próximos espacialmente a eles. Isso remete à discussão sobre como identificar um ideal alvo terapêutico para o desenho computacional de novos compostos. Anderson (2003) publicou uma descrição de como deve ser realizado o procedimento de desenho computacional de fár- maços baseado em estruturas protéicas, desde os critérios que devem ser adotados para a escolha do alvo terapêutico para tal desenho até os processos de desenvolvimento, docking e virtual screening (AC Anderson. The pro- cess of structure-based drug design. Chem Biol. Sep;10(9):787-97, 2003). O trabalho discute que o desenho de drogas antimicrobianas deve se basear em alvos que sejam essenciais, principalmente encontrados nos patógenos (em relação a organismos não-patogênicos, e ao hospedeiro), tenham uma função única no patógeno e que sejam passíveis de sofrerem inibição por pequenas moléculas. Pensando nisso, o alvo considerado, a proteína PG, é essencial para a patogenicidade destes fungos, é passível de inibição, já demonstrada praticamente através de estudos com a PGIP, e, sugerimos a seguir resíduos a serem usados como alvos preferenciais por existirem especificamente em PGs de fungos e ausentes nas de plantas.

Analisando-se o alinhamento e características estruturais de resíduos próximos aos envolvidos na catálise e ligação ao substrato, pode-se perceber a existência de três aminoácidos importantes, presentes exclusivamente nas PGs de fungos e, portanto, ausentes nas PGs vegetais: His188, Asp194 e G305. A estrutura da SpPG1 depositada no PDB (1 KCD) possui, co-cristalizada dois resíduos de ácido galacturônico e, através de visualização no programa Java Protein Dossier da plataforma STING (Ne- shich G., Rocchia W., Mancini A.L., Yamagishi M.E., Kuser PR., Fileto R., Baudet C, Pinto I.P., Montagner A.J., Palandrani J.F., Krauchenco J.N., Torres R.C., Souza S., Togawa R.C., Higa R.H. JavaProtein Dossier: a novel web-based data visualization tool for comprehensive analysis of protein s- tructure. Nucleic Acids Res. 2004 Jul 1 ;32 (Web Server issue):W595-601 , 2004), foi possível extrair informações de que aminoácidos estão interagindo por meio de contatos com estes resíduos glicídicos. Estes são os resíduos do sítio ativo Asp212, Asp213 e Asp191 , e sítio ligante: Asn189, His234, Gly239, Ser 240, Arg267, Lys269 e Tyr302 que, como exposto por Markovic e Janecek (2001), estão altamente conservados entre as PGs e possuem alta similaridade estrutural com os correspondentes nas estruturas de fungos já resolvidas (A niger (1 CZF e 1 NHC), F moniliforme (1 HG8), C. lupini (2IQ7), A. aculea- tus (1 IA5)) e, somados à similar estrutura geral, os fazem ser classificados como hidrolases da família 28, apesar da baixa identidade de sequência.

No alinhamento, o alto grau de identidade dos resíduos especificamente envolvidos na catálise e ligação do substrato e a alta similaridade nos leva a crer os compostos aqui desenhados para a PG de Fusarium mo- niliforme, por exemplo, seriam igualmente capazes de inibir as PGs destes outros fungos. Além disso, foram selecionados resíduos próximos (distância menor que 2Â) aos resíduos mencionados que participam do sítio catalítico e sítio ligante através do programa JavaProtein Dossier. Estes foram analisados cuidadosamente no alinhamento mostrado na figura 1 quanto à exclusi- va presença em PGs fúngicas em detrimento de PGs vegetais e também na presença em posições correspondentes no maior número possível de PGs de fungos o que vai de encontro à idéia de desenhar um composto que teria alta abrangência e não traria efeitos indesejáveis para o desenvolvimento da planta. Foram encontrados, portanto, os resíduos His188, Asp194 e G305, que foram escolhidos como "alvos preferenciais". Coincidentemente, o resíduo His188 é considerado um dos mais importantes quanto à interação do inibidor protéico de PGs (PGIP) na inibição das PGs, como é mostrado no trabalho de Federici et al (L. Federici, C. Caprari, B. Mattei, C. Savino, A. di Mateo, G. De Lorenzo, F. Cervone, D. Tsernoglou, Structural requirements of endopolygalac- turonase for the interaction with PGIP, PNAS, 98(23), 13425-13430, 2001 ).

Um alinhamento de estrutura primária já foi publicado contendo toda a família de 28 hidrolases glicosídicas a que pertencem essas enzimas (O. Markovic, S. Janecek, Pectin degradin glycoside hydrolases of family 28: sequence-structural features, specificities and evolution, Protein Engineering, 14(9):615-631 , 2001 ) onde foi evidenciado, pelo alinhamento das sequências de 115 enzimas dessa família oriundas de plantas, insetos, fungos e bacté- rias, que as regiões que compreendem os aminoácidos N189, T190 D191 , D212,D213, G233,H234, G235, R267, I268, K269 e o aminoácido Y302 (numeração da FmPG) estão altamente conservadas em todas as PGs, EPGs e EPGDs.

Para uma análise mais profunda acerca das posições estruturais dos resíduos destacados no alinhamento da figura 1 , optamos por modelar a estrutura tridimensional das PGs de outros fungos, como: Fusarium oxyspo- rum f. sp. lycopersici, F graminearum, Aspergillus flavus, Botrytis cinema, Cochliobus carbonum, Crypphonectria parasitica e Sclerotinia sclerotiorum a fim de se verificar as correspondências quanto às posições dos aminoácidos envolvidos na ligação. A estrutura que serviu de molde ("template") para modelagem por homologia usando o programa Modeller 9v8 (Eswar, N., Marti- Renom, M. A. , Webb, B. , Madhusudhan, M. S., Eramian, D., Shen, M., Pie- per, U., Sali., A. Comparative Protein Structure Modeling With MODELLER. Current Protocols in Bioinformatics, John Wiley & Sons, Inc., Supplement 15, 5.6.1-5.6.30, 2006), foi a PG do C. lupini (código PDB 2iq7) pois este apresentou maior identidade e similaridade com sequências dos fungos de importância económica citados (Tabela 2). Após a modelagem, uma rodada de minimização de energia foi efetuada usando o programa Gromacs (D. Van Der Spoel, E. Lindhal, B. Hess, G. Groenhof, A.E. Mark, H.J Berendsen, GROMACS: fast, flexible, and free, J Comput Chem, 26(16), 1701-18, 2005). Adicionalmente, usando o programa Deep-View (Guex, N. e Peitsch, M. C. SWISS-MODEL and the Swiss-Pdb-Viewer: An environment for comparative protein modelling. Electrophoresis 18:2714-2723, 1997), foi realizada edição das estruturas otimizando a numeração de aminoácidos na estrutura prima- ria, dentre outras ações.

Foi feita a validação das PG modeladas usando a análise de gráficos de Ramachandran (Ramachandran, G. N., Ramarkrishnan, C, Sasi- sekharan, V. Stereochemistry of polypeptide chain conformations. J. Mol Biol 7:95-99, 1963) em uma interface gráfica da plataforma STING (Neshich, G., Togawa, R., Mancini, A. L, Kuser, P. R., Yamagishi, M. E. B., Pappas Jr., G., Torres, W. V, Campos, T. , Ferreira, L. L, Luna, F. M., Oliveira, A. G., Miu- ra, R. T, Inoue, M. K., Horita, L. G., de Souza, D. F., Dominiquini, F., Álvaro, A., Lima, C. S., Ogawa, F. O., Gomes, B. G., Palandrani, J. C. F., dos Santos, G. F., de Freitas, E. M., Mattiuz, A. R., Costa, I. C, de Almeida, C. L, Souza, S., Baudet, C. and Higa, R. H. STING Millennium: a Web based suite of programs for comprehensive and simultaneous analysis of protein structu- re and sequence. Nucleic Acids Research, 31 :13, 3386-3392, 2003), que indicou que, para todos os modelos obtidos, cerca de 84-86% dos resíduos se encontravam em regiões permitidas, o que não difere muito da estrutura que serviu de molde (CIPG, PDB: 21Q7_A, resolução 1.94 A), que teve 85.55% de resíduos em regiões permitidas. Considerando que a qualidade dos modelos está muito próxima da qualidade do molde, os modelos são considerados aceitáveis. A validação através do ProsaWeb indicou que os valores de z-score equivaleram a -7.75, -7.54, -7.29, -7.04, -7.88, -7.58, - 7.59, respectivamente para as PGs modeladas de Fusarium oxysporum f. sp. lycopersici, F graminearum, Aspergillus flavus, Botrytis cinerea, Cochlio- bus carbonum, Crypphonectria parasitica e Sclerotinia sclerotiorum; e o z- score da enzima do Colletotrichum lupini (CIPG) foi de -7.59. Estes z-scores estão contidos no intervalo de resultados normalmente encontrados para as proteínas nativas de tamanho similar (Whiederstein, M., Sippl, M. J. ProSA- web: interactive web service for the recognition of errors in three-dimensional structures of proteins. Nucleic Acid Research, Web Server issue: W407-10, 2007). Portanto, os modelos foram considerados aceitáveis para a continuação das análises.

Para uma análise comparativa das posições estruturais dos aminoácidos relevantes ao presente estudo, foram efetuadas sobreposições estruturais dos modelos gerados com a estrutura molde e entre as diversas estruturas resolvidas e depositadas no PDB (Tabelas 4 e 5). Foram calculados os valores de desvio no alinhamento entre as estruturas terciárias alinhadas através do programa TM-align (Yang Zhang, J. Skolnick, TM-aiign: a protein structure alignment algorithm based on th TM-score, Nucleic Acid Research, 33(7): 2302-2309, 2005). Observa-se que os valores de RMSD e TM-score são satisfatórios entre os modelos e a enzima 1 HG8 e entre os modelos e seu "template", a enzima 2IQ7. A visualização e confecção de imagens foram feitas com o programa PyMol (W.L Delano, The PyMol molecular graphics system Delano Scientific, San Carlos, CA, USA, http://www.pymol.org) e MVD (Thomsen R, Christensen MH.: MolDock: a new technique for high- accuracy molecular docking. J Med Chem. 2006 Jun 1 ;49(11):3315-21.;W.F. De Azevedo Jr, MolDock applied to structure-based virtual screening, Current Drug Targets, 11(3):327-334, 2010). Os alinhamentos estruturais entre a PG do F. moniliforme e as estruturas depositadas no PDB são mostradas nas figuras 2a, 2b, 2c, 2d e 2e com enfoque nos resíduos importantes do sítio ligante (H234, R267, K269 e Y302) e na sobreposição geral das estruturas. Os valores fornecidos pelo TM-align são o RMSD e o TM-score, sendo que o primeiro calcula a média quadrática da distância entre os resíduos correspondentes considerando apenas as distâncias entre pares de resíduos e sendo influenciado pelo tamanho da proteína, não levando em conta sua topologia. Já o TM-Score é calculado levando em conta a topologia das es- truturas sobrepostas, o que é bastante importante uma vez que a maioria das interações entre proteínas são influenciadas pela topologia. Foi observado, nestas sobreposições, que as posições dos aminoácidos nos sítios ligantes das proteínas são bastante conservadas estruturalmente, o que reforça a idéia de que um ligante que funcione como inibidor da PG ligando-se a esses aminoácidos pode ter grandes chances de também ter atividade inibitória para as outras PGs fúngicas. A finalidade em se obter modelos tridimensionais das enzimas que não possuem estrutura resolvida por métodos experimentais é o de fornecer resultados adicionais para a modelagem dos ligantes além daqueles fornecidos pelas simulações entre ligantes e PGs que possuem estrutura depositada no PDB. Os valores de RMSD e TM- score foram considerados satisfatórios, pois como pode ser visto nas figuras (Figura 2) e no alinhamento (Figura 1 ), as enzimas são muito semelhantes estruturalmente.

Tabela 4: Valores de RMSD e TM-Score resultantes de alinhamento estrutural entre as estruturas de PGs fúngicos e enzima FmPG (1 HG8.pdb). O RMSD fornece a média quadrática das distâncias entre pares correspondentes de resíduos depois da sobreposição de uma estrutura sobre a outra. O TM-score utiliza o fator de Levitt-Gerstein que considera os pares de resíduos em menores distâncias como mais relevantes do que a- queles a maiores distâncias e também é mais sensível à topologia geral do que a variações estruturais localizadas. O TM-score é normalizado de forma a não ser dependente do tamanho da proteína, seu valor pode ir de 0.0 a 1.0, sendo valores maiores que 0.17 indicativos de similaridade estrutural elevada (Yang Zhang, J. Skolnick, TM-align: a protein structure alignment algorithm based on th TM-score, Nucleic Acid Research, 33(7): 2302-2309, 2005). Como o TM-score leva em consideração principalmente a topologia, esses resultados indicam que todas as enzimas possuem alta correlação estrutural com a FmPG (1 HG8.pdb).

Tabela 5: Valores de RMSD e TM-Score resultantes de alinhamento estrutural entre as estruturas modeladas de PGs fúngicas e as estru-

Adicionalmente, foi feita sobreposição da PG de F. moniliforme (FmPG) com a PG do S. Purpureum (SpPG), sendo que esta última foi cris- talizada em complexo com galacturonato no trabalho de Shimizu et al (T. Shimizu, T. Nakatsu, K. Miyairi, T. Okuno, H. Kato, Active-site architecture of endopolygalacturonase I from Stereum purpureum revealed by crystal struc- tures in native and ligand-bound forms at atomic resolution, Biochemistry, 41 , 6651-6659, 2001). Foi observado que a FmPG sobreposta à de S. purpureum apresentou boa sobreposição de aminoácidos no sítio de interesse; e também que a posição do galacturonato cristalizado em complexo com a SpPG1 corresponde à posição obtida pelos ligantes no docking com a FmPG, o que valida a técnica para atracamento de ligantes no sítio alvo da proteína (Figura 3) e pode ser considerada um controle positivo da metodologia.

Um adicional trabalho foi realizado para a análise da conser- vância de parâmetros físico-químicos e estruturais dentre os resíduos importantes entre as estruturas de PGs fúngicas. Sabe-se que a função da proteí- na é mais conservada com relação à estrutura 3D do que em relação à sequência primária (Chothia C, Lesk AM. The relation between the divergence of sequence and structure in proteins. EMBO J. Apr;5(4):823-6, 1986), havendo várias proteínas com pouca ou nenhuma similaridade de sequência que, mesmo assim, têm similaridade estrutural. Conhecer a estrutura permi- te-nos explicar o mecanismo bioquímico pelo qual a proteína implementa sua funcionalidade. Os fatores que determinam a funcionalidade do sítio ati- vo de uma proteína são muito complexos e dependem da estrutura tridimensional, além das propriedades bioquímicas e biofísicas.

É possível analisar os sítios funcionais como um nano- ambiente físico-químico que acompanha uma função, ao invés de considerá- los como um grupo de resíduos fixos. Assim, buscamos uma caracterização mais genérica do sítio ativo (e/ou conjunto dos aminoácidos que constroem o chamado sítio de ligação ao substrato), a partir de descritores estruturais, sem considerar necessariamente a conservação como o principal fator e sim a geometria específica, que sejam úteis para a previsão dos resíduos catalíticos das enzimas.

Aplicamos um método para seleção de descritores da estrutura contidos no STING_DB (Neshich, G., Togawa, R., Mancini, A. L., Kuser, P. R., Yamagishi, M. E. B., Pappas Jr., G., Torres, W. V., Campos, T. E, Ferreira, L. L, Luna, F. M., Oliveira, A. G., Miura, R. T., Inoue, M. K., Horita, L. G., de Souza, D. E, Dominiquini, E, Álvaro, A., Lima, C. S., Ogawa, E O., Go- mes, B. G., Palandrani, J. C. E, dos Santos, G. E, de Freitas, E. M., Mattiuz, A. R., Costa, I. C, de Almeida, C. L, Souza, S., Baudet, C. and Higa, R. H. STING Millennium: a Web based suite of programs for comprehensive and simultaneous analysis of protein structure and sequence. Nucleic Acids Research, 31 :13, 3386-3392, 2003), projetado especificamente para previsão do sítio catalítico e do sítio de ligação ao substrato de enzimas. Apenas alguns resíduos da enzima participam da catálise, ao passo que a grande maioria dos resíduos são não reativos. Outros resíduos são caracterizados como aqueles que servem para o atracamento de ligante ou substrato e estes também tem suas características que podem ser usadas para sua sele- ção e consequentemente, para descrição do nano-ambiente criado por este conjunto de resíduos que compõem o sítio de ligação. Com a identificação de um conjunto dos descritores de nano ambiente, estamos habilitados para a construção de uma tabela de assinaturas (consulta sobre os descritores estruturais dos resíduos restringindo seus intervalos de valores) para os di- versos membros de famílias enzimáticas. Estas assinaturas devem funcionar em todos os membros se identificadas com rigor. No caso da proteína PG, identificamos apenas dois parâmetros que com sucesso foram capazes de selecionar em todas as estruturas existentes no PDB o conjunto de resíduos que compõem o sítio catalítico que, como já foi mencionado anteriormente, é constituído por três aminoácidos idênticos - ácidos aspárticos (Glu), que tem numerações 191 , 212 e 213 no FmPG 1 HG8.

Foram examinadas 7 estruturas de PGs fúngicas (em parêntesis a numeração dos aminoácidos da tríade catalítica correspondentes em cada estrutura) 1hg8 (191 , 212,213), 1kcd (153, 173,174), 1k5c (153, 173,174), 1 ia5 (159,180,181), 1czf (180,201 ,202), 2iq7 (178,199,200) e 1bhe (202,223,224). Usando a ferramenta Select do Java Protein Dossier. O conjunto de descritores e seus intervalos de valores que caracterizam única- mente estes resíduos foram: Valor do parâmetro Conservation HSSP Relati- ve Entropy <= 2 e do parâmetro Electrostatic Potencial no último átomo pesado (LHA) num intervalo de [-300,-167 kT/e], o que indica a característica do potencial eletrostático medido em volta de último átomo pesado da cadeia lateral, sendo este negativo e os resíduos possuem alta conservação na evolução deste aminoácido no contexto da estrutura desta enzima (indicado pelo baixo valor de "Conservation HSSP Relative Entropy").

Em adição, foram identificados os aminoácidos constituintes de sitio de ligação ao substrato para estas estruturas, de acordo com a sua pre- sença estabelecendo interações com a molécula de galacturonato na estrutura da SpPG (PDB 1 KCD). O conjunto de descritores e seus respectivos valores, usados para identificar o nano ambiente criado na estrutura protéica por eles, são bem mais complexos e diversos. É constituído pelos seguintes parâmetros STING, com seus respectivos intervalos: Conservation HSSP Relative Entropy <= 4; Reliability (x100) >= 80; Rotamers Percent <= 8; E- lectrostatic Potencial Average Range:[-12,50]; Unused Contacts Total >= 62; Unused Contacts Energy Total >= 127; Hydrophobic Scale Isolation < 1 ; Sur- face Accessibility Isolation < 33. Pode-se observar que estes aminoácidos, além de conservados altamente, têm baixo teor de rotâmetros, também pos- suem baixo valor de intervalo de potencial eletrostático médio (calculado como uma media em volta de todos os átomos) bem mais positivo que aquele calculado em volta do LHA para resíduos do sitio catalítico. Outra característica observada foi o alto número de contatos não usados (indicando alto potencial em fazer contatos com molécula de substrato) e tendo hidrofobici- dade baixa e acessibilidade das moléculas ao solvente não expressiva porém existente. Estes conjuntos foram usados não apenas para identificação nas estruturas estudadas, como também para melhor compreender o ambiente para qual o inibidor seria construído, tendo a eficácia necessária para sua aplicação final. Portanto, estes parâmetros indicam as características físico-químicas do alvo terapêutico para o adequado desenho dos novos compostos.

Para o desenho computacional de ligantes partiu-se da estrutu- ra do ligante natural, galacturonato. A partir dele foram feitas buscas por compostos que possuíam similaridade na estrutura química acima de 90% na base de dados PubChem (http://pubchem.ncbi.nlm.nih.gov/) através do "PubChem Structure Search" (Junguk Hur, David J Wild: PubChemSR: A se- arch and retrieval tool for PubChem, Chemistry Central Journal, 2:11 doi: 10.1186/1752-153X-2-11 , 2008) e, ao todo, foram obtidas 2004 estruturas. Também foi feito o desenho de ligantes tendo como alvo principal os resíduos D194, H188 e G305, que são conservados apenas nos fungos; as plantas possuem prolina/leucina no lugar da histidina e histidina/treonina no lugar do aspartato. A estratégia para o desenho desses ligantes partiu da observação da posição de todos os aminoácidos do sítio ligante e confirmação de conservação estrita a fungos através de vários alinhamentos feitos usando o CLUSTALw entre estruturas primárias de fungos e plantas (apenas algumas sequências de plantas são mostradas na Figura 1). Todas as estru- turas desenhadas foram então submetidas a simulações de docking com a estrutura da FmPG, código PDB 1 HG8. O docking foi realizado com o programa Molegro Virtual Docking (MVD) (Thomsen R, Christensen MH.: Mol- Dock: a new technique for high-accuracy molecular docking. J Med Chem. Jun 1 ;49(11):3315-21 , 2006.), que é baseado em algoritmo evolutivo para simular as interações ligante-proteína.

As simulações de docking (com ligante flexível) usando-se o programa MVD, foram efetuadas centralizando-se nos resíduos do sítio ativo mencionado e com um raio de esfera de espaço de busca de 30Ã (que envolveu quase toda a proteína). O algoritmo de cálculo de score usado foi o MolDock Score [GRID], usando uma resolução de Grid de 0,3Â (avaliando- se o ligante por meio de Interações internas de pontes de hidrogénio, interações eletrostáticas e torções Sp 2 -Sp 2 ). O algoritmo de busca e docking usado foi o MolDock Optimizer (que é uma implementação de uma variação do algoritmo evolutivo), com 10 rodadas, tamanho de população igual a 50 e com 2000 iterações. Após o docking, o MVD realizou Minimização de energia e otimização de pontes de Hidrogénio das "poses" (sendo que uma pose é um modo de ligação candidato) obtidas. Com o MVD é possível visualizar os resultados das simulações em modelos tridimensionais, o que torna possível eliminar facilmente as "poses" que adotaram posições visualmente erróneas, não tendo de levar apenas em consideração os valores numéricos fornecidos pelo programa para isso. Dada a importância dos resíduos preferenciais H188, D 94 e G305 e os envolvidos na interação ligante-proteína D194, H188, H234, R234, K269, T302 e G305, os compostos foram então selecionados de acordo com os valores de energia, em relação a esses resíduos, fornecidos pelo programa através do módulo "Ligand Energy Inspector". Foi também considerado o MolDock score, que é a energia total da pose, como parâmetro secundário na seleção de ligantes.

A cada docking seguiu-se a seleção de ligantes e modificações estruturais nos mesmos a fim de melhorar a interação com os resíduos-alvo. As modificações foram feitas com o programa ChemBioDraw (http://www. cambridgesoft.com/software/ChemBioDraw/) e as estruturas foram energeticamente minimizadas com o mesmo.

Foram obtidas 11 estruturas (Figura 4) derivadas daquelas que apresentaram melhores resultados nas rodadas de dockings anteriores e que se sugere que podem apresentar atividade inibitória para a(s) enzima(s) poligalacturonase(s). Nas tabelas 6 e 7 são demonstrados os resultados de docking dos ligantes desenhados e de duas simulações de docking executadas usando os ligantes naturais trigalacturonato e monogalacturonato, contra as enzimas FmPG e CIPGA, sendo que foi feito também docking com esta última devido a maiores identidade e similaridade com as enzimas modela- das do que o apresentado pela FmPG. Os valores de energia na interação com os resíduos escolhidos como alvo (numeração da CIPGA: H234, R267, K269 e soma das energias dos resíduos D194, H188 e G305 e segundo numeração da FmPG; H221 , R254, K256 e soma das energias dos resíduos D181 , H175 e G292, numeração da CIPGA) são menores para os ligantes desenhados, bem como os valores de MolDock score, interação com proteína, interações de hidrogénio e o LE1 (divisão do valor do MolDock score pelo número de átomos do ligante, exceto hidrogênios), significando que o complexo formado entre os compostos desenhados computacionalmente e até mais estável.

Tabela 6: Valores de energias de interação (em Kcal/mol) entre os ligantes e os resíduos conservados entre todas as PGs (H234, R267, K269 e Y302), soma das energias de interações estabelecidas entre os ligantes e os resíduos específicos de fungo (H188, D194 e G305) e valores de Moldock score (energia total do ligante), Protein (total energia de interação do ligante com a proteína), Hbond (energia decorrente de interações de Hidrogénio) e LE1 (valor do MolDock score dividido pelo número de átomos pesados, exceto hidrogênios) fornecidos pelo Molegro Virtual Docker, no módulo Ligand Energy Inspector. Estes resultados foram obtidos da simulação de docking dos ligantes desenhados com o espaço de busca centralizado no sítio catalítico da FmPG. Para o desenho das moléculas foram especi- almente consideradas as interações com os resíduos especificados. A soma das energias de interação entre os ligantes e esses resíduos foi o primeiro parâmetro de avaliação para exclusão e modificação das estruturas dos compostos. O segundo parâmetro utilizado foi o MolDock score. Também foram consideradas as energias de interação com proteína, de ligação de hidrogénio e o LE1. Observa-se então que são menores os valores de energia total entre esses resíduos e os ligantes desenhados se comparados aos valores encontrados no docking das moléculas de galacturonatos, o que sugere que a ligação dos ligantes desenhados a esses resíduos pode ser mais estável.

Tabela 7: Valores fornecidos pelo docking dos ligantes desenhados com espaço de busca centralizado no sítio catalítico da CIPGA (2IQ7.pdb), conforme padrão da tabela 6. Foi feito um docking com essa en- zima, pois ela serviu de molde para a confecção de modelos para as sequências enzimáticas que não possuíam estrutura terciária resolvida e devido à sua maior similaridade e identidade. Observa-se que são menores os valores de energia total de interação entre os resíduos H221 , R254, K256, Y289 (mesmos resíduos da 1 HG8 citados na tabela 6, mas com numeração diferente, agora correspondentes a numeração encontrada no 2IQ7.pdb) e os ligantes desenhados comparado com os valores dos galacturonatos, o que sugere que a ligação dos compostos desenhados a esses resíduos pode ser mais estável. No entanto, os valores de energia de interação entre os ligantes e os resíduos D181 , G292 e H175, não foram muito diversos dos valores dos galacturonatos, exceto no caso dos ligantes dh3211 , 204 e 402, que apresentaram menores valores de energia.

Considerando que os compostos serão para uso agrícola e seus resíduos poderão ser consumidos por humanos e animais é fundamental que o desenho de novos compostos seja analisado em relação ao potencial de risco de produção de efeitos indesejáveis. Pensando nisso, foi feita predição de parâmetros moleculares que influenciam na Absorção, Distribuição, Metabolismo, Excreção e Toxicidade (ADMET) utilizando-se o Osiris Pro- perty Explorer (Thomas Sander, Actelion Pharmaceuticals Ltd., http://www.organic-chemistry.org/prog/peo ). Essa ferramenta permite analisar cLogP, solubilidade em água, peso molecular e riscos de toxicidade; a- lém disso, fornece dois parâmetros: Druglikeness e Drug-score. O Druglike- ness baseia-se na comparação do composto desenhado com compostos de base de dados de compostos comercializados e de base de dados de com- postos sem propriedades farmacológicas (Fluka). O Drug-score fornece um valor geral que considera todos os parâmetros anteriores. Os resultados da análise constam na Tabela 8. Como não é interessante que os compostos sejam absorvidos pelo trato gastrointestinal dos consumidores, valores menores de cLogP são desejáveis. Alta solubilidade em água também é desejável, pois favorece a aplicação do produto na agricultura e se mantém superficialmente na planta, o que é interessante, pois vários fungos chegam à planta pela superfície. Também é possível uma aplicação com água no solo, que seria absorvida pelas raízes (outra porta de entrada às infecções fúngica) e disseminar-se para outros pontos da planta pelo Xilema. Ademais, alta solubilidade em água também favorece a difusão através da rede vascular vegetal quando for de interesse que o composto atue na inibição das PGs vegetais. O Osíris fornece dados de toxicidade animal tais como risco de mutagenicidade, tumorogenicidade, efeito reprodutivo e irritação baseado em fragmentos moleculares com toxicidades conhecidas armazenadas em base de dados (RTECS).

Tabela 8: Resultados da análise de ADMET, feita pelo programa Osíris Property Explorer (http://www.organic-chemistry.org/prog/peo/) com os dados de risco de toxicidade tais como mutagenicidade, tumorgenicidade, irritabilidade e eventuais efeitos colaterais reprodutivos, baseados em fragmentos de moléculas conhecidas depositados no banco de dados RTECS. Este programa fornece um valor de LogP, o coeficiente de partição entre á- gua e n-octanol, que mede a hidrofobicidade (quanto maior o valor, maior a solubilidade do composto em lipídeos). No caso das plantas e tratando-se de um composto de uso superficial (não precisa ser absorvido para agir), ter um LogP baixo pode ser algo positivo pois será menos absorvido e menos distribuído em tecidos animais. Fornece um valor de LogS (solubilidade), parâ- metro que afeta tanto absorção e distribuição, cujo valor deve ser maior que -4, baseado no LogS médio dos medicamentos comercializados. Fornece o Drug-score que é um valor geral resultante da combinação de todos os parâmetros anteriores mais o Druglikeness, que compara fragmentos do composto desenhado com base de dados de compostos comercializados e com base de dados de compostos que não servem como fármacos (Fluka). É desejável que tanto Druglikeness quanto o Drug-score sejam positivos.

Temos 2 ligantes que se destacam:

-dh3211 , nome IUPAC (3S,Z)-3-amino-4-((3S,4S,E)-6-(2- aminoethylidene)-4-(hydroxymethyl)hexahydropyridazin-3-yl)-1 -((3R,4R)-4- (3,3-dihydroxyallyl)-2-hydroxy-6-((E)-3-hydroxyprop-1-en-1-y l)-3,4-dihydro- 2H-pyran-3-yl)but-1-ene-2,3-diol, SMILE C1 (=0)OC(=C(C(C1 (\C(=C(/0[H])C(0[H])(N([H])[H])C(C2(C(C(\C(N(N2[H])[H ])=C([H])/C(N([H])[H])([H])[H])([H])[H])([C](0[H])[H])[H])[H ])([H])[H])[H])[H])([H] )\C(=C(\C(=0)0[H])[H])[H])[H])\C(=C(\C(0[H])([H])[H])[H])[H] (este ligante, atracado ao sítio alvo, está mostrado na figura 5)

-602, nome IUPAC (3S,4S,E)-2,6-bis((1 ,1 ,4,4-tetrahydroxybutan- 2-yl)oxy)hex-5-ene-1 , ,3,4,5-pentaol, SMILE O(C(C(0[H])(C(0[H])(C(/0[H])=C(\OC(C(C(0[H])(0[H])[H])([H])[ H])(C(O[H])( 0[H])[H])[H])[H])[H])[H])(C(0[H])(0[H])[H])[H])C(C(C(0[H])(0 [H])[H])([H])[H])( C(0[H])(0[H])[H])[H] (este ligante, atracado ao sítio alvo, está mostrado na figura 6).

O primeiro composto, dh3211 , obteve ótimas interações com os resíduos H188, D194 e G305, que são específicos para fungos e o segundo, 602, com os resíduos H234, R267 e K269, que são resíduos conservados inclusive em plantas, como pode ser visto nas tabelas 6 e 7. Além disso, o 602 também obteve destaque na análise de ADMET (tabela 8). Ambos podem ser considerados como bons potenciais para inibição das enzimas fúngicas, porém a maior afinidade específica à PGs Fúngicas pelo dh3211 nas simulações feitas são indicativo de que esse composto tem um potencial de uso mais seguro em relação ao 602, pois os resíduos com os quais interage melhor não estão presentes em plantas. Porém, se considerarmos outras aplicações para esses compostos além da fungicida, como por exemplo, retardamento da maturação de frutos ou mesmo da germinação de sementes (funções fitofisiológicas essas que tem relação direta com a expressão de PG vegetal) todos os compostos, inclusive aqueles que são potencialmente inibidores de enzimas vegetais, podem contribuir para a produção agrícola. Além disso, outras funções das PGs vegetais poderão ser manipuladas u- sando estes compostos caso seja confirmada sua ação inbitória sobre as PGs de plantas, tais como: processos de separação de células, germinação, abscisão de órgãos, deiscência das anteras, maturação do grão de pólen, amadurecimento do fruto, formação das células do xilema e crescimento do tubo polínico (Kim J, Shiu SH, Thoma S, Li WH, Patterson SE. Patterns of expansion and expression divergence in the plant poiygalacturonase gene family. Genome Biol. 7(9):R87, 2006). Acreditamos que o composto desenhado dh3211 , por ter apresentado fortes interações com resíduos específi- cos de PGs fúngicas, terá maior especificidade à ligação sobre estas enzimas em detrimento das PGs vegetais (que possuem resíduos com propriedades físico-químicas antagónicas aos resíduos específicos de PGs fúngicas). Possivelmente o composto dh3211 seria um bom candidato para aplicação em campo sem causar inibição da enzima vegetal.