Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
USES OF MULTI-DIMENSIONAL MATRIX IN PHARMACEUTICAL MOLECULE DESIGN AND PHARMACEUTICAL MOLECULE DESIGN METHOD
Document Type and Number:
WIPO Patent Application WO/2012/139421
Kind Code:
A1
Abstract:
The present invention relates to uses of a multi-dimensional matrix in pharmaceutical molecule design and a pharmaceutical design method. The method is the first to apply the mathematical matrix optimization concept to pharmaceuticals and to the related field of molecule design. A multi-dimensional matrix is used to combine factors that affect pharmaceutical chemical structures and features, so that the large number of factors that must be taken into consideration during the process of pharmaceutical research and development can be categorized and compared according to certain characteristics. A small number of variables are used to represent a large number of variables, so as to effectively obtain the pertinent pharmaceutical chemical structure, thereby enhancing the physical chemical properties thereof. The structure is then compared to structures from existing pharmaceutical empirical data, and the pharmaceutical molecule structure is further optimized. The pertinence and design efficiency of pharmaceutical design, and synthesis efficiency are substantially enhanced.

Inventors:
YAN JINGBO (CN)
HUO XIUMIN (CN)
Application Number:
PCT/CN2012/000467
Publication Date:
October 18, 2012
Filing Date:
April 09, 2012
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
YAN JINGBO (CN)
HUO XIUMIN (CN)
International Classes:
G06F17/50
Foreign References:
CN101329698A2008-12-24
CN1493051A2004-04-28
CN1523350A2004-08-25
Other References:
WALTERS WP; STAHL MT; MURCKO MA: "Virtual Screening: An overview", DRUG DISCOVERY TODAY, vol. 3, 1998, pages 160 - 78, XP000886120, DOI: doi:10.1016/S1359-6446(97)01163-X
WALTERS WP; MURCKO A; MURCKO MA: "Recognizing Molecules with drug-like properties", CURR OPIN CHEM BIOL, vol. 3, 1999, pages 384 - 7
C.A. LIPINSKI; F. LOMBARDO; B.W. DOMINY; P.J. FEENEY: "Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings", ADV DRUG DEL REV, vol. 23, pages 3 - 25, XP000892390, DOI: doi:10.1016/S0169-409X(96)00423-1
LIPINSKI CA; LOMBARDO F; DOMINY BW; FEENEY PJ: "Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings", ADV DRUG DELIV REV, vol. 46, 2001, pages 3 - 26, XP001097746, DOI: doi:10.1016/S0169-409X(00)00129-0
See also references of EP 2698733A4
Attorney, Agent or Firm:
YIN INT'L IP FIRM (CN)
北京中创阳光知识产权代理有限责任公司 (CN)
Download PDF:
Claims:
权 利 要 求 书

L 一种优化候选药物分子结构的方法, 包括如下步骤:

( 1 ) 将目标化合物按照基本结构单元进行结构分区, 并分别以大写字母 A, B, C, D...Y或 Z代表相应的结构区域, 并确定候选药物的可修饰区域, 分别选择可修饰区域 中可选择的变量, 其中, 可修饰区域 A的变量选自 Al、 A2、 A3... An, 可修饰区域 B的 变量选自 Bl、 B2、 B3...Bn, 可修饰区域 C的变量选自 Cl、 C2、 C3...Cn, 可修饰区域 D的变量选自 Dl, D2, D3...Dn……, n为自然数;

(2)参照经验型数据, 选择影响候选药物的可变因素及其变量, 所述的可变因素分 别以小写字母 a, b, c, d...y或 z加以表示,其中,可变因素 a的变量选自 al、a2、 a3...an, 可变因素 b的变量选自 b】、 b2、 b3...bn, 可变因素 c的变量选自 cl、 c2、 c3...cn, 可变 因素 d的变量选自 dl , d2, d3...dn, ······, n为自然数;

(3 ) 采用多维矩阵排列分析步骤 (1 ) 中所述的可修饰结构区域 A, B, C, D...Y 或 Z的相应变量或 Z与步骤(2) 中所述的可变因素 a, b, c, d...y或 z的相应变量, 再 参照结构区域和经验型数据的结构对比结果, 优选出具有代表性的化合物结构类型代表 A'、 B'、 C'、 0'.. '或2', 完成候选药物的结构设计与优化。

2.根据权利要求 1所述的方法, 包括如下步骤:

( 1 ) 将目标化合物按照基本结构单元进行结构分区;

(2) 参照经验型数据, 确定影响候选药物分子靶标生物活性 /细胞活性的结构部分, 将其作为不可修饰区域;

(3 )对目标化合物结构进行分析与结构确认, 确定候选药物的可修饰区域, 分别以 大写字母 A, B, C, D...Y或 Z代表相应的结构区域, 分别选择可修饰区域可选择的变 量, 其中, 可修饰区域 A的变量选自 Al、 A2、 A3... An, 可修饰区域 B的变量选自 Bl、 B2、 B3...Bn, 可修饰区域 C的变量选自 Cl、 C2、 C3...Cn, 可修饰区域 D的变量选自 Dl, D2, D3...Dn……, n为自然数;

(4)参照经验型数据, 选择影响候选药物的可变因素及其变量, 所述的可变因素分 别以小写字母 a, b, c, . 或2加以表示,其中,可变因素 a的变量选自 al、a2、a3...an, 可变因素 b的变量选自 bl、 b2、 b3...bn, 可变因素 c的变量选自 cl、 c2、 c3...cn, 可变 因素 d的变量选自 dl, d2, d3...dn ·'····, n为自然数:

(5 ) 采用多维矩阵排列分析步骤 (3 ) 中所述的可修饰结构区域 A, B, C, D...Y 或 Z的相应变量与可变因素 a, b, c, d...y或 z的相应变量, 再参照结构区域和经验性 数据的结构对比结果, 优选出具有代表性的化合物结构类型代表 A'、 B'、 C'、 D'...Y'或 Z,。

3.根据权利要求 1或 2所述的方法, 所述方法还包括,

在步骤 (1) 或 (3) 确定可修饰区域的同吋, 排除修饰暂不予考虑的部分, 所述的 暂不予考虑的部分选自环状结构上的取代基、 像药型化合物不应具有的官能团和结构类 型的任一种或其组合。

4.根据权利要求 1-3 任一项所述的方法, 所述方法还进一步包括如下任一或全部步 骤:

(6)对步骤(5)优选出的具有代表性的化合物结构类型 A'、 B'、 C'、 0'.. '或2' 的结构进行分析与结构确认,确定其可选择的变量,其中,可修饰区域 A'的变量选自 A'l、

A'2、 A'3...A'n, 可修饰区域 B'的变量选自 B'l、 B'2、 B'3...B'n, 可修饰区域 C'的变量 选自 C'l、 C'2、 C'3...C'n, 可修饰区域 D'的变量选自 D'l, D,2, D'3...D'n , n为 自然数;

(7)参照经验型数据, 选择影响候选药物的可变因素及其变量, 所述的可变因素分 别以小写字母 a', b', c', <1'...^或2'加以表示, 其中, 可变因素 a'的变量选自 a' 1、 a'2、 a'3...a'n, 可变因素 b'的变量选自 b'l、 b,2、 b'3...b'n, 可变因素 c'的变量选自 c'l、 c,2、 c'3...c'n, 可变因素 d'的变量选自 d'l, d'2, d'3...d'n……, n为自然数;

(8) 采用多维矩阵排列分析步骤 (6) 中所述的优选出的具有代表性的化合物结构 类型 A'、 B'、 C'、 D'...Y'或 Z'的相应变量与步骤(7)中所述的可变因素 a', b', c', d'...y' 或 ζ'的相应变量, 再参照结构区域和经验性数据的结构对比结果, 优选出具有代表性的 化合物结构类型 A,B,、 B'C'、 C'D'...Y'Z';

(9) 根据需要, 参照步骤 (6) - (8) 所述的方法, 采用多维矩阵排列分析优选出 的具有代表性的化合物结构类型 A'B'、 B'C'、 C'D'...Y'Z'的相应变量与可变因素&'13'、 b'c\ C'd'...y'z'的相应变量, 再参照结构区域和经验性数据的结构对比结果, 优选出具 有代表性的化合物结构类型 A"B"C"、 B"C"D"...X"Y"Z"; 或

(10) 根据需要, 参照步骤 (6) - (9)所述的方法, 采用多维矩阵排列分析优选出 的具有代表性的化合物结构类型 A"B"C"、 B"C"D"...X"Y"Z"与可变因素 a"VV'、 b"c"d"...x"y"z", 再参照结构区域和经验性数据序列的结构对比结果, 完成候选药物 的结构设计与优化; 或

(11) 任选地, 根据候选药物的设计需要, 采用多维矩阵重复进行上述步骤中的部 分步骤或全部步骤, 以进行候选药物的结构分析、 结构确认、 结构优化, 直至获得所需 的候选药物结构类型。

5.根据权利要求 1-4任一项所述的方法,其中所述基本结构单元包括分子结构中的任 一结构单元, 选自饱和或不饱和的单环结构单元、 双环结构单元、 多环结构单元、 取代 基、 官能团的任一种或其组合;

其中, 所述的单环结构单元选自芳香单环、 非芳香单环、 取代的芳香单环、 取代的 非芳香单环的任一种或其组合;

所述的双环结构单元选自芳香双环、 非芳香双环、 取代的芳香双环、 取代的非芳香 双环的任一种或其组合;

所述的多环结构单元选自芳香多环、 非芳香多环、 取代的芳香多环、 取代的非芳多 单环的任一种或其组合;

所述官能团选自酮、 醛、 脂、 胺、 酰胺、 单键、 双键、 三键、 卤素、 酸、 醇、 硫醇、 磺酸、 酚、 硫酚的任一种或其组合;

所述取代基是任何化合物的结构残基, 选自烷基、 烯基、 炔基、 羟基、 醚基、 酯基、 芳基、 杂芳基、 环烷基、 杂环基的任一种或其组合。

6.根据权利要求 1-5任一项的方法,所述可修饰区域是指影响化合物生物活性或者细 胞选择性的结构区域。

7.根据权利要求 1-6任一项的方法, 所述的经验数据选自靶标生物活性、 靶标生物选 择性、 细胞活性、 毒副作用、 ADME性质、 像药性、 可合成性的任一种或其组合。

8.根据权利要求 1-7任一项的方法, 所述的经验型数据选自如下数据库的任一种或其 组合:

1 )世界药物研发领域常用蛋白质靶标数据库及其对应的化合物结构类型数据库; 或

2 ) 世界药物研发常用蛋白质靶标相对应的化合物结构类型数据库; 或

3 ) 药物研发核心结构数据库; 或

4) 药物分子构架化合物类型数据库; 或

5 ) 被验证的具有生物活性的化合物结构类型数据库; 或

6) 可查询上市药物数据库; 或

7) 生物等效型数据库; 或

8 ) 新陈代谢化合物类型数据库; 或

9 ) 毒性化合物结构类型数据库; 或

10) 中药有效成分化合物类型数据库; 或

11 ) 天然产物单体化合物结构数据库; 或 12 ) 药物治疗数据库; 或

13 ) 医疗关键词数据库。

9.多维矩阵在药物分子设计中的应用, 其特征在于, 所述的多维矩阵排列由结构因 素与经验型数据共同确定。

10、 根据权利要求 9所述的应用, 所述的药物分子选自 Me-Too类新型药物、 药物 构架化合物、 "像药 "型化合物、 Hit-T0-Lead、 先导化合物的任一种或其优化结构。

Description:
说 明 书 多维矩阵用于药物分子设计的应用及药物分子 设计方法 技术领域

本发明属于药物分子设计方法领域, 尤其涉及多维矩阵用于药物分子设计的应用及 药物分子设计方法。 背景技术

近 100年来, 药物研发经历了下述阶段, 1 ) 标靶发现; 2 ) 标靶验证; 3 ) 高通量筛 选 (High Throughput Screening) ; 4) Hit- to- Lead; 5) 先导化合物; 6) 临床研究等, 其中, 靶标验证阶段和药物分子设计被公认为药物研 发的技术瓶领。

上世纪末和本世纪初, 基因工程和蛋白质工程取得了长足进歩。 其中, 基因工程发 现了大约 12000 15000种新型的靶标蛋白质类型, 但使用这些新型靶标开发出来的新型 药物的预期效果与其实际疗效之间的偏差非常 大, 导致世界制药和药物研发行业遭遇巨 大的损失并深感困惑。 目前,世界药物研发行业主要运用的还是被广 泛验证过的 300-500 个生物靶标类型, 并有多种药物筛选合成方法被广泛地加以应用 。

高通量筛选(HTS)是当前药物研发中广泛应用 药物筛选手段。 研究大型数据库的 结果表明, 用于药物研发过程的高通量筛选化合物种类有 1500-2000万。 尽管高通量筛 选可通过自动化设备每天筛选出 12万个以上的化合物, 但其又受到诸多技术限制: 1 ) 生物靶标的精确性, 需要在微量下具备精确度的可用于自动化过程 的生物靶标; 2)检测 手段的提高, 需要高分辨度的检测设备, 如高质量基因芯片; 3 ) 高质量的化合物收藏, 一般包括 300-500万种精选的化合物, 如具有像药型特性的高质量化合物, 药物研发项 目相关的化合物等, 不仅需要考虑化合物的质量与纯度, 还要考虑化合物结构类型可代 表的化学空间化合物数量,包括化合物的多样 性(Diversity)与像药性(Drug Likeness) 等。

"像药"型化合物的分子设计和开发将成为世界 药行业的研发重点之一。 像药型 化合物的可能药物分子数目为 10 M ,该方法所面临的主要困难是如何从中有 效寻找具备特 定生物功效的化合物结构类型? 如何使 "像药"型化合物代表的化学空间有效的与蛋白 靶标所代表的生物空间紧密地结合, 增加新型化合物结构种类和数目?其开发的局 限性 在于, 分子设计的有效性和可利用的药物构架化合物 (Bui lding Block) 种类的多样性, 并成为药物研发的另一个重要瓶颈。 ,

Hit-to-Lead成为药物研发的主要手段,并在近 年 JH式引入药物研发产业链。该方 法先通过高通量筛选 "像药型"化合物, 以确认一组活性化合物( "Hit " ) , 再评估和 优化活性化合物以获得先导化合物 ( "Lead" ) , 并经多次筛选和优化先导化合物结构 类型, 以有效和准确地在高通量筛选的结果中优化出 针对于特定生物靶标具备可成药性 的化合物结构。 通常, 从化合物的合成、 筛选、 药效药理学、 完成化合物的结构优化需 要耗费 4-6年, 并需要开展大量的分子设计和分子结构对比工 作, 故存在系统性较差, 需与分子设计理念相结合等缺陷。

目前, 先导性化合物的优化又成为药物研发的关键, 将优化后的先导性化合物进行 分子设计和分子结构对比, 以获得核心的化合物结构, 再通过结构修饰以实现下述效果: 1)最大程度增加对于特定靶标的生物活性; 2)在保持对特定靶标生物活性的同时, 具有 选择性; 3)增加对特定细胞的功能和活性; 4)优化化合物的体内试验效果; 5)调节化合 物的吸收、 分布、 代谢、 排泄、 毒性 (ADME/T) 等特性; 6)配合和满足化合物在制剂、 给药方式、 输送系统、 生物利用度等方面的需求。

然而, 己有的先导化合物的优化过程比较机械和繁琐 , 涉及调整先导化合物的取代 基、 杂原子成分、 分子形状等方面的结构修饰, 使其具备 "像药"性。 通常, 需针对 1 - 3 个具有核心结构的化合物进行结构改造, 再研究化合物结构与其生物活性之间的关系

(SAR) , 并结合化合物的药代药理毒副作用等性质来优 化化合物结构, 多需要合成 5000 个以上的化合物, 化合物分子的设计效率较低, 并存在没有有效地利用现有的药物研究 数据与药物研究手段等缺陷。

"针对"性小型化合物收藏 (Focused Library)也是目前用来提高药物筛选效率的方 法之一,该方法约包含 500-2, 000个化合物,主要针对特定的化合物靶标并以 靶标 (Target Orientated)、多样性(Diversity Orientated)、天然产物(Natural Product Orientated)^ 化合物基本结构单元 (Fragment Orientated) 等为基础进行化合物的设计。 但这些设计 均以药物生物活性相关的单一因素为基础, 很少考虑因素之间的关联性, 也没有考虑与 其它影响化合物像药性的结构进行相对量化的 综合对比和评估, 更没有充分利用已有的 经验数据。 因此, 该收藏中的化合物分子设计趋于单一, 严重影响化合物结构的设计效 率。

尽管世界药物研发领域投入大量的人力物力开 发了很多新技术, 旨在提高药物的研 发效率, 但是, 如何提高药物设计的有效性、 针对性与设计效率, 使之更加有效、 实用 与便利, 如何合理地进行化合物结构对比, 如何在分子设计时综合利用和考虑影响药物 分子生物活性和理化性质的多种因素及其关联 性等, 如何将影响化合物结构与特性的诸 多因素进行综合分析与评估, 显著提高药物分子的设计效率, 仍是药物研发领域急待解 决的技术问题。 发明内容

为了加快药物研发的进程, 尤其是加速国内药物研发和世界接轨的进程, 显著提高 候选药物的设计效率, 发明人研究获得了多维矩阵用于分子设计的方 法和技术平台。 该 平台首次将数学的矩阵优化理念使用在药物及 其相关的分子设计领域, 并通过将药物研 发过程中需要考虑的大量因素按照一定的特性 进行归类和对比, 从而使用少量的变数来 代表数量巨大的变数, 以提高药物研发分子的设计效率及其合成效益 。

多维矩阵分子设计的理念在于, 任何药物分子都是由所谓的化合物基本结构单 元组 合而成的, 通过对 300万种高价值的 "像药' 型化合物按照 28000种化合物基本结构单 元进行化合物结构分类, 然后进行结构分析, 结果表明化合物基本结构单元组成药物分 子的方式呈现矩阵和多维矩阵的排列、 组合方式。 同时, 天然产物和中药有效成分单体 化合物结构的结构分类分析结果表明, 合成化合物的基本结构单元的组合方式与天然 产 物化合物的结构组合方式极具相似性。 因此, 在药物分子设计时, 将己知化合物结构的 各种经验型数据进行结构对比, 可以大大提高药物分子设计的针对性和有效性 。

多维矩阵分子设计平台为药物及其相关的分子 设计提供了一个系统化的矩阵模式的 结构对比和结构优化的方法。 该方法采用多维矩阵排列分析化合物的结构因 素的相应变 量和可变因素的相应变量, 再参照结构区域和经验性数据的结构对比结果 , 优选出具有 代表性的化合物结构类型, 以显著地减少需要合成的化合物数量, 并快速获得所需的具 有生物学活性或特定药物活性的候选药物,从 而显著提高化合物分子的设计效率和效益。

本发明采用多维矩阵并参照目标化合物结构优 化候选药物结构和完成候选药物分子 设计的方法可用于 Me- Too类新型药物、 药物构架化合物、 "像药 "型化合物、

Hit-To-Lead, 先导化合物优化等方面, 可以最少变量和最少数量的化合物合成来获得 最 佳的候选药物, 具有很强的设计针对性, 显著地提高药物的设计效率和研发效益, 并显 著缩减研发时间和研发费用。

为了实现本发明的发明目的, 本发明提供如下技术方案:

1. 一种优化候选药物分子结构的方法, 包括如下步骤:

( 1 )将目标化合物按照基本结构单元进行结构分 ,并分别以大写字母 A,B,C,D-Y 或 Z代表相应的结构区域, 并确定候选药物的可修饰区域, 分别选择可修饰区域中可选 择的变量, 其中, 可修饰区域 A的变量选自 Al、 A2、 A3〜An, 可修饰区域 B的变量选自 Β1、 Β2、 Β3···Βη, 可修饰区域 C的变量选自 Cl、 C2、 C3-Cn, 可修饰区域 D的变量选自 Dl, D2, D3-Dn ··· ···, 可修饰区域 Y的变量选自 Yl、 Υ2、 Υ3-Υη, 可修饰区域 Ζ的变量 选自 Zl、 Ζ2、 Ζ3〜Ζη, 其中, η为自然数;

( 2)参照经验型数据, 选择影响候选药物的可变因素及其变量, 所述的可变因素分 别以小写字母 a , b, c, d-y或 Z 加以表示,其中,可变因素 a的变量选自 al、 a2、 a3— an , 可变因素 b的变量选自 bl、 b2、 b3-bn, 可变因素 c的变量选自 cl、 c2、 c3-cn, 可变 因素 d的变量选自 dl , d2, d3-dn, ……, 可变因素 y的变量选自 yl、 y2、 y3-yn, 可变因素 z的变量选自 zl、 ζ2、 ζ3〜ζη, 其中, n为自然数;

( 3)采用多维矩阵排列分析步骤(1 ) 中所述的可修饰结构区域 A, B, C, D〜Y或 Z 的相应变量与步骤 (2) 中所述的可变因素 a, b, c, (^^或 2 的相应变量, 再参照结构 区域和经验型数据的结构对比结果,优选出具 有代表性的化合物结构类型代表 Α' 、Β' 、 C 、 D' -·'Υ, 或 Z' , 完成候选药物的结构设计与优化。

优选步骤 (1 ) 中的可修饰区域的确定通过经验型数据的对比 分析结构进行。

在本发明的优选技术方案中, 所述的方法还包括如下步骤-

( 1 ) 将目标化合物按照基本结构单元进行结构分区 ;

(2 )参照经验型数据, 确定影响候选药物分子靶标生物活性 /细胞活性的结构部分, 将其作为不可修饰区域;

(3 )对目标化合物结构进行分析与结构确认, 确定候选药物的可修饰区域, 分别以 大写字母 A, B, C, D—Y或 Z代表相应的结构区域, 分别选择可修饰区域可选择的变量, 其中,可修饰区域 A的变量选自 Α1、Α2、 Α3··'Αη,可修饰区域 Β的变量选自 Β1、Β2、 Β3···Βη, 可修饰区域 C的变量选自 Cl、 C2、 C3—Cn,可修饰区域 D的变量选自 Dl, D2, D3—Dn……, 可修饰区域 Y的变量选自 Yl、 Υ2、 Y3-Yn, 可修饰区域 Ζ的变量选自 Zl、 Ζ2、 Ζ3〜Ζη, η为自然数;

(4 )参照经验型数据, 选择影响候选药物的可变因素及其变量, 所述的可变因素分 别以小写字母 a, b, c, d〜y或 z加以表示,其中,可变因素 a的变量选自 al、 a 2、 a3-an, 可变因素 b的变量选自 bl、 b2、 b3-bn, 可变因素 c的变量选自 cl、 c2、 c3〜cn, 可变 因素 d的变量选自 dl, d2, d3〜dn ······ , 可变因素 y的变量选自 yl、 y2、 y3〜yn, 可变 因素 z的变量选自 zl、 ζ2、 ζ3···ζη, η为自然数;

(5 )采用多维矩阵排列分析步骤(3) 中所述的可修饰结构区域 A, B, C, 或 Z 的相应变量与可变因素&, b, c, d〜y或 z的相应变量, 再参照结构区域和经验性数据 的结构对比结果, 优选出具有代表性的化合物结构类型代表 A' 、 B' 、 C' 、 D' →' 或

V 。

在本发明的优选技术方案中, 所述的方法还包括如下步骤:

在^骤 (1 ) 或 (3 ) 确定可修饰区域的同时, 排除修饰暂不予考虑的部分, 所述的 暂不予考虑的部分选自环状结构上的取代基、 像药型化合物不应具有的官能团和结构类 型的任一种或其组合。

在本发明的优选技术方案中, 所述方法还进一步包括如下任一或全部歩骤-

( 6)对步骤 (3 )或 (5 )优选出的具有代表性的化合物结构类型 A' 、B' X' 、D' →, 或 Z' 的结构进行分析与结构确认, 确定其可选择的变量, 其中, 可修饰区域 A' 的变量 选自 A' 1、 A' 2、 A, 3—A' η, 可修饰区域 B' 的变量选自 B' 1、 B' 2、 Β' 3™Β' η, 可修饰区域 C' 的变量选自 C' 1、 C 2、 C 3〜C' n, 可修饰区域 D ' 的变量选自 D ' 1 ,

D' 2, D' 3-D' n , 可修饰区域 Γ 的变量选自 Y' 1、 V 2、 V 3-Y' n, 可修饰 区域 Z' 的变量选自 Z' 1、 V 1、 V "V n, 其中, n为自然数;

( 7)参照经验型数据, 选择影响候选药物的可变因素及其变量, 所述的可变因素分 别以小写字母 a' , b' , c ' , d' "'f 或 ζ ' 加以表示, 其中, 可变因素 a' 的变量选 自 a, 1、 a' 2、 a' 3〜a' n, 可变因素 b, 的变量选自 b' 1、 b, 2、 b' 3—b, n, 可变 因素 c' 的变量选自 c' 1、 c ' 2、 c' 3〜c ' n, 可变因素 d' 的变量选自 d' 1, d ' 2, ά' 3-d' n……,可变因 y' 的变量选自 y' 1、 γ' 2、 y' 3-y' n, 可变因 z' 的变量选 自 z, 1、 z' 2、 τ, 3〜ζ' n, 其中, n为自然数;

( 8) 采用多维矩阵排列分析步骤 (6) 中所述的优选出的具有代表性的化合物结构 类型 A' 、B' 、C' 、D' -Y' 或 Ζ' 的相应变量与步骤(7 )中所述的可变因素 a' , b ' , c' , d' "·γ, 或 Z' 的相应变量, 再参照结构区域和经验性数据的结构对比结果 , 优选 出具有代表性的化合物结构类型 A' B' 、 B' C 、 C' D' →, V ; 或

(9) 根据需要, 参照步骤 (6) - C8 ) 所述的方法, 采用多维矩阵排列分析优选出 的具有代表性的化合物结构类型 A' B' 、 B, C' 、 C D' →, V 的相应变量与可变因 素 a' b ' 、 b' c' 、 c' ό' ·' ' z ' 的相应变量, 再参照结构区域和经验性数据的结构 对比结果, 优选出具有代表性的化合物结构类型 A' ' B' ' C' ' 、

B, ' C, ' D, ' ·'·Χ, ' Υ, ' Ζ' ' ; 或

( 10) 根据需要, 参照步骤 (6) - (8) 所述的方法, 采用多维矩阵排列分析优选出 的具有代表性的化合物结构类型 A' , B' , C' ' 、B' ' C ' Ώ' ' →' ' Υ' , Ζ' , 与可变因素 a' ' b' ' c ' ' 、b, ' c' ' d, , …乂' ' y, , z' ' ,再参照结构区域和 经验性数据序列的结构对比结果, 完成候选药物的结构设计与优化; 或

( 11 ) 任选地, 根据候选药物的设计需要, 采用多维矩阵重复进行上述歩骤中的部 分歩骤或全部歩骤, 以进行候选药物的结构分析、 结构确认、 结构优化, 直至获得所需 的候选药物结构类型。

在本发明的优选技术方案中, 所述基本结构单元包括分子结构中的任一结构 单元, 选自饱和或不饱和的单环结构单元、 双环结构单元、 多环结构单元、 取代基、 官能团的 任一种或其组合;

在本发明的优选技术方案中, 所述的单环结构单元选自芳香单环、 非芳香单环、 取 代的芳香单环、 取代的非芳香单环的任一种或其组合;

在本发明的优选技术方案中, 所述的双环结构单元选自芳香双环、 非芳香双环、 取 代的芳香双环、 取代的非芳香双环的任一种或其组合;

在本发明的优选技术方案中, 所述的多环结构单元选自芳香多环、 非芳香多环、 取 代的芳香多环、 取代的非芳香多环的任一种或其组合, 其中, 所述环数不少于 3;

在本发明的优选技术方案中, 所述官能团选自酮、 醛、 脂、 胺、 酰胺、 单键、 双键、 三键、 卤素、 酸、 醇、 硫醇、 磺酸、 酚、 硫酚的任一种或其组合;

在本发明的优选技术方案中, 所述取代基是任何化合物的结构残基, 选自烷基、 烯 基、 炔基、 羟基、 醚基、 酯基、 芳基、 杂芳基、 环烷基、 杂环基的任一种或其组合。

在本发明的优选技术方案中, 所述的可修饰区域是指影响化合物生物活性或 者细胞 选择性的结构区域。

在本发明的优选技术方案中, 所述的经验数据选自靶标生物活性、 靶标生物选择性、 细胞活性、 毒副作用、 ADME性质、 像药性、 可合成性的任一种或其组合。

本发明的优选技术方案中, 可根据候选药物的设计需要, 采用多维矩阵重复进行 1 ) -8) 的部分或全部步骤来进行候选药物的结构分析 、 结构确认、 结构优化, 直至获得具 有所需生物学活性或药理活性的候选药物结构 类型。

在本发明的优选技术方案中, 所述的经验型数据选自如下数据库任一种或其 组合:

1 )世界药物研发领域常用蛋白质靶标数据库及 对应的化合物结构类型数据库; 或

2) 世界药物研发常用蛋白质靶标相对应的化合物 结构类型数据库; 或

3) 药物研发核心结构数据库; 或

4) 药物分子构架化合物类型数据库; 或

5) 被验证的具有生物活性的化合物结构类型数据 库; 或

6) 可查询上市药物数据库; 或 7 ) 生物等效型数据库; 或

8 ) 新陈代谢化合物类型数据库; 或

9 ) 毒性化合物结构类型数据库; 或

10 ) 中药有效成分化合物类型数据库; 或

1 1 ) 天然产物单体化合物结构数据库; 或

12 ) 药物治疗数据库; 或

13 ) 医疗关键词数据库。

本发明的另一目的在于提供多维矩阵在药物分 子设计中的应用, 其特征在于, 所述 的多维矩阵排列由结构因素与经验型数据共同 确定。

优选地,采用多维矩阵排列分析化合物的结构 因素的相应变量和可变因素的相应变 量, 再参照结构区域和经验性数据的结构对比结果 , 优选出具有代表性的化合物结构类 型。

本发明的优选技术方案中, 所述的药物分子选自 Me-Too类新型药物、 药物构架化合 物、 "像药"型化合物、 Hit-T 0 -Lead、 先导化合物的任一种或其优化结构。

优选地, 在药物分子设计中的应用中, 采用前述任一种药物分子设计方法进行药物 分子的设计。 发明详细描述

为了清楚表述本发明的保护范围, 本发明对下述术语进行解释和说明。

本发明所述的基本结构单元包括分子结构中的 任一结构单元, 选自饱和或不饱和的 单环、 双环、 多环等环状结构单元、 取代基、 官能团的任一种或其组合; 所述单环结构 单元选自芳香单环、 非芳香单环、 取代的芳香单环、 取代的非芳香单环的任一种或其组 合; 所述的双环结构单元选自芳香双环、 非芳香双环、 取代的芳香双环、 取代的非芳香 双环的任一种或其组合; 所述的多环结构单元选自芳香多环, 非芳香多环, 取代的芳香 多环, 取代的非芳香多环的任一种或其组合, 其中, 所述环数不少于 3; 本发明所述的官 能团包括酮、 醛、 脂、 胺、 酰胺、 单键、 双键、 三键、 卤素、 酸、 醇、 硫醇、 磺酸、 、 硫酚的任一种或其; 所述取代基是任何化合物的结构残基, 包括院基、 烯基、 炔基、 羟 基、 醚基、 酯基、 芳基、 杂芳基、 环烷基、 杂环基的任一种或其组合。

目前, 药物研发领域拥有的基本结构类型、 官能团和元素有 30000多种。 本发明通 过多维矩阵可将这些基本结构类型确定为约 500种, 将常用官能团确定为 30-50种。

本发明所述的 "ADME/T "是指化合物在吸收、 分布、 代谢、 排泄、 毒性等方面所具 有的性质。

本发明所述的可修饰区域是指影响化合物生物 活性或者细胞选择性的结构区域。 本发明所述的不可修饰区域是指决定化合物的 生物活性或者细胞活性且不能轻易 更改或修饰的结构区域。

本发明所述的 "暂不予以考虑的部分"是指在候选药物设计后 予以考虑的因素或 变量, 包括基本环状结构上的取代基, 该部分与化合物的某些性质有关, 但属于候选药 物的附加部分, 且其可选变量较多, 并对候选药物的可变因素影响较少, 通常需将其与 相连接的基本环状化合物统一考虑。 因此, 可在设计后期予以考虑, 以有效减少化合物 设计中的可变因素量, 显著提高化合物的设计效率。

本发明所述的靶标是指对一定适应症具备功效 的生物蛋白质,可以按照其生物功效、 适应症(如抗癌, 心脏病, 中枢神经疾病等) 、 靶标类型 (如 GPCR、 离子通道等)分类。 同时, 任何生物靶标或者蛋白质都具有一些靶点, 相同的靶标对应不同的靶点也对应不 同的生物活性或适应症而起到不同的作用, 而同一靶点仅对一个生物靶标或适应症具备 特别有效的活性。

本发明所述的 "目标化合物"又称 "参考化合物" 、 "药物设计目标"或 "参照 物" , 包括已知的对于特定生物靶标和靶点具备一定 的生物活性的化合物结构类型, 即 己知的化合物结构类型。

本发明所述的 "己知化合物结构类型"是指已被专利文献或科 文献公开的针对特 定生物靶标具有生物活性的化合物结构类型, 包括上市药物、 处于政府部门申报阶段或 临床阶段的候选药物、 处于临床前研究阶段的化合物等。

本发明的优选技术方案中, 选择目标化合物的途径包括适应症、适应症对 应的靶标、 被验证的靶标或被广泛接受的靶标或机理明确 的靶标、 靶标类型或蛋白组 (如 GPCR、 离 子通道等) 、 靶标蛋白质的结构类型、 专利文献或科技文献所公开的化合物结构类型 。

在本发明的优选技术方案中, 所述的目标化合物选自已知的具有特定生物活 性的化 合物结构、 按照靶标代码数据库査询到的化合物结构或对 特定靶标有效的化合物结构类 型、 已知药物或者候选药物等化合物结构类型, 包括上市药物、 处于临床阶段的候选药 物、 处于临床前研究的候选药物、 先导化合物、 具备生物活性的天然产物、 中药单体化 合物、 中药有效成分、 被验证的具备生物活性的像药性化合物、 计算机辅助药物分子设 计 (CADD设计化合物) 、 高通量筛选化合物、 已知靶标蛋白质空间立体结构及其靶点区 域的空间立体结构的任一种或其组合。

参照目标化合物进行药物分子设计是新型药物 的主要研发方向, 即将针对靶标设计 的化合物结构类型进行化合物结构分子的分析 、 设计、 改造和优化, 以得到新的化合物 结构类型或先导型化合物结构类型, 还可用于验证生物靶标, 以及寻找或设计药物化合 物新结构 (如 Me- Too类药物) 等。

本发明所述的化合物结构类型是指对于特定生 物靶标具备生物活性和结构相似性的 系列化合物。

本发明所述的候选药物是指有可能成为上市药 物的新化合物结构 (new chemical entity, NCE) 。

本发明所述的 "化合物结构类型的分析、 确定和优化"是指采用多维矩阵来排列、 分析影响候选药物可成药性因素的任一种或其 组合, 实现以最少数目的考虑因素来有效 地设计药物分子, 得到优化的先导型化合物或者候选药物化合物 结构的目的。

本发明所述的靶标生物活性是指化合物对特定 生物靶标所具有的生物活性或细胞活 性。

本发明所述的靶标生物选择性是指化合物对生 物靶标不同靶点的生物活性所具有的 选择性。

本发明所述的细胞活性是指化合物对特定细胞 的生物活性。

本发明所述的毒副作用是指化合物所具有的毒 性和 /或副作用。

本发明所述的可合成性是指化合物具备可被合 成出来的可行性。

本发明所述的 "先导型化合物优化"是指将一个具有特定生物 性的化合物进行结 构和性质的优化, 以获得具备所需生物活性或细胞活性的候选药 物。

目前, 化学信息学用于判断化合物的 "像药"性, 并利用一些总结的物理化学参数 来确定化合物的 "像药性" , 以提高活性化合物(Hit )和先导化合物(Lead) 的设计速 率。 其中, 用于确定化合物 "像药性" 的参数多源自己知药物、 处于临床试验阶段候选 药物、 天然产物等的分析和鉴定结果。

本发明所述的 "像药型"(drug like)化合物的含义来自 Walters和 Murcko(Walters WP, Stahl MT, and Murcko MA. Virtual Screening: An overview. Drug Discovery Today 1998; 3 : 160-78; Walters WP, Murcko A, Murcko MA. Recognizing Molecules with drug-like properties. Curr Opin Chem Biol 1999 ; 3 : 384-7 ) , 他们通过对美国药典 中所列成药的研究, 认为 "像药型"化合物的分子结构应与大多数己知药 (成药) 的 官能团和物理化学性质相一致, 现有的 "像药"型化合物的性质大多来自于已知药物的 研究和总结, 但已知药物的结构种类仅涵盖了 "像药"型化合物的很少一部分, 并不能 代表所有的 "像药"型化合物的种类和特点。 Lipinski (C. A. Lipinski ; F. Lombardo ; B. W. Dominy and P. J. Feeney (1997) . "Experimental and computational approaches to estimate solubi lity and permeabi lity in drug di scovery and development settings". Adv Drug Del Rev 23 : 3 - 25. ; Lipinski CA, Lorabardo F, Dominy BW, Feeney PJ. Experimental and computational approaches to estimate solubility and permeabil i ty in drug discovery and development sett ings. Adv Drug Del iv Rev 2001; 46: 3-26)认为: "像药"型化合物应具有充足的, 可接受的 ADME/T (吸收, 分布, 新陈 代谢, 排除和毒性) 性质, 并要通过 I期临床试验, 且分布在一个极其广泛的化学空间, 大约包含 1040-10100个 "像药"型化合物, 相对于可能的生物靶标, 发现一个活性化合 物的几率小于 1/1014。 "像药"化合物的物理性质将在很大程度上决定 合物能否成为 活性化合物。 Lipinski不仅发明了著名的 "5规则"来帮助鉴别和分析 "像药"型化合 物, 并认为在高效筛选时就应考虑药物的 ADME/T性质, 与传统意义上的化合物优化后期 才予以考虑 ADME/T性质有所不同。

现有的商业化合物数据库包括下述几种-

1) 综合药物化学数据库 --- Comprehensive Medicinal Chemistry (CMC); 2) 世界药物数据库一- World Drug Index (WDI);

3) MDDR数据库;

4) 调查类药物数据库 --- Investigational Drug Database (IDDB);

5) 商业化合物数据库 --- Avai lable Compound Databse (ACD/SCD);

6) 化学导向数据库一- ChemNavigator

7) 生物活性天然产物数据库 --- Biologically Active Natural Products (BDNP) 因此, 本领域技术人员可以基于上述数据库获得所述 的目标化合物。

在本发明的优选技术方案中, 所述的目标化合物为已知药物结构, 优选为市场上广 泛使用的己知药物, 如抗糖尿病药物、 心血管药物等。

本发明采用在临床上被广泛验证过的药物化合 物结构, 针对新型的靶标进行结构优 化和改造, 设计出新颖的针对特定适应症具有功效的药物 化合物结构类型, 包括先导型 化合物类型等。

本发明所述的 "经验型数据"又称 "经验型参数"或 "实验型参数" , 是指在药物 研发历史上积累下来的实验验证过的数据, 所述经验数据选自靶标生物活性、 靶标生物 选择性、 细胞活性、 毒副作用、 ADME性质、 像药性、 可合成性或药代药理参数等, 这些 经验型数据与化合物的结构密切关联, 包括化合物的构效关系, 因此, 经验型数据的对 比过程包含化合物的结构对比和化合物的结构 优化等方面。 本发明的经验型数据均是本领域已知的数据库 , 现例举如下:

1 ) 世界药物研发领域常用蛋白质靶标数据库及其 对应的化合物结构类型数据库。 处于临床阶段的化合物数据库用于寻求处于临 床阶段的化合物相关的信息, 以及与结构 相关的蛋白质靶标信息, 包括靶标的发现, 被验证的靶标, 蛋白质结构及其与其相关的 化合物结构类型, 其代表型的数据库包括:

http : //thomsonscientif ic. jp/ roducts/ i ddb/ index, shtml ;

http: //www, cancer, gov/ cancer topics/ factsheet/Therapy/investigational-dr ug-access;

http : //science. thomsonreuters, com/support/ f aq/ sddb/;

http : //www, center atch. com/drug- information/pipel ine/;

http: //www, pharmaprojects. com/research development analysis/tools, htm; http: //www, pipel inereview. com/ store/ roduct info. php?products id 2741 ; http: //www. bioportfolio. com/store/product/7781/R-d-Drug-Pipel ine-Databa se-2- months- Subscription, html ;

http: / / thomsonreuters. com/products services/science/science products/a- z/pipeline data integrator/;

http: //www. ovid. com/site/cataloR/DataBase/1244. . sp;

http : //www, imshealth. com/portal/site/imshealth;

http: //www, p.jbpubs. com/; 或

http: //www, fda. gov/ 0

ADME数据库用于研究、总结与化合物的吸收、 布、代谢与排泄等性质相关的结构 信息, 其代表型数据库包括:

http: //www, phar mai n f or mat i c . com/html /adme ox predictions, html ;

http: // w . aureus- sciences, com/aureus/web/guest/adme-overview;

http: //jp. fu itsu. com/group/kyushu/services/lifescience/en l ish/asp/adm edb/;

https : //www. cloegateway. com/services/cloe knowledge/pages/service front p age, php ;

http : //www. siritech. com/Cheminformatics. htm;

http: //modem, ucsd. edu/adme/ databases/databases extend, htm;

http: //www, pubpk. org/index. php?title~Main Page; http://www. pubpk. org/index. php?title~Main Page;

http://ww . hmdb. ca/;

http://www. nu O. orR/metabolomics/36124;

http://w w. genome. jp/ke g/pathway. html;

http://kanaya, naist. ,jp/KNApSAc /;

http://accelrys. com/products/databases/bioactivity /metabolite, html禾口 http://metlin. scripps. edu/。

蛋白质靶标数据库用于寻求和疾病相关的蛋白 质靶标的信息, 包括靶标的发现, 被 验证的靶标, 蛋白质结构及其与其相关的化合物结构类型, 具有代表型的数据库如下- http://tarRetdb. pdb. org/

http://www. dddc. ac. cn/pdtd/

http://www. rcsb. org/ pdb/home/home. do

http://bidd. nus. edu. SR/ group/ CJTTD/TTD. asp

http://w w. sciclips. com/sciclips/drug- targets- main, do

http://w w. ncbi. nlm. nih. gov/genbank/

http://w w. ebi. ac. uk/Databases/structure. html

化合物合成方法数据库用于寻求化合物的合成 方法及其可行性,具有代表性的数据 库如下: https://scif inder. cas. org;

http: / /accelrys. com/products/databases/ synthesis/和

http: //www, thieme-chemistry. com/en/products/ ournals/synfacts. html。

天然产物与中药数据库用于寻求天然产物及其 中药化合物的结构数据,具有代表性 的数据库如下- http://naturaldatabase. therapeut i cresearch. com/home. aspx?cs=&s-ND;

http://www. ponderf odder. com/node/113;

http://www, ncbi. nlm. nih. gov/pmc/articles/P C1347494/;

http://dnp. chemnetbase. com/intro/index. i'sp; sessionid=80C9568C977F47200 197BE48213AC51A:

http = //www, heterocycles..jp/ structure/ structure. php ;

http://www. chemnetbase. com/;

http://www.gfmer.ch/TMCAM/TNCAM database system. htm ;

http: //www, rmhiherbal. orR/ai/pharintro. html; http://tcm. emu, edu. tw/aboutOl. php?menuid=l; 禾口

http://tcm. cz3. nus. edu. sg/group/TCMsite/Default. aspx

"像药"型化合物、具有生物活性化合物数据库 于寻求 "像药"型化合物和具有 生物活性的化合物的信息. 具有代表性的数据库如下- http://accelrys. com/products/databases/bioactivity/mddr. html;

http://accelrys. com/products/databases/bioactivity/comprehensive-medici nal- chemistry, html;

http://www. chemnavigator. com/禾口

http://accelrys. CQm/products/databases/sourcing/screening-compounds-dir ectory. htmlo

药物毒副作用数据库用于寻求化合物的毒性、 副作用等特性的数据库, 其代表性数 据库包括- http: //databases, biomedcentral. com/browsesubject/?sub id二 1013;

http://www. drugs, com/; http://sideeffects. embL de/;

http://www. pdrhealth. com/ drugs/drugs - index, aspx;

http://w w. drugs, com/drug interactions, html;

http://www. drhealth. com/home/home. aspx;

http://www. rphworld. com/1 ink-350. html; http://toxnet. nlm. nih. gov/; http://bioinf. xmu. edu. cn/databases/ADR/index. html;

http://ctd. mdibl. org/和

http://accelrys, com/products/databases/bioactivity/toxicity. html。

已知药物数据库可以提供相关药物的基本信息 , 包括蛋白质靶标机理、 药物分子结 构、 药代药理性质、 毒副作用、 药物相互作用等信息, 其代表性数据库包括:

http://www. drugbank. ca/;

http://www. nlm. nih. ROv/medlineplus/druRinformation. html;

http://chrom. tutms. tut, ac.. j /.J I NNO/DRUGDATA/OOdat abas e. html;

http://www. rxlist. com/script/main/hp. asp;

http://www, accessdata. fda. gov/scripts/cder/drugsatfda/;

http:// ww. fda. gov/Drugs/Information0nDrugs/ucnil42438. htm;

http://ww . ncbi. nlm. nih. Rov/pubmed/; http://www. webmd. com/;

http://ww .3dchem. com/atoz. asp? http://ww. drugs, com/禾口 http : //www. pdrhealth. com/home/home. aspx。

本发明的优选技术方案中, 采用多维矩阵法设计候选药物时首先进行目标 化合物的 结构确认, 即按照分子结构基本单元拆分化合物的分子结 构, 再参照经验数据的结构比 对分析和结构优化结果, 以寻求数量最少的可改变区域或可修饰区域。

作用于生物靶标的化合物结构类型多具备特定 的结构母核, 该结构母核体现了化合 物针对特定靶标的生物活性, 其中, 化合物结构母核的空间结构应与靶标蛋白质的 立体 结构相匹配, 二者的匹配程度也是决定化合物生物活性的主 要因素; 结构母核上的杂原 子分布与化合物的生物选择性相关; 结构母核的官能团分布与其生物活性和选择性 相关, 而任何杂原子和官能团在化合物结构的分布均 有可能影响化合物的药代、 药理和毒副作 用等性能。

另外, 不同的母核结构类型对某一特定生物靶标具有 生物活性, 其决定因素是化合 物的空间立体分子结构和蛋白质空间立体结构 。 因此, 化合物的结构设计过程需进行分 子结构对比, 可参照化学基因工程的技术扩大化合物结构对 比的范围, 并增加考虑因素, 以进一步验证生物靶标, 并寻找新的先导型化合物结构类型。

在设计药物分子时, 需要考虑众多因素, 所述考虑因素包括适应症、 生物活性、 可 合成性、 理化性质、 稳定性、 新陈代谢、 药代、 药理、 毒副反应的任一种或其组合。 如 何有效地评价和分析相关影响因素是药物设计 的主要工作, 并且, 设计不同的参照物需 要考虑的影响因素或其顺序存在不同, 有时需反复考虑一些影响因素。

当以目标化合物为基础设计候选药物时, 应尽量不改变甚至增加其生物活性和选择 性, 并通过合理的结构修饰以改善甚至提高其药代 药理性质, 降低其毒副作用, 其中, 设计需要考虑因素包括:

A. 蛋白质靶标 (又称 "生物靶标" ) ; 或

B. 靶标的验证状态; 或

C. 作用于特定靶标的化合物结构类型; 或

D. 被验证的具备生物活性的 "像药 "型化合物结构类型; 或

E. 巳知药物的化合物结构类型; 或

F. 处于临床研究阶段的候选药物的化合物结构类 型; 或

G. 处于临床前研究阶段的候选药物的化合物结构 类型; 或

H. 天然产物的化合物结构类型; 或

I. 中药有效成分的化合物结构类型; 或

J. 生物等效性化合物结构类型; 或 K. 新陈代谢物结构类型; 或

L. 药代药理分子结构类型; 或

Μ. 毒性化合物结构类型; 或

Ν. 基本化合物结构单元类型; 或

0. 基本化合物官能团结构类型; 或

Ρ. 合成方式的任一种或其组合。

在本发明的优选技术方案中, 当需要保持甚至改善化合物的生物活性和选择 性时, 需要考虑的因素选自 A、 B、 C、 D、 E、 F、 G、 H、 I、 K、 P的任一种或其组合。

在本发明的优选技术方案中, 当需要保持甚至改善化合物的空间结构时, 需要考虑 的因素选自 A、 D、 E、 H、 I、 N、 0、 P的任一种或其组合。

在本发明的优选技术方案中, 当需要保持甚至改善化合物的新陈代谢时, 考虑的因 素选自 E、 F、 H、 I、 K、 Ν、 0、 Ρ的任一种或其组合。

在本发明的优选技术方案中, 当需要保持甚至改善化合物的药代药理性质时 , 考虑 的因素选自 D、 E、 F、 G、 H、 I、 L、 P的任一种或其组合。

在本发明的优选技术方案中, 当需要降低化合物的毒副作用时, 考虑的因素选 E、

F、 G、 H、 I、 L、 M、 P的任一种或其组合。

采用多维矩阵设计化合物的分子结构时, 可单独考虑因素 A-P的任一种或其组合, 其目的是有效地组合不同的因素, 从而确定目标化合物的结构类型, 并可采用多维矩阵 法来分析化合物结构。

在本发明的优选技术方案中,所述靶标为 12000-15000种源自 Genebank, TargetDB,

Threapuetic Target DB, DART, PDTD, TRMP、 其他相关数据库等, 包括被验证的靶标、 被广泛使用的靶标等, 以确定靶标对应的化合物结构, 并设计出新颖的药物化合物结构 类型、 新颖的先导型化合物类型等。

在本发明的优选技术方案中, 所述目标化合物选自来自天然产物或中药有效 成分的 化合物结构类型, 可以结合其传统药物的特性, 将其与靶标蛋白质结构进行结构对比和 结构优化, 寻找出有效的新化合物结构类型或先导型化合 物结构类型, 其中, 所述的天 然产物源自 The Directory of Natural Product, Tradional Chinese Medicine Databas, Natural Product Database等数据库。

本发明的优选技术方案中, 将有效的化合物结构类型与生物靶标进行结构 分析和对 比, 以寻求对该生物靶标具备活性的新化合物结构 类型, 其中, 所述有效的化合物为经 过验证的具备一定生物活性的化合物结构类型 , 并在化学空间内代表最大数目的化合物 结构,包括天然产物,以及己知的、可査询到 的、来源于文献和相关数据库(包括 PubMed, CMC, MDDR, IDDB, Scifinder, Chemnivagator等) 的化合物结构等。

与现有技术相比, 本发明的有益效果包括:

本发明采用多维矩阵法系统的分析、 设计和优化化合物的分子结构, 以显著提高 候选药物分子设计的全面性、 针对性、 准确性、 系统性和设计效益。

2、 本发明结合高效的药物分子设计, 并采用广泛使用的已知药物验证本发明的候药 物设计方法, 显著提高了人们对于候选药物分子结构和性质 性能之间关联性质的认识, 更加系统和完善地提高 SAR的统计效力, 并大幅度地降低药物分子设计的研发投入。

3、 本发明系统地、 全面地和合理地总结和使用药物研发经验型数 据, 并深入地和系 统地完善候选药物的设计、 结构对比、 结构确认和结构优化技术, 显著提高了药物分子 设计的针对性、 有效性和效益。 附图说明

图 1: 本发明优化目标化合物分子设计全过程。

图 2: 本发明优化化合物分子设计的多维矩阵示例。

图 3: 实施例 1目标化合物卡托普利的优化过程。

图 4 : 实施例 5目标化合物奥美拉唑的优化过程。

图 2中, 大写字母如 A, B, C…… Y或 Z; AB, AC ··· ··· BC, BD ··· · ·· CD, CE · · · ··· XY或 YZ 等代表化合物的结构区域序列,小写字母如 a, b, c…… 或 2; ab, ac-. . bc , bd…… cd, ce…… yz等代表经验性数据序列。 具体实施方式

以下结合实施例对本发明做进一步描述。 需要说明的是, 下述实施例不能作为对本 发明保护范围的限制, 任何在本发明基础上作出的改进都不违背本发 明的精祌。

需要说明的是, 下述所有化合物中, 化学键不完整的表示与氢相连。 实施例 1 卡托普利系列化合物的结构优化

Captopri l

以卡托普利为目标化合物进行药物分子结构设 计的方法, 具体步骤如下:

1 ) 将卡托普利按照基本结构单元进行结构分区, 分为 A, B, C, D, E五个区域; 2 )参照和比对经验型数据, 确定 E区域为关键核心区域, 其酰胺、 邻位的酸基及其 杂环属于核心结构范畴, 需要尽量保留。 考虑其决定靶标生物活性 /细胞活性的功效, 确 认 E区域为不可修饰区域, 而 A, B, C, D为分子设计的可修饰区域;

3 )根据影响候选药物的可变因素来确定候选药 的可修饰区域。 具体过程如下:

① A区域, 参照和比对经验型数据可知, 巯基 (SH) 官能团具有较强的还原性, 在 新陈代谢、 剂型、 稳定性、 毒性和副作用等方面均不是比较合适的官能团 , 可将其替代 为 0H, NHR, NH 2 , SOR, S0 2 R, S0 3 H, S0 3 R, C00H, C00R或其杂环基本结构等。

② B区域, 参照和比对经验型数据可知, 增加碳链和替代元素是需要考虑的范畴, 可替代的元素包括: 0, N, S及杂环基本单元。

③ C区域: 参照和比对经验型数据可知, 其立体化学结构需要保留, 而替换甲基可 用于增加化合物的 "像药"性, 尤其在药代药理方面。 可以替换的官能团为: 任何芳香 或者非芳香官能团。

④ D区域: 参照和比对经验型数据可知, 其立体化学需要保留, 并需考虑不同类型 的环结构及其双环结构。 需要考虑的单环环状结构类型 (包括杂环)包括: 4元环, 5元 环, 6元环, 7元环, 8元环或其杂环等, 需要考虑的双环结构 (包括杂环) 包括: 4-5 类型, 5-5类型, 5- 6类型, 5-7类型, 5- 8类型, 6- 5类型, 6-6类型, 6-7类型, 6-8 类型或其杂环等。

根据经验型数据的分析, 5-6类型为最佳选择, 再需考虑其药代药理, 像药性, 己知 药物结构对比, 天然产物结构对比, 等效性等可变因素, 选择 5-6类型和 6-6类型最为 合理, 其中, 主要考虑非芳香环, 其次是芳香环或非芳香环。

4) 根据经验型数据, 选择影响药物的可变因素及其变量, 具体过程如下: A区域需要考虑的经验数据参数 a的范围为靶标生物选择性, 毒副作用, ADME性质, 像药性, 可合成性。

主要的考虑范围需要参照经验型数据库的支持 , 包括生物等效性, 新陈代谢数据库, "像药 "型化合物数据库, 已知药物数据库, 临床药物数据库等。 根据 SH的特性, 可以 确定经验参数 a使用的官能团为: S0R, S0 2 R, S0:,H, COOH, COOR和环状基本结构。 其中, SOR在稳定性方面存在着问题; 50 3 11和(:0011作为强酸性官能团, 在 "像药"型方面和已 知药物结构对比方面存在着问题; 常用的药代药理手段为 S0 3 R, 用来调节结构因素, 但 S0 3 R同样存在着化学不稳定性, 在一定的酸性条件下会转化为 S0 3 H; COOR具有一定程度 的化学稳定性, 为最佳选择。 参照天然产物的结构和性质, 此区域部分可以考虑使用环 状结构类型来减少可旋转化学键的数目, 可以选择的环类型为 6- 8元环。

B区域要考虑的经验数据参数 b的范围为靶标生物选择性, ADME性质, 可合成性。 B区域中的 0, N, S等官能团和 C00R的结合, 会形成尿素类化合物结构类型, 不完 全符合 "像药"型化合物结构, 而增加碳链, 不仅仅可以满足稳定性的要求, 还在调节 化合物的药代药理性方面具备一定的优越性, 且增加的碳链应该为 1-2个碳, 以符合化 合物的空间结构类型。

C区域要考虑的经验数据参数 c的范围为靶标生物选择性, ADME性质, 可合成性。 D区域要考虑的经验数据参数 d的范围为靶标生物选择性, 毒副作用, ADME性质, 可合成性。

5)根据每个结构区域和经验性数据序列的结构 比结果, 选出具有代表性的化合物 结构类型, 具体如下:

通过 Aa矩阵的对比分析可以确定, A区域的结构类型代表为 C00R或 6-8元环结构。 通过 Bb矩阵的对比分析可以确定, B区域的结构类型代表为碳链结构。

通过 Cc矩阵的对比分析可以确定, C区域的结构类型代表为任何芳香或者非芳香 能团。

通过 Dd矩阵的对比分析可以确定, D区域的结构类型代表为单环或双环结构。

6)根据经验型数据的对比分析结构, 多维矩阵的第二层考虑如下:

AB组合需要考虑的经验数据参数 ab的范围为靶标生物选择性, 毒副作用, ADME性 质, 像药性, 可合成性。

具体确定 A部分为酸基 (C00H) 、 脂基 (C00R) 或酰胺基 (C0ONHR) , 同时结合 B区 域为加长链, 如烷基 (CH 2 -CH 2 , CH 2 -CH 2 -CH 2 ) , 醚基 ((¾-◦) 或者胺基 (CH 2 - N) 。

BC组合需要考虑的经验数据参数 be范围为靶标生物活性 /选择性, ADME性质, 像药 性, 可合成性。 具体 B区域和 AB组合一样, 而 C区域可以选择长链取代基, 这部分需要 和可合成性紧密结合。

CD组合需要考虑的经验数据参数 cd的范围为靶标生物选择性, ADME性质, 像药性, 可合成性。 C区域应该和 BC组合一样, 而 D区域考虑饱和或者不饱和环状结构, 避免单 一取代基。

两层综合考虑, A区域需要考虑部分为酸基 ( C00H) , 脂基 ( C00R) , 或者是酰胺基 (C00NHR), B区域考虑如烷基((¾ (¾,或者 CH 2 -CH 2 -CH 2 ),醚基(CH 2 -0)或者胺基(C -N), C区域为长链取代基, 而 D区域为饱和或者不饱和单环或双环结构。

7 ) 根据经验型数据的对比分析结构, 多维矩阵的第三层考虑如下:

ABC组合需要考虑的经验数据参数 abc的范围为靶标选择性, ADME性质, 毒副作用, 像药性, 可合成性, 可以确定 A=C00H或者 C00R; B=CH 2 或者 CH 2 - CH 2 ; C=CH 3 或者长链取代 基。

BCD组合需要考虑的经验数据参数 bed的范围为靶标选择性, ADME性质, 像药性, 可合成性, 可以确定 B=C 或者 (¾-(¾; C=CH 3 或者长链取代基, D=5- 5双环, 6-5双环, 同时 D区域 5元环可以做开环考虑。

8 ) 根据经验型数据的对比分析结构, 多维矩阵的第四层考虑如下:

ABCD组合需要考虑的经验数据 abed的范畴为靶标生物活性 /选择性,毒副作用, ADME 性质, 像药性, 可合成性, 可将 ABCD分为:

A=C00H, C00R; B= CH 2 - CH 2 ; C=CH 3 或者长链取代; 0=单5元环, 5- 5双环, 6- 5双环, 5元环幵链组合。

( 9) 根据经验型数据的对比分析结果, 可以确定如下具体结构化合物, 见表 1。

卡托普利系列化合物的结构优化

实施例 2 卡托普利系列化合物的结构优化

步骤同实施例 1, 确认 Captopri l -—卡托普利, Enalapri l-—依那普利, Lisinopri l ---赖诺普利, Ramipri l—-雷米普利, Trandolapri l—-群多普利, Quinapri l ---喹那普利, Meocipril ---莫昔普利, Prindopril 培哚普利,

Benazepri l—-贝那普利, Fosinopri 1 ---福辛普利后。

作为药效而言, 群多普利, 雷米普利, 培哚普利和莫昔普利具备较强的作用, 采用 多维矩阵并参照经验型参数比较研究化合物结 构可知, D区域对于化合物的生物活性和选 择性决定的作用, 如何阻止 D区域五元环发生新陈代谢成为主要的提高化 物分子靶标 活性的因素, 而饱和环 (如群多普利, 雷米普利, 培哚普利) 相对于芳香环 (莫昔普利 和喹那普利) 具备更有效的作用。

在毒副作用领域, 雷米普利显示出最佳的毒副作用结果, 显示五元环以下的饱和环 将是最佳的选择。

赖诺普利, 福辛普利, 贝那普利和喹那普利显示出相对较差的药效和 毒副作用, 表 明 C和 D区域的重要性, 且 C区域中小型而简单的取代基将是最佳选择。

培哚普利显示出生物等效性官能团取代的优势 。 结合化合物的结构对比类型, 可以 根据多维矩阵分子设计方面, 对化合物结构进行设计优化, 其优化的前提是保证化合物 的生物活性保持在小于 10 μ Μ, 并保持和优化其生物选择性, 方案见表 2。

卡托普利系列化合物的结构优化 吡格列酮

吡格列酮的结构分区及其可修饰区域

根据 Piogl itazone的结构类型, 按照化合物基本结构单元将其划分为 A, B, C, D,

E, F, G, H, I, J, K, L, M, N, 0和 P共 16个区域, 见表 3。

区域 J, 0, P决定和影响化合物的靶标生物活性 /细胞活性,应属于不可修饰的区域。 区域属于和影响靶标生物活性 /细胞活性的区域, 并在一定程度上影响化合物的靶 标生物选择性, 对其适当的修饰将可以调节靶标的生物选择性 , 需要结合 G, H, K进行 综合考虑, 故在候选药物化合物结构优化设计时进行整体 考虑。

I, Κ, L, Μ属于取代基或官能团范畴, 属于暂不予以考虑的区域。

F, G, Η区域属于连接区域, 可以调节靶标生物选择性, ADME性质, 毒副作用, 像 药性和可合成性的可修饰区域或可修改部分, 并作整体考虑。 A和 B区域属于可以调节靶标生物选择性, 毒副作用, ADME性质, 像药性和可合成 性的区域, 可以被确定为可修饰或可修改的区域, C, D, E属于取代基或官能团范畴, 属 于暂不予以考虑的区域, 可 A, B, C, D, E区域可以作为整体来考虑。

综合上述分子结构分析结果, 确定吡格列酮的可修饰区域为^ B , C, 见表 3。 A区域主要修饰可以为替换杂环结构类型,如 环和其他杂环结构,但重点考虑为吡 啶环的取代基类型。

B区域主要修饰考虑其起到的链接作用的功能 故碳链的长度及 C, 0, N的生物等效 替换是主要的修改手段。

C区域是一个比较复杂的区域, 该区域的修饰将影响到靶标生物活性 /细胞活性, 应 尽量不做改动, 主要手段可以是碳链长度和 c, 0, N生物等效替换。

同时, A区域需要考虑的经验数据参数 a的范围为主要适应靶标生物选择性,毒副作 用, ADME性质, 像药性及其可合成性。

B区域需要考虑的经验数据参数 b的范围为而影响化合物的靶标生物选择性, 副作 用, ADME性质和可合成性。

C区域需要考虑的经验数据参数 c的范围为靶标生物活性的、 调节靶标生物选择性, 毒副作用, ADME性质, 像药性和可合成性。

根据经验型数据的对比分析结果, 优选出具有代表性的化合物结构类型如下: 通过 Aa矩阵的对比分析可以确定 A区域的结构类型代表为吡啶环。

通过 Bb矩阵的对比分析可以确定 B区域的结构类型代表为 C, 0, N的生物等效替换。 通过 Cc矩阵的对比分析可以确定 C区域的结构类型代表为碳链长度和 C, 0, N生物 等效替换。

综合考虑上述分析结果, 可以确认 A可以为吡啶环, B区域可以为 -NCH 3 C C 0, C 区域保持不变, 可以快速 :

Osiglitazone 实施例 4 奥美拉唑系列化合物的结构优化

Losec/Prolosec --奥美拉

1 ) 将奥美拉唑按照基本结构单元结构分区, 分为 A, B, C, D四个区域;

2 ) 根据经验型数据或者文献实验数据表明, 区域 A, B, C, D的可能的多维矩阵组 合不少于上万种。 根据影响候选药物的可变因素来确定候选药物 的可修饰区域。 具体过 程如下:

① A区域, 根据经验性数据, 可替代甲氧基的有效官能团包括 R, Ar, R0, RN, RS, RC0, RCON等, 且可分布在 1位和 2位。

B区域, 根据数据库的分析表明, 可替代 B区域的有效宫能团包括

③ C区域:根据数据库的分析表明,可替代 C区域的有效官能团包括 SON, S0 2 N, S0 2 C, SC等。

④ D区域:根据数据库的分析表明,可替代 D区域的有效官能团包括 Ar或 其中 R 2 、 R 3 、 !^和^可以分别为 R, 0R等。

3 ) 根据经验型数据, 选择影响药物的可变因素及其变量, 具体过程如下- 针对相同靶标的分子结构分子, 生物靶标的结构分析, 经验型数据库数据的分析等 经验型数据库说明: 区域 B和区域 C属于生物活性的必需结构成分, 为不可修饰区域。 其中, 区域 B中氮原子取代的吲哚环将导致取代基在酸性 新陈代谢过程中不稳定, 且 吲哚氮原子上的氢原子在药物生物活性方面及 其化合物酸碱性方面有着重要作用, 虽然 在生物等效性方面合理, 但将此氮原子换成氧原子或者硫原子存在不合 理性; 区域 C中 单氧化的硫原子是非常重要的生物活性成分, 将其转化成为双氧化的硫将对于生物活性 不利, 且将连接硫原子和吡啶环的碳环成氮, 虽然在生物等效型方面合理, 但是在化合 物的 "像药"型和选择性方面不够合理。

使用多维矩阵方式分析结果,将分子设计的重 点放在区域 A和区域 D。参照商业化合 物数据库和经验型数据, 并采用多维矩阵排列、 组合、 分析、 优化和区域 A、 D结构。 首 先将一个类型的分子结构类型和取代位置类型 进行分类及其排除操作, 选择出最少量的 因素, 进行实际合成测试, 从而寻找出最佳的 A区域取代基类型和位置, D区域的芳香环 类型及其取代基类型和位置。 参照化合物合成数据库, 进行新型化合物结构类型的合成 验证。

A区域, 主要在于苯环和杂环的选择及其取代基的位置 和类型, 以及生物等效性、药 代药理、 天然产物、 合成的可能性和化合物的酸碱性等, 并在碳, 氧, 氮, 硫和卤素之 间进行多维矩阵组合, 寻找出合理的选择。

D区域, 关键在于芳香环的选择, 其可能性非常得多, 就特定的化合物结构而言, 由 于类似构效的分子结构均采用吡啶 2位取代, 但采用不同含氮原子杂环结构为必需的设 计战略。 多维矩阵分子排列给出多种取代可能性, 而多维矩阵分子结构分析集中在 2位 取代吡啶环结构, 目的在于提高和改善其生物活性等。 而吡啶环取代基, 其主要的方面 是化合物的酸碱性, 药代药理, 生物等效性, "像药"性, 天然产物等方面。

4)根据每个结构区域和经验性数据序列的结构 比结果, 选出具有代表性的化合物 结构类型, 具体如下:

通过 Aa矩阵的对比分析可以确定, A区域的结构类型代表为 R, Ar, R0, RN, RS,

RCO, RC0N等, 且可以分布在 1位和 2位。

通过 Bb矩阵的对比分析可以确定, B区域的结构类型代表为苯并吡唑。

通过 Cc矩阵的对比分析可以确定, C区域的结构类型代表为 -S0CH 2 -。

通过 Dd矩阵的对比分析可以确定, D区域的结构类型代表为 D区域可以为 , Ar 等。

5 ) 根据经验型数据的对比分析结构, 多维矩阵的考虑如下:

ABCD组合需要考虑的经验数据 abed的范畴为靶标生物活性 /选择性,毒副作用, ADME 性质, 像药性, 可合成性, 包括:

A= OR, R, R可以为 H、 垸基或取代烷基, 尤其是卤代烷基; B=苯并吡唑; C=- SOCH厂; 其中 R 2 、 R :i 、 和 R 5 可以分别为 R, OR等, R 可以为 H、 垸基或取代烷基, 尤其是卤代烷基或垸氧基垸基。

( 6) 根据经验型数据的对比分析结果, 可以确定如下具体结构化合物, 见表 4。

表 4 奥美拉唑系列化合物的结构优化

实施例 5 百优解系列化合物的结

百忧解

表 5 百忧解的结构分区与其可修饰区域

百忧解的结构分区 百忧解的可修饰区域

( 1 ) 按照化合物基本结构单元将百忧解 (Prozac ) 可以划分为 A-Q共 17个区域, 见表 5。 若全部考虑 17个区域, 其排列组合的化合物数目庞大。

( 2 ) 参照确定影响候选药物分子标靶生物活性 /细胞活性的结构部分, 确认不可修 饰部分, 可以先不考虑的区域, 可以修饰的区域。 具体过程如下:

G , N, 0区域与化合物的靶标生物活性 /细胞活性密切相关, 属于核心结构范畴, 尤 其是 N, 0区域, G区域是不可轻易修饰或轻易修改部分, 而 N区域可以进行生物等效性 官能团替换; P, Q区域也是由于靶标生物活性 /细胞活性考虑而不可轻易修饰部分, 而新 陈代谢前或后的氢键给予能力将予以考虑。 故将 G, N, 0, P, Q区域分为一个区域考虑。 A, B, C, D, E, F区域属于取代基区域, 对化合物的毒副作用具有影响, 在化合物 的设计早期暂不予考虑, 而设计和结构优化后作为整体加以考虑。

( 3 )根据目标化合物的结构分析与确认结果, 确定 A、 B、 C为可修饰区域(表 5 )。

( 4 ) 根据经验型数据, 选择影响药物的可变因素及其变量, 具体过程如下: 就 A区域而言, 保持苯环结构, 更换取代基将是合理的修饰方式。

就 B区域而言, 结合中枢系统药物的发展历史, 早期的药物属于 MA0I系列化合物结 构类型,三环化合物类型,可以确认如下结构 : CH 2 CH 2 N (CH 3 ) 2 , CH 2 CH 2 NHCH 3 , CH 2 CH 2 CH 2 (CH 3 ) 2 和 CH 2 CH 2 CH 2 NHCH 3; 同时考虑 0原子作为连接官能团的等效基团;

就 C区域而言, 保持苯环结构将是优先考虑的因素, 更换取代基将是合理的修饰方 式。

根据经验型数据库可知, A区域的可变因素 a需考虑生物选择性, 毒副作用, ADME 性质, 像药性和合成性, 应关注该区域的取代基类型。

根据经验型数据库可知, B区域的可变因素 b需考虑 ADME, 生物选择性, 细胞活性, 新陈代谢, 毒副作用, 像药性, 可合成性, 尤其是像药性中的可旋转健数量和生物选择 性, 毒副作用等, 初步确定 0原子的等效基团 C原子, 当然考虑到天然产物的特性, 优 先考虑保持 0原子, 同时环状化合物结构类型也是一种可修饰的区 域。

根据经验型数据库可知, C区域的可变因素 c需考虑生物选择性, 毒副作用, ADME 性质, 像药性, 可合成性等因素, 可考虑加入取代基; 更优先结合考虑 A区域的取代基 的类型。

(5)根据每个结构区域和经验性数据序列的结构 对比结果, 选出具有代表性的化合 物结构类型, 具体如下:

通过 Aa矩阵的对比分析可以确定, A区域的结构类型代表为取代苯环(如卤素或 CN 取代的苯环, 其中 CN与卤素等效) , 天然产物常见的五元环二醚取代苯环结构类型 , 含 氧五元杂环;

通过 Bb矩阵的对比分析可以确定, B区域的结构类型代表为含有 N原子的环状结构, 优选六元环结构; C¾C N(CH 3 ) 2 , CH 2 CH 2 NHC¾, CH 2 CH 2 C N(C ) Z 和 CH 2 CH 2 CH 2 NHCH 3 , 或者 0 原子的等效基团, 如 (或1^

通过 Cc矩阵的对比分析可以确定, C区域的结构类型代表为相对于 0原子的 Beta 位置引入了立体化学结构类型, 而在五元杂环引入了苯环结构及被取代基取代 的苯环, 如优选卤素, 更优选 F原子。

C6) 根据经验型数据的对比分析结构, 多维矩阵综合考虑如下:

ABC组合需要考虑的经验数据 abc的范畴为靶标生物活性 /选择性, 毒副作用, ADME 性质, 像药性, 可合成性, 可以分为:

A=五元环二醚, 卤素取代苯环, 含氧五元杂环; B= CH 2 CH 2 NHCH 3 , CH^H^iCH,),, CH 2 C C N(CH 3 ) 2 或立体结构; C=苯环, 取代苯环, 如 F或 C1取代苯环。

(7) 根据经验型数据的对比分析结果, 可以确定如下具体结构化合物, 见表 6。

实施例 6 吉非替尼类似物的结构优化

吉非替尼(Irresa, gef inib, ZD1839)为选择性表皮生长因子受体 (EGFR) 酪氨酸激 酶抑制剂, 为易瑞沙新型抗肿瘤 , 其结构如下式所示:

吉非替尼

吉非替尼的结构分区与其可修饰区域

吉非替尼的结构分区 吉非替尼的可修饰区域

(一) 化合物结构分区和结构确认

按照基本结构单元划分将吉非替尼划分为 A, B, C, D, E, F, G, H, I, J, K, L, M, N, 0, P, Q, R和 S等 19个区域, 见表 7左栏。

此类化合物结构类型属于概念验证型新型药物 研发类型, 其化合物结构可以修饰的 区域相对广泛。

F, J, K, L, M区域与化合物的靶标生物活性 /细胞活性密切相关, 属于不可修饰或 者不可修改区域, 但 J区域被认为是可进行结构修饰的部分, 但双环结构不应轻易修饰。

A, B, C, D, E区域为可修饰区域, 主要考虑因素为 ADME性质, 像药性, 毒副作用, 靶标生物选择性, 可合成性, 并需考虑附加影响靶标生物活性的可能因素。

G区域为可修饰区域, 主要考虑的因素为 ADME性质, 像药性, 毒副作用, 靶标生物 选择性, 可合成性, 并需考虑附加影响靶标生物活性的可能因素。

H, I区域为取代基或官能团, 设计前期暂不予以考虑。

N区域为可修饰区域, 其主要的考虑因素为 ADME性质, 像药性, 毒副作用, 靶标生 物选择性, 可合成性, 并需考虑附加影响靶标生物活性的可能因素, 其主要的考虑结构 类型应该为取代基的类型。

区域 0, P, Q, R, S为取代基或官能团, 设计前期暂不予以考虑。

在多维矩阵分析结构和结构确定完成后, 确定吉非替尼的可修饰区域为 A, B, C, D, 见表 7右栏。

(二) 化合物的结构优化

A区域主要的考虑因素为 ADME性质, 像药性, 毒副作用, 靶标生物选择性, 可合成 性, 且考虑附加的影响靶标生物活性的因素。 B区域主要的考虑因素为 ADME性质, 像药性, 毒副作用, 靶标生物选择性, 可合成 性。

C区域主要考虑靶标生物活性, ADME性质, 像药性, 毒副作用, 靶标生物选择性, 可合成性。

D区域主要考虑 ADME性质, 像药性, 毒副作用, 靶标生物选择性, 可合成性。 其主 要的考虑因素为苯环取代基或官能团, 主为简单的取代基, 如卤素, 氰基, 三键或者双 键 (主要考虑抗癌药物的特性)'。

表 6 吉非替尼类似物的结构优化

考虑 AB区域的 ADME性

质, 像药性, 可合成性, 毒副

作用, 靶标生物选择性, 附加

靶标生物活性 /细胞活性(氮原

子亲核点 Micheal Acceptor)

和可合成性,并保持 CD区域保

持不变

考虑 AB区域的 ADME性

质, 毒副作用, 靶标生物选择

性, 像药性:

C区域保持不变;

D区域的 ADME性质, 像 GW572016 药性和可合成性

考虑 AB区域的 ADME性质, 像

药性, 毒副作用, 靶标生物选

择性, 附加靶标生物活性, 可

合成性;

C 区域的毒副作用, 靶标生物

EKB569 选择性; D 区域可以不变, 或

考虑 ADME性质,像药性,靶标

生物选择性及其可合成性

H I272

实施例 7 唑烷酮抗生素 Linezoline类似物的结构优化

A C B

Linezoline

唑院酮抗生素如 Linezoline对许多较顽固的革兰阳性细菌有效, 括耐万古霉素屎 肠球菌、 耐甲氧西林金黄葡萄球菌、 耐青霉素肺炎链球菌等。 它可在 mRNA转录的早期抑 制细菌蛋白的合成, 口服后吸收迅速而完全。 许多尚未发表的临床研究资料表明, linezolid对成年人的肺炎、 皮肤感染、 耐万古霉素屎肠球茵等均有效。 其不良反应与 β 内酰胺类抗生素、 克拉霉素、 万古霉素等相似。 Linezolid是第一个获准用于治疗耐 万古霉素肠球菌的口服抗生素。 由于唑院酮类药物独特的作用机制和抗菌谱很 广, 治疗 高度耐药的革兰阳性菌有效, 使它成为一个极有价值的治疗药物, 可取代现在应用的其 他药物。 基于此, 对于 l inezoline进行结构改进, 以获得改进结构的化合物。

具体步骤如下:

1 ) 将该 Linezoline照基本结构单元结构分区, 分为 A, B, C, D四个区域;

2) 根据经验型数据或者文献实验数据表明, 区域 A, B, C, D的可能的多维矩阵组 合不少于上万种。 根据影响候选药物的可变因素来确定候选药物 的可修饰区域。 具体过 程如下:

D部分设计: 使用简单取代基团;

① A区域, 决定化合物活性的关键区域, 根据经验性数据, 可替代的结构为饱和杂 环或芳香杂环, 以饱和杂环为优选。

② B区域, 决定化合物活性的关键区域, 根据数据库的分析表明, 可替代 B区域的 有效官能团包括取代的环外氮原子 (其目的为取消氢键) , 氧原子, 硫原子等。

③ C区域: 根据数据库的分析表明, 可替代 C区域的有效官能团包括取代苯环和芳 香杂环。

④ D区域: 调节 DMPK性质, 解决新陈代谢问题, 根据数据库的分析表明, 可替代 D 区域的有效官能团包括简单取代基团。

3) 根据经验型数据, 选择影响药物的可变因素及其变量, 具体过程如下: 使用多维矩阵方式分析结果,将分子设计的重 点放在区域 A和区域 B。参照商业化合 物数据库和经验型数据, 并采用多维矩阵排列、 组合、 分析、 优化和区域 A、 B结构。 首 先将一个类型的分子结构类型和取代位置类型 进行分类及其排除操作, 选择出最少量的 因素, 进行实际合成测试, 从而寻找出最佳的 A区域取代基类型和位置, B区域的芳香环 类型及其取代基类型和位置。 参照化合物合成数据库, 进行新型化合物结构类型的合成 验证。

4 )根据每个结构区域和经验性数据序列的结构 比结果, 选出具有代表性的化合物 结构类型, 具体

其中 Rl, R2, R3, K4均为任意取代基, 如 Η, 垸基, 环垸基, 垸酰基, 环垸酰基, 取代的酰基, 磺酰胺基, 烷基氨基磺酰基等;

X, Υ为芳环上常规取代基, 如 Η, 素, 院基, 烷氧基, 环烷基, 酰基等; 5) 根据经验型数据的对比分析结构, 对步骤 4) 中的前两个结构可能的修饰区域进 行修饰,

其中 Rl, R2, R3 , 4, R5, R6, R7均为任意取代基, 如 H, 烷基, 环烷基, 烷酰基, 环烷酰基, 取代的酰基, 磺酰胺基, 垸基氨基磺酰基等;

X, Y为 CH, NH, 0, S;

(6 )在步骤 5 )基础上, 根据经验型数据的对比分析结果, 考虑到 R2、 R3、 R4、 R5、 R6对活性的影响不大, 确定如下结构式:

其中各取代基的定义如下:

通过上述方法, 获得如上所述的 4个化合物, 并通过 MIC活性检测, 这些化合物显示出 和 Linezolid相似的抑制浓度指数, 其结果为 MIC 5 。 (A) 介于 1-1. 5; MIC 50 (B) 介于 0. 25-0. 75 ο

其中化合物的抗菌的活性使用 MIC(MIC=minimum inhibition concentration: Lowest drug concentration for reducing growth by 50% or morw) , 使用 Met thici 11 in-susceptible Staphylococcus 测试 A; Penicilin suscepible

Streptococcus pneumonia - 测试 B。 实验的步骤按照标准测试步骤和测试方法, 抑制浓 度指数标准为微克 /毫升。