跳转至

LBDD 用户指南

1. 算法简介

准确的预测蛋白质靶标与小分子药物的相互作用(药物筛选),是药物发现过程中的关键环节。在计算机辅助药物虚拟筛选中,基于配体的药物设计方法(ligand-based drug discovery,LBDD)从已知有活性小分子配体结构出发,构建和学习已有分子结构与活性之间关系的模型,用于新化合物在多种测定方法上的活性预测。

腾讯团队首次将元学习算法用于LBDD任务,旨在解决目标靶点已测活性的化合物数量不足以学习鲁棒的分子结构与活性关系的问题。我们首次引入深度神经网络作为预测该关系的模型,基于ChEMBL活性数据学习一个该深度神经网络的参数初始化,使得仅需测定少量配体活性即可在目标靶点上得到较优的模型预测精度。我们对上述深度神经网络进行模块化,针对每个受体学习一个特定路径策略以选择相关模块;因此,均选择相同路径的受体则被认为相似度较高。该算法所学受体相似性在后续药物分子设计中具有非常重要的指导意义。

注: 本平台所用的Assay ID与ChEMBL数据库上的ChEMBL Assay ID保持一致。

2. 使用流程

2.1 选择Assay(必选项)

我们提供了两种Assay ID选择方法,一种是通过靶点选择相关Assay,另一种是直接指定Assay ID,两种方法二选一。

  • 1) 通过靶点选择Assay

    在靶点输入框输入Target名称,点击“提交”按钮,会弹出相关的AssayID列表,用户需要勾选相关Assay ID,如下图所示。

img

  • 2) 直接指定Assay ID

    用户在知道Assay ID的情况下,或者需要选择的Assay列表不在同一个target,可以通过直接指定的方式选择Assay ID列表,点击“Assay”选项,再在输入框中输入Assay ID,系统会根据用户的输入前缀给出相关候选assay ID。

img

2.2 选择Safety Panel Assay(可选)

平台挑选了34个跟药物安全性有关的Assay,用户可以指定相关Assay ID。

img

2.3 选择Kinase相关Assay(可选)

平台挑选了99个跟激酶选择性有关的Assay,用户可以指定相关Assay ID。

img

2.4 选择分子库

平台提供了11个公开数据库的分子,提供了其在全部Assay上的活性预测数据,用户可以选择少于等于3个数据库。

img

2.5 提交任务

在用户设置好以上参数后,点击提交任务即可,若显示如下页面,则表示提交成功。用户可以点击下方的Recent History执行查询进度和删除操作。

img

2.6 查询任务结果

用户想要查询历史任务的结果,可以点击上方的“历史记录”,如下所示,用户可以通过设置相关阈值来查询结果,如设置理化性质阈值,pIC50阈值,和安全性(safety & kinase selectivity)相关的pIC50阈值,聚类等操作,并以csv文件的格式导出结果到本地。

img

img

  • 分子成药性和理化性质过滤

平台选择了8种常见的分子基本性质和ADMET性质,分别是logP(脂水分配系数),HBA(氢键受体),HBD(氢键供体),molecular weight(分子量),TPSA(极性表面积),solubility(溶解度,单位μmol/L),hERG 毒性(“negative”指的是预测毒性概率小于0.3,“positive”指的是预测概率大于0.3),血脑屏障通过率(“negative”指的是概率小于0.5, “positive”指的是概率大于0.5)。

img

  • 分子预测活性过滤

可以根据分子在不同活性pIC50值范围,来决定选取想要进行后续筛选的分子。这里的pIC50值是根据你在前面第一步里面选择的assay,进行的活性预测值。如果你选择了多个assay,那么这里的pIC50值就是几个pIC50值的平均值。

img

  • 安全性和激酶选择性过滤(safety & kinase selectivity)

平台在前面进行活性预测的时候,提供了一些和安全性相关的assay上的活性预测。分别是常见的安全性assay和激酶选择性的assay,主要是考虑可能的脱靶毒性。你可以指定在选择的这些assay里,最大的预测活性不能超过多少。同时也可以选择预测活性值是某一值的assay数量不能超过多少。例如,你可以限定在选择的assay上最大pIC50值不能超过7 (这个值应该是有明显的毒性了),或者你可以继续限定分子在选择的assay上的pIC50值大于5的assay数目不能超过3个。

img

  • 聚类(clustering filter)

这里平台会计算分子的Tanimoto相似度,并按相似度大于0.6的进行聚类。并从每个聚类中指定你想选取的分子数。

img

点击筛选将会得到按照上述规则过滤后得到的最终分子的数目,你可以选择以CSV格式的文档导出所有的分子。