蛋白质模型质量评估 用户指南
1. 算法简介
通过计算得到的蛋白质结构模型精度不稳定,模型质量评估(model quality assessment, MQA)有利于选择精度较高的模型作为输出结果。
本模块同时结合单模型(single-model)与多模型(multi-model)特征;再以我们预测的蛋白2D结构为辅助信息;同时参考模板残基对之间的距离;利用图神经网络预测模型中每个残基的质量分数。
2. 使用流程
2.1 输入氨基酸序列 (必需)
通过文本框编辑输入氨基酸序列;合法性检查包括:
1) 只能以大写字母输入,不支持非标准氨基酸字符 (即:B,J,O,U,X,Z)。
2) 允许的氨基酸序列长度范围是30到800个残基。
3) 仅支持一次提交一个序列;序列“以 > 开头的行”将被识别为序列名并被忽略,该行后面的所有内容作为该序列的内容;若存在多个“以 > 开头的行”将被识别为多个序列,是不被支持的。
2.2 上传蛋白质模型文件 (必需)
点击“文件上传”按钮上传一个或多个蛋白质模型文件(pdb格式文件)。
蛋白质模型文件中的残基序列必须符合2.1中氨基酸序列标准,并且是2.1步骤中上传的氨基酸序列的子序列。
2.3 输入任务名 (可选)
可以选择在“任务名”输入框输入任务名。若不输入,则网站会将随机分配的UniqueID作为任务名。
2.4 提交任务
在用户完成以上步骤后,点击“预测”按钮即可,显示“任务创建成功”表示提交成功。
任务成功结束后用户的注册邮箱会收到任务完成的通知。通常一个任务的计算时间在半个小时—数个小时不等。
为了合理的分配有限的资源,我们对用户的任务额度进行了一定的限制,鼠标悬停在“预测”按钮上可以看到限制情况与使用情况。在额度不足的情况下无法点击“预测”按钮提交任务。
3. 查看结果
3.1 查询历史记录
在提交任务下方的“最近运行历史”中查看最近10条任务状态;也可以点击“所有历史”查看所有历史记录。
只有完成的任务可以进行“查看”操作。
只有完成/等待中/失败任务可以被删除,运行中的任务无法删除(无法中止任务释放计算资源)。
点击“运行状态”旁的下拉箭头,可以根据任务运行状态进行筛选。
3.2 查看结果详情
在历史记录上点击“查看”按钮可以查看任务结果。
任务详情界面展示了:
-
氨基酸序列;鼠标选中可以显示对应残基的详情。
-
蛋白质结构模型文件名;在下拉框中选择文件名,在界面上显示对应文件的结果。
-
蛋白质结构模型的3D图像。
-
蛋白质结构模型的 "Global Score"(所有残基的平均分)和其中每个残基的预测分数。打分为零的残基代表该蛋白质文件中不含有此残基(影响Global Score)。
3.3 下载任务结果
-
在查看任务界面点击“下载预测结果”下载任务结果:
-
在“历史记录”分页中批量下载任务结果: