在实验的初始筛选阶段,我们使用Megadock将二十万个纳米抗体与抗原对接初筛。Megadock是一款高效、精确的蛋白对接工具,以其卓越的并行计算能力和高通量筛选模式,使得在庞大的蛋白质互作数据库中快速识别潜在的有意义蛋白互作成为可能。通过其核心算法,Megadock能够有效计算和评估成千上万个蛋白-蛋白相互作用的对接分数,预测潜在的结合模式及结构稳定性,从而筛选出有望形成稳定复合体的候选分子。
在这一阶段,我们利用Megadock的高通量并行筛选技术,对纳米抗体库中的候选抗体与IAG蛋白进行粗筛。筛选过程的目标在于快速评估不同候选抗体与IAG蛋白之间的潜在结合力和稳定性。通过计算每个候选抗体与IAG蛋白之间的对接分数并按得分排序,筛选出最有可能形成稳定复合物的候选对接模型。在这一粗筛步骤中,得分较低的候选复合体将被淘汰,而得分较高的前200个候选复合体将被选入下一轮筛选流程。
该阶段的主要目标是大幅缩小候选范围,将可能的蛋白互作从十万级别筛选至最具潜力的高分复合体,为后续更精细的筛选提供候选基础。精筛阶段将进一步分析和验证这些候选抗体对IAG蛋白的特异性结合能力,以确保纳米抗体的高亲和力和特异性,为开发有效的诊断试剂和治疗工具奠定扎实的科学基础。
在完成Megadock初筛后,实验选择得分最高的前200个候选复合体,转入Hdock进行更加精细的筛选。Hdock是一款结合能驱动的蛋白质对接工具,通过精确计算分子间的相互作用能量,识别出更具稳定性和潜在生物活性的候选复合体。与Megadock的快速初筛侧重于广泛评估相互作用不同,Hdock的筛选更注重结合能的绝对值,从而在分子层面为每个候选复合体提供更加精准的结合分析。
在这一精筛阶段,Hdock通过深入分析每个复合体的结合能,挑选出结合能最低、即最稳定的候选结构。较低的结合能通常代表着复合体在物理和化学层面上的稳定性较高,从而可能具有更强的亲和力和特异性。Hdock的筛选结果能够提供高分辨率的结合模式和能量分析,确保仅最优质的复合体进入下一阶段的验证。最终,这一阶段不仅显著缩小了候选范围,还提升了候选复合体的生物学可靠性和功能潜力。
通过Megadock与Hdock的协同筛选,我们能够逐步筛除不稳定的候选抗体,使实验最终锁定对Alpha-toxin具备高亲和力的纳米抗体,为下一步的生物验证、功能研究及潜在的诊断和治疗应用奠定坚实基础。
在Hdock精细筛选的基础上,将筛选出的top10候选复合体输入AlphaFold3模型,进行更为深入的结构预测分析。AlphaFold3是一款最新的蛋白质结构预测工具,能够通过深度学习算法准确预测蛋白质复合体的三维结构。在这一阶段,AlphaFold3不仅预测蛋白质整体结构的准确性,还通过计算pTM(预测TM分数)和ipTM(界面预测TM分数)对互作界面进行更加精细的分析。pTM值用于评估蛋白质的整体折叠结构与实验结构的相似性,而ipTM值则专门用于评估蛋白质互作界面处的预测准确性。pTM+ipTM值的综合评估可以更为精确地确定蛋白质复合体的稳定性和对接位点的准确性,数值越高表示预测模型与实际生物结构越一致。
通过AlphaFold3的精细建模,不仅能够进一步验证Hdock筛选出的复合体是否符合实际生物特征,还能提供关于蛋白质复合体的详细结构信息,从而为后续的实验验证提供坚实的理论支持。这个步骤极大提高了筛选结果的准确性和生物学可信度,为后续的功能实验奠定了基础。
注释:pTM值:该指标用于评估蛋白质整体三维结构预测的准确性,衡量预测模型与实验结构的折叠相似性。分数越高,表示预测的蛋白质整体结构与实际结构更为接近。
ipTM值:该指标专门用于评估蛋白质复合体中不同蛋白质互作界面的预测准确性,主要针对蛋白质接触区域的精确性分析,能够帮助确认互作位点的精确对接位置。
实验过程中二十万个纳米抗体序列来源于以下序列CDR1、CDR2、CDR3区域的随机突变生成结果,其骨架保持不变。
QVQLQESGGGLVQAGGSLRLSCAASGYISTTFAMGWYRQAPGKERELVAAIDKGSSTYYADSVKGRFTISRDNAKNTVYLQMNSLKPEDTAVYYCAARYYDYPLDGTYHIYWGQGTQVTVSS
整个实验流程通过多步筛选、精细对接和深度结构预测,确保了最终筛选出的蛋白互作复合体具有较高的生物学相关性和稳定性,为后续的功能验证和应用研究提供了坚实基础。
1.提取20万纳米抗体数字化文库的纳米抗体建模文件。
2.通过AlphaFold3预测IAG蛋白的三级结构,后续使用对接模型将IAG蛋白与20万数字化纳米抗体的数字化文库的三维结构进行对接分析,记录对接分数等特征值。
3.使用Megadock对纳米抗体数字化文库进行初筛,并选出结合分值最高的TOP200进入下一步精筛。
4.使用Hdock对接软件对TOP200的纳米抗体进行批量对接,获得分子对接的结合能分值,选出10组蛋白进行复合体蛋白预测,去除了MOF值在1200以上的对接结果,MOF值大于1200代表纳米抗体建模准确性的不足,这会影响对接结果的准确性。
5.使用AF3对接模型对10组蛋白进行蛋白复合体预测,获得pTM和ipTM分值。
6.整理结果。
通过使用AlphaFold3预测得到IAG蛋白的三级结构(图1),AlphaFold3预测得到的IAG蛋白的三级结构较为明确,可以进行数字化智能筛选,预测结果较为可靠。
图1. IAG蛋白三级结构图
经过两轮模型筛选后,综合结合能分值(Megadock和Hdock分值)和蛋白复合体构象预测(ipTM和PTM),本研究为20万纳米抗体库与IAG蛋白的对接,发现IAG蛋白与20万纳米抗体库中的oa_281806、oa_256346、oa_1017912的AlphaFold3对接分值绝对值高,发生互作的可能性更高。ipTM+PTM值的高低代表了蛋白复合体(诱饵蛋白+高对接分值纳米抗体)建模的精准度,数值越高,复合体建模精准度越高。标绿部分的ipTM+PTM大于0.75代表复合体建模质量较高且预测诱饵蛋白与纳米抗体之间结合位点的准确性较高。
以筛选出来亲和力编号为oa_281806的纳米抗体为例绘图,oa_281806与诱饵蛋白胡AlphaFold3精确分析其PTM+iPTM达到1,绘制其与诱饵蛋白与编号为oa_281806的纳米抗体具体分子对接的结合位点图。
图1.AlphaFold3分别单体建模
图2. oa_281806纳米抗体与IAG蛋白结构对接
图3. oa_281806纳米抗体与IAG蛋白精细化结构位点对接图
IAG蛋白与oa_281806依旧是最高得分
以筛选出来亲和力编号为oa_281806的纳米抗体为例绘图,oa_281806与诱饵蛋白protenix精确分析其PTM+iPTM达到1.8497,绘制其与诱饵蛋白与编号为oa_281806的纳米抗体具体分子对接的结合位点图。
图4. Protenix蛋白单体建模
图5. oa_281806的纳米抗体与IAG蛋白结构对接
图6. oa_281806的纳米抗体与IAG蛋白精细化结构位点对接图