筛选甘蓝型油菜(Brassica napus L.)中对启动子chr10_0166、chr1_0188高亲和力的转录调控因子。
HDOCK是一款功能强大的分子对接软件,能够模拟和预测蛋白质-蛋白质以及蛋白质-核酸间的相互作用。通过对桃树转录因子与启动子之间的互作进行筛选,可以快速识别出与目标启动子结合能力最强的转录因子。这一过程不依赖于实验条件下的繁琐筛选和时间消耗,而是通过计算模型来高效预测潜在的生物学重要性互作。
利用Hdock软件,将Spacing(网格点间距)和Angle(旋转步长角度)参数分别设置为2和60度,进行初步的大规模筛选。这一步骤能够迅速锁定那些具有潜在生物学意义的启动子与转录因子相互作用候选者。Hdock的高效初步筛选功能,使得在庞大的数据集中快速定位目标成为可能。随后,我们选取了Hdock评分高于阳性对照(P53启动子互作的转录因子)的前2523个候选者进入下一阶段的精细筛选。
(注:Spacing参数决定了对接过程中网格点的密度,这些网格点覆盖在受体分子表面,用于引导配体的定位和取向搜索;而Angle参数则控制了配体分子在旋转过程中的步长角度,即每次旋转的增量。在初步筛选阶段,采用较大的Spacing和Angle值可以迅速锁定可能的结合模式;而在精细筛选阶段,通过减小这两个参数的值,可以实现更加精确的计算和筛选。)
在Hdock的精细筛选阶段,我们将Spacing和Angle参数调整至1.2和15度,以获得更加精准的对接结果,从而进一步缩小候选范围,提高筛选效率。我们重点考虑了结合能的大小(通常为负值,且数值越低表示结合越稳定、亲和力越强)。这一指标对于识别出具有高稳定性和强亲和力的蛋白质相互作用至关重要,它有助于提高我们最终筛选结果的准确性和可靠性。桃树作为重要的果树之一,其生长、发育及抗逆等过程受到转录因子的严格调控。通过HDOCK筛选,可以从10个候选转录因子中筛选出与特定启动子具有最强结合力的转录因子。精准筛选能够为后续的功能验证和基因调控网络的构建提供重要线索,避免了大量的实验性筛选,通过对多个转录因子与单一启动子的相互作用进行比较筛选,不仅能够找出与启动子结合能力最强的转录因子,还能从中揭示启动子调控机制的细节。哪些转录因子具有优先结合启动子的能力,可能反映了启动子的调控特点,也可能与桃树特定的生理或生长发育过程相关。
在本研究中,我们基于桃树的启动子和转录因子的互作,使用Hdock进行启动子与转录因子对接筛选,接着通过AlphaFold3进行精细的结构预测和深入分析,旨在为后续的功能研究和实验验证提供可靠的理论支持。这一方法的优势在于它结合了分子对接与深度学习模型的精确预测,能够更加全面、准确地评估转录因子与启动子复合体的结构和稳定性。通过AlphaFold3的精细建模,不仅能够进一步验证Hdock筛选出的复合体是否符合实际生物特征,还能提供关于复合体的详细结构信息,从而为后续的实验验证提供坚实的理论支持。这个步骤极大提高了筛选结果的准确性和生物学可信度,为后续的功能实验奠定了基础。
AlphaFold3预测的结果通过两项关键指标——pTM值(预测TM分数)和ipTM值(界面预测TM分数)——进行评估,这两者共同提供了对蛋白质复合体和互作界面的可靠性判断。
pTM值:此值衡量蛋白质整体折叠结构与已知实验结构的相似性。pTM值越高,说明AlphaFold3预测的蛋白质折叠结构与真实结构之间的吻合度越高,预测的蛋白质复合体越可能稳定存在。
ipTM值:这一值专门评估复合体中蛋白质互作界面的预测准确性。由于蛋白质-蛋白质相互作用通常依赖于高度特异性的接触位点,ipTM值较高表示AlphaFold3对互作界面的预测更加精准,复合体的互作位点更可能具有生物学功能。
通过结合pTM值和ipTM值,我们可以对每个候选复合体的稳定性、互作位点和整体结构的可靠性进行综合评估,进而确定最具生物学潜力的转录因子与启动子复合体。AlphaFold3的结构预测不仅仅是对复合体的整体结构进行建模,更为重要的是,它能够细致地展示复合体内各个相互作用位点的空间排列及可能的关键氨基酸残基。我们可以利用这些信息进一步了解哪些转录因子与启动子之间的结合更为稳定、有效,哪些关键的氨基酸残基参与了互作界面的形成。此类结构数据能够为后续实验提供更精确的设计依据,尤其是在蛋白质突变、互作验证以及功能分析等实验研究中。
1、甘蓝型油菜转录因子三维结构库的构建
我们首先从桃树中提取了所有转录因子的序列,并逐一进行了三维结构的构建工作。在构建过程中,我们详细记录了每个模型的建模分值,以确保结构的准确性和可靠性。最终,我们成功建立了包含2523个蛋白pdb文件的甘蓝型油菜转录因子三维结构库。
2、诱饵核酸三维结构构建与对接分析
我们也对诱饵核酸进行了三维结构的构建,并记录了相应的建模分值。为了深入探究目的基因与桃树转录因子之间的相互作用,我们利用先进的对接软件,将目的基因与甘蓝型油菜转录因子的序列进行了一一对应的对接分析。在对接过程中,我们详细记录了对接分数等关键特征值,为后续的筛选工作提供了有力的数据支持。
3、核酸-蛋白互作数据的筛选与验证
(1)初筛阶段:我们首先使用Hdock软件进行了初步的筛选工作,通过设定合理的参数,我们成功筛选出了Top2523的核酸-蛋白互作数据,为后续的精细筛选奠定了良好的基础。
(2)精细对接阶段:为了获得更加准确的对接结果,我们使用Hdock的更加详细的对接参数,对初筛得到的前10组蛋白进行了批量对接。在对接过程中,我们重点关注了分子对接的结合能分值,这一指标对于评估转录因子互作的稳定性和亲和力具有重要意义。
(3)验证阶段:为了进一步验证对接结果的准确性,我们选取了对接评分最高的10组转录因子,使用了AFM3对接模型进行了批量对接。在对接过程中,我们获得了分子对接的PTM(整体预测TM分数)和iPTM(界面预测TM分数)分值,这两个指标分别用于评估蛋白质整体结构和相互作用界面的预测准确性,为我们提供了更加全面的评估依据。
4、结果整理与总结
最后,我们对整个筛选和验证过程中得到的数据进行了系统的整理和总结。通过对比和分析不同阶段的对接结果和特征值,我们成功筛选出了具有潜在生物学意义的核酸-蛋白互作候选者,为后续的深入研究提供了有力的支持。
结果解析:
经过三轮模型筛选后,综合结合能分值(Hdock分值)和核酸蛋白构象预测(ipTM和PTM),本研究为chr10_0166、chr1_0188启动子和甘蓝型油菜转录因子的对接,主要关注HDOCK结合能负值与AF3中ipTM+PTM相加值, 以综合结合系数最高的Prupe.1G313300.1.p为例(其结合能负值为-328.45,IPTM+PTM分值为0.54),晶体结构及核心互作位点如下: