新浪新闻

SeedFold超越AlphaFold3,AI蛋白质预测技术如何重塑药物研发范式?

BigNews

关注

2025年末,字节跳动推出的SeedFold蛋白质预测模型在FoldBench基准测试中全面超越AlphaFold3,其创新性的“宽度扩展优先”架构将抗体-抗原预测精度提升5个百分点以上,标志着AI驱动的药物研发正式步入效率和精度双升级的新阶段。

一、SeedFold的核心技术突破:破解AlphaFold3的瓶颈

宽度优先的模型架构

SeedFold摒弃传统堆叠网络深度的策略,将Pairformer模块的隐藏维度从AlphaFold3的128维扩展至512维,使模型全局结构预测准确度(RMSD)和局部质量(LDDT)显著提升。这一设计与大语言模型的缩放定律一致,证明增加表示维度比加深层数更能高效提升模型容量。

线性三角注意力机制

针对长序列蛋白质的计算瓶颈,SeedFold引入门控型线性三角注意力,将计算复杂度从O(n³d)降至O(n²d)。例如,处理2000长度序列时,显存占用从80GB压缩至10GB,时间成本从300ms降至50ms,为长链蛋白和复合物预测提供可能。

超大规模数据蒸馏策略

通过整合PDB实验数据(18万)、AlphafoldDB预测结构(330万)及宏基因组数据(2300万),构建总量达2650万的训练样本池,覆盖更多长序列蛋白(中位长度435),消融实验证明蒸馏数据全程不可或缺。

二、性能优势与产业落地价值

关键任务全面领先

FoldBench测试显示:

抗体-抗原预测成功率53.21%(AlphaFold3为47.90%)

蛋白-配体相互作用成功率66.48%(提升1.58%)

这意味着每筛选1000个化合物可多发现15-20个潜在有效分子,显著降低抗体药物早期研发成本。

赋能药物研发全链条

靶点发现:英矽智能LabClaw系统结合SeedFold技术,将靶点筛选周期从数周压缩至分钟级,科学家通过自然语言指令即可调用多源数据库。

分子优化:如武汉智化科技的AI逆合成平台,将药物原料设计成本从万元/公斤降至3000元/公斤,合成路径设计效率提升百倍。

临床转化加速

2026年,多款AI辅助药物进入临床:德睿智药口服减重药MDR-001进入III期试验;晶泰科技肿瘤抑制剂PEP08启动患者招募,AI将临床前候选物确定时间从传统10年缩短至10个月。

三、AI重塑药物研发范式的核心路径

从“试错式”到“预测式”研发

传统药物发现依赖大量合成与测试(成功率<10%),而AI通过虚拟筛选数十亿分子库,如清华大学DrugCLIP平台将百年计算任务压缩至单日完成,效率提升百万倍。

人机协同新范式

以“AI思考+机器执行+人类监督”为特征的智能实验室崛起。例如LabClaw系统通过5个AI智能体接管标准化操作,科学家聚焦复杂假设生成,抗衰老靶点调研效率提升99%。

动态结构预测突破

新一代模型如Isomorphic Labs的IsoDDE(被视为AlphaFold4)已能预测蛋白质隐藏结合位点,在脑啡肽蛋白案例中,仅凭序列几秒内定位到实验耗时15年发现的位点。 超级药物搜索可将效率提升上百万倍

四、挑战与未来方向

数据与验证瓶颈

高质量数据仍分散于医院、药企等“孤岛”,需联邦学习等技术实现“可用不可见”。

AI预测需湿实验验证,如膜蛋白柔性结构误差较高,FDA要求关键药物必须通过晶体学、质谱、功能实验三重校验。

算法可解释性

中医复方等复杂体系的多靶点作用机制难以被当前黑盒模型解析,需构建融合传统理论的新型质控标准。

开源与闭源博弈

AlphaFold3开源受限催生OpenFold3等替代方案,但企业专用模型(如IsoDDE)因私有数据优势闭源,加剧技术普惠与商业化的冲突。


当前AI蛋白质预测技术正推动药物研发从“经验驱动”转向“计算驱动”,而SeedFold等模型的突破不仅在于性能超越,更在于为行业提供了可复制的技术路径(如宽度扩展策略),其开源计划或将加速下一代生物分子基础模型的生态构建。 (以上内容均由AI生成)

加载中...