蛋白质结构预测
通过氨基酸序列推算蛋白质三维结构的科学问题,自 1972 年 Anfinsen 假说提出以来困扰生物学界 50 年,2020 年 AlphaFold2 取得突破性进展,被认为"基本解决"。
定义
蛋白质结构预测(Protein Structure Prediction, PSP)是从蛋白质的氨基酸序列推断其三维空间结构的计算问题。蛋白质的功能由结构决定,因此 PSP 是基础生物学、药物发现、酶工程等领域的基石问题。
技术演进
| 阶段 | 时期 | 代表方法 | 速度 / 精度 |
|---|---|---|---|
| 实验测定 | 1958-2020 | X 射线晶体学、冷冻电镜、NMR | 数月至数年 / 高精度 |
| 同源建模 | 1990s-2010s | MODELLER、Rosetta | 数天 / 中等精度(依赖模板) |
| 物理模拟 | 2000s-2020s | 分子动力学(MD)、片段组装 | 数周 / 中等精度 |
| AI 革命 | 2018-2020 | AlphaFold / AlphaFold2 | 数小时 / 高精度(GDT_TS >90) |
| 多模态扩展 | 2024+ | AlphaFold3 / Boltz-2 / AlphaProteo | 蛋白 + 核酸 + 小分子复合物预测 + 从头设计 |
关键里程碑
- 2020-12:AlphaFold2 在 CASP14 竞赛中以 GDT_TS 92.4 分碾压所有对手
- 2021:DeepMind 与 EMBL-EBI 联合开放 AlphaFold 数据库,开源 2 亿+ 蛋白质结构
- 2024-05:AlphaFold3 发布,覆盖几乎所有生命分子复合物
- 2024-10:Demis Hassabis + John Jumper 因 AlphaFold 获诺贝尔化学奖
- 2025:Boltz-2 开源,对标 AlphaFold3
在 AI for Science 中的角色
蛋白质结构预测是 AI for Science 最具代表性的成功案例,标志着 AI 可以解决"困扰科学界 50 年的开放难题"。其商业化路径催生了 Isomorphic Labs、Recursion Pharmaceuticals、英矽智能、晶泰科技 等一批 AI 制药公司。
主要玩家
- 学术 / 基础研究:DeepMind、MIT
- 商业化:Isomorphic Labs、Recursion Pharmaceuticals、英矽智能、晶泰科技
- 开源生态:AlphaFold(数据库免费)、AlphaFold3(学术非商业开源)、Boltz-2(完全商用开源)
相关概念
- 子代::AlphaFold AlphaFold3 AlphaProteo Boltz-2
- ↓ down::AI制药 分子对接 ADMET预测
- ∈ belongs_to::5-15-AI科学研究