創造更好用的蛋白質!用 AI 設計細胞的物流加速器「泛素變體」——專訪吳昆峯

泛素變體:加快蛋白質修飾的效率

細胞像是繁忙的工廠,每天都有無數次的物質交換和化學反應,如果我們可以用 AI 設計出一塊「加速晶片」,讓某一段物流速度提升 6 倍呢?中央研究院「研之有物」專訪院內生物化學研究所的吳昆峯副研究員,他的團隊運用 ProteinMPNN 和 AlphaFold2,改造細胞內的重要蛋白質:泛素(Ubiquitin)。團隊成功設計出自然界不存在的「泛素變體」(UbV),可耐高溫,精準黏住酵素,讓酵素工作效率瞬間提升 6 倍!此為國內早期使用 ProteinMPNN 設計蛋白質的成果,最後他更進一步分享 AI 蛋白質設計的最新發展。

細胞裡的貼標籤物流系統

我們體內的細胞是持續運作的小工廠,每天要製造成千上萬的蛋白質,設法運送到目的地。此外,細胞時不時也會檢查哪個化學零件已經損壞,幫忙除舊換新。不禁讓人好奇,這座小工廠的物流系統是如何運作的呢?

細胞的物流有一套精密的標籤管理方式,參與化學反應的蛋白質通常會被貼上一個分類標籤(即修飾分子),並觸發後續對應的化學反應。在眾多分類標籤中,「泛素」(Ubiquitin,簡稱 Ub)尤其特別。

「一般的化學修飾,例如生物課本提到的磷酸化,通常都是小分子,就像在蛋白質上蓋一個小小的印章。」吳昆峯生動地比喻,「磷酸化只加了一個磷原子和三個氧原子,但泛素化(Ubiquitination)的過程,我們是用一個很大的、完整的蛋白質(泛素)作為標籤,去標記另外一個蛋白質。」比起其他的修飾分子來說,泛素作為物流標籤,很大也很複雜。

泛素是 76 個胺基酸所組成的蛋白質,要把這麼大的標籤穩穩地貼在另一個蛋白質上,細胞已經演化出一套嚴密的機制:即泛素與三種酵素的互動。

以本次研究來說,活化酶 E1 會先和泛素結合,活化泛素。接著 E1 會將泛素轉移給結合酶 E2,E2 會把自己接到連接酶 E3 身上,並將泛素轉移給 E3。E3 接收到泛素之後,就會立刻將泛素精準地貼到目標蛋白(註:HECT Domain 機制)。

對泛素而言,E1 通常只有一種,E2 有 30 幾種,E3 則是有 600 多種。「為什麼 E3 需要這個多?因為人體有兩萬個蛋白,大約一半以上都需要泛素標記。每一種 E3 對應多種蛋白質,有的 E3 進入細胞核,有的 E3 會跑到細胞膜附近,功能分化非常複雜。」 吳昆峯解釋。

泛素 Ub 會經過 E1、E2、E3 酵素的處理,最後才會貼到目標蛋白質上。 圖|研之有物(資料來源|吳昆峯)
泛素 Ub 會經過 E1、E2、E3 酵素的處理,最後才會貼到目標蛋白質上。
圖|研之有物(資料來源|吳昆峯)

泛素標籤怎麼貼?貼完之後要幹嘛?

當細胞內的蛋白質零件損壞時,就需要分解與回收,泛素最為人所知的就是作為資源回收的標記功能,當蛋白質貼上泛素標籤之後,就會送去資源回收中心「蛋白酶體」(Proteasome)銷毀。但是,泛素標籤其實還有很多功能!

泛素很少單獨貼在蛋白質上。吳昆峯提到,當泛素接上去之後,下一個泛素會再接在它上面,變成很複雜的長鏈。

雖然我們在圖上把泛素簡單畫成一個球,但是泛素其實是泛素鏈。吳昆峯指出,泛素有八個可以用來串接的位點,不同的串接方式代表不同的指令,例如:

  • K48 連結:代表蛋白質是「垃圾」,通知細胞把蛋白質送去資源回收中心銷毀。
  • K63 連結:代表蛋白質「需要修復」,告訴細胞蛋白質裡面有 DNA 壞掉了,快來修理。
  • K11 連結:代表蛋白質和細胞分裂有關,控制細胞週期。

 

「這就像是同一種貼紙,貼一張、貼兩張,或是貼成圓的、貼成直的,都代表不同的意思,甚至還會出現分岔的鏈狀結構,」吳昆峯說,「這是一個非常複雜的語言。」

泛素是由 76 個胺基酸組成的蛋白質,在真核生物的演化中高度保守。如果把泛素攤平來看,泛素有 7 個離胺酸位點(K6、K11、K27、K29、K33、K48、K63)和 1 個 M1 功能位點。這些位點讓泛素修飾變得多樣,執行不同的生物功能。 圖|研之有物(資料來源|Molecular Biomedicine)
泛素是由 76 個胺基酸組成的蛋白質,在真核生物的演化中高度保守。如果把泛素攤平來看,泛素有 7 個離胺酸位點(K6、K11、K27、K29、K33、K48、K63)和 1 個 M1 功能位點。這些位點讓泛素修飾變得多樣,執行不同的生物功能。
圖|研之有物(資料來源|Molecular Biomedicine

除了貼泛素標籤的 E3,細胞內還有約 100 種負責撕標籤的「去泛素酶(DUBs)」,它們可以把標籤修剪、回收,維持系統的平衡。生命的運作就是這麼巧妙和複雜~

既然這個泛素物流標籤系統對細胞這麼重要,吳昆峯心想:我們是否能用 AI 設計出「加速晶片」,組裝到 E3 酵素上,加快 E3 酵素的貼標籤效率?吳昆峯團隊鎖定的 E3 酵素是 Rsp5;而所謂的加速晶片,則是人造蛋白質:「泛素變體(UbV)」。

生物化學駭客:用 AI 設計蛋白質

為了理解吳昆峯團隊如何運用 AI 設計泛素變體,改變 E3 酵素(Rsp5)的反應速率,我們可以先這樣比喻:

Rsp5 是細胞工廠裡的機械手臂,手臂上有兩個非常關鍵的位置:

  • 夾爪區(活性位點):機械手臂的工作區,會接住從 E2 來的標籤(修飾用泛素 Ub),把它貼到目標蛋白質上。
  • 晶片插槽(異位結合位):機械手臂背後的插槽,用來控制機器效能,一般來說會插普通晶片(WT-Ub,野生型泛素或稱原版泛素),手臂動作流暢但速度普通。

 

而吳昆峯團隊的目標是:用 AI 設計出一顆最強的加速晶片(泛素變體 UbV),讓它緊緊卡在插槽裡面,讓機械手臂進入超級模式,大幅提升工作效率!

如果把 Rsp5 比喻為細胞工廠裡的機械手臂,吳昆峯團隊的目標是:用 AI 設計出最強的加速晶片(泛素變體 UbV),讓它緊緊卡在插槽裡面,讓機械手臂大幅提升工作效率! 圖|AI 生成,研之有物後製
如果把 Rsp5 比喻為細胞工廠裡的機械手臂,吳昆峯團隊的目標是:用 AI 設計出最強的加速晶片(泛素變體 UbV),讓它緊緊卡在插槽裡面,讓機械手臂大幅提升工作效率!
圖|AI 生成,研之有物後製

在上次的文章「破解 50 年折疊難題之後:AI 如何成為蛋白質設計師?」之中,我們認識了設計序列的 ProteinMPNN,以及預測結構的 AlphaFold2

要妥善運用這兩個 AI 來打造全新的蛋白質(泛素變體 UbV),不用從零開始,來看吳昆峯團隊是怎麼做的!

研究團隊先丟大的骨架給 ProteinMPNN 看,就是 Rsp5 和原版泛素的 3D 複合骨架。然後,團隊請 AI 幫忙以下:Rsp5 不能動到,並且請維持原版泛素的骨架,幫我重新填入更穩定的胺基酸序列!

也就是說,ProteinMPNN 必須在不改變形狀的前提下,計算出哪一種胺基酸排列,能讓酵素和泛素變體的原子抓得更緊,結合的更緊密。僅僅 10 分鐘,AI 就給了吳昆峯團隊 3000 種可能的胺基酸序列。

研究團隊根據序列恢復率和化學性質,從 3000 個 UbV 名單中篩選出 20 個最有潛力的候選人 R1~R20。現在,我們有蛋白質的設計圖了,但是做得出來嗎?卡得進去嗎?輪到 AlphaFold2 登場!

AlphaFold2 預測 Rsp5 和 UbV 的複合體結構,結果顯示,這 20 個泛素變體 UbV 的信心分數(pLDDT)都非常高(>90 分),結構也跟預期的一樣,可以和酵素緊密結合,團隊才放心去實驗室合成這 20 個 UbV 。

延續先前比喻,研究團隊把骨架丟給 ProteinMPNN 生成大量泛素變體的序列(可能的晶片設計圖),並篩選出 20 個最有潛力的 R1~R20(精選的晶片設計圖)。然後丟給 AlphaFold 分析,結果顯示信心分數都大於 90 分,結構也跟預期的一樣,可以和酵素緊密結合。 圖|AI 生成,研之有物後製
延續先前比喻,研究團隊把骨架丟給 ProteinMPNN 生成大量泛素變體的序列(可能的晶片設計圖),並篩選出 20 個最有潛力的 R1~R20(精選的晶片設計圖)。然後丟給 AlphaFold 分析,結果顯示信心分數都大於 90 分,結構也跟預期的一樣,可以和酵素緊密結合。
圖|AI 生成,研之有物後製

吳昆峯團隊根據序列,合成 20 個候選泛素變體(UbV)之後,他們做了非常詳細的驗證。第一步是確認結構的穩定性,他們發現 R1~R20 的折疊結構正確,即使加熱到 80°C~90°C,結構的光譜沒有明顯變化,有很好的熱穩定性。

第二步是確認親和力,他們發現 R1、R3、R4、R5、R10、R11、R12 和 R20 變體能有效結合 E3 酵素(Rsp5),其中 R4、R10 和 R12 的結合力最強,這些泛素變體的結合力比原版泛素多了 10~25 倍。

第三步是確認是否真的能夠增加酵素活性。我們無法直接量測貼標籤的效率,因為 Rsp5 一旦抓到標籤,就會「立刻」貼出去,快到無法量測。退而求其次,團隊監控泛素標籤 Ub 從 E2 轉移到 E3 (Rsp5)的效率,也就是 E3 抓標籤的能力。

在沒有泛素變體的情況下,Rsp5 的活性極低,但是加入 R4 或 R12 後,Rsp5-UbV 複合體的速率提升了約 6 倍!

最後,團隊再次確認結構正確性,用 X 光繞射解析表現最好的 R4 變體,發現與原版泛素的骨架幾乎沒有差異,且 R4 的原子排列與 AlphaFold2 預測的結構高度一致,證明 ProteinMPNN 在改變序列的同時,也成功維持了骨架。

延續先前比喻,泛素變體 UbV 如同圖中加速晶片,本體可耐高溫,還能和特定 E3 酵素 Rsp5 緊密組裝,讓酵素的蛋白修飾工作效率提升 6 倍之多。 圖|AI 生成,研之有物後製
延續先前比喻,泛素變體 UbV 如同圖中加速晶片,本體可耐高溫,還能和特定 E3 酵素 Rsp5 緊密組裝,讓酵素的蛋白修飾工作效率提升 6 倍之多。
圖|AI 生成,研之有物後製
吳昆峯團隊運用 AI 成功設計出自然界不存在的泛素變體,提升 E3 酵素的工作效率。 圖|研之有物(資料來源|吳昆峯)
吳昆峯團隊運用 AI 成功設計出自然界不存在的泛素變體,提升 E3 酵素的工作效率。
圖|研之有物(資料來源|吳昆峯)

AI 蛋白質設計:從雜訊中雕刻出生命

隨著 AI 技術的進展,蛋白質設計的研究領域,如雨後春筍般展開。吳昆峯表示,如果把蛋白質設計比喻成藝術,那 AI 正在做的,不再僅僅是修圖或潤飾,而是從一片混亂的雜訊中,把物質的秩序給雕刻出來。

這一切都來自:擴散模型(Diffusion Model)

物理學中,墨水滴入水中會開始擴散,越來越混亂;而擴散模型做的,就是反方向的過程,它會學習如何從雜亂無章的狀態,慢慢地抽絲剝繭,把一個合理的蛋白質骨架重新建構出來。

擴散模型「去噪」(denoising)的能力,讓科學家第一次擁有可靠的生成工具,不用依賴自然界現成的蛋白質,可以直接打造全新的蛋白分子。

吳昆峯繼續說道,蛋白質設計的化學革命,由 David Baker 團隊的 RFdiffusion 開始引爆,新秀 Boltz 則緊跟其後。AI 模型的生產力極高,只要設定想要的蛋白質大小(例如 50 個胺基酸)、結構偏好或功能需求,AI 便能在幾秒鐘內產生數千甚至上萬個骨架。研究人員再用 ProteinMPNN 填上胺基酸序列,就能批量製造出驚人的小蛋白質資料庫。

他強調,如果十年前有人說建立蛋白庫這件事可以從半年縮短到一天,大概沒人會相信。而且令人驚訝的是,現在的 AI 除了設計,還會自己驗證作品。

RFdiffusion 的產出會被自動送往 AlphaFold2 或 AlphaFold3 做結構預測,再比對兩者的吻合度。AI 工具之間的自動化流程已經建立:製造 → 檢查 → 篩選,一氣呵成!原本需要科學家花上數月試錯的過程,如今也只需要幾週。

吳昆峯分享,最近 AI 的精密程度已經不可同日而語,它還可以幫抗體做微觀的改造。抗體最重要的結合區域叫 CDR,它們像觸手一樣負責抓住病毒或抗原。現在的 AI 工具可以在不動到骨架的前提下,重新改造這些觸手,抓得更精準、更牢靠。

不過,吳昆峯也提出心中的隱憂,他說 AI 畫出的結構雖然很完美,但是蛋白質是會動的,靜態的結構互相吻合,並不代表它們真的會黏在一起,這是目前所有 AI 設計的盲點。

吳昆峯認為,AI 畫出的結構雖然很完美,但是蛋白質是會動的,靜態的結構互相吻合,並不代表它們真的會黏在一起,還是要做實驗驗證。 圖|研之有物
吳昆峯認為,AI 畫出的結構雖然很完美,但是蛋白質是會動的,靜態的結構互相吻合,並不代表它們真的會黏在一起,還是要做實驗驗證。
圖|研之有物

研究者常常會在模型中看到漂亮的結構對接,卻在實驗中發現其實並不黏。吳昆峯笑著說:「就像人際關係一樣,兩個人看起來很合,不代表真的聊得來。」

他繼續說:在蛋白質世界,我們用「結合常數(K)」來衡量兩者黏在一起的強度。如果把每個胺基酸想成一個人好了。有些人比較內向(類似 I 人),不太想和別人互動;有些人很外向(類似 E 人),喜歡社交、很容易建立連結。

吳昆峯比喻,兩塊蛋白質的表面結構,如果剛好都是一群 E 人,自然會很容易「相互黏住」。但如果超過一半都是 I 人,就算形狀很完美,也未必願意真正靠近。

「這就是為什麼 AI 設計出的結構再漂亮,也可能完全沒有結合(binding)。」吳昆峯說,「因為 AI 捕捉到的是外觀,而不是隨時在變動的『互動意願』。」

傳統的能量計算軟體(例如 Rosetta)試圖用數學去估算這種浮動的「黏著度」,但是準確度往往只有 20–30%。科學家最後還是得用大量實驗試誤(try and error),從上千的候選名單中挑出少數的有效蛋白質。

如此的瓶頸,直到近年才開始真正突破。吳昆峯提到,目前他的實驗室正在開發一套直接預測「結合常數」的機器學習工具,AI 除了畫出正確的蛋白質骨架,還能夠真正預測它們是否真的會黏在一起。

吳昆峯實驗室的 AI 工具,使用圖神經網路(Graph Neural Networks, GNNs)的技術架構,它可以把蛋白質看成一個巨大的社群網路:每個胺基酸是一個節點(像一個人);化學鍵和交互作用,是人與人之間的關係;結合區域則是兩個群體要不要互相靠近。

GNN 擅長捕捉這種關係緊密程度,也是傳統方法最容易忽略的部分。吳昆峯強調,他們已經把結合常數的預測準確度從 30% 提升到 70%。

與其合成 100 個蛋白質去碰運氣,不如挑 1 個最有可能成功的候選物,只做 1 次實驗!

從雜訊到生命秩序,從形狀到動態互動,從大量試錯到精準預測,AI 的革命仍在加速,我們此刻正站在它的浪尖之上。

吳昆峯實驗室正在開發的 AI 工具,使用圖神經網路的技術架構,擅長捕捉蛋白質之間的關係緊密程度,他們已經把結合常數的預測準確度從 30% 提升到 70%。 圖|研之有物
吳昆峯實驗室正在開發的 AI 工具,使用圖神經網路的技術架構,擅長捕捉蛋白質之間的關係緊密程度,他們已經把結合常數的預測準確度從 30% 提升到 70%。
圖|研之有物
2025-12-17

採訪撰寫|簡克志
責任編輯|簡克志
美術設計|蔡宛潔
文章審訂與建議|吳昆峯

延伸閱讀