心靈深處已經采取了行動。有可能用人工智能打敗新的皇冠病毒嗎?
病毒 蛋白質 結構
作者: 新智元
2020-06-15 13:12:35
[ 聞蜂導讀 ] 簡介:這一次,以用人工智能擊敗人類而聞名的心靈深處,將幫助人類擊敗新的皇冠病毒!DeepMind發布了一份文件,稱新冠狀病毒的蛋白質結構可以通過深度學習系統AlphaFold來預測。它還發布了六個預測結構,這對科學家理解病毒和開發疫苗至關重要。 谷歌母公司Alphabet旗下的明星人工智能公司DeepMind因擊敗人類、用AlphaGo擊敗人類圍棋世界冠軍以及用AlphaStar擊敗99.8%的人類玩家而聞

簡介:這一次,以用人工智能擊敗人類而聞名的心靈深處,將幫助人類擊敗新的皇冠病毒!DeepMind發布了一份文件,稱新冠狀病毒的蛋白質結構可以通過深度學習系統AlphaFold來預測。它還發布了六個預測結構,這對科學家理解病毒和開發疫苗至關重要。

谷歌母公司Alphabet旗下的明星人工智能公司DeepMind因擊敗人類、用AlphaGo擊敗人類圍棋世界冠軍以及用AlphaStar擊敗99.8%的人類玩家而聞名于世。這一次,心靈深處將幫助人類戰勝新的皇冠病毒。

為了檢測病毒和開發疫苗,科學家必須首先了解病毒的結構,尤其是病毒蛋白。這是一個需要幾個月的漫長過程,有時是徒勞的。近年來,研究人員轉向計算機預測。

全世界的實驗室都在研究冠狀病毒。深度思維的深度學習系統被稱為“阿爾法折疊”。

幾天前,DeepMind發表了一篇文章,表示希望通過“發表與非典型肺炎相關的幾種蛋白質的結構預測來幫助開展這項研究,這些蛋白質是由病毒引起的COVID-19,但尚未得到充分研究”。接下來,讓我們分享這篇文章。

深層思維:covid-19相關蛋白質結構的計算預測

“人類對冠狀病毒的研究已經進行了幾十年,所以利用以前的數據庫對COVID-19流行病作出快速反應已經在幾天內開發出一種新的病毒檢測方法。

然而,與傳染性非典型肺炎冠狀病毒-2型相關的蛋白質結構,這種冠狀病毒-19的罪魁禍首,還沒有被確定。傳統的方法可能需要幾個月甚至更長的時間,這給我們理解病毒的功能和傳播機制造成了很大的障礙。

由于傳統方法耗時太長,我們使用新版本的α折疊來預測與SARS-CoV-2相關的蛋白質結構。新系統可以在沒有相似蛋白質結構的情況下獲得精確的預測。

我們分享了幾種模型預測的病毒蛋白結構,希望能為廣大研究者提供一些幫助。

我們相信新系統比我們早期的CASP13系統更精確。以前,我們在蛋白質數據庫中成功預測了經實驗驗證的SARS-CoV-2棘突蛋白的結構,這給了我們足夠的信心,新系統也有可能預測其他蛋白結構。

最近,我們與英國弗朗西斯·克里克研究所的幾位同事分享了我們的研究成果,包括結構生物學家和病毒學家,他們鼓勵我們現在就公布我們的結構。我們的模型將指出結構的哪些部分更可能是正確的。盡管這些未被探索的蛋白質目前不是治療的重點,但它們可能會增加研究人員對非典-CoV-2的了解。

在正常情況下,我們將等待這項工作發表后,同行審議。然而,鑒于時間的緊迫性和疫情的嚴重性,我們決定公布與非典相關的六種蛋白的預測結構-CoV-2。這些數據文件是開源許可證,現在任何人都可以使用。

感興趣的研究人員可以通過我們提供的鏈接下載這些數據文件,并附上許多技術細節。最后,應該強調的是,這些都是預測結構,還沒有通過實驗驗證。"

根據DeepMind文章中提供的下載文件,新智元已經制作了六種蛋白質的預測結構圖,僅供參考(不能保證100%的準確性):

原始文件的下載地址:https://storage . googlepis . com/deep mind-com-vdataset/alpha fold-covid 19/structures _ 4 _ 3 _ 2020 . zip

DeepMind預測新皇冠病毒的“蛋白質折疊”重型武器

預測新冠狀病毒的蛋白質結構非常重要。它可以使科學家通過模擬和建模獲得更多關于蛋白質形狀及其運行模式的知識。它還為新藥開發開辟了新的潛力,降低了實驗成本,大大加快了科學家尋找更有效治療方法的過程,最終拯救了全世界的患者。

然而,DeepMind這次用來預測新冠狀病毒蛋白質結構的重型武器是它的AlphaFold,它于2018年底推出,受到各種媒體的高度贊揚。

DeepMind匯集了來自結構生物學、物理學和機器學習領域的專家,應用尖端技術,僅根據蛋白質的基因序列來預測蛋白質的三維結構。

據報道,阿爾法世界不僅在被稱為“奧林匹克運動會”的全球蛋白質結構預測比賽中遙遙領先于朋友和商人,而且其預測精度已經超過了人類專家。

純粹從基因序列確定蛋白質的三維形狀是一項復雜的任務。挑戰在于,DNA只包含蛋白質結構塊序列的信息,這些結構塊被稱為氨基酸殘基,排列形成長鏈。預測這些長鏈如何折疊成復雜的蛋白質三維結構被稱為“蛋白質折疊問題”。

蛋白質越大,模型越復雜和困難,因為氨基酸之間的相互作用更復雜。一些研究人員估計,在目前的條件下,精確確定所有蛋白質的三維結構可能需要比宇宙壽命更長的時間。

基于深度學習的蛋白質結構預測新方法

阿爾法折疊從零開始,不使用分析的蛋白質作為模板來模擬蛋白質的形態結構。結果預測蛋白質結構的物理性質具有較高的準確性。在此基礎上,用兩種不同的方法構建了完整蛋白質結構的預測模型。

這兩種方法都依賴于深層神經網絡,它可以從蛋白質的基因序列中預測蛋白質的特征。網絡的預測指標主要有兩個指標:(1)氨基酸對之間的距離(2)連接這些氨基酸的化學鍵之間的角度。這項技術被用來估計氨基酸對是否彼此接近。

上圖是三種蛋白質的距離矩陣。每個像素的亮度代表蛋白質序列中氨基酸之間的距離。像素越亮,配對越緊密。頂行顯示真實的、實驗確定的距離,而底行顯示阿爾法褶皺的預期距離分布的平均值。重要的是這些比賽在全球和本地都很好。底部面板使用3D模型來表示相同的比較,其特征在于苜蓿富爾德的預測(藍色)和與相同的三種蛋白質相關的真實地面數據(綠色)。

深度思維團隊訓練了一個神經網絡來預測蛋白質中每對殘基之間距離的個體分布。然后將這些概率組合起來,形成預測相應蛋白質結構的準確度得分。此外,訓練一個單獨的神經網絡來總結所有預測的距離,并估計預測的結構和實際結構之間的接近度。

使用這些評分函數,可以找到與預測相匹配的蛋白質結構。第一種方法基于結構生物學中常用的技術,用新的蛋白質結構片段重復替換原始的蛋白質結構片段。為此,研究小組訓練了一個生成的神經網絡來發明新的蛋白質片段,并不斷提高預測蛋白質結構的分數。

第二種方法通過梯度下降來優化分數。梯度下降是機器學習中常用的技術,可以用來實現小的、漸進的改進,并最終產生高度精確的結構。研究人員將這項技術應用于整個蛋白質鏈,而不是組裝前必須分開折疊的片段,降低了預測過程的復雜性。

不能等到同行評議,在第一時間發布預測結果,準確性未知

與之前未發布的GPT-2形成鮮明對比的是,由于當前疫情的緊迫性,DeepMind迫不及待地要通過同行評審。蛋白質結構的預測結果立即發布并存儲在pdb文件中。下載后,研究人員可以使用pdb文件中的數據自己繪制圖像。

目前,阿爾法褶皺在競爭中取得了優異的成績,但其在預測穩定性方面的缺陷也非常顯著。比賽中有兩個極端:43個預測中有25個非常準確,而其他的則大錯特錯。因此,阿爾法福對新冠狀病毒的預測結果的準確性仍然未知,同行評審結果和實際臨床治療的驗證是有望的。

無論如何,深度思維的這一舉動為人工智能應用于實際場景開辟了一條新的途徑,尤其是在對抗流行病方面。同時,我也期待更多的國內人工智能企業在抗擊疫情中找到自己的突破口。

更多關注微信公眾號:jiuwenwang

  • 劉曠的頭像

    劉曠

    購團邦資訊網創始人

  • 馮耀宗的頭像

    馮耀宗

    IT評論者、互聯網觀察員、SEO專家

  • 盧松松的頭像

    盧松松

    百強自媒體、IT博客50強、創業者

  • 康斯坦丁的頭像

    康斯坦丁

    知名IT評論人,科幻星系創建人,多家知名媒體及企業特邀顧問專家

  • 王雪華的頭像

    王雪華

    RUN媒體創始人

  • 月光博客的頭像

    月光博客

    知名IT獨立博客作者龍威廉


  • 驗證碼: 看不清?點擊更換 看不清? 點擊更換
  • 意見反饋
    意見反饋
    返回頂部
    网络捕鱼平台