您的位置:首頁>數碼>正文

用GANs尋找潛在藥物,抗癌新藥指日可待

據雷鋒網消息,近日,來自莫斯科物理科技學院(MIPT),InSilico Medicine和 Mail.Ru集團的研究人員首次將生成神經網路(generative neural network )應用在研發擁有特定醫療屬性的藥物上。這種用生成對抗網路(Generative Adversarial Networks ,GANs)發展、訓練新的分子結構的方法,能大幅度減少尋找有潛在藥物特性物質的時間和其他成本。研究人員表示,將把該技術應用在腫瘤、心血管疾病甚至抗感染等多個醫療領域。(雷鋒網此前曾在《硬創公開課》中和大家分享過有關GANs的原理、應用和走向等內容,詳情請點擊

這裡

無機分子基( inorganic molecule base)包含數億種物質,但其中只有少數能被人類應用在醫療領域。研究人員用藥理學方法研製藥物通常會基於前人的研究成果。例如,阿司匹林很早以前就已經被用作藥物,但藥理學家以後還會基於當下的成果繼續研究它,為該化合物增加其他成分以減少它的副作用、提高藥效。今年早些時候,來自 Insilico Medicine的科學家向公眾展示了用深層神經網路減少搜索藥物範圍的有效性。但如今他們正面臨著一個新的挑戰:是否能用大量分子結構去訓練深層神經網路,然後讓該網路創造一種概念上的新型分子?

生成對抗自動編碼器(Generative Adversarial Autoencoder ,AAE)結構是GANs的延伸。研究人員把它作為基礎,加上已知的醫療特性和有效濃度,將之用在訓練神經網路上。研究人員會把和所需化合物相關的資訊輸入到網路中,網路對其進行調整後會輸出類似的資料。 網路由三個部分構成:編碼器,解碼器和鑒別器。其中每一個在與另兩個“協作”中都有自己特定的角色。 編碼器與解碼器一起壓縮、恢復母化合物的資訊,而鑒別器則使壓縮後的資訊更適於恢復。 當網路已經學習過大量已知分子結構後,編碼器和鑒別器則會結束工作狀態,網路就能用解碼器自動生成對分子的描述。

開發基於文本輸入而生成高品質圖像的生成式對抗網路,需要擁有豐富的專業知識,並且要在高性能計算設備上進行長時間的訓練。 對於生成圖像和視頻而言,研究人員則可以快速判斷生成品質如何。但在生物學中,品質控制不僅不能通過“看”來解決,並且還需要大量的驗證實驗來產生大分子。

在系統中,所有分子均表示為“SMILEs”或化學物質圖形注釋(雷鋒網注:graphical annotations of chemical substances,目的是它們的結構能儲存在系統中)的形式呈現。學校裡教授的標準註冊(standard registration)不適於網路處理。SMILEs也是如此,因為它們的長度是隨機的。而神經網路訓練需要一個相等的描述長度的向量。這時候,分子“指紋”便能解決這個任務,因為它包含關於分子的完整資訊。

該技術的其中一個研究人員Andrei Kazennov,和在Insilico Medicine工作的MIPT研究生評論說:

“我們創造了一個生殖類型的神經元網路,也就是說它能夠生成訓練它類似的東西,最終教會該網路模型根據指定的屬性創建新的分子“指紋”。

另外,也可以把抗癌藥物資料庫用於網路檢查。 首先,網路用其中一半的藥物化合物資訊進行訓練,然後再檢查另一部分。目的是讓它預測已學習過,但在訓練時未包含在內的化合物。結果是網路識別出了69種預估化合物。

Mail.Ru集團搜索優化團隊首席程式師、Insilico醫學獨立科學顧問Artur Kadurin總結道。

“GANs是神經科學領域相當前沿的研究領域。很明顯,與生成圖像、音樂相比,它的應用範圍更廣。我們已經在生物資訊學中嘗試了這種方法,並且獲得了巨大的成果。“

via:

dddmag

喜欢就按个赞吧!!!
点击关闭提示