淘新聞

全球首個癌症計算解決方案啟動,英偉達、IBM 加持的機器學習搞得定嗎?

癌症自出現之日就是環繞在人們頭頂上的烏雲,如今,隨著社會壓力越來越大,癌症發病率也越來越高,而攻克癌症一直是醫學界正在努力的方向。

今年一月,美國總統奧巴馬宣佈了“抗癌登月計畫”的科研目標,旨在讓抗癌研究的進展速度翻一番,在 5 年內達到原本可能需要 10 年才能取得的成果,專案總預算大約 10 億美元。

近日,據國外媒體報導,美國啟動了全球首個“癌症先進計算解決方案的聯合設計”( Joint Design of Advanced Computing Solutions for Cancer ,簡稱 JDACS4C)專案,旨在借助深度學習技術加快抗癌研究。該項目也是為了實現“登月計畫”的十大任務之一——建立癌症資料共用系統。

負責人之一的 Rick Stevens 透露,在明年第二季度,JDACS4C 的首批成果將會面世。

三個試點專案

之所以被稱為“聯合設計”,是因為 JDACS4C 專案共分為 3 個試點,內容涵蓋了從分子學到人口學的研究。通過這些項目,研究人員希望能夠提供可擴展性機器學習工具的研究資訊,進一步發展深度學習、模擬和分析技術,更快地為用戶找出解決方案,為未來計算解決方案的設計提供參考。最終達到“有效地利用逐漸多樣化、不斷增長的癌症相關資料,建立起預測模型,提供對疾病更準確的判斷,進一步為患者的治療提供指導,最終建立起未來癌症研究的新模型。”

大家先跟雷鋒網一起看下這三大試點項目是個啥:

RAS 分子項目

該專案希望通過開發出新的計算方法,支持當前已經在進行的 RAS 分子研究,最終希望增強研究者對癌症中 RAS 基因及其相關信號通道的理解,在 RAS 蛋白膜信號複合體中發現新的治療物件。

臨床治療前的篩查。

這一專案以試驗性的生物資料為基礎,針對“機器學習、大規模資料和預測模型”進行重點開發。通過建立回饋迴圈,讓試驗模型對計算模型的設計進行指揮,而這些模型或許就能對準癌症中的新目標,説明醫生找到新的治療方式。

人口模型

該專案希望開發出可擴展性框架,對全世界癌症患者的病情記錄進行有效的歸納和分類,總結。根據人們的生活方式、所處環境、癌症種類、醫療體系等要素,從大量癌症病人的病歷資料中自動分析,以獲得最佳的治療方案。這種引擎將對醫療健康的多個方面影響巨大,包括資料的分發,以及對成本的控制等等。

每個項目都有深度學習加持

Rick Stevens 認為,深度學習對推動抗癌研究非常重要,“ JDACS4C 的每個專案都需要深度學習技術,但它們需要不同的使用方法。所以,我們需要瞭解軟體環境和網路拓撲結構,以免重複勞動。”對此,研發團隊重新定義了一些關鍵指標,以“解決和癌症相關的不同子環節的深度學習問題”。

Stevens 還表示,團隊正在用深度學習技術整合細胞系中篩選出的化合物資訊,並將其用在實驗小老鼠身上,從而在身懷腫瘤的老鼠群裡用不同的化合物進行測試,並監測老鼠們對給定藥物有何反應。

此外,由於大部分的病理報告帶有主觀性,研究團隊要讓機器讀懂所有歷史資料是一個很大的挑戰。

“我們首先建立了一個分類器,它會告訴我們腫瘤的類型以及它分佈在人體的哪個部位。”Stevens 介紹到。

事實上,JDACS4C 專案的目標是讓模型的發展獨立於深度學習框架,這樣一來,如果將框架更換,JDACS4C 也不需要調整模型。在深度學習領域,這是很常見的做法,即設置用於模型表達的腳本層。Stevens 在接受採訪時表示:“我們正在與學術界和一些企業合作,比如英偉達,我們還開發了分層架構,這涉及到與深度學習領域各個組織的合作。”

不過,Stevens 也承認,目前想要獲得大規模且高品質的訓練模型資料仍然具有挑戰性。“雖然我們建立的機器學習模型已經能夠比較精准地預測出藥物反應或者腫瘤的類型,但它並不能告訴我們預測的原因。模型不能解釋自己的結果。”Stevens 說,“研究者需要以一種機械論的模型或者資料來提供支援,並且將這些與機器學習模型融合。這樣一來,我們就得到了兩個成果,一個是高精度預測的模型,一個是有解釋能力的模型。這種混合方法會給未來的研究帶來巨大的空間。”

多方支持,NVIDIA、IBM、Intel 參與

JDACS4C 專案目前已經獲得了美國能源部的資助,合作方還包括 Intel、IBM 和英偉達等。

Stevens 表示吸引供應商參與進來並不難,因為所有的 HPC(高性能 PC)供應商都制定了積極的深度學習發展路線圖。

“英偉達優化了針對不同 GPU 的通用框架,英特爾也有許多機器學習方面的計畫。可以這麼說,我們正在與英特爾所有適合(JDACS4C)的部門展開合作。”雷鋒網瞭解到,

今年八月份,英特爾耗資 4 億美元收購了深度學習平臺 Nervana Systems公司,Nervana 雖然只是初創企業,但卻擁有專為深度學習打造的全方位優化的軟體和硬體堆疊,號稱處理器速度將可達到 GPU 的 10 倍。

此外,Rick Stevens 及其團隊還在評估最適合的深度學習框架,Stevens 表示:“我們正在尋找一種最適合該項目的機器學習框架。團隊正在與供應商合作在硬體上進行優化。我們還和利佛莫實驗室合作,包括開發可擴展的人工神經網路框架 LBANN。”據瞭解,穀歌、微軟、Facebook 等公司也在團隊的考慮範圍內。

雖然目前 JDACS4C 試點項目仍處於創辦初期,但這個牽動全球人民健康的項目已經備受關注。而它首批試驗成果會是什麼樣,專案進展如何,雷鋒網將會持續關注。

Via 

hpcwire