《自然》:這家中國AI公司的計畫 超越了所有對手
OFweek機器人網訊:碳雲智慧在本月5號的發佈會上首次公佈了自己的產品。會後,頂級 期刊《自然》也在其官網上發文報導了碳雲。文中指出,這家公司正在實施一項大膽的計畫,但實現的過程困難重重,且外界褒貶不一。原文編譯如下:
中國一家讓人感興趣的生物技術公司提出了一個大膽的計畫,它希望用人工智慧改變醫療健康的現狀。
這家公司就是位於深圳的碳雲智慧,其創始人王俊在1月5日的數字生命峰會上表示,公司與世界各地的7家技術公司組成了一個雄心勃勃的聯盟,專注收集不同類型的醫療健康資料。
聯盟會使用演算法分析基因組、生理和行為資料,並通過APP直接向消費者提供個性化的健康和醫療建議。
這也是碳雲智慧產品的首次亮相。2015年10月,王俊離開同樣位於深圳的華大基因後,成立了碳雲智能。目前公司已經獲得了6億多美元的投資,相比之下,它的競爭對手們對同類產品的投入才數千萬美元而已(不過像Google這樣的公司,具體金融也未知)。碳雲最初的融資有約2億美元,多數來自另一家深圳公司騰訊。在峰會上王俊稱,已經向聯盟成員另行投資了4億美元,不過他沒透露資金來源。他還展示了“覓我”手機應用,使用者可以借此輸入資料,接收建議。
除了Google和IBM,Arivale等初創公司也在開發類似的技術。但王俊認為,碳雲聯盟能更快速且廉價地收集資料。
王俊認為,聯盟成員的工具是最前沿的,而且整個系統能讓不同類型的資料無縫集成;另外中國大量的用戶已經習慣於用微信和其它社交媒體分享資訊。“沒有人能收集我們這樣規模的資訊。”他相信,五年內可以獲取100萬人的樣本和資料,而這會帶來更智慧的AI。
他的計畫源于對基因組學的失望。對於個體與疾病的關係,最大規模的基因組研究也能給出微弱的提示。比如,確定一個會讓個體患心臟病風險增加1-2%的基因。因此,除了挖掘基因組資訊,碳雲聯盟還會從各種組織中提取生物分子資訊,為個體健康提供更精確和可操作的藍圖。碳雲選擇用合作的方式挖掘這些信號。
比如,SomaLogic的晶片可以同時測量大約4200種蛋白質。去年6月,利用能讀取1130種蛋白質的商用前體,研究人員通過測量9種血液蛋白質的活性,可以預測哪類心臟病患者會復發。
另一個聯盟成員是HealthTell,它開發的晶片使用約33萬個蛋白片段的微陣列,從血液樣品中捕獲抗體,從而回答疾病發展,過敏和疫苗效用等問題。
還有一個成員是PatientsLikeMe,這家公司擁有約50萬用戶,他們會上傳有關疼痛度,睡眠品質和疲勞度等不容易量化的資料。這些會與醫療資料,行為模式和使用者的疾病與用藥經歷整合,從而找到預測這些不可測量指標的模式。
所有上面的最終結果,會是來自各種資料來源的難以處理的資料集。這也是為什麼碳雲在開發一些演算法,可以理解這些變數與健康或疾病有怎麼樣的關係。在使用者輸入包含和活動資料,以及任何生理或生命體征資料後,覓我應用會給出應該吃什麼,什麼時候睡覺,應該做多少運動等建議。
外界對碳雲是否能做成這些事的評價不一。
藥物開發組織FasterCures的高級研究員Bernard Munos就認為,聯盟中的公司能為碳雲提供一系列高品質的指標,減少資料中的噪音,並能呈現出某種模式。由於他們要處理的變數很多,所以這些指標十分關鍵。
但他同時也擔心系統的混亂性質。另一家聯盟成員公司GALT,對於人體微生物如何影響健康,會提供個性化的評估。但現在對微生物組的瞭解很少,而且他們總是不斷變化。“個體水準上的生物有很強的隨機 性,這樣資料很難被獲取,更不論生成模型了。目前,我對他們的成功持謹慎態度。”
不過也有人對碳雲和王俊有信心,比如聯盟成員SomaLogic的創始人Larry Gold,他認為,“這不是胡 說,我被他的遠見所吸引。這是可能的,而且他會把這些變成現實。”
王俊也深知,公司的成員取決於使用者是否願意提交資料,並聽取應用程式給出的建議。正如他自己所言,“ 覓我會告訴我不要喝酒,但我不一定會聽。”
中國一家讓人感興趣的生物技術公司提出了一個大膽的計畫,它希望用人工智慧改變醫療健康的現狀。
這家公司就是位於深圳的碳雲智慧,其創始人王俊在1月5日的數字生命峰會上表示,公司與世界各地的7家技術公司組成了一個雄心勃勃的聯盟,專注收集不同類型的醫療健康資料。
聯盟會使用演算法分析基因組、生理和行為資料,並通過APP直接向消費者提供個性化的健康和醫療建議。
這也是碳雲智慧產品的首次亮相。2015年10月,王俊離開同樣位於深圳的華大基因後,成立了碳雲智能。目前公司已經獲得了6億多美元的投資,相比之下,它的競爭對手們對同類產品的投入才數千萬美元而已(不過像Google這樣的公司,具體金融也未知)。碳雲最初的融資有約2億美元,多數來自另一家深圳公司騰訊。在峰會上王俊稱,已經向聯盟成員另行投資了4億美元,不過他沒透露資金來源。他還展示了“覓我”手機應用,使用者可以借此輸入資料,接收建議。
除了Google和IBM,Arivale等初創公司也在開發類似的技術。但王俊認為,碳雲聯盟能更快速且廉價地收集資料。
王俊認為,聯盟成員的工具是最前沿的,而且整個系統能讓不同類型的資料無縫集成;另外中國大量的用戶已經習慣於用微信和其它社交媒體分享資訊。“沒有人能收集我們這樣規模的資訊。”他相信,五年內可以獲取100萬人的樣本和資料,而這會帶來更智慧的AI。
他的計畫源于對基因組學的失望。對於個體與疾病的關係,最大規模的基因組研究也能給出微弱的提示。比如,確定一個會讓個體患心臟病風險增加1-2%的基因。因此,除了挖掘基因組資訊,碳雲聯盟還會從各種組織中提取生物分子資訊,為個體健康提供更精確和可操作的藍圖。碳雲選擇用合作的方式挖掘這些信號。
比如,SomaLogic的晶片可以同時測量大約4200種蛋白質。去年6月,利用能讀取1130種蛋白質的商用前體,研究人員通過測量9種血液蛋白質的活性,可以預測哪類心臟病患者會復發。
另一個聯盟成員是HealthTell,它開發的晶片使用約33萬個蛋白片段的微陣列,從血液樣品中捕獲抗體,從而回答疾病發展,過敏和疫苗效用等問題。
還有一個成員是PatientsLikeMe,這家公司擁有約50萬用戶,他們會上傳有關疼痛度,睡眠品質和疲勞度等不容易量化的資料。這些會與醫療資料,行為模式和使用者的疾病與用藥經歷整合,從而找到預測這些不可測量指標的模式。
所有上面的最終結果,會是來自各種資料來源的難以處理的資料集。這也是為什麼碳雲在開發一些演算法,可以理解這些變數與健康或疾病有怎麼樣的關係。在使用者輸入包含和活動資料,以及任何生理或生命體征資料後,覓我應用會給出應該吃什麼,什麼時候睡覺,應該做多少運動等建議。
外界對碳雲是否能做成這些事的評價不一。
藥物開發組織FasterCures的高級研究員Bernard Munos就認為,聯盟中的公司能為碳雲提供一系列高品質的指標,減少資料中的噪音,並能呈現出某種模式。由於他們要處理的變數很多,所以這些指標十分關鍵。
但他同時也擔心系統的混亂性質。另一家聯盟成員公司GALT,對於人體微生物如何影響健康,會提供個性化的評估。但現在對微生物組的瞭解很少,而且他們總是不斷變化。“個體水準上的生物有很強的隨機 性,這樣資料很難被獲取,更不論生成模型了。目前,我對他們的成功持謹慎態度。”
不過也有人對碳雲和王俊有信心,比如聯盟成員SomaLogic的創始人Larry Gold,他認為,“這不是胡 說,我被他的遠見所吸引。這是可能的,而且他會把這些變成現實。”
王俊也深知,公司的成員取決於使用者是否願意提交資料,並聽取應用程式給出的建議。正如他自己所言,“ 覓我會告訴我不要喝酒,但我不一定會聽。”