FTCon2017|通聯資料首席科學家蔣龍:如何用人工智慧發現投資機會?
雷鋒網AI金融評論按:3月25日,由開源社、TopGeek、匯智Tek聯合主辦的中國區塊鏈和金融創新科技峰會(FTCon2017)在上海舉行,通聯資料首席科學家蔣龍分享了許多關於人工智慧時代的智慧投資服務的故事。據雷鋒網AI金融評論瞭解,蔣龍畢業于北京大學,曾任微軟亞洲研究院副研究員、阿裡巴巴高級演算法專家。
“對於給定的問題,技術工程師具備很強的技術能力解決,但是技術需要跟場景結合才能發揮更大的作用。所以,我今天講的更多的是場景”,蔣龍說道,“我今天主要分享三個問題:投資科技是什麼,它的內含是什麼?以及具體的案例”。
以下是雷鋒網AI金融評論整理的演講全文,對其進行了不改變文章原意的編輯。
大家可能都聽說過FINTECH這個詞,我今天想講另外一個InvesTECH。
金融欲實現整個社會資源最有效配置。投資與資產管理相關,是金融的子行業,是券商、銀行、投行、金融公司等做的事情。傳統的方法是根據邏輯和經驗分析,未來則要更多借助大資料和人工智慧的説明,來發現有價值的機會。
“投資的發展也是由科技所引領”
金融是把社會資源更好的配置,很多資源是優先的,比如先知道一些有價值的資訊,你就能提前知道機會,別人就沒有辦法競爭了。資訊的傳遞是非常重要的技術,投資的發展也是由科技所引領。
古代就有通過烽火臺和信鴿傳遞資訊。比如在戰爭中,如果你可以提前知道戰爭的結局,在市場上就可以獲得很大的回報;70年代以前主要是通過電話來交易,管理人通過自己的經驗進行判斷;後來電腦出現了,對資訊的處理和分析能力隨之加快,開始出現了批量交易,即一次交易幾百支股票。
隨著科技的發展,我們發現未來是不可預測的,但是風險可以預測。漸漸地,對沖基金出現了,通過計算、嚴謹分析以及大量風險對沖,可以實現更穩健的受益。現在有更厲害的出現了,國外出現了機器人做宏觀的對沖,所以說,科技一直引領著投資界的革命。
如今我們講的投資科技有三個方面的基礎,分別是:
雲計算,提供計算的基石,未來的投資一定是通過負責複雜的運算進行的。
大資料,未來做投資決策的原料。後面我們可以看到很多實際的案例,主要關於:怎麼樣用互聯網獲取的公開的的大資料進行更及時的決策。
人工智慧,從大資料中發現有價值的資訊。人工智慧可以幫助我們解決問題,作為加工和處理的手段,幫我們把最重要的資訊提取出來。可以進行複雜的決策。
大資料產品的資訊主要分為這幾類:
物的資訊——物聯網,國際上就有一些監控農作物產出以預測農作物的收成,從而進行大規模投資的案例。如果通過即時監控氣候、水分等,就能提前知道今年農產品的收成情況,接下來對相關產品就有投資優勢。
人的資訊——可穿戴設備,人和物體構成互動,人去了哪裡,看了什麼,想了什麼,這呈現出了我們的社會。
環境的資訊——低軌道衛星,低軌道衛星是在低空一萬米進行檢測,不僅能檢測農產品的產區,還能檢測港口停泊郵輪的數量、超市停車場停車量等,有了這樣的資料,就能知道是不是符合預期,可以判斷未來的收益情況。
投資管理的“相對論”
投資界有一個公式非常有名,就像相對論在物理學裡的價值一樣。就是這個公式,這裡提到證券資產的模式,主要是來自三方面,
第一是持有該資產未來可以帶來的現金流折現,比如說持有股票。
第二個是市場情緒,也就是市場其他人對於該資產未來的看好看壞程度。
最後是套利成本,或者說是資金成本。買了證券後,就不能把這些錢去存銀行或者投資低風險債券等。
比如說通過三個報表、現金流量、資產負債表的資料,就能夠分析一個公司的盈利是不是可持續性,發展是否正常,財務結構是否健康,以預測未來的盈利情況。
投資是競爭非常激烈的行業,誰能領先一步做出有效的決策,誰就可能獲得一個很高的回報。現在大家都在思考的是:如何能夠超越現有的資料?往前看一點。按照中國現有的市場上,三個報表是每個季度發佈一個,如果季度過了才進行預測的話,那已經晚了,所以要提前預測三大報表。比如說根據行業的某些資訊,或一些金融事件來判斷,在報表發佈之前,就知道大概的受益。
投資科技目前最想實現的目標是科學投資。所謂的科學投資,就是基於合力的經濟邏輯,嚴格的實證分析,構建投資模型,進行可重複的投資決策。
經濟學裡有一個有趣的故事,叫孟加拉黃油。加州理工學院博士David J. Leinweber在1995年的時候發表過一份研究論文,顯示孟加拉的黃油產出、美國的乳酪產出以及孟加拉和美國的綿羊總數量是高度相關的。大家覺得沒有邏輯,但又沒有辦法反駁。後來博士自己就發現了,這個三者高度相關很正常,因為他研究了大概幾百萬條經濟資料,在這些資料中,只看漲跌,有可能幾個變數恰好高度相關,這種概率是存在的,當你從大量的無序數據當中尋找這些變數,總能找到的。
科學投資是希望投資從藝術轉為科學,目前,我們認為巴菲特是藝術投資的大師,但藝術是普通人輕易不能學來的。
大資料、人工智慧如何發現投資機會?
我們接下來講具體的案例,到底大資料、人工智慧怎麼樣發現投資機會的?
大資料
首先講大資料對於投資應用的案例,這裡提到的案例公司是華誼兄弟。我們要解決這樣一個問題:華誼兄弟是不是值得買?
我們有這家公司目前市場行情、公司狀況、當前發佈的最新財務報表以及相關公司的行業狀況資料。這是傳統研究所依賴的資料,但有大資料之後,投資就產生了變化。
我們發現華誼兄弟收入來源,70%來自影視。研究華誼兄弟具體拍攝狀況,包括今天拍了哪部電影,導演、編劇是誰等,就可以瞭解其收入情況,並研究其歷史的上映過的電影票房情況,包括其在百度上的搜索指數,豆瓣上的評分的情況,這樣,我們就可以做一個
票房預測模型
。用這個模型,我們就可以在電影上映之前,對票房進行預測,並結合業務情況,評估該公司接下來的收入情況。
萬科是一個地產公司,公司最值錢的是土地和正在開發的樓盤。我們有萬科的基本狀況資料,包括其土地在哪個城市,土地周邊的環境等。查閱歷史資料,我們知道了萬科所建立的樓盤情況,包括每個樓盤的名字和地點,我們能知道每個樓盤增值到少。有了這些之後,我們可以判斷要開發的這塊地的真實價值到底是怎樣的。房地產的資料來自于搜房、鏈家等,我們可以用這些大資料構建起一個地產公司分析平臺。
除了直接公司分析主營業務大資料之外,也可以根據公司之間的關係分析價值。這裡面的結點是公司,之間的關係是任職關係,或持股關係。比如某公司發佈一個新聞,說要和另一家公司合資成立一個新公司,這兩家公司之間就建立了關係。上市公司的變動會公開發佈的,全國工商總局有所有企業的情況,基於這些,我們就可以畫出圖譜,進行關係構建,包括投資關係、持股關係等。
基於這個圖譜,就可以知道一家公司金融投資的詳細目的,比如發現投資人是誰?是不是存在同業競爭?所謂同業競爭是指,一個老闆下面有兩家公司做同樣業務,而且兩個都是上市公司,這樣對中小投資者是不利的,所以解決同業競爭對上市公司是利好的。比如上市公司會不斷並購,我們基於其過去的歷史和現在的資產情況,可以猜測其下一步並購的情況。
智慧投研
那智慧技術是怎麼幫助投資研究的?
一、知識圖譜
上市公司的公告是研究上市公司最重要的來源,因為上市公司有嚴格的資訊要求,所有重大資訊必須公告發佈,不能通過其它的管道,如果交易資訊被提前洩漏出來,也就構成了內部交易,而這是違法的。嚴格來講,所有的資訊都會同一時間在公告上發佈,但公告的資訊有很多,並且公告都以PDF的形式發出來的,每天上市公司公告很多,高峰期可能是四五千份,如果要四五千看完了再做選擇,肯定是晚了。那怎麼樣利用智慧技術提高投資效率呢?
首先把PDF解析成有價值的結構化資訊,首先要做的是公告的分類,包括是什麼類型的公告,如果是高管增減持股公告的話,那這個高管曾經做過什麼等,這些關係資訊要提取出來。之後電腦做初步的識別,在每天大量的公告裡面,識別那些值得關注的重要的公告。
我們翻閱公告的時候,我們要看的不僅是一個資訊,要看歷史的股價增持,過去的高管情況,過去的增減情況等,這些資訊聯合起來才可以做決策。現在,有了自動分析和解析功能,就可以把所有相關資訊展示出來,大大提升公告決策投資的效率。
二、新聞
新聞面臨同樣的問題,每天有大量的新聞,怎麼樣從海量的新聞裡面發現有價值的資訊,提升投資效率呢?這就涉及到資訊的組織、檢索。
互聯網的發展經歷了幾個階段,第一階段是把資訊放出去,所有的資訊像圖書目錄一樣組織起來,大家可以找到;但當資訊太多的時候,組織也沒有用,搜索就比較重要了;當資訊進一步擴展,人們甚至不知道世界上有哪些資訊時,搜索就不管用了,因為你都不知道世界上有什麼,這時,推薦就變得很重要,它能根據你的描述知道給你推薦什麼東西。
投資現在處於第一個階段,正往第二個階段走,目前比較原始的。
首先是分類,要知道這個新聞談的是什麼內容,關於哪個行業,什麼產品。
它是什麼來源?是某個部門發的,或者是某一個小的訊息源
這些基本資訊提出來後,再利用資訊降噪方法,提煉重要的資訊,剔除冗餘資訊。
三、量本投資
有了這些資訊後,機器就可以自動化判斷這個企業值多少錢。這個過程,有兩個很重要的研究方法,一個是基本面,另一個是量化。現在又出現一個新的名詞叫量本投資。基本面是基於邏輯分析,比如上市公司的業務是什麼,收入來自哪裡,支出哪些方面。之後,根據市場狀況分析政策和新聞,預測上市公司接下來會怎麼變?
到目前為止,量化走的是廣度,投資機會很多,但勝率會低一點,將基本面與量化結合,會形成新的量本投資機會。
我們以航空公司來看,航空公司的利潤總額,可以拆解成客運和貨運,客運又可以分多種,所有的資料都可以這樣拆。之後,預測各部分資料的變化,就可以知道利潤總額是多少。
我們曾經做過一個案例,預測東方航空的月收入,每個月都會公佈這個預測。我們用2016年以前所有的資料訓練,最終公佈與預測資料之間,一開始相差比較大,後來控制平均誤差是10%左右。10%什麼概念呢?中級研究員的預測誤差是10%左右。
公司在不同的項目收入多少,利潤率多少,這是已知的。機器人也可以做類似的事情,雖然說現在機器人還不能達到研究員的程度,但是研究員覆蓋的地方有限,有些太冷門,關注者很少,在這些地方機器人就可以幫忙。
前一段時間,我參加了一個北大金融論壇,那次論壇上參與的金融方面領導表示,希望把新三板搞得更活一點,現在新三板非常的不活躍,原因是不知道該投什麼。這個時候機器預測就很重要了,雖然預測結果沒有人那麼准,但至少可以作為一個參考。有了這樣的決策,進入新三板的人才多,才可以把新三板搞活。
前兩年大資料挺火的,百度搞了一個百度百發,基於他們掌握的大資料來預測之後的發展形勢。2015年,我們也開始這樣的嘗試,用了宏觀、中觀、微觀三個層次分析,之後機器人來發現目前市場上有投資潛力的行業,每週一開盤前會公佈到官方網站上。按開盤的價格估計,目前的計算要領先很多。
我認為,機器人分析很快會發展起來,國外就有很多機器人做投資。具體怎麼做沒有公開,但是我們知道的是,它們可以做這樣的事情。大家可能在各個券商APP上看到過機器人發佈的投資。
如何利用大資料和人工智慧提升投資服務?
投資科技不僅包括怎麼做研究,還包括怎麼做好服務,怎麼樣利用大資料和人工智慧技術提升服務品質。
作為投資服務商,首先要瞭解用戶。加入通聯之前,我在阿裡負責精准行銷,建立用戶畫像。用戶畫像很重要的,因為我們之後瞭解用戶之後,才能精准投放廣告。
比如,要用戶偏好投資的標的是什麼,用戶畫像是非常重要的。很多用戶沒有時間看投一些比較穩健的項目;針對於市場上的散戶,怎麼樣從資料的角度分析進行預測,找到賣點,去挖掘他們的投資潛力。基於使用者的歷史資料,我們能分析出很多細化人群,有了這樣的用戶畫像,就可以提供非常個性化的服務,包括個性化炒股建議,理財建議等。
2009年,美國就出現了這樣的公司,基於用戶的特點,提供個性化的理財投資建議。長期來講,財富增長的90%來自於良好的資產配置,如果你要做長期投資的話,只要做好資產配置就好了。之前資產配置需要專業人員的服務。在美國,50萬美元以下的投資很難享受服務。但現在人工智慧解決了50萬美元以下的投資。