淘新聞

寫稿機器人“小南”上崗 1秒完成一篇春運報導

OFweek機器人網訊:南都訊“車次主要是K字頭和普列,基本都是無座票,一站到底,路途會比較辛苦。”如果不說,你能看出來這句話是機器人寫的嗎?
昨日,南方都市報社寫稿機器人“小南”正式上崗,並推出第一篇共300餘字的春運報導。此外,南方都市報社、凱迪網路和北京大學電腦科學技術研究所還在小南的基礎上,聯合成立了“智媒體實驗室”,探索人工智慧在媒體上的更多應用。
首篇文章一秒完成
請用5秒的時間思考以下新聞的共同點:《蘋果第一季度營收超華爾街預測》(Apple tops Street 1Q forecasts),2015年1月發佈;《8月C P I漲2%創12個月新高》,2015年9月發佈;《綿陽安州發生4.3級地震》,2016年5月發佈;《奧運會乒乓球女子單打四分之一決賽 丁寧(中國)4:0輕鬆晉級下一輪》,2016年8月發佈。
這道題其實沒有標準答案,但不管你有沒有注意到,有一點非常重要:這些新聞的作者,都不是人。或許你已經聽說過“寫稿機器人”———在寫作這一似乎最不可能被機器人涉足的領域,變化正在發生。

看看這些數字:蘋果財報發佈數分鐘後,美聯社的機器人報導便已完成,他們還號稱每個季度可撰寫3000篇財經報導。《紐約時報》走得更快,其機器人編輯Blossom blot每天推送300篇文章,在財報季、運動比賽報導中寫稿已成慣例。
如此速度和品質,確實讓人類記者望塵莫及。但真正嘗試使用機器人寫稿的媒體,尤其是在國內,還並不多。如今,小南正式入場。
北京大學電腦科學技術研究所萬小軍教授,是小南的技術開發團隊負責人。他透露,小南的首篇春運報導作品,共300餘字,資料自動抓取完成後,報導的生成只用了不到一秒的時間。
率先進軍民生領域
與其他機器人“同行”有所區別的是,小南聚焦的是民生領域報導。
此前,寫稿機器人大顯身手的領域,往往是體育和財經———因為這兩個領域都涉及大量資料。從龐雜、枯燥的資料中尋找模式,就準確度和速度而言,機器人比人類更有優勢。
人類的筆法千變萬化,但總是有“套路”,也就是模式和規則可以依循的。這時候,演算法就有了用武之地。
採集資料、分析資料、規劃文章結構,再到最終的遣詞用句,和人類一樣,機器人也能做到“讀書破萬卷,下筆如有神”。海量的資料和高效的演算法,是寫稿機器人的兩大利器。
相較於體育和財經領域,民生報導的生成對機器人來說略為棘手。許多財報文章都大同小異,但民生報導的“套路”可就太多了,從交通出行到食品安全,主題也五花八門。
一個民生領域的人類記者可以同時報導交通和食品領域,但就目前而言,讓機器人做到跨界的“融會貫通”還需要時間。萬小軍介紹,機器人寫稿又快又好的前提是通過大量的積累和訓練。
“教小南寫稿的過程中,主要的難點就是可供學習的樣本不夠豐富。”萬小軍說,民生議題的關注度高,卻不像常規的體育和財經報導一樣有著相對固定的模式,訓練語料較為缺乏。