淘新聞

清華大學用機器人寫詩:31%竟被認為是人寫

聽說這幾天古詩詞很火,各種專業騷客、民間高手、百年才子如雨後春筍湧現於神州大地,令人歡欣振奮。

先上詩,第一組:

問:哪首是人寫的,哪首是機器寫的?

是不是大寫的服?

如果說二選一還是比較容易判斷(蒙中)的,那再來第二組:

1、雲峰

白雲生處起高峰/鬼斧神功造化成/古往今來誰可上/九重宮闕握權衡

2、畫松

孤耐淩節護/根枝木落無/寒花影裡月/獨照一燈枯

3、悲秋

幽徑重尋黯碧苔/倚扉猶似待君來/此生永失天臺路/老鳳秋梧各自哀

4、春雪

飛花輕灑雪欺紅/雨後春風細柳工/一夜東君無限恨/不知何處覓青松

5、落花

紅濕胭豔逐零蓬/一片春風細雨濛/燕子不知無處去/東流猶有杜鵑聲

問:這五首哪些是機器作的?

沃剛人的詩在宇宙裡可能發生的最壞的事裡排名第三位。——《銀河系漫遊指南》

公佈答案:第一組左邊一首,第二組中2、4、5是機器所作的詩。

從詞語拼湊到基於深度學習技術的造詩機

實際上,以上的機器詩可以說是當下機器所能達到的較高,甚至可能是最高水準了。

知乎專欄作者蕭瑟在《當AI邂逅藝術:機器寫詩綜述》一文中,認為機器詩歌生成的工作,起始於20世紀70年代。但在電腦誕生之前,就有好事者弄了個高頻詩歌詞語轉盤,轉到哪個詞就記錄下來,然後連起來形成一首“詩”。這種詩自然會出現類似“蘋果吃姑娘,殘紅殺馬特”,邏輯不通,不倫不類的句子。當然,也可能偶然搞出“澎湃是個好新聞”這樣的佳句。

這個套路叫做“word salad”——把各種詞語像沙拉一樣拌在一起,在有了電腦後,被引入進去,成為早期的機器詩歌生成方法。

根據蕭瑟的介紹,在詞語沙拉法之後,機器詩歌的傳統生成辦法還有基於範本和模式的、基於遺傳演算法的、基於摘要生成的方法以及基於統計機器翻譯的方法。這些方法,要麼是詩句之間缺乏語義連貫性,要麼缺乏靈活性,而且都有別於詩詞領域的專業知識,需要專家設計大量的人工規則,對生成詩詞的格律和品質進行約束。

但是,隨著深度學習技術的發展,造詩機迎來了春天。基於RNN語言模型的方法,將詩歌的整體內容,作為訓練語料送給RNN語言模型進行訓練。訓練完成後,先給定一些初始內容,然後就可以按照語言模型輸出的概率分佈進行採樣得到下一個詞,不斷重複這個過程就產生完整的詩歌。

這樣的:

看來同樣是深度學習技術,學習的能力還是有差別的。

“機器詩猶如塑膠花,入手即知”?

開篇第二組的機器詩,來自清華大學語音與語言實驗中心(CSLT)。去年,就在AlphaGo戰勝人類當下最傑出的一批圍棋選手後,CSLT網站宣佈,他們的作詩機器人“薇薇”通過社科院等唐詩專家評定,通過了“圖靈測試”。所謂“圖靈測試”是指通過對話分辨真實人類和人工智慧的試驗,通過“圖靈測試”意味著人類無法通過語言對話分辨出人類和人工智慧。

據CSLT網站公佈結果,“薇薇”創作的詩詞中,有31%被認為是人創作的。不過,在本次比賽中,“薇薇”創作古詩的水準還是未能超越現代人類詩人,雙方的比分為2.72比3.20(滿分5分)。

看來不僅是普通人,即便擁有一定創作經驗的作者,要區分這種比較高明的機器詩也是有一定困難的。

曾胡隨後將這兩首詩發到了朋友圈進行測試,結果:“一半人猜對,都是學問比較好的,未見學問好的猜錯。一位朋友說,機器詩猶如塑膠花,入手即知。”

不過曾胡的這位朋友在面對第二組的五首詩時,卻未能入手即知。曾胡則在反復細度之後,通過“孤耐淩節護”(句意不明)、“一夜東君”(東君指太陽,一夜東君語義矛盾)、“細雨濛”(濛字一般不單用)等語詞、語義方面,判斷出2、4、5為機器詩。

曾胡認為,因為測試的對比樣本是現代人的古體詩詞,與機器詩的分野並不明顯,如果是唐詩,即便不是那麼名篇佳作,那麼可能就會容易許多。畢竟無論是Alpha Go還是百度機器人“小度”,這些人工智慧所挑戰甚至戰勝的都是該領域人類最傑出的一批頭腦,如果機器詩的比較樣本,本身都沒有多少獨特性、創造性,那麼該如何檢驗作詩機器人是否具有創造力呢?

藝術會成為人類最後的陣地嗎?

AlphaGo、“小度”、搜狗“汪仔”、新聞寫稿機器人,以及各種各樣的人工智慧不斷的出現,並且取得了不俗的效果後,似乎未來獨屬於人類的領域越來越少,機器無法涉足的人類空間越來越少。

現在,被視為人類最後陣地的藝術也成為人工智慧進軍的方向。但是,無論是在文字藝術、圖像藝術還是聲音藝術方面,機器的表現都很難與人類媲美。

在清華作詩機器人之前,達特茅斯學院舉辦的“創意圖靈測試”(Turing Tests in Creative Arts)週三宣佈,這場競賽並未選出最終優勝者,因為人工智慧演算法未能創造出與人類媲美的故事和詩歌。

在詩歌測試中,有兩支參賽隊伍分別創作了兩首14行詩;在文學競賽中,有3支隊伍分別創作了一個簡短的故事。這些內容都與人類創造的內容混在一起。最終結果顯示,沒有一篇故事或詩歌成功蒙混過關,只有一篇短篇故事讓一位人類評審員判斷失誤。

看看穀歌人工智慧所的英文詩,你或許就會明白為什麼沒人判斷失誤。

no. he said.

“no,”he said.

“no,”i said.

“i know,”she said.

“thank you,”she said.

“come with me,”she said.

“talk to me,”she said.

“don’t worry about it,”she said.

而在繪畫和作曲上,機器的表現要比在文字上的好些,但也不盡如人意。

上圖是德國貝特格實驗室裡進行的研究,研究人員能將畢卡索、梵古、康定斯基和蒙克的風格應用到數位圖像上。原照片(左上)分別被轉換為不同的風格:特納(J.M.W. Turner)的《米諾陶戰艦的傾覆(The Shipwreck of the Minotaur)》風格(右上)、文森特·梵古(Vincent van Gogh)的《星夜(The Starry Night)》風格(左下)、以及愛德華·蒙克(Edvard Munch)的《呐喊》風格(右下)。

上圖是穀歌Deep Dream根據照片所作的繪畫,仍然是風格轉移,也就是美圖秀秀的濾鏡水準。

眾所周知,人與機器最本質差別是人擁有意識,機器沒有。越高級的意識活動越具有獨特性,這種獨特性要求催生這種意識的物件獨一無二:獨一無二的詩歌,獨一無二的繪畫,獨一無二的音樂。

就目前來看,無論機器所寫的詩、畫的畫、譜的曲多麼以假亂真,甚至在審美上多麼令人讚歎,但是不具有獨特性、創造性的仿品也就不具有藝術價值,就像小孩子隨意塗鴉也可以很好看一樣。

“在一些重複性的腦力勞動中,機器已經開始具備比人類做得更好的能力。但是在一些需要創造力的領域中,目前機器的能力還需要繼續提升。

“機器目前還有兩個限制條件:第一個限制條件是它的工作環境相對封閉,輸入的是一些固定有限的資訊;第二個限制條件是有標準化解答。所以一項工作如果面臨的環境越簡單,最後的動作越標準,比如審計師、司機,就越有可能被機器取代。

“但是還有很多機器解決不了的問題,比如:創造力的問題、認知上的問題、人的好奇心的問題。人工智慧到今天為止還只是幫助完成簡單的重複性的腦力勞動,圍棋其實也是接近重複性的腦力勞動,更加具有挑戰性、更有創造性的事情還需要人類來完成。”

顯然,在藝術的道路上,人工智慧要走的路還很遠。但是,沒人能斷定,未來不會真像科幻小說家劉慈欣預言的那樣,人工智慧可以擁有自我意識,產生情感,具備藝術創造性。

不過到那時候,又該如何界定人和機的界線呢?搜狗的這位專家的回應是:如果真有那麼一天,那麼未來人工智慧與人的融合將會帶來新的物種,這也是人類的自我進化。

這說法,是不是有點像《攻殼機動隊》呢?