為遊戲打分那點事:讓人又愛又恨的Metacritic
Metacritic
是一家專門收集媒體對於電影、電視節目、音樂專輯、遊戲等評論的網站,它會整合每家對產品的評價分數,再按照一定的演算法得出總評分。在許多消費者看來,Metacritic的評分具有較高的可參考性。
近日,外媒Glixel採訪了Metacritics的一位聯合創始人兼主編,請他談了談為遊戲做綜合評分和與電影、電視劇、音樂專輯做評分的差異,以及他認為Metacritic對玩家、遊戲公司和行業分析師們有哪些價值。
觸樂對文章的主要內容進行了編譯,原文標題
《'Metacritic' Still Matters, But For How Long?》
,作者Chris Baker。
當馬克·多伊爾(Marc Doyle)和他的幾位大學老友準備動身到聖巴巴拉過週末時,他收到一個消息:《華盛頓郵報》的評論家不太喜歡電子遊戲《神秘海域4:盜賊末路》(Uncharted 4: A Thief's End)。評論家認為遊戲畫面俗氣,玩法如同一次“艱苦的長途跋涉”,遊戲給人的總體體驗就像一場“原因不明的沉船事故”。多伊爾立即意識到那個週末會不太平,《華盛頓郵報》的評論篤定會對《神秘海域4》在Metacritic的得分產生影響。
多伊爾是評分聚合網站Metacritic的聯合創始人兼主編,他經常查看CBS旗下《華盛頓郵報》的遊戲版塊。多伊爾決定Metacritic追蹤哪些遊戲網站,整理他們對遊戲的評論,並將評論轉化成為介於0~100分之間的一個分數。通過統計和整合來自許多不同網站的評分,Metacritic會為每款遊戲計算出單一評分,也就是Metascore。
《華盛頓郵報》不會對遊戲直接給出分數,不過這家媒體認為Metacritic相當重要,所以評測人員會將他們的評分直接發送給多伊爾。《華盛頓郵報》的評論家
為《神秘海域4》打了40分
。
“在看到分數的那一刻,我就知道接下來會發生什麼。”多伊爾說,“我知道玩家們會有哪些反應。”
根據Metacritic的統計,111家不同媒體積極評價《神秘海域4》,讓遊戲的Metascore達到了94分。不過來自《華盛頓郵報》的差評,則會將平均分拉低到93分。
一分之差似乎不算什麼大事,但《神秘海域4》的玩家們被激怒了。許多從未玩過這款遊戲的人同樣憤怒,因為他們是索尼死忠,PS4獨佔的《神秘海域4》被他們視為一款能夠證明PS4優越性的旗艦大作。在這些玩家看來,《神秘海域4》降低1分,就如同他們支持的NFL球隊的季後賽排名下降了一個位次。
在那個週末,多伊爾完全沒了度假的心情。他知道讀者們會情緒激烈——Metacritic遊戲版塊的訪問量遠遠高於電影、電視劇或音樂版塊。玩家們群情激憤,甚至到Change.Org
發起了一次請願
,要求Metacritic將《華盛頓郵報》對《神秘海域4》的評分移除。近10,000人在請願書上簽名。
不過多伊爾堅持捍衛媒體對遊戲的評分。“《華盛頓郵報》的人因為這件事造成的麻煩向我道歉,我說,‘兄弟,不要道歉!’這就是我們的工作。”多伊爾回憶說。
《華盛頓郵報》對《神秘海域4》差評所引發的爭議表明,許多人仍發自內心地認為Metacritic很重要。除了玩家之外,開發團隊能從發行商那裡拿到多少獎金,往往與遊戲的Metascore掛鉤,而發行商們也會投入大量時間和精力試圖預測遊戲作品的Metascore,因為這個分數將可能對遊戲在零售店的訂單量和最終收益產生影響。
但遊戲行業和遊戲作品本身都在變化。在許多方面,媒體在一款遊戲發售時的評價,並不能反映它的最終品質。在新的行業環境下,Metacritics是否依然重要?
■
善用你的時間和金錢
1999年,南加州大學的三個同班同學共同創辦了Metacritic。傑生·德茨(Jason Deitz)提出最初的構想,馬克·多伊爾(Marc Doyle)和他的妹妹朱莉·多伊爾·羅伯茨(Julie Doyle Roberts)一起創建了網站,選擇追蹤哪些媒體,並將媒體對娛樂產品的評分製成圖表。他們的任務簡單明瞭。“Metacritic試圖教育消費者,讓他們知道怎樣才能最好地使用他們的時間和錢。”多伊爾說道。
馬克·多伊爾(Marc Doyle)
如果評論家在評測一款作品時沒有打分,Metacritic的工作人員會根據他們的評測內容和語氣估一個分數。這種方法對電影和音樂專輯的評測來說通常有效,不過評論家偶爾也頗有微詞。“《華爾街日報》的喬·摩根斯登(Joe Morgenstern)曾告訴我們,‘你們說我給《珍珠港》(Pearl Harbor)打40分,不過我覺得它只配得10分。’”多伊爾說。
估分通常適用於電影和音樂專輯,不過一旦涉及為遊戲評分,Metacritic的工作人員就不會這麼做了。從傳統角度來看,數值量化是遊戲評測中不可或缺的一部分,玩家們似乎希望遊戲評測擁有更高的精准度。
這是可以理解的。一款遊戲既是藝術作品,同時又是一款軟體。遊戲跟其他娛樂作品都有所不同:你不需要為一張音樂CD下載補丁,也不需要在觀看某部電影時查找攻略。當你觀看一部電視連續劇時,你不會因為存檔系統出現故障丟失所有進度。
“遊戲售價昂貴,它們需要你投入大量時間。”多伊爾說。在某些時候,玩家花60美元購買一款遊戲,卻因為它無趣或存在問題在短短一兩個小時後就放棄。考慮到這些因素,評測人員試圖對玩家在遊玩時可能感受到的體驗進行量化是合理的。
“人們也許會問,‘我該不該買這款《行屍走肉》遊戲?’”多伊爾說,“如果它是Telltale製作的《行屍走肉》系列中的一部作品,那麼在Metacritic上的分數會在90分以上。不過如果遊戲是《行屍走肉:生存本能》(Walking Dead: Survival Instinct),那就只有30多分了。”
遊戲作品在Metacritic的得分不僅影響玩家對它們的看法,還會影響到從業者。遊戲行業分析師經常在財務報告中提及Metacritic分數,有人甚至認為這些分數會讓動視和Take-Two等公司的股價出現波動。
某些發行商付給開發團隊的獎金也與遊戲的Metacritic分數掛鉤,黑曜石娛樂的克裡斯·阿維隆(Chris Avellone)曾聲稱,由於《輻射:新維加斯》(Fallout: New Vegas)的Metacritic分數沒有達到發行商的預計目標,他的團隊錯過了一筆獎金(據傳為100萬美元)。據阿維隆透露,《輻射:新維加斯》的Metacritic分數只比發行商的目標少了1分。
“這是真事,現在還會經常發生。”遊戲業務管理顧問公司Tiswaz娛樂CEO,業內長期投資人士凱文·鄧特(Kevin Dent)說,“開發團隊能夠得到多少額外獎金,與遊戲銷量和Metacritic分數掛鉤。一位執行製作人可能得到大約10萬美元的額外獎金,一個普通程式師也許會得到1.5萬美元獎金,夠買一輛車了。”
“我認識一些遊戲公司員工,他們向我解釋了Metascore對他們的生活和工作有多重要。”多伊爾說道,“如果發行商關心遊戲作品品質,而不僅僅是銷量,我覺得那會是件好事,但我不知道他們是怎麼做的,我不參與的。”
“我能理解與遊戲銷量掛鉤的獎金。”鄧特說,“不過我永遠無法理解與Metacritic分數掛鉤的獎金。遊戲行業的從業者害怕Metacritic,因為它絕對能影響收入,就這麼簡單。”
■
可靠性和聲譽很重要
多伊爾不認為自己是行業內幕人士,但他密切監測Metacritc所覆蓋的媒體。“我訂閱了美國、英國和世界其他國家和地區的30本雜誌。”多伊爾說,“在任何時候,我都追蹤著140~150家媒體的評測。”
在普通玩家看來,某些媒體知名度不高。“我在遊戲行業已經工作多年,有些媒體就連我也從未聽說過。”鄧特說,“我查看了Metacritic收錄的《守望先鋒》媒體評測,有些媒體我在網上搜過之後才知道它們。”’
Metacritic共收錄了62家媒體對
《守望先鋒》PC版本的評測
,它們當中既有大眾流行媒體,也有專注於PC遊戲的垂直細分媒體,有IGN和IGN瑞典分站,Eurogamer波蘭分站,還有像Ragequit.gr.(希臘)、Level(捷克共和國)和Навигатор игрового мира(俄羅斯)這樣一些不知名媒體。
多伊爾相信,美國或英語國家的媒體不會壟斷有見地的評論,每年他都會在耶誕節後評估Metacritic可追蹤的新媒體。據多伊爾說,他會向那些希望自家評測被Metacritic收錄的媒體發一份很長的調查問卷,以瞭解他們的日常運作、編輯背景、寫作團隊的人員構成以及分數範圍和評分理念。
如果遇到外語媒體,多伊爾還要求對方翻譯評測,同時多伊爾還會詢問他所熟識的一些海外評論家,瞭解每個媒體的聲譽。“我在尋找能夠獨立思考,評分誠實公正並值得信賴的媒體。”多伊爾說。
Metacritic非常重視可信度和聲譽,而不是簡單直接地統計媒體評測的平均分數。除了審查媒體管道之外,多伊爾和他的同事們還會決定每一家媒體的評分權重,這意味著就算兩家媒體對某款遊戲作品同樣給出70分的評價,玩家對它們的信賴程度也不一樣。
“在我們的系統中,權重是一個不透明的因素。”多伊爾說,“它是我們的獨家秘方。”
不過多伊爾試圖淡化權重所帶來的影響。據他稱在Metacritic,一款遊戲的平均分數通常與另一家姊妹網站Game Rankings上的分數十分接近,後者採用的是直接統計來自英語媒體評測的平均分。“這對於那些會吸引許多媒體評分的大型遊戲來說尤其如此。”
但發行商們仍然非常關注遊戲在Metacritic上的分數,他們渴望知道哪些媒體對分數的影響力最大。有傳聞稱,某些發行商覺得他們已經成功破解了Metacritic統計分數的演算法。
“我突然知道,我們的(遊戲評測)權重比較高,這給我們帶來了巨大的壓力。”英國媒體Eurogamer編輯奧利·威爾什(Oli Welsh)說,“Eurogamer給遊戲評分常常低於其他媒體,而較高的分值權重意味著我們可以將一款作品的Metascore拉低1~2分。”
威爾什稱在2014年底,Eurogamer決定不再為遊戲評分。不過有趣的是,Eurogamer波蘭、西班牙和義大利分站有獨立編輯團隊,他們對遊戲的評分仍然會被Metacritic收錄。
Eurogamer主站上已經沒有了主觀的評分機制
據威爾什解釋,Eurogamer之所以決定不再採用評分制度,恰恰是因為Metascore的影響力太大。“Metacritic是一個有用的網站。”他說,“不過它正在對遊戲行業、發行商和玩家產生負面影響。我不認為這是Metacritic的錯……但這種影響確實不健康。”
另外一些媒體也開始取消評分制。“我們曾有一段時間使用Yes/No系統,不過在去年,我們把這個系統也取消了。”Kotaku副主編派翠克·赫爾南德斯(Patricia Hernandez)說,“我明白評分為什麼吸引人——數字很容易被消化,但分數不代表一切。”
■
遊戲評測的演變
威爾什認為,Metacritic影響力過大只是遊戲媒體取消評分制的原因之一。“我們感覺遊戲變得太複雜、太易變了。”他說,“過去我們對遊戲的評測通常集中在一篇文章裡,不過如今我們更有可能花幾周時間,寫幾篇文章來評測一款遊戲。”
在過去,當一款遊戲發售時,Metacritic會對媒體對它的評價進行整合,從而影響玩家決定是否購買。但部分知名遊戲公司不會在遊戲發售前向媒體發送評測碼了,評測者需要花幾十個小時才能通關一款遊戲,這意味著在遊戲發售幾天甚至幾周後,媒體都無法發佈對它的評測。
在收到足夠的評測數量前,Metacritic不會顯示作品的綜合評分
另外,隨著聯網玩法在遊戲作品中變得越來越普遍,評測者幾乎不可能在一款遊戲發售前對它做出評判。“看看《命運》(Destiny),如果一個評測者無法跟許多玩家接觸,那麼他根本就理解不了遊戲的特色。很多媒體對《命運》的評價都不太合理,因為他們以為這是《光暈》開發商製作的一款新FPS,因為遊戲的劇情很垃圾。不過當你跟其他玩家聯網遊玩,你就會發現更多有趣的玩法。”
“在當今的遊戲行業,開發商除了製作續作之外,還有可能永久支持某些遊戲的運營。”鄧特說道,“過去如果你想為遊戲推出一個補丁,索尼和微軟也許會要求你繳費大約8.5萬美元,但瞧一瞧《我的世界》和《守望先鋒》,它們持續為玩家提供新內容;《H1Z1》現階段還只是一個存在各種Bug的原型,不過它的玩家社區在不斷擴大。”
威爾什說,他和多伊爾談論過Eurogamer決定取消打分制的決定,後者希望通過一些調整,讓Eurogamer對遊戲的評測繼續在Metacritc得到展示。“他提議先解讀我們的評測,然後自己為遊戲給出一個分數。”威爾什說,“但這個過程似乎充滿了困難。那是一次很好的談話,他(多伊爾)對待工作的認真態度讓我印象深刻,不過我還是請他不要再收錄我們的評測。”
■
YouTube主播和評測的力量
遊戲評測的影響力和權威性似乎已經開始減弱。在許多媒體,評測變得更為個人化和散文化,而不再追求根本無法實現的客觀性。
威爾什曾為英國著名電子遊戲雜誌《Edge》撰稿,據他回憶,《Edge》的評測極具影響力,以至於如果這本雜誌為一款遊戲打滿分,就會在遊戲業內引發轟動。“我尊敬《Edge》的這個傳統,不過我顯然更偏愛那些擁有自我品位和缺陷的評論家。”威爾什說,“傳統的文字評測也許不像過去那樣有影響力了,但這未必是件壞事。”
“讀者越來越關心某些名人的意見。”赫爾南德斯說。在明星主播的影響力日益增長的今天,Metacritic很難收錄主播們對遊戲的評論,也越來越難以與他們競爭。
“YouTube明星和主播們變得比過去任何時候都更重要了。”鄧特說,“我的兒子不讀評測,他只看別人玩遊戲,他會觀看Total Biscuit或Boogie製作的視頻。我曾跟一家主流遊戲平臺的高管聊天,他告訴我,他不太關心文字評測都寫了些什麼。據他說,排名前十或前二十的YouTube明星和主播能夠為遊戲帶來遠比所有文字評測加在一起都更多的曝光量。如今文字評測通常只會作為遊戲簡介或行銷材料的一部分使用,或是出現在某些作品的年度珍藏版的包裝盒上。”
■
模擬評測
雖然傳統遊戲評測的權威性似乎在下降,不過它們仍是塑造遊戲行業的基石之一。絕大多數主流發行商都會在公司內部對遊戲進行評測,他們在遊戲研發期間雇傭外部顧問(其中相當一部分有評測遊戲的經驗),請這些顧問估算遊戲的評分。
“還記得Gamergate事件嗎?當時許多玩家覺得發行商收買了評測人員。”鄧特說,“跟我聊過的每個公關人員都說,‘真希望能收買他們啊’,有趣的是他們確實在收買評測人員。他們會聯繫一些評測者,以相當於為媒體工作兩到三倍工資的酬勞請他們撰寫用於公司內部使用的‘模擬評測’。這些評測者與遊戲公司簽署了保密協議,不能將自己的評測公開,不過能得到足夠償還大學貸款的一筆錢。”
一位不願透露姓名的受訪者告訴我,在遊戲行業,這種做法很普遍。在某些3A遊戲的開發過程中,很多顧問會在各個階段對遊戲做出評價,據一位元消息人士說,有公司曾因為顧問們為一款遊戲估算的評分太低,而放棄了那個研發已經耗資數千萬美元的專案。
“這相當普遍。”鄧特說,“許多遊戲因為類比評測的分數較低而被取消。”
■
玩家更關心評分
與電影或音樂愛好者相比,遊戲玩家似乎更關心評分。“音樂粉絲往往不會那麼關心評測。有人給《Purple Rain》打了低分,誰在意呢?”多伊爾說,“不過玩家群體就要關心得多了,他們覺得分數就像自己購買的股票那樣重要。”
從某種意義上講,玩家如此嚴肅地對待評測並不讓人覺得奇怪。遊戲硬體和軟體售價昂貴,會吸引玩家對它們形成一種品牌忠誠度;玩家熱衷於站隊,比較不同遊戲的分數和排名。對許多玩家來說,追蹤Metacritic對遊戲作品的評分本身就像是一個足球博☆禁☆彩類遊戲。
在Metacritic,玩家試圖提高他們所支持的遊戲的用戶評分,同時拉低其競爭對手的用戶評分。“在網站上線四五年後,粉絲之間的抱團戰爭就成了一個大問題,我們不得不對粉絲投票的時間加以限制。”多伊爾說,“比如當一款像《小小大星球》那樣的PlayStation獨佔遊戲正式發售前,其他主機的使用者很可能會瘋狂湧入給它打低分,但他們根本不可能玩到遊戲。”
多伊爾說他希望Metacritic能夠説明消費者瞭解一款產品的情況,不過他不建議每次購買產品都將Metacritic的分數作為參考。“如果電影《月光男孩》(Moonlight)的分數是50或者70份,我會不會去看?也許不會。但我喜歡寶利·謝爾(Pauly Shore)的所有作品,《Biodome》是我最喜愛的電影之一。”他說。在Metacritic,《Biodome》只得到了1分(滿分100)。
“如果我看到某些愚蠢的喜劇分數很低,我認為這不重要。我會去看,會發笑,我會喜歡它的。”