玩家應該為游戲質量之外的原因打差評嗎? - 游戲研究社微信公眾號文章

2019年4月15日11時59分內容來源:游戲研究社



玩家目前仍然保有“差評”這件最后的武器,但我們也要思考怎么維護好它。



模擬經營游戲“紀元”系列最新作《紀元1800》還沒發售,因為首次加入中文,又回歸經典歷史題材,在主播的推波助瀾下引起了不小的關注。但與此同時,“紀元”系列之前的作品卻在Steam上收獲了一些新的差評。


原因非常簡單,今年這種事兒都說膩了:它是一款離開Steam轉投Epic(和Uplay)的游戲。



不過因為《紀元》系列一直比較小眾,也預留出了足夠多的時間給玩家預購,所以“新作叛逃,前作挨噴”的情況不是特別慘烈。


反觀前段時間宣布Epic獨占半年的《無主之地3》,情形就慘烈得多:

《無主之地2》評論區的刷屏


在如潮的差評之中,有悲傷的玩家表示,“游戲還是好游戲”,大家還是不要因為情緒因素瞎開火了。



其實這部分玩家并不需要替《無主之地》擔心,G胖已經用嶄新的技術手段幫助開發者規避了大規模差評的風險。


Steam上個月推出了新的“反差評機制”:短期內出現的大量與游戲本身無關的負面評價會經人工審核后遭系統主動屏蔽。


《無主之地2》的近30天評測曾一度低到了“褒貶不一”,但現在已經恢復到了“好評如潮”


這些評價本身將依然可見,卻不再計入整體權重。Steam官方稱,此舉是為了人工避免“跑題的評測惡意轟炸”。


關于這個機制有一堆官方問答,其中一個問題是:假如因為DRM或EULA(反盜版機制)的變更產生了差評,你認為他們屬于不相關還是跑題呢?


V社官方回答是:



“從技術上講,它們并不是游戲的一部分,但對某些玩家來說卻是個問題。最終,我們決定將它們定義為跑題評測惡意轟炸。原因是“一般”的Steam玩家并不太在意它們,因此如果評測分數不包含它們,會更加準確。



Steam的這個新措施引起了一些爭議,也得到了一些玩家的歡迎。根據立場的不同,你可以將其解讀為“Steam尊重用戶體驗”和“Steam不尊重用戶體驗”這兩種截然不同的答案。所以單純評論對錯與否意義不大,我們不妨從平臺和用戶的屬性,來聊聊Steam為什么要這么做。



Steam游戲評測的特殊性


Steam官方開發這個反差評機制的原因,看上去似乎很簡單:“跑題”的評測實在太多了,很多游戲的Steam評分已經不能客觀反映出游戲本身的質量。非黑即白的二元評分制度,也在過去一段時間里招致了不少玩家和媒體的批評,常見的論調就是“不如電影評分準確”。


比如Steam上好評率最高的那堆游戲,很多都不是質量吹爆、拿獎拿到手軟的游戲。有個第三方統計網站叫SteamTop250,是效仿電影評分網站IMDb建立的。這個網站統計了去年新晉的Top250榜單,第二名是知名三消黃油《Mirror》。

雞立鶴群


《Mirror》進入這個榜單的原因有很多——作為一個成人內容相當“良心”的黃油,它的售價常年折后5元,是一個典型的“性價比”游戲。顯然,一部電影不會因為性價比和“尺度大”之類的因素進入IMDb榜單。


但在批評Steam評分公信力不足時,我們也有必要了解Steam評分誕生的初衷:它本來就不是一個“質量打分”,而是為其他人的購買做出參考。

Steam評分系統時的說明


一些熱衷于貢獻評測的玩家經常在社區里科普,Steam的“贊”和“踩”按鈕,代表的含義本來就不是“好”或者“差”,而是“推薦”和“不推薦”。


評價系統的存在不是為了“給游戲打分”,而是為了避免用戶買了一款不適合他的游戲。


舉個例子,有個開發商叫Rockfish(石魚),制作過非常經典的手游《浴火銀河》。在轉向端游開發后,他們又做了一個科幻飛行射擊游戲叫《永恒空間》(Everspace),看上去很像《浴火銀河》,實際上的玩法完全不同,是個非常硬核的Rougelike游戲。



在這款游戲的評論區,就有很多評測特意說明了這一點:這不是《浴火銀河》,想要探索收集突突突的玩家可以繞道走了。



這就是典型的、Steam所希望的“有用評測”:


評論者對整個游戲做出一個全面的概括,并且盡量寫出“什么樣的玩家適合/不適合買這個游戲”,最后根據自身的判斷給出“我不推薦”或“我推薦”。


這也意味著Steam評分系統最大的價值并非好評率的數字,而是用戶的文字評測,要判斷一個游戲值不值得買,需要用戶自己付出認知成本。


從底層系統的角度來講,Steam一人一票的二元評分制有著先天缺陷,很難像電影網站一樣光靠看得分就相對客觀地判定一個產品的質量。


主流電影評分網站采用的評價系統往往相當復雜,比如老牌電影評分網站IMDb的Top250排名,基于一套貝葉斯算法:



其中,v代表用戶投票數,m代表電影進入Top250榜單所需的最小票數,R代表該電影的平均分,C代表IMDb數據庫所有電影的平均分。


IMDb這套算法的科學性,在于只計算對社區有過貢獻的活躍用戶票數,避免粉絲刷榜;同時,評論數所占權重很高,不會出現“一百人個人打10分”超過“一萬個人打9分”的情況。


相比之下,Steam的評分制度確實在評價游戲素質上太過原始。


但話說回來,就算有一套更嚴謹、精準的評分算法,游戲界能誕生自己的IMDb嗎?


答案大概率是“否”。



為什么Steam評分必然是“不客觀”的


其他領域的評分規則,直接套在游戲界身上會顯得格格不入。


玩家如果觀察同一個游戲在Steam上和在媒體、評分網站上的分數差異,可能會發現一個有趣的現象:不僅評分天差地別,玩家對同一個分數的看法也截然不同。


Steam上達到70%好評率則進入“多半好評”,玩家們會傾向于認為是款不錯的作品。《黑暗之魂3》因為漲價、盜版聯機、優化等等問題,在發售初的好評率就堪堪達到70%,玩家卻不會對游戲的素質有太多的疑慮。



但如果IGN給一個作品打出6。5或者7分,卻往往意味著這是個“行吧就這樣吧”的游戲。


R.I.P


這種觀感不同,來自Steam評分里大量“游戲外因素”的影響,我們舉兩個例子。


第一個因素,是玩家對廠商的情感投射。


如《賽博朋克酒保行動》,Metacritic均分為79,卻在Steam上的好評率卻高達97%。


游戲本身的優秀素質固然是好評原因之一,但“開發者來自委內瑞拉,為了做游戲吃了半年黃油拌飯”這種動人的故事,也成為了Steam玩家打出好評的加分項。

《賽博朋克酒保行動》的大量評論都在表示對委內瑞拉開發者的敬意


要是有一個《社博朋克酒保行動》,是國內大廠旗下工作室推出的,這個加分項顯然就沒了。


這正是Steam反差評機制萌生的悖論:V社希望有一個對游戲素質相對公平的評分,因此約束玩家情感表達導致的不公正差評——他們卻忘了,玩家的情感也會產生“不公正”的好評。


如果你只要一個絕對理性的評測,那這二者都是出局的。


第二個因素,是售價。


我們這里要說的并非“漲價差評”的問題,而是“性價比”影響分數的問題——這正是為什么游戲評分不可能直接對標電影評分的原因。


電影票價大多數時候只跟檔期、票補、城市經濟水平等因素相關,商業大片和文藝片的票價不會相去甚遠(當然,最近的《復仇者聯盟4》首映除外)。而游戲的定價跨度,可能會從6元直到600元。


有些作品可能本身素質未必有那么出眾,卻因為便宜/有成人內容等原因好評率驚人,我們隨便看一個售價6元的小黃油:

《巫師3》的好評率只比它高1%喲


“你給我看便宜的(.人.),我就給好評”,這究竟算不算在V社標榜的“游戲本身質量”里呢?


這就是為什么其他領域的評價標準很難直接挪到游戲身上:光是對性價比的判斷,有著不同經濟能力和消費態度的玩家之間就會產生巨大差異。


游戲的評分生態,和電影、劇集、書籍之類的作品是完全不同的。玩家給游戲打出的分數,遠不只是評價游戲質量,反映出玩家復雜的心態和思想感情。


這就回到了這篇文章討論的原點:“評分”這件事情,對于不同的角色而言,有著怎樣的意義和價值?


對于游戲媒體,評分是單純的:媒體對一款游戲作出的綜合評價,給讀者以直觀的游戲質量認知。而玩家的評分,可能會反映出包括質量、情懷、廠商口碑和運營行為在內的大量信息。


《地鐵:離去》點贊數最高的差評


打個比方,一名玩家給《地鐵:離去》打差評,原因是開發商不信守諾言,結果玩家紛紛點贊,認為說出了自己的心聲。但如果一家游戲媒體給《地鐵:離去》打個5分,原因是“垃圾游戲叛逃Steam”,那基本上只能得到“這編輯有病吧連基本的客觀中立都沒了”的評價。


知名游戲媒體Polygon在去年就取消了打分制,給好游戲的評價就是一個單純的“Polygon推薦”認證。他們認為,之前幾十年用來支撐大部分游戲評價的“10分制”已經明顯到達瓶頸。人們可以通過視頻、直播等不同渠道了解到游戲的價值,而非依靠游戲媒體簡單的分數做出判斷。


這就是為什么游戲有著和其他文化載體完全不同的評分生態:媒體的職責是做產品評測,而玩家的集體評分更像是共同書寫一款游戲的歷史。


關心游戲本身的玩家,在評分里留下的是全貌式的評價;對運營商有意見的用戶,在評分里像史官一樣寫下“X月X日某某游戲鎖區”;還有很多Steam用戶,碼下的評測完全是基于共情的,像是一篇私人日記。


《新手指南》下的一篇評論


而Steam也在這個過程中,獲得了難以復制的社區優勢。



玩家唯一的武器


現在,讓我們回到文章的標題做個總結:玩家應該為游戲之外的因素打差評嗎?


其實這不是一個規則或道德方面的的問題,而跟產品定位有關,因為玩家有兩面性,平臺也有兩面性。


玩家的兩面性體現在,他們一方面想在Steam上找到質量高的游戲,這時候會希望評測數據貼近游戲本身的素質,是客觀公正的。但另一方面,玩家在遇到一些外部情況時,又難免去Steam刷差評或好評來表達情緒。


這兩面之間的矛盾是不可調和的,因為除了打分以外,玩家幾乎沒有能對廠商產生直接影響的表達通道,大多數時候他們只能靠Steam評分來表達。這個問題對于國內玩家更明顯一些,國外玩家好歹能去Twitter、Metacric這些地方炎上,而國內玩家只有Steam這一個通道。


而Steam平臺的兩面性體現于,它既要試圖提供某種中立的好壞評價體系,這個體系會帶有很強的權威屬性和引導性。同時,它又要服務于用戶,以此來賺錢。這就是為什么Steam以“無關游戲質量”為由屏蔽了他們認為的“惡意差評”,卻回避了“無腦好評”——情緒化的好評同樣是不客觀的,但游戲被吹得更高、賣得更多對于平臺來說卻不是壞事。


多種因素的制衡之下,就有了我們看到的評測生態:用戶的情緒訴求常常和評價系統發生沖突。只是因為Steam本身平臺+社區的屬性,容錯能力比單一的廠商和媒體強,所以大多數時候人們已經習慣了這種對立的情況,只會隱約有一種“評論區跑題了”的不對勁感。


但這種情況長存下去會越來越失控,“積極的差評”和“無效的差評”之間的界限會變得模糊,總的來說,群眾發現差評有效,他們就會更依賴差評。而差評增多對于Steam平臺本身就有負面影響,因為這畢竟是一個需要通過賣游戲來抽成盈利的平臺,就更不說“跑題評論”泛濫后帶來的輿論影響了,這些都會反過來影響V社作為商業公司的未來。


所以Steam開發了“反差評機制”避免失控。類似的控制其他平臺也有,比如國內的TapTap一直在用技術來制衡“惡意差評”和“刷好評”,但也會出現“同一個游戲只因為開發商寫的是網易就差了兩倍分數”的情況。而隔壁影視圈——Netflix做得更狠,直接不顯示用戶評論、純粹依靠算法推薦了。


去年7月,Netflix宣布取消現有評分體系,用戶無法在影片的評論區撰寫新的影評。



Netflix的說法是這樣的:意見領袖的建議已經不重要了,用戶的主觀評論也不再有意義。現在最有效的推薦模式是基于你的個性化偏好的算法,它為你量身定制,而且“越用結果越準”。


這就是算法、片方和平臺商共同定制的、沒有“主觀評論”的世界。如果游戲業也變成這樣,好像格外令人悲傷。


目前為止,僅針對PC平臺來說的話,Steam是玩家僅有的、能造最直觀影響的話語權平臺。這是它的競爭力,但反過來,也是軟肋之一。如果玩家過于濫用差評這件武器,Steam調和不了這種矛盾,可能最后就去學習Netflix或Epic商店的“先進經驗”了。


Epic商店的采用的“評分系統”——如果它能被稱為評分系統的話——可以讓開發者自行選擇是否接受評價打分。也就是說,廠商看到差評太多,可以主動切換到“以下為開發者精選評論”模式。


當時有很多玩家群情激憤,Epic商店的戰略總監Galyonkin是這樣回應的:



有句古老的名言很適合評價Epic搞的這套“開發者精選”:若批評不自由,則贊美無意義。所幸在目前的Steam上,玩家仍然保有“差評”這件最后的武器——我們需要思考的,是怎么維護和用好它。


至于濫用……沒人能定義怎樣用才算濫用,但所有人都將承擔濫用的后果。




APP| 你還可以回復"APP",獲取下載地址

最值得關注的微信公眾號

黑帽SEO