1947 年的秋天,一只飞蛾钻进了大型计算机 Mark II 的继电器,导致设备短路。正当哈佛大学的工作人员焦头烂额、苦恼于故障的诱因时,程序员 Grace Hopper 声称自己发现了「Bug」(虫子),并将事件记录到了日志中。她根本不会想到,这一称谓日后居然化身为程序隐错的代指,成为了游戏从业者们理应同仇敌忾的对象。
螺旋升天、颅内透视、身首异处,即使你在多年的冒险生涯中未曾遇到这些奇闻异事,也多少会看过社交网络流传而出的依稀剪影,「买 Bug 送游戏」甚至成了一种受人调侃的文化现象。质量粗劣的作品自不必提,它们本身就是一个个错误的集结体;而那些堪称完美的内容也未必能够幸免,在正式迈入市场之前,它们早已经过了精雕细刻、千锤百炼。
兄弟,来一杯冥酒吗?
圣莫妮卡工作室就曾展示过一批《战神》发售前的 Bug,它们有些看起来极为诡异,有些又引得众人捧腹大笑。但困惑与欢乐背后所潜藏的,却是 QA(质量检测)团队为了修缮这些内容而经历的痛苦和磨难。3A 游戏规模的持续扩张,让他们需要处理的工作成倍增长。
并不是所有的团队都像圣莫妮卡这样,会将 QA 视为重要的工作搬上台面,它在游戏行业中未能得到公正的待遇。QA 往往被当成低水准、高强度,密集劳动的代名词,如果想要寻求更好的机会,业内人士也会建议人们转向生产、设计的职业道路。然而,纵览游戏业界几十年间勾勒而出的图景,却又在不断指出这些判断和言论的谬误之处。
操着卖白粉的心
作为世界上最知名的两家游戏厂商,黑曜石和 Bethesda 曾经签署过一份有趣的协议。如果《辐射:新维加斯》发售后能够获得 85 分的 Metacritic 媒体综合评分,那么 Bethesda 就将为黑曜石提供额外的奖金。但令人记忆深刻的是,这款游戏在 Metacritic 上的评分最终止停于 84,距离目标仅差 1 分。
《辐射:新维加斯》最大的缺陷,源于拮据的技术力和制作时间。在一年半的制作周期内,黑曜石难以对细节进行细致调整,Fandom 的相关词条中随便数数就能找到 30 ~ 40 个恶性 Bug,这恰恰是玩家们最为诟病的地方。如果这款游戏拥有完善的 QA 保障,拿到 Bethesda 的额外奖励可谓手到擒来。
《辐射:新维加斯》的建模有时都读不出来
质量检测、或者说国内常称的测试,往往是游戏抵御差评的前御防线。试想一下,那些评论家所做的工作有时和测试也没什么差别,他们往往突破边界,以错误的顺序完成任务,亦或是莫名其妙的穿过一堵墙,发现了一些正常情况下难以触发的事情,之后又在某个论坛中键下文字,并将 Bug 公之于众。
也许正因如此,这促成了人们对 QA 最为普遍的误解 —— 只不过是玩玩游戏罢了。
这个显而易见的错误不仅存纳于小白心中,即使是那些资深的高层和从业人员,在揭开理性的面纱后往往也附带着一丝轻视。那些默默无闻的工作很容易被人忽略,殊不知细致、精准的内容检索,也得建立在机敏的统筹和大量精力的前提之上。
如果要给 QA 做规整且细致的分类,那么它会涉及到游戏的方方面面,其中包括功能性(Functionality QA)、本地化(Localization QA),以及平台检定(Platform Certification),这些工作所对应的范围和能力略有不同,但也有重合之处。
那些无视物理规则的、令人发笑的 Bug 通常都在功能性 QA 的管辖范畴内。功能性调整往往是决定用户反馈的直接因素,也是保证质量和维护口碑的必要流程,它们事无巨细,画面、音效、AI、镜头、平衡、设计,几乎每个地方都要插上一脚。
以最常见的碰撞(Collision)为例,模型之间有时会相互嵌入,有时又会失去实体,导致角色「坠入深渊」。由于这种问题在游戏中的任意位置都能触发,QA 人员通常得耗费数不尽的时间对每个小元素进行测试,想一些歪门邪道的方法,以此来探索作品的边界。
一个典型的碰撞问题
本地化 QA 可以笼统的理解成翻译审校,主要负责梳理文字,对术语、俚语、以及本地文化相关的内容进行修缮。但更为专业的一点是,文本问题有时也会上升到系统层面,各个语言的占位符不同,意味着它们有可能溢出预先规划好的框架,导致程序崩溃。
你有时还得去找那些随机生成的乱码,它们往往附带着特别精确和复杂的触发过程。为了解决问题,需要说服本就忙得焦头烂额的开发人员,不厌其烦的索要特定的调试工具,以便直接查找字符串,定位并发现触发的可能性。
文本问题也是常见的游戏 Bug
有所不同的是,平台检定一般只在跨平台的情况下才会用到,由于每个平台的硬件、命名规则各有限定,需要检定程序与软件是否兼容,确保游戏在特定情况下按预期运行。
当然,并非所有的团队都会将工作分拣得如此细致,甚至在很多 3A 项目中,文本、系统兼容也可能被纳入功能性 QA 的职责。但从整体来看,无论你专注于哪个方向,它们都有着同样的苦难。当你兴高采烈的发现某个 Bug 时,殊不知一段噩梦才刚刚开始。
对于测试人员而言,完全解决问题的精髓是,得将相同的触发方法应用于其它角色、物品和区域。如果匹配到元素丰富的开放世界作品,一个问题又可能导致另一个问题,俄罗斯套娃式的工作几乎没有止境。这意味着从业者不仅得是多年的玩家,思维还要领先开发者一步,且有着极强的探索欲和自主性。
为此,详细的表格记录必不可少,错误信息往往会被提交到数据库、崩溃日志和性能报告。通过文档和缺陷相关的证据,开发人员就能复现和重审问题。但也不是所有问题都会被即时修复,有时制作周期确实吃紧,QA 团队和开发团队会对 Bug 进行两轮筛选,细枝末节的小毛病只能等到日后再做修补了。
QA 问题记录表
有趣的是,恰恰是在甄选的过程中,QA 团队的层级变得鲜明起来。普通测试员作为骨干发现问题,高级测试员指导他们如何去做,测试主管负责 Bug 的筛选和沟通工作,项目管理撰写计划,并决定在何处投注资源。
这套看似合理的系统,直观反映了行业内默认的奇怪逻辑,开发商往往只愿意花很少的钱,或者根本不愿意构筑自己的 QA 团队,除了金字塔的上层人员是内部招聘外,下两层主要以外包的形式招募,压榨现象极为严重,也直接导致了人们的偏见。
QA团队的层级结构
拿着卖白菜的钱
《游戏开发者》杂志主编 Brandon Sheffield 曾发表言论,对游戏行业 QA 的现状深感忧虑:「质量检测是游戏开发的一个非常重要的支柱,而整个行业并没有相应的对待它。」
事实确实如此,很多公司未能转变视角,仍将这项工作当成一种成本负担,而不是创造额外价值的机会。当一个项目面对财政问题和即将到来的圣诞特卖期,需要赶着上线收回成本时,QA 往往成了首先被压榨、被抛弃的对象。
大多数底层测试人员都是初出校园的新手,他们对游戏充满热情,但却不知道要如何投身其中。虽然任职门槛最低的 QA 看似成了最好的选择,但在某些管理层的眼中,QA 团队不过是临时工、合同工、派遣人员的聚合体,这些年轻人往往在一个项目结束后就会被踢出团队。
双向的认知偏差,导致整体的环境越来越差。创造性思维?职业晋升道路?当应试者将 QA 作为迈向其它游戏部门的垫脚石,管理层将其视为用完即弃的一次性餐具时,又有谁会把这项工作真正当一回事?
Bug 也能成为创意!
通过 Kotaku 对 Rockstar 加班文化的爆料,很容易就能一窥 QA 从业者那严酷的生存现状。
Rockstar 林肯工作室中充满了「灾难」,测试人员不仅每个工作日都要加班到很晚,被迫放弃周末,连续干 12 天的也大有人在。在此情况下他们还要经历不人道的安保限制,没收手机、禁止食物、甚至还出现了无人机监视的状况。
基层测试员与公司签订的是临时合同,他们领取着微薄的薪资,寄希望于下一次续签,乞求拿到永久合同的机会。根据 Gamasutra 在 2014 年的调查来看,全美游戏行业的年平均工资为 83060 美元,其中 QA 的平均年薪仅为 54833 美元,处于整个行业的最底层,收入几乎只有商务和管理人员的一半。
这并非个别现象,在 Reddit 的讨论版中,就充斥着人们对游戏行业 QA 现状的困惑和申讨。其中一名用户指出,他曾在 THQ、EA、动视、2K 和 Square Enix 的 QA 部门任职,但无论哪个都是很糟糕的工作经历:「QA 实在是太烂了,离开它是一个改变我一生的决定,我深感庆幸。」
压榨 QA 部门的劳动力,削减 QA 的开销和工作周期,似乎成了游戏行业中一种常见的处理方式。但如若考虑到长期的财政问题,这很可能是一种错误的决策。至少对于 3A 内容而言,后期亡羊补牢的消耗,远比一开始就构筑完整的系统要多得多。
2013 年发售的《星际迷航:The Video Game》(Star Trek: The Video Game)就付出了惨痛的代价,在经过了长达三年的开发之后,它却让玩家们的期待落空。由于想要在营销层面配合同期上映的电影《星际迷航:暗黑无界》,项目在收尾阶段不得不持续赶工,其中 QA 几乎只是走了个过场。
这导致莫名其妙的 BUG 在游戏中随处可见,AI 的行为无比诡异,动作和任务无法触发的情况也是家常便饭。《Edge》杂志还提到一些更为细致的问题,比如人物可以肆意穿过墙壁,敌人恰似吃下了灵丹妙药,怎么打也打不死,画面镜头还时不时切到角色的「脑袋内」,让人们欣赏史波克的头骨结构。
《星际迷航:The Video Game》角色碰撞 Bug
《星际迷航:The Video Game》的评价极其糟糕,不仅在 Metacritic 上的评分只有 40 多分,还被人们列入了「史上最差电子游戏」的行列。作为一款有着知名 IP 开路的 3A 作品,前三周仅仅售出 14 万份,《星际迷航:暗黑无界》的导演 J.J. Abrams 甚至认为这款游戏损害了电影的收益。
GameSpot 的作者 Mark Walton 认为,该作本身的设计虽有一些恼人之处,但整体的思路还算过得去。然而,糟糕的动画和诸多 Bug 却挑落了杠杆上的最后砝码。不难看出,如果派拉蒙多将一些资源投注到 QA 上,它们第一次自主参与研发和发行的作品,也不会以如此惨淡的结局告终。
芬兰坦佩雷应用科学大学的 Essi Ruuska 曾对 129 名受访者进行调查,其中有 97% 的人认为 Bug 会影响到实际的游戏体验,82% 的人声称 QA 是游戏开发中相当重要的组成部分,并且在一定程度上能够接受作品因 QA 而延期。从市场表现和用户反馈来看,轻视质量检测的后果可能比想象中还要严重。
90 年代的萧条与兴盛
如果要为 QA 的重要性列举案例,那么 1983 年美国游戏业的大萧条,以及随后任天堂的质量检测手段(权利金制度)形成了正负两面的绝佳对比。尽管权利金主要用于控制硬件和媒介的质量,并从宏观上把控游戏内容,并不决定一款作品的细枝末节和「是否好玩」,但它仍然具有一定的参考意义。
除了家用计算机的兴起,以及「填埋卡带事件」的直接冲击外,美国游戏业崩盘的主要原因,通常会被认为是大量劣质游戏的盛行。以雅达利的商业模式为例,彼时它们的硬件平台「完全开放」,其他公司的内容质检和收益和它们没有一毛钱关系,直接导致了三流作品的泛滥。
电子游戏当时在许多人眼中成为了垃圾
不过,这也不是雅达利不想管,1982 年,该公司才刚刚从一场决定这些事项的官司中败诉。
由于当时的开发团队只有死工资,无法获得产品销售的版税分成和红利。1979 年,雅达利核心骨干 David Crane 与公司高层产生巨大分歧。Crane 认为游戏设计师应该像音乐家,导演、演员那样享受版税收益,但公司却高傲的声称「是个人就会做卡带」。
Crane 一气之下带着三名设计师离开公司,并共同成立了动视,在未经允许的情况下自行开发雅达利游戏。这些象牙塔的工作者第一次完整享受了自己的劳动成果,他们凭借着优质的内容赚了个盆满钵满。虽然察觉到利益受损的雅达利立马做出回应,于1980年以侵权罪将动视告上法庭,但最后却没有成功申请到禁售令。
动视四人组,左二:David Crane
失去了产品监控后,像动视这样的公司基本还能够维持内容质量,而赶着风潮、没有任何经验,又不受 QA 限制的新团队就不是如此了。一批被寄予厚望的二线游戏,最终以极其低质的形象亮相人前,试想一下,当生产燕麦的桂格公司为了博取华尔街青睐,也跟风创建电视游戏开发部时,整个行业的内容质量自然会一落千丈。
面对着大洋彼岸吹过来的阴风,任天堂社长山内溥也感受了一阵凉意。经过深思熟虑后,他决定在开放第三方开发权的基础上,加入一定的约束条件,此举恰恰是为了提高游戏的质量:
第三方厂商一年只能生产 3 ~ 5 款游戏;
制造游戏前需要向任天堂缴纳权利金,卖不出的卡带由第三方自负亏损;
软件内容也必须经过任天堂检查。
在引入一套规整的 QA 系统,并且严格控制制作标准后,任天堂决定让南梦宫、Hudson、太东、卡普空、Jaleco、科乐美参与到 FC 游戏的开发中来。不难看出,最初入驻的六家厂商都有相当的底力,其中有些如今仍是日本游戏业界的中流砥柱。这一长期战略建立了消费者对公司和质量系统的信任,从而弥补了发行量过少的前期忧虑。
通过审核后,任天堂会给游戏打上金色标签
因此我们可以看到,QA 并不应该被扣上重复、试错的标签,它也不是单纯的密集型劳动。严谨的态度、创造性思维、以及宽广的视野都是与之相关的重要素质。
虽然权利金确实是过于霸道的政策,但游戏质量检测的一轻一重,直接促成了雅达利冲击和 90 年代日本游戏业的繁荣,当行业中心从纽约转向东京时,任天堂和世嘉渐渐掌控了业界的主导权,现代游戏机的商业模式也基本成型。
这足以证明,如果「买 Bug 送游戏」成为常态,游戏厂商仅仅重视短期利益,而不能给予测试人员平等的待遇,QA 也在普遍意义上被当成最廉价、最无价值的工作时 —— 那距离现今 30 余年前的萧条景象与行业崩溃,说不准还得再来一次。
回复
老板,来份带有育碧精品BUG的土豆丝,不要草莓味的。
回复
不要总是让玩家成为倒贴钱的游戏测试员
回复
点名批评
回复
育碧我们出来谈一谈
回复
玩家付费测试
回复
点名育婊
回复
深度好文 赞一个 写的真好