Ben Lewis-Evans：分析三种游戏用户研究方法之优势

我将在本篇文章以及接下来的后续文章中阐述开发者能够用于游戏用户研究中的一些不同方法。

在此我将涉及游戏用户研究的某些要点，并详细讨论3种方法，焦点小组，启发式评估以及问卷调查等内容。

playtesting(from gamasutra)

什么是游戏用户研究？

开始之前我们必须先搞清楚什么是游戏用户研究？首先，让我们将其与质量保证（QA）进行比较。QA是软件开发过程中的一大组成部分，并且总是由一些开发团队中一些专业人士去执行这一任务。这些专业人士的主要目标便是寻找漏洞并确保游戏的顺利运行。

然而，由一些致力于某一项目的人员去执行QA也就意味着这些人士非常专注并熟悉这项工作。而这恰好也是问题的根源，特别是涉及游戏可用性和游戏体验的评估时。因为对于那些专注于项目中的人员来说，他们认为很明显或者很有趣的内容对于新用户来说可能是完全陌生且让人沮丧的内容。

所以这时候便需要游戏用户研究方法的介入——即完全专注于用户以及他们游戏体验的领域，并且这一领域所关注的主要问题是“玩家是否会觉得游戏有趣？”

简单地来说，QA和测试是关于软件，以及它是如何在用户面前运行的，而游戏用户研究则正好相反，它是关于用户，以及用户是如何面对软件。

所以，如何才能做到这一点？并且什么才是真正的乐趣？乐趣是一种很容易使用的元素，但是它同时也会伴随着奋斗和挑战的出现。有趣的体验，吸引人的体验或者轻松的体验都能够为玩家带来乐趣。

如此看来乐趣是一种主观的变量，即不同人在不同情境下对于乐趣的感受也不同。而因为乐趣拥有情感成份，所以可以说当玩家在你的游戏中感到乐趣时，他们便会想要告知你——但是前提是你必须知道如何去询问玩家的这种反馈。

那么应该如何询问玩家的反馈呢？

在开始阐述细节内容之前我想先列出一些重要的基本原则：

明确目标玩家

不论你选择的是何种方法，你都需要明确正确的玩家。这就意味着你需要获得富有代表性的用户，也就是那些你希望能够玩这款游戏的玩家。

如果你拥有大把的时间，你当然能够尽可能地拓宽用户群体（如果你真的认为所有人都会喜欢游戏的话），但是通常情况下你总是会受到时间（以及金钱）的限制，所以你最好能够专注于那些你所明确的目标玩家。

测试游戏而不是玩家

其次，当你在进行这类型的研究时都必须确保让玩家清楚自己并不是测试对象。研究是关于如何完善游戏而不是玩家，所以即使玩家在某一方面做得不好也不用因此感到自责。原则上来看，他们所提供的所有反馈（不管好坏）都是非常有价值的信息。

但是做到这点却不容易，因为你参与了游戏设计工作，所以如果听到别人对于游戏的批评肯定会感到不舒服。但是不管怎样你都要想办法克服这一障碍而让自己更加客观地接受玩家反馈。

明确自己要了解的信息

每当你在进行研究时，你都需要明确自己想要知道哪些内容。你在创造游戏时肯定会亲自尝试游戏，并且因为你拥有明确的设计文件，所以你知道游戏中的每个环节是如何运行的。所以不要责怪那些输掉游戏的玩家，而是仔细想好自己要问他们哪些问题。仔细思考哪些区块是问题所在，并在测试之前搞清楚自己想知道些什么。

请注意：我并不是说你们带有偏见或者已经“知道”自己想要的答案；我只是希望你们能够准备好并知道自己真正在寻找哪些内容，否则你将只会收到一些无用的信息。同时，你还需要学会处事不惊，因为你根本不知道自己会收到哪些答案。

尽早且频繁地进行测试

这是用户研究中最重要的一点，也就是你应该在自己认为合适的时间尽早进行测试。但是做到这点却很难，因为你可能在游戏还未完善之前就将其暴露在用户面前。但是你却可以因此更早地进行测试——例如测试纸上原型。

如果能够尽早进行测试，你便能够及早发现问题并即时做出修改。而当你做出修改后，你必须再次进行测试。也就是说你最好确保游戏不会漏洞百出，因为当你在测试游戏体验时，你肯定不希望因为漏洞而破坏体验。

一种有效的方法便是微软的游戏用户研究员所研发出来的快速迭代测试和评估方法（RITE）。在这一方法中，研究员需要不断运行测试（经常是通过行为观察），并在发现问题时立刻进行修改（直到面向下一名测试者）。有可能在第一名测试者完成测试时便会发现问题。

听取问题并付诸行动，但是测试者所提出的却不一定是解决方法。

当你在面对用户时，你需要足够开明地听取他们所提出的各种问题。你同样也可以听取他们所提出的解决方法——但是这一方法对你来说不一定有用。你是游戏开发者，所以你知道该使用自己所拥有的技术，时间和资源完成某些内容。但是你的玩家却不行。所以当玩家提出相关问题时你一定要正视它，并进行一定的研究，但对于玩家所提出的解决方法你可以持保留态度。

游戏用户研究是另外一种数据来源

通常情况下像我们这类文章发布到网上时，便会有人担忧这些研究是否会破坏游戏的艺术性或者是否会催生出“评委式设计”等问题。当然了，我理解这种担忧，但是与QA一样，用户研究也只是帮助你完善游戏的一种工具罢了。它不会主导你的设计或压制你的艺术才能；而如果你能够合理利用这一工具，不仅你的才能有望得到进一步扩展，你还能够以一种全新的视角去看待游戏。

细节内容

我将在之后的内容中从各种深度分析：焦点小组，启发式评估和问卷调查。

焦点小组

这一方法本身就存在一定的问题（其实它也是“评委式设计”问题中的一环）。所以我们将最先解决这一问题。

你可能已经非常熟悉焦点小组了——尽管你可能从未亲眼见识过。基本上来看，焦点小组就是你号召一群人来玩你的游戏，然后将他们汇聚在一个房间里谈论游戏。他们可以很自由地谈论自己的观点，不管喜不喜欢你的游戏；而你需要在房间里安排了一名引导者，负责询问一些特殊问题。

focus group(from techblog.dallasnews.com)

我们也可以在开发的早期阶段使用这一方法（而不是让人们单纯地玩你的游戏），即你可以阐述关于游戏的相关理念并获得相关反馈。

焦点小组的优点便是它们总是包含许多参与者，而你能够因此获得更多反馈。这是一种相对有效的方法，即所有人都聚集在一处地方，由引导者负责向他们提问。所以如果有人提及他们喜欢或不喜欢的内容时，你应该让他们更加详细地说出原因。

如果处理不当的话，焦点小组便会成为一种浪费时间的无用方法。所以为了避免这一问题你就需要安排一名优秀的引导者去组织你的焦点小组。引导者必须拥有足够的能力以有效地引导对话，同时也不会绝对地主导着小组成员的讨论。

焦点小组所存在的最大风险，也是为何研究员很少使用这一方法的最大原因便是：有1至2名的焦点小组成员会主导整个讨论。迫于小组的压力，你甚至不会听到其他人关于游戏的更有价值的想法。并且焦点小组总是倾向于讨论问题的解决方法而不是问题本身。而这正好都不是你所希望看到的。

最后，焦点小组还是一种非常主观的方法，也就是我们所获得的反馈都是来自于不同人的看法，我们还需要去判断他们所持有的不同“态度”，思考他们的可能性行为，并且我们也清楚人们不一定总是会按照自己所说的去行动。

优点

参与者越多也就意味着能够收到越多反馈

能让所有人汇聚到同一个地方

允许在讨论后提出问题

如果是讨论理念便非常有帮助

缺点

要求必须要有一名优秀的引导者

主导者总是会抢尽风头导致其他人不能发表自己的见解

一窝蜂地讨论解决方法而不是问题所在

人们的所言并不一定是其所行

启发式评估

启发式评估是指你找到游戏用户研究领域的专家，让他们帮你玩游戏，并基于一定标准（启发法）进行评估。有点像系统式游戏评估。

基本上来看，这些专家都需要使用一系列启发法——一些基本规则或心理模式，反馈你的游戏是否匹配这些启发法并提出问题所在。启发法多种多样，我将在此列出Christina Koeffel及其同事在2009年所列出的一些可能的启发法：

是否提供了明确的目标？

是否提供给玩家有意义的奖励？

玩家是否能够掌控局面？

游戏是否保持平衡？

游戏是否留给玩家一个好印象？

游戏中是否拥有一个好故事？

游戏是否能够有序地发展？

游戏是否具有一致性并且能够得到响应？

玩家是否能够清晰地知晓自己失败的原因？

游戏中是否拥有各种难度等级？

游戏以及游戏结果是否公平？

游戏是否具有重玩价值？

游戏的AI是否明显，是否一致，或者是否存在一些不可预知因素？

游戏是否会让玩家感到沮丧？

游戏中的学习曲线是否过于起伏不定或者太长？

有何情感影响？

是否存在过多无趣的重复内容？

玩家是否能够认出屏幕上的一些重要元素？

我认为启发法最让人惊喜之处便在于即使你不是专家，你也能够基于这一系列内容更好地去思考你的游戏。例如，你的游戏是否提供给玩家足够的反馈，并让他们知晓自己的行动对游戏世界会产生何种影响？游戏是否强迫玩家以一种笨拙的方式去使用控制器？当然了，这些都是一种常识，但是你常会发现这些所谓的“常识”却并不为人所正视。

而启发式评估的一个明显的优势便在于你只需要使用少数的专家（有时候甚至只需要一名），并且专家们也总是清楚自己在讨论些什么。但这一优势同时也是问题所在，因为你需要思考该去哪里才能找到这些专家？以及你是否能够找到合适的专家？不同专家可能会使用不同的启发法，而你还需要确保这些启发法能够适用于你的游戏——这一点非常重要。

但是有时候专家其实都太过专业，常常会忽略一些新手们可能会遇到的问题。这是因为当我们变得更加有经验时我们便不会下意识地考虑那些我们所察觉到的一切，然而那些仍然处于学习阶段的人却仍需要思考这些内容。这也是为何想要做好一件事需要遵循专家的做法，而想要学习一件事则需要咨询新手的道理。

优点

不需要太多人参与

能够较快速地解决问题

专家就是专业人士

缺点

你要去哪里寻找这些专家？

你是否能够找到合适的专家？

专家都太过专业

问卷调查

你肯定知道什么是问卷调查，但是你是否知道如何正确设计并使用这一方法？

首先，你需要清楚何时能够使用这一方法？问卷调查是关于玩家对于你的游戏的主观评价，特别是关于价值的判断。而这些调查的范围更是广泛，包括玩家喜欢何种武器以及一些更开放的问题如他们对于游戏体验的总体评价等。

开发者能够在游戏期间向玩家发放问卷调查，因为这时候他们正切身感受着游戏体验——但是这么做的风险则是会打断玩家的游戏进程（游戏邦注：所以开发者最好寻找一些更加合适的暂停时间去提出这些问题）。开发者也能够在游戏结束后进行问卷调查。而问卷调查的一大优点便是它是面对大众群体，也就是开发者能够因此获得更广泛的研究数据。

在详细阐述如何创造属于你自己的问卷调查之前，我想先列举出一些致力于评估游戏体验乐趣的问卷调查案例。

这类型问卷调查的例子包括“游戏体验问卷调查（GEQ）”——用于调查玩家的游戏体验以及影响规模或者针对于不同情感等级的人体模式系统。这些问卷调查都非常优秀，因为其中的问题都是设计师精心设计而成的，可以说都是可信赖的问题。但是通常情况下这些问卷调查问题更倾向于学术性，所以你需要谨慎设置这些问题以让它们能够更好地反映你的游戏，并在适当的时候做出调整。

所以，你到底该如何设计你自己的问卷调查？以下我将列出四大步骤：

步骤1：明确你想知道些什么

就像之前所阐述的，所有的这些方法都需要你事先明确自己想要了解的信息。特别在问卷调查中更加重要。因为你不可能不断追踪着每个玩家的答案，所以你肯定希望他们能够尽可能清晰地回答你的问题，并且你也需要确保你所获得的信息就是你想要知道的内容（保证这些问题不会太多也不会太少！）

你可以通过头脑风暴，制作列表等一系列方法明确自己到底想了解些什么。然后再进行压缩，留下那些自己真正需要知道的内容。切记一定要有所侧重！

新手研究员经常会犯的一个错误便是认为机会很多而一直问一些非常简单的问题。但是如此便会创造出一大堆需要分析的数据并最终促成一些没有意义的结果。除此之外，你肯定也不希望玩家需要投入超过15至20分钟的时间去回答你的问卷调查吧！

步骤2：设计内容

内容的设计是创造问卷调查的核心内容，我们可以将其分解为以下内容进行分析。

问题或陈述？你希望调查对象是回答问题还是进行陈述？这一点非常直接但同时也非常重要。一般来看，问题更能够帮助你获得想要的信息，例如：

Horrible Bog Beast具有多大的挑战性？

1 2 3 4 5 6 7

非常简单非常困难

问题也能够以指令的形式表现出来。例如：“根据1至6个分数点为你刚刚玩过的游戏关卡评级，1代表你非常喜欢这一关卡，而6则代表你非常讨厌它。”这是一种非常有效的方法，就好象你在询问每个人对于不同关卡的评价等级一样。

Horrible Bog Beast是玩家所遭遇到的一个有趣的敌人。

1 2 3 4 5 6 7

强烈赞同强烈反对

问题也好陈述也罢，你都应该为你的游戏选择最适合的方式，并且不要在同一份问卷中频繁地转换不同方式。

语言的使用。你必须使用那些耳熟能详的日常用语；避免使用晦涩的专业术语。如此你才能够确保你所询问的对象能够理解你的问题。很多研究员只是简单地提出问题，有时候甚至都不理解自己的问题（我敢保证很多人都这么做过），如此他们最终只能够获得一些没有用的信息。所以切记一定要直接提出那些你真正想知道的问题！

当你提供了一些问题的可选择答案时（游戏邦注：例如他们不得不从自己所拥有的控制台列表中做出选择）。你必须确保这些答案足够详尽。换句话说，你必须好好思考这些可选择答案。在此添加其它额外选项很有帮助，但是前提是不要频繁使用这种“其它”选项。

同时你还需留意不要问一些重复的问题（即使是基于不同方式）。一定要尽可能地压缩问题。避免出现任何消极语气；也就是基于肯定的语气而不是否定，如“我喜欢跳跃机制”而不是说“我不喜欢跳跃机制”。就比如说在消极语气问题中，人们便不得不逆向思考到底要选择“同意”还是“不同意”，而因此混淆了问题与自己的答案。

避免出现诱导性问题，双重问题以及含沙射影式问题。诱导性问题是指人们会被引导着而给出一个肯定的答案，如“这是一款有趣的游戏。而它的趣味性在哪？”当然了，这个例子太夸张了，但是你还是得正视这一点，因为实在有太多问卷调查中出现了这种类型的问题。所以请一定保持提问措辞的直接与中立。不要装腔作势！

双重（或多重）问题指同时影射多个问题。我将列举一个游戏外部的例子，即新西兰的公民投票进行说明：

“我们是否应该改革司法制度，更多地强调受害者的需求，提供给他们赔偿，并以最低的刑罚和较重的苦役判定任何严重的暴力犯罪？”同意/反对

我们可以看到在这个疑问句中至少出现了六个问题，包括是否需要进行改革，是否需要更加强调受害者的需求，是否应该提供赔偿，是否应该执行最低刑罚，是否应该施以苦役，是否应该面向所有严重的暴力犯罪？但是你却只能回答一次。正如我所说的，这一问题是面向整个新西兰的民众，但是却严重地破坏了他们的投票体验。

含沙射影式问题是指做出一些道德上的判断或没有根据的假设；同样以新西兰公民投票中的一个问题作为例子：

“在新西兰应该将打巴掌这一良好的管教孩子方法视为刑事犯罪吗？”同意/反对

这个问题使用了一个道德术语，即“良好”；同时它也使用了一个不够明确的表达，即“良好的管教孩子方法”（不管是什么方式），并最终造成了一种误解，即反对打巴掌的人不得不回答“同意”而赞成打巴掌的人则需要回答“反对”。

封闭式或开放式？问题可以是开放式的，也就是玩家可以随心所欲地说出自己的想法；也可以是封闭式的，即给出玩家一定的选项让他们做出选择。

开放式问题能够帮你收集到更多信息，因为它能够让玩家尽情地阐述反馈。但与此同时它也会产生局限，并且因为没有明确的方向而导致所有的问题变得更加含糊。

所以如果你选择开发式问题你就需要尽量确保拥有足够的时间阅读这些问题，以防你可能会要求回答者解释他所给出的答案。但是如果你的问卷调查是远程发放（游戏邦注：如通过电子邮件或在线发放）的，你便很难做到这一点。

而如果是封闭式问题你便可以通过不同衡量法掌控参与者的答案：

二分量表：也就是最简单的是与否的问题。通常情况下这是用于收集一些肯定与否定，正确与错误之类的信息。尽管这种方法非常直接，清晰，但是它却不能创造出多少信息。所以这种问题只能用于收集人口统计资料，或者当你必须在两个选项中做出选择时使用。

《暗黑破坏神III》中的二分选择(from gamasutra)

连续量表：也就是要求人们沿着数值的增减或基于比例增减做出选择（游戏邦注：就像你在游戏中定制角色的脸部比例）。这种方法的一大优势便是能够给出明确的衡量数值。但是通常情况下过于明确的数值也没有多大的用处（就像96.43与93.21又有多大区别呢？）

等距量表：这是我们最熟悉的一种量法类型。在此你可以基于一些相互分离的步骤而做出等级评定。

比起连续性选择，这种方法虽然会降低量表的精确度，但是我们却能够因此更好地比较结果。依我看来，1至7的量表是最合适的选择，因为这一范围的精确度也是最合理的，不会过宽。

《魔镇惊魂》中一些间等距量表(from gamasutra)

如果你选择了等距量表，你就需要进一步将其分解为以下类型：数值量表，李克特量表（游戏邦注：是一种心理反应量表，常在问卷中使用）或语义量表。

数值量表非常简单，你只要使用一些数值进行提问即可。这种方法经常用于评级中。

李克特量表是最频繁出现的一种方法，当你想要知道有多少人表示赞同或者反对时便能够使用这一量表，例如在1至7的数值范围中，1表示强烈反对而7表示强烈赞同。

语义量表常用于单纯的评级或价值判断中，例如在1至7的数值范围中，1代表最糟糕而7代表最优秀等。

你可以基于不同需要使用不同量表，但是最好不要过度混合使用；否则将会误导回答问题的群众，让他们不知道是该直接回答同意或不同意，还是需要逆向进行思考。

除此之外在等距量表中，你可以提出单级问题（以程度去区别变量），如在1至7的数值范围中，1代表不是很有趣而7代表非常有趣，或者是双极问题（即对比两个变量），如1代表非常无聊而7代表非常有趣。单级变量能够更深入地表现出同一种情感，而双极变量则给予人们更多的空间去传达他们的想法。切忌在同一份问卷中过度混合使用这些不同类型的量表。

步骤3：整合在一起

现在你已经明确了自己想知道哪些问题了，接下来你就需要将它们整合在一起。首先，思考你需要使用何种媒介，也就是你想通过电脑还是纸发放你的问卷？如果可能的话，通过电脑发放问卷更加有效，因为你不需要在之后进行额外的数据输入，但是如果从可携带性和易用性来看，纸上问卷则更胜一筹。

你应该投入更多时间去做出选择，如果你决定使用基于电脑的调查方式，你可以寻求一些专业公司的帮助（有很多专门提供问卷调查服务的公司），SurveyMonkey便是一个非常好的选择。

接下来你需要考虑问题的排列顺序。一般来讲我都会建议研究员将最简单的问题放在最前面。这样才不会让回答者感到厌烦——只要你的问卷不会过长，他们也会愿意回答你之后提出的较困难的问题。

基于一种合理的模式或者它们所涉及的内容将剩下的问题整合在一起。不要再问过大量关于武器的问题后一下子跳到boss身上，然后又转回到武器上。

确保你在问了一些问题后能够排除一些不可能的问题或相对应地衍生出一些新问题，也就是如果你问的是“你是否拥有Xbox”有/没有，而回答没有的人则不需要列举出他们所拥有的前10款Xbox游戏。

步骤4：测试

任何计划都需要与玩家进行第一次接触，所以你就需要先亲自测试你的问卷调查。如果你使用的是基于电脑的问卷调查，你应该尽可能保证你最终获得的信息是良好。然后邀请其他人（最好是那些不熟悉你的游戏的人，并且最好不是游戏设计师）去填写你的问卷调查（而此时的你不应该与他们待在同一个房间，所以不可能帮助他们回答问题），并询问他们对于该份问卷的意见。基本上来看，问卷的测试过程也是遵循用户测试，提出一些问题并且你予以改进（然后继续进行测试）的过程。我知道这是一项相对繁琐的工作，但是一旦你拥有了一份完善的问卷，你便能够在今后重复使用它（或至少利用其中一些有帮助的内容）。

优点和缺点

问卷的最大优点便在于你能够同时面向许多人提出相同的问题，也就是你可以获得一致的可量化数据，并基于这些数据去比较不同人的看法。

但是这种方法却缺少后续过程，也就是你不能够询问人们为何他们选择这一级别；这并不是一种绝对客观的方法，而如果你希望获得一些可靠的结论你便需要投入额外的努力。即当你针对于某些人进行测试时，你所提供的问卷只能帮你获得这些人的观点而已。

优点

一致性

足够量化

能够快速进行管理

可以大规模地使用

缺点

缺少后续过程

不够客观

至多只能代表接受测试者的观点

整合一份优秀的问卷需要投入不少时间

最后，我想说的是我在此所阐述的内容还不够全面，但是至少我希望它们都是有帮助的。而在之后的系列文章中，我将进一步涉及面谈，观察法，游戏参数以及生物统计学等内容。

菜单Menu

更多阅读：

菜单Menu

更多阅读：

分享这篇文章