第六章广告文案测试分析
虽然文案测试的用途广泛,但它也可能阻碍创意过程的进行,因为广告主有可能只坚持制作那些在文案测试中“得分高”的广告。所以,必须慎重考虑是否进行文案测试以及如何进行文案测试。
一、文案测试的必要性
首先要决定是不是需要花钱搞研究。尽管广告耗资颇多,一般人会选择不搞文案测试。多数地方性广告没有经过测试,很多全国性广告也未经过正式的文案测试。文案测试需要投入时间和资金。一般情况下,文案测试会使广告的制作时间延长几周甚至几个月。
从另一方面看,如果投入新产品的广告预算费用是2000万美元,那么,在文案测试上的投资就显得很有意义。此外,仅依赖创意小组的判断、个人经验和某人的直觉风险太大。我们想知道的是潜在顾客将对广告做出何种反应,也就是说,要进行文案测试。这里要指出的是,有几家创意机构坚信,设有文案测试,他们的创意作品会显得更加新颖独特。许多广告公司的创意人员否定文案测试的作用,把它视作一种类似警察的讨厌角色。因为文案测试只告诉人们该干什么,却不说明原因。然而,不少未经过测试的广告在市场上“触礁”的惨痛教训,使人们开始相信文案测试的必要性。重要的是要选择一种能令创意工作者们信服的文案测试系统,以及不能出于在测试中夺高分的目的制作广告。
二、文案测试的时间和内容
何时进行文案测试?测试什么?文案测试可以在4个时间进行:
(1)创意过程开始时;
(2)创意过程结束时(在布局设计阶段);
(3)制作阶段的末期;
(4)广告推出之后。总的来说,在前3个时期进行的测试叫预先测试,在第四个时期进行的测试叫事后测试。在任一个时期都能进行不同的测试,具体采用什么测试则取决于是广播广告还是印刷广告。
在创意过程之初进行的测试常常涉及定性研究,比如进行小组访谈,以获得人们对文案构思的反应。此处更适合进行战略测试,因为广告形式设计比较抽象,无法进行具体测试。
在第二阶段,需检测已完成的初步文案或部分完成的电视广告,因为其耗资相对较少,而这种“粗糙”的广告可对日后广告的有效性做出好的预测。当然,广告的最终成功还要视人物形象的塑造和场景的编辑等。
最近的一项调查表明,在一些大的广告公司中,电视广告的预先测试总是使用动画(画出电视广告的一些场景,并给画面配音)、消费者群或购物中心的实地访问。主要测试的是传达信息的清晰度和广告要点的可信度。在过去10年中,人们更倾向于这种快捷的定量研究。
第三阶段经常省略,特别是当广告已播放了几次而新文案又无大的变化时。一个基本问题是,是开发和测试一个广告,还是开发和测试几个广告?开发和测试几种方案是合乎逻辑的做法,但也是很昂贵的做法。一般说来,在第三和第四阶段测试广告花费较多。如果广告本身的投入较多,那么花在广告测试上的投资就很容易被接受。
三、文案测试的准则
应该使用何种准则或文案测试?文案测试可根据测试中所使用的反应变量的性质加以区分。尽管选择文案测试时还要考虑其他因素,但准则相关变量可能是最重要的一点。
广告研究中有5种基本准则或者说5类反应:其一,广告认知;其二,广告及其内容的回忆;其三,说服(或态度改变);其四,购买行为准则;其五,对品牌忠诚度或对产品、服务消费量的测试。在这5类准则中,有的适合于事后测试,有的则适合预先测试。当然大多数能应用于两种情况。
在这5种准则中进行选择的关键问题是:在当前市场营销活动中,有关此品牌或此广告活动的广告效果根据什么来测量?每一品牌通常在认知、偏好、尝试、重购这个“等级”层次中有广告“问题”,而且“诊断性”消费者数据可用来确定某一广告或广告活动的具体目标。回忆(以及认知)在低度参与的情况下一般是比较重要的目标,而说服在高度参与的情况下比较重要。因此,每个广告在文案测试之前,应确定自己的有效性准则。
但是,一般不会只有一种准则评价广告的有效性,通常需要涉及到几个准则。比如,人们经常根据一则广告的认知或回忆分数来评价它的“广度”,因为这些得分告诉你有多少人看到了这个广告。而广告的说服或购买意图分数可用来评价它的“深度”,它说明广告影响受众的程度。他们是否更喜爱这种品牌以及他们是否愿意尝试它。
四、广告文案的分析
广告研究的整套方法不是为了测试广告的整体效果,而是为了帮助创意人去了解广告的各部分如何对整体产生影响,即:广告的薄弱环节在哪儿?它们是如何相互作用的?许多测试方法不仅可应用于设计中的广告,还可应用于已经完成的广告。
(一)定性研究
集中群体研究广泛地运用于广告开发的后期。一个对112家大型广告公司采用技术的研究发现,使用集中群体研究,96%的时间是为了广告形成创意;60%的时间用于测试对广告草案的可能反应。正如本章开始提到的那样,在过去10年中,人们大大地增加了对定性技术的使用。
(二)受众对广告的印象
许多文案测试增加了一套较为随意的提问,以试探观众对广告的印象。这一方面是要查出受众对广告可能出现的误解,另一方面就是发现在受众中可能存在但现在还没发现的巧妙联想。如果在受众中出现了太多不好的评论,那就该加以注意了。一则大众汽车广告描述了一位底特律汽车工人驾驶着一辆VW罗比特车,只因该车具有更优良性能。这则广告最终没有被通过,因为很多受众不喜欢广告表现出对公司不忠诚的形象。
(三)形容表格
如BRC邮寄问卷包括一个形容表格,该表格使广告公司可以判断受众对广告的看法(广告是温馨的/有趣的/令人愤怒的/信息含量大的)。ASI公司、电讯研究公司及其他一些广告公司都使用了类似的表格。雷奥·伯内特广告公司和杨—鲁比凯姆广告公司也采用了一个类似的表格,称之为观念反应记录。表格中的一些语句用于探测观众的理解程度,如“我自己也可能那样做”,“我指的就是那样”等。有些人认为,广告必须要与观众心灵相通,否则难以取得成效。
(四)文案测试情感反应
许多广告公司施展浑身解数,以便测试广告能否激发消费者的某种情绪,或者是否意外地激发了一种不该激发的情绪。据报导,一些词汇尺度可用来测试这些情感反应,这些度量方法在爱尔公司和麦堪—爱立克森公司,及其他广告公司里得到应用。雷奥·伯内特通过计算机辅助消费者访问的方法,测试了这些反应,消费者首先选择自己受广告触动产生的一种情绪种类,在这一种类下,计算机又进入一个更详细的情绪分类中,消费者再继续选择。
BBDO广告公司选择的是一种非文字系统。此系统向看过广告的观众展示53张人脸照片,这些照片显示了26种不同的情绪。消费者选择…—种最能反映他们感受的表情。
研究者把统计数字列表,表明各照片被选择的概率各是多大。在进行统计分析时,每个广告都被置于一个两维的情感空间里,这两维分别是主动—被动和肯定—否定(这是情感研究中经常使用的两组概念)。把BBDO公司的方法应用到吉列剃须刀广告“一个男人能得到的最好的东西”中,广告取得了极好的效果。男士们剃须后宣称,自己增加了自豪、自信,充满了欢乐和幸福。广告的情感战略大获全胜。
(五)心理测试的方法
研究者们还通过一些心理测试设备观测人们对广告的反应,捕捉人们在观看广告时神经系统或情绪上出现的变化。这些方法着重观察人们的眼部运动。
1.眼睛摄像器
这种设备可拍摄眼睛的移动。它可以拍下眼睛反射出的一束光,也可以拍下眼睛运动的影片。这种没备可记录下印刷广告中目光每秒停留60次的视点,从而得知读者看到了什么,视线主要集中在广告内容的哪一部分。在包装测试中,受测试者被要求在一堆同类产品中找出测试品牌来。
2.测瞳仪
测瞳仪根据眼睛收缩原理进行测试。当眼睛看到一些有趣或赏心悦目的东西时,瞳孔放大;反之,看到丑陋的、恶心的东西时,瞳孔缩小。这一原理被用到观看新的电视节目中。一些与眼睛运动相关的设备,如视速仪、影像位移仪、测距仪、照度表、立体声测速计都在测试中发挥了作用。
3.广告动态策划分析
广告动态策划分析是指观众在收看广告时,可通过一个手动或脚动的操作装置,控制电视机音像频道的强度。广告节目的音像信号以—种特定的方式减弱,观众要保持信号的强度需付出努力。他们为之付出的努力是衡量他们对广告兴趣大小的标准。
4.大脑波
有些公司根据激发的大脑波的数量、性质和分布来测试广告效果。测试者让消费者坐在椅子上,在他们身上(前、后、左、右)插上电极。广告播放时,通过脑电图(EEG)记录大脑不同部位的大脑波。通过对大脑波频率和幅度的分析,可以测试广告的各个部分及整体对观众注意力的吸引程度。例如,广告的认知是在大脑左半球进行,因为左半球一般负责对信息进行分析性处理。所以,这种处理过程的加剧意味着有更多的信息箱人。
通过这些方法及其他心理测试(如电触皮肤反应等)得到数据,可能产生的问题有:
①人为因素的干扰,使数据不能真实地反映广告的有效性;
②数据本身难以解释(比如,大脑波活动的加剧或减少到底与认知过程有何关系)。
(六)广告反应的线上监视
ASI公司的剧院测试利用了一个特殊的号码盘,号码盘数字的升降显示消费者对广告兴趣的大小。从号码盘记录器中得到的数据可提供诊断性信息,告诉人们广告的哪部分更令人感兴趣。市场实情公司开发了一套系统,当观众感觉广告的某部分给他的印象很深时,就按一下按钮,然后,让观众再看一遍广告,并问他们为何在那些时候按按钮。通过这种方式可以理解观众的反应。琳达·阿尔维特和她的同事在研究广告的播出频率和播放进程时,也采用了相似的技术。
戴维·艾柯、道格拉斯·斯德蒙和迈克尔·哈格梯利用计算机操纵杆测试观众在收看广告时对温馨感觉的反应。该方法同样可监测其他情感,如愠怒、幽默或喜好。詹姆斯·麦克拉士兰和约翰·迈尔斯根据消费者在不同品牌产品间进行选择的时间来衡量广告是否有效。这种被称作反应等待的方法,在广告研究中应用广泛。另一种很有潜力的技术称作面部反应活动编码。通过观察观众在收看广告时的面部表情变化,可以监测出不同的情感反应,C·大卫·休斯和他的同事们开发了一种拨号式连续测量方法来观测观众对广告的反应。他们发现,这种方法可以测试广告是否因过时(wearingout)而失去作用,因为该方法给出了消费者不再从广告中提取新信息的时间。
五、文案准确度和可信度测试
现已开发了多种文案测试方法可供广告公司选择。在提出是否需要进行文案测试的问题后,还要考虑选择何种测试方法。这一问题是文案测试产生以来研究者们关注的对象。关于这一问题有不少专著问世。人们对评价不同类型广告的准确度和可信度很感兴趣。这个问题对广告主来说也十分重要,因为他们付出了巨额广告经费,期望能发现一种合适的测试方法。广告研究基金会成立了一个常设委员会,以鼓励开发更好更新的测试方法,它的年度大会总是围绕某种方法或技术的优势和劣势进行讨论。
选择测试方法的一个基本问题是该测试方法是否准确可靠。它真的能检测广告的有效性吗?某种测试方法中的测试值能真实地度量一个广告吗?测试可信吗?它每次测试时都是在衡量同一个事物吗?一个测试就能测出所有一切时还需要多种测试方法?选择文案测试方法是需考虑这些问题。
(一)合适的文案测试方法
评价文案测试准确度的首要问题是:要测试的广告是否有一个沟通目标。如果此目标存在,文案测试必然有一个运行目标,这需要一个代表该目标的可度量的有用的变数。
事实上,研究者们往往面对的是一些模糊的、不明确的目标,从广告中搜索出明确的广告运行目标,并在文案测试中检验出来,这是很必要的。一个量度不能代表另一个量度,如:回忆不能衡量说服力。
很明显,某种文案测试的准确度取决于广告期望激起何种反应。一个期望产生识别效果的广告不能采用强调即时行为反应的测试方法。一个试图创造一种形象或酿造一种温馨氛围的广告可能需要反复播放的评价方法和比较细致的评价方法,比方说,根据产品使用经验问一些问题。那种附常随机赠券的只播一次的广告测试方法可能不合适。这就是说,必须根据广告目标来评价文案测试中不同准则的有用性。
此外,对文案测试方法的选择还必须结合广告决策的风险性。如果一个全新的广告活动涉及高风险的战略决策,那么,我们需要对上述所有方面进行评价。同时,检验广告是否会使观众产生某种对抗性反应也很重要。一个完整的评价还必须提供足够的诊断信息以判断受众对广告可能产生的反应,以便于我们根据所有这些评价和诊断性信息做出决策。一个广告同时获得高度识别和负面反应是可能的。
广告的全面评价在经费上并非总是可行或必要的。涉及低风险决策的广告只需部分评价。在有些评价中,说服力和改变态度是关键,而吸引受众的注意力则不重要;有时候清楚地传递信息是关键,对说服力的强弱进行主观判断就足够了;还有的时候是强调运作过程中可能存在的消极因素。每种情况下,文案测试的目标都是不同的。
(二)最佳尺度:ART研究
一旦这些目标已经确定,针对各个目标采取哪种文案测试的方法是好呢?在广告研究基金会最近指导进行的一项使用分线测试的研究中,涉及了6种文案测试方法、5对包装产品的广告和超过一年的销售数据,最终发现的结果是:
1.测试说服力的最佳方法是采用从最差到最好品牌的排列,这通常在广告展示后获得。
2.测量文案特色的最佳方法是无辅助认知情况下首先提到被测品牌的次数。
3.测试广告沟通(信息传递)能力的最佳方法是考虑这样一个问题:“除了劝你买这种产品外,广告还告诉你什么了?”
4.销量的最佳预测是根据对“这则广告是最近我见过的广告中最好的一个”这句话同意和不同意的数量比。
5.如果广告给人的印象是“告诉我很多关于产品如何工作的知识”或是“这个广告很有趣、很聪明”,那么产品销量就会增加;如果广告给人的印象是“我觉得这是个很有艺术性的广告”,或是“这个广告没有提供任何信息,只是创造了一个形象”,那么这个广告对销售不起任何作用。
(三)竞争环境
大卫·史都华和保罗·米尼亚德等研究者提出,由于受测试的广告最终要进入竞争环境中,而且这种竞争会降低广告的有效性,所以,只有在竞争环境中进行测试才能检验一个广告是否成功。在测试中,需要搜集测试品牌及所有竞争品牌的资料。有时候,虽然测试品牌在消费者好感和整体态度方面的反应没有增加,但其竞争品的相应指标有所下降。
当然,除非测试中收入了竞争者的相关资料(如:“哪种品牌这一属性更好?”),否则这些信息无法在文案测试中显示出来。
如果采用比较型广告,在测试前后,就要收集两种品牌的相似度信息,因为广告的一种效果可能是增加比较品牌的相似度。此外,广告还有可能改变受众对测试品牌(或竞争品牌)的某种认识(哪怕这些消费者认识在广告中并未明确提到),而消费者对这些认识会有自己的推断,所以,文案测试还需收集有关这些认识的相关信息。
(四)目标市场
如果大致知道目标市场的大小,那么受测试者们就应代表这个目标市场。最好是进行随机抽样.并且抽样人数要具有统计意义。当然,也应根据实际情况灵活处理,有时候取得数量较大的随机样本在经费上不可行,特加是在有个别采访的情况下更是如此。受测试者的个体差异也会给一些测试造成影响。人们在回答问题、参与实验和参加心理测试时,倾向很不相同。那些不愿参加测试的人与那些欢迎测试的人的回答也会截然不同。
此外,在购物中心采访只能遇见购物者,基于电话的采访会漏掉那些没有电话的人。还有一个问题是:在—个城市甚至三四个城市抽样能否代表整个目标市场。若不能的话,测试结果就很难作为决策的依据。
(五)反应
受测试者对测试环境和检测手段的反应。研究表明,那些希望接受广告回忆或认知效果测试的消费者比没有这种愿望的消费者表现得好。这种不同的反应会歪曲测试结果。不同的人在测试环境中的表现不一样,而任何广告测试中的主要问题都是受测试者是否做出他们应有的反应(称作反应效果或角色选择等)。研究表明,在某些系统中,抽样成员开始适应了系统环境,这个问题不太显著。然而,在那些需要受试者表明态度的系统中,这就成了最值得人们重视的问题,受测试者愿意或者能够如实回答吗?
有些技术可减少这种偏见效果。一种是不让受测试者知道实验的真实目的,只告诉他们:他正在评价一个电视节目而不是其中的广告。然而,这种方法,也不能完全消除所有的偏见反应,而且,在涉及伦理和道德问题时,未经受测试者同意,能够这样欺骗他们吗?另一种方法是采用非反应的测量。受测试者可以不受情绪干扰而做出回答。直接邮寄测试就可以避免偏见反应的干扰。
(六)广告初稿与成稿
广告初型与最终广告的测试结果高度相关。要认识这一问题,首先要了解广告初稿模型和最终广告有何不同,以及这些差异对受众反应的影响。例如,在初型广告形式下,很难测试幽默感、情绪反应及对整体广告的喜好程度。从另一方面看,动画这类的初型广告适合测试对文案要点的理解程度,因而可用于战略测试中,尽管一些研究表明,动画可能比最终广告更突出了对要点的理解。
(七)广告展示次数
文案测试如何预测在广告展示了几十次甚至上百次后受众的反应?一次性展示能提供有意义的结果吗?是不是至少应让受测试者看二三次呢?另一个值得探讨的问题是,测试广告应置于什么样的背景环境中?最好的办法是在一个节目或一本杂志中安插许多广告,但这无疑使测试变得复杂。还有可能干扰实验结果。
(八)自然观看和强迫观看
比哈维尔斯卡分线测试的方法被称为在线测试,因为受测试者是在家中收看电视节目。诸如ASI的方法也属于在线测试的一种,但受测试者知道他们是进行试验,且收看广告的时间也不是他们一般习惯看的时间。因而,其收看环境可能影响到试验结果。
人为的测试环境可能会影响到测试结果的准确性。人为环境的极端情况是在购物中心的购物者中抽样,请他们观看广告模型,并在纸上记录他们看完广告后的反应。比哈维尔斯则是在比较在自然的环境下进行测试,观众们知道自己是在进行一项试验。
有3种主要的文案测试研究:实验室测试、模拟自然环境测试,以及市场测试。
实验室测试和模拟自然环境测试是强迫观看广告,而市场测试更倾向于在线回忆测试。据对广告公司专业人士的调查,他们最偏爱的是只播放一次、在多个市场中进行的在线测试(而非单播放、单市场;多播放、单市场;多播放、多市场),对于强迫观看的情况,剧院和实验室测试比电影预告片和家庭强迫观看测试更受这些人士的欢迎。当然,这只反映了一个整体的偏好,测试方法的选择应该是具体问题具体分析。
(九)文案测试可靠性
选择文案测试还需考虑测试方法的可信度。每次测试测量的都是同一个东西吗?针对这一问题人们做了很多工作。凯文•克兰西和利蒙·奥斯伦进行的一项研究中,对106个广告先后进行了两次在线回忆测试。可信度系数(两次测试分值的相互关系)是0.67(去掉产品类别的影响)和0.29,显然这些系数较低,实验者向在线回忆测试的可靠性提出了挑战。研究表明,偏爱测试的可靠性甚至比回忆测试的可靠性还低,特别是在播放一次的情况下更是如此。
阿尔文斯·斯尔克指出了使用反复测试的方法来评价可靠性也有很大困难,因为每次测试的条件必须一样。如果消费者在两次测试中观看广告的环境不同,测试的条件就不一样,此时较低的相关系数并不意味着较低的可靠性。加科布·霍尼克的研究甚至表明:
文案测试的分值与测试时间有关。如果广告测试在上午9:00进行,回忆得分最高,因为人们在那个时间最清醒!由于这些因素,使用反复的方法直接评价文案测试的可靠性十分困难。
(十)文案测试敏感性及其他因素
选择文案还需考虑其他一些因素,如测试的性质、测试提供者等。除了可靠性和有效性以外,约瑟夫·普鲁默还提出评价测试的另外5个标准:
(1)敏感性:测试应能区别同一品牌的不同广告。
(2)测试的独立性:在测试中不同测试值的关系不大。
(3)全面性:测试不仅提供基本的评价分值,还应解释各评价分值代表什么。
(4)与其他测试的关系:同一广告经相似的两个测试系统检验,结果应该相似。
(5)接受性:测试结果应被决策负责人接受。
在选择广告测试公司时,主要考虑因素有:公司声誉,如服务记录、是否存在标准、在行业中的地位等。此外,公司的地理位置、与竞争者相比服务费用的高低也要考虑。
这些便是评价广告测试有效性时应考虑的因素。
(十一)PACT原则
1982年,21家广告公司联合发展了一套文案测试原则,它被称作定位广告文案测试(positioningadvertising copytesting,PACT)。PACT总结了包括我们在本章中提到的许多原则。
(1)一个好的文案测试系统提供了与广告目标密切相关的量度。
(2)一个好的文案测试系统应保证在测试开始之前,就在如何使用测试结果上达成—致意见。
(3)一个好的文案测试系统应提供多个测量值,因为一个测量值不足以评价一个广告的效果。
(4)一个好的文案测试系统应建立在人类反应模型基础上——接受刺激、识别刺激、对刺激产生反应。
(5)一个好的文案测试系统应考虑是否应播放几次广告。
(6)一个好的文案测试系统意识到,一个广告文案越接近完成,越能很好地评价它,至少应使用与广告完成程度一致的测试模型。
(7)一个好的文案测试系统应尽力避免因观看环境的不同而产生的偏见效果。
(8)一个好的文案测试系统应合理抽样。
(9)一个好的文案测试系统应同时具备可靠性和有效性。