最近大家都很忙,忙着制定年度计划。
制定年度计划是在做 甚么?是在向未来要业绩。
如何要得来业绩?得先分析市场。
如何分析市场?免不了要调研。
如何调研?绕不开样本量。
那今天就和大家聊一聊:如何确定样本量?
一、根据允许的抽样误差的范围确定样本量
什么是抽样误差呢?抽样误差与样本量之间存在什么关系?
先说抽样误差。假设你是互联网公司的分析师,你想研究网民的偏好,所有的网民就构成了总体,他们是你最终想了解的对象。但是,你有足够的精力调查所有的网民吗?没有,你只能调查一部分,这一部分就是样本。样本能代表总体吗?那要看两者之间的差异,这个差异就叫做抽样误差。当然,你肯定希望抽样误差越小越好。
那么,抽样误差和样本量之间又是什么关系呢?你想啊,之所以会存在抽样误差,是因为你只调查了总体中的一部分样本,样本所包含的个体越少,则抽样误差越大。样本所包含的个体就是样本量,所以,样本量和抽样误差是反向的。若描述得更确切些,公式就出来了:在简单随机抽样中,样本量N与抽样误差△的关系见下面的公式:
其中:
α为显著性水平,1-α为置信度。置信度是指当以样本估计总体时,能够正确估计的概率的大小。例如,当置信水平为95%的时候,表示正确估计的概率是95%。
Zα/2是正态分布条件下与置信水平相联系的系数,置信水平取95%,则Zα/2=1.96。
P表示总体的百分比,虽然总体百分比P未知,但容易看出当P=0.5时,N取最大值
因此,公式里未知的只有抽样误差△和样本量N。他们的反向关系,在这个公式中淋漓尽致地体现出来了。
当然,你希望抽样误差越小越好,这样精度高呀,但是,这要付出代价。代价就是要支付更多的调研经费。因此,确定样本量的工作,实际上是在找到一个精度和经济的平衡点,即目前的调研经费可支持多大范围的抽样误差,你是否允许这个抽样误差。
原理和公式说完了,我们看具体操作步骤:
步骤一:设置α、p和△的值
设(1-α)=95%、p=0.5,、△=9.8%、分别将它们输入到EXCEL表中,如下图所示。步骤二:计算累积机率值
在单元格B2中输入“=50%+A2/2”, 计算出来的累积机率值为97.5%,如下图所示
步骤三 选择“NORMINV”函数
选定单元格C2,单击菜单栏中的“插入> 函数”命令(2003版单击“插入>函数”命令,2007版单击“公式>其他函数>统计>插入函数”),打开下图所示的“插入函数”对话框,在“或选择类别”下拉列表中选择“统计”,然后再“选择函数”列表框中选择“NORMINV”
步骤四:计算Z值
单击“确定”按钮,打开“函数参数”对话框,设置该函数的各个参数值后,单击“确定”按钮。
步骤五:计算样本量
根据公式1,在单元格F2中输入:=C2^2*D2*(1-D2)/E2^2,得到样本量的计算结果为100。
二、根据特定目的确定样本量
这个思路叫做特定目的法。其中最有名的是拇指定律。具体内容如下:
1、样本若分成不同的组,总样本量要保证每组的样本量都不能低于100个;
2、当每组样本还需按不同的特性或配额划分成更小的组时,要保证每个小组的样本量至少在20-50个之间
拇指定律常用于总体数量庞大且有配额要求的调研,比如大众消费品市场的研究。
例如,要调查某城市消费者对某品牌香烟的态度,我们可以把受访的消费者分成重度吸烟者和轻度吸烟者两组,如果重度吸烟者的人数少,约占所有香烟消费者的10%,为了保证重度消费者的样本量不低于100人,用简单随机抽样法,则总样本量就需要1000人。
如果将重度吸烟者再细分成收入高、中、低三档,其中收入高的人数最少,只占总体人数的1%,按照拇指定律,要求该组样本量不少于20人,那么总样本量至少需2000人。
因此,这个品牌香烟的调查项目样本量就应该是2000人。
总之,确定样本量要考虑样本结构、精度要求、调研经费以及总体特征易变性等因素。比如说,如果总体易变性强,或者说是样本之间的差异性大的时候,则需要适当增加样本量。