样本是从总体中抽出来的部分单位的集合,样本中所包含的单位数称为样本容量,一般用n 表示,确定样本容量是抽样环节中非常重要的问题。样本容量增大,抽样误差相对会减少,估计精确度就会提高,但调查单位(样本容量)过大,成本和时间也会大幅上升,抽样调查的优势就会丧失;反之,样本容量过小,抽样误差相对过大,会失去可信度。
(一)影响样本容量的因素
影响样本容量的因素是多方面的,主要有以下几个方面:
(1)总体各单位标志值的差异程度。在其他条件不变的情况下,σ越大,所需样本容量越大;反之,σ越小,所需样本容量越小;二者成正比关系。
(2)允许误差(或Δp)的大小。在其他条件不变的情况下,允许误差越大,所需样本容量越小;反之,允许误差越小,所需样本容量越大;二者成反比关系。
(3)推断的可靠程度,即置信度。对可靠程度要求越高,所需样本容量越大;反之,则越小。
(4)抽样方法。重复随机抽样的平均抽样误差比不重复随机抽样的平均抽样误差大,在相同的可靠程度要求下所需样本容量要大。
此外,样本容量还受抽样的组织方式等影响。
(二)必要样本容量的确定
必要样本容量指在保证一定可信度的条件下的最低样本容量。一般允许误差(或Δp)和置信度都是在抽样之前根据抽样的目的和要求来规定的,根据允许误差与样本容量之间的关系,能推出必要样本容量。
1.推断总体平均数的必要样本容量
(1)在重复随机抽样条件下:
可得
(2)在不重复随机抽样条件下:
可得
【例6-7】 某面粉厂要检验本月生产的10000 袋面粉的重量(以质量计),根据上月资料,每袋面粉重量的标准差为250 g。要求在95.45% 的概率保证程度下,平均每袋面粉重量的误差不超过50 g,应至少抽查多少袋面粉?
解 已知:N=10000,σ=250 g,=50 g,且由1 -α=0.9545 查得t=2。(www.zuozong.com)
在重复随机抽样条件下:
在不重复随机抽样条件下:
应至少抽查100 袋面粉。
2.推断总体成数的必要样本容量
(1)在重复随机抽样条件下:
可得
(2)在不重复随机抽样条件下:
可得
【例6-8】 已知资料同例6-7,该厂对这10000 袋面粉进行水分检测,国家标准为:水分含量为13.5% ±0.5%。最近三次检测所得水分含量分别为14.5%、14%、13.5%,为了使合格率的误差不超过5%,在99.73% 的概率保证程度下,应至少抽查多少袋面粉?
解 已知:N=10000,Δp=5%,p1=14.5%,p2=14%,p3=13.5%,且由1-α=0.9973查得t= 3。
首先确定方差。因为共有三个过去的合格率数据,为保证推断的准确程度,应选其中方差最大者。
应选择=12.4%。
然后计算必要样本容量。
在重复随机抽样条件下:
在不重复随机抽样条件下:
应至少抽查428 袋面粉。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。