作者:布尔熊 | 来源:互联网 | 2023-10-12 08:10
得 此时总费用约为: 2、 待估的参数为总体总和 由于总体总和的分层估计可以写成 ,样本容量 n 的确定是十分容易的。 假设 为 的允许的最大方差,由于 只需将 代入有关 的一切公式,就可以得到相应的 结论,下面列出有关的结果。 对给定的各层分配额, 有: (4.39) 若记 ,则 (4.40) 若记 ,则 (4.42) 相应的Neyman最优分配: (4.41) 若记 ,则 (4.44) 若按比例分配: (4.43) §4 分层的若干技术问题 1、 单指标分层的构造方法 这一原则在理论上是无可置疑的,但在实际应用中较难 实施,看上去符合基本原则的分层手法可以有许许多多种, 究竟哪一种是最理想最合理的呢? 本章第一节介绍分层抽样时已经强调了分层时应注意的 一些问题。根据对平均数 的方差的分析,我们看到合理的 分层比起简单随机抽样来可以避开层间差异的影响而使方差 较小。因此,要使分层合理,一个基本原则是 “ 使层内差异 尽可能小 ” ——各层有自己鲜明的特色,并 “使层间差异明 显地较大 ” ——各层之间有显著不同。 前面提到根据具体的调查目的,有时可以根据地理、性 别、民族、宗教、职业等因素来分层,在多项指标问题中有 时采用聚类分析的手段进行分层。这一小节我们考虑单项指 标调查时如何分层。如果按地区、民族等因素分层则称为基 于辅助因素的分层,倘若该辅助因素与我们感兴趣的指标关 系密切,那么这样分层常获益匪浅;反之,有可能导致不合 理的分层从而引起糟糕的结果。假如我们对总体的单项指标 有所认识,最有效的方法是按这些数值来分层,具体的做法 是确定各层之间的分点。 设将总体分为 k 层,假设 与 分别为总体的最小与最 大可能值(所谓“可能”,是因为其实我们并不确切地知道), 按数值分层即为在 与 之间插上 (k-1) 分点: 如果各层抽样分配方案已定,我们设法求这些分点使得 达到最小。 考虑分配原则为比例分配,且假定各层 相当大,那么 由于: * * §1 分层抽样及估计量 简单随机抽样是最基本的抽样手段,在一些小型的抽样调查中被人们采纳。所谓小型是指总体容量N 较小,当总体容量N 较大时,不便采用简单随机抽样方法。这时,分层抽样将起到作用。 第四章 分 层 抽 样 根据调查的要求,将总体 N 划分为若干个子总体 (通常用总体或子总体的容量大小来表示总体或子总体本身),实质上是将总体分为 k 层。独立地在各层中进行抽样,称为分层抽样。如果在各层中的抽样都是简单随机进行,则称为分层随机抽样,所得的样本称为分层随机样本。 总体如何分层是一门学问。 一般来说,按照调查的目的要求,从地区、民族、指标 的反映程度等因素出发考虑分层。因为一项社会经济调查, 常常不仅需对总体的有关参数进行估计,而且对一定群体的 相应参数也需要估计。例如,调查全国的消费物价指数,同 时想知道各省市的消费物价指数,根据这种要求自然以全国 所有省市作为层来进行抽样。如果我们希望在样本中有某些 子总体的代表,比如前面所讲的民族的代表,那么分层就要 考虑到这些子总体作为独立的层。 应当注意,按照某种因素或特征进行分层时,各层之间 具有明显的区分界限将会提高估计的精度。样本既然考虑到 各种类型的代表性,那么这样获取的样本就更能代表总体, 直观告诉我们,这种样本用来估计总体会达到较小的误差。 各层中的抽样是独立进行的。这一事实还包括在各层中 所采取的抽样手段完全可以不相同,在一个层进行简单随机 抽样,在另一层则可采用更复杂一些的抽样,完全视各层的 情况不同而定,这种因地制宜的手段将使样本尽可能反映总 体的特性以及子总体的特性。 现在考虑分层抽样的具体估计方法,首先引进一些符号 1、符号 总体N= 第 h 层的单元标志值记为 ,从该层抽 取的样本记为 ,第 h 层子总体的总体平均 数为