Sun
您当前的位置: www.6460.com > www.6460.com >

区间估量小结 (重置抽样) (不重置抽样) 第一

浏览次数: | 时间:2019-11-01

  请盲目恪守互联网相关的政策律例,严禁发布、、的言论。用户名:验证码:匿名?颁发评论

  统计学概论 第四章 参数估量 统计揣度的过程 进修方针 理解概率及概率分布的意义; 控制抽样的根基概念以及抽样分布的概念; 控制总体参数点估量的根基方式及其优秀尺度; 控制总体均值和成数目标的估量方式; 领会抽样设想的根基内容。 本章内容 概率取概率分布 抽样分布 总体参数估量 抽样设想 本章内容 概率取概率分布 抽样分布 总体参数估量 抽样设想 本章内容 概率取概率分布 抽样分布 总体参数估量 抽样设想 靠得住性是抽样估量本身准确性的一个概率,凡是称为估量的相信度。 精度要求取靠得住性要求凡是是一对矛盾。 参数估量的方式 估量量的优秀性原则 ——(无偏性) 例: 估量量的优秀性原则 ——(无效性) 估量量的优秀性原则 ——(分歧性) 分歧性:跟着样本容量的增大,估量量越来 越接近被估量的总体参数 区间估量(概念要点) 1. 按照一个样本的察看值给出总体参数的估量范畴 2. 给出总体参数落正在这一区间的概率 3. 例如: 总体均值落正在50~70之间,相信度为 95% 相信区间估量(内容) 落正在总体均值某一区间内的样本 相信程度(相信度) 1、总体未知参数落正在区间内的概率 2、暗示为 (1 - ???? ??为显著性程度,是总体参数未正在区间内的概率? 3、常用的显著性程度值有 99%, 95%, 90% 响应的 ??为0.01,0.05,0.10 区间取相信程度 影响区间宽度的要素 1. 数据的离散程度,用 ? 来测度 2. 样本容量, 3. 相信程度 (1 - ?),影响 Z 的大小 例: 总体平均数的区间估量 第一,样本抽取后,用简单算术平均或加权平均的方式计较样本平均数 。 第二,汇集总体数量标记方差的经验数据或计较样本数量标记方差S2。 第三,计较抽样平均数的平均误差: 总体成数的区间估量 本章内容 概率取概率分布 抽样分布 总体参数估量 抽样设想 . . . . 。 弥补功课 1、某种零件长度从命正态分布,从该批产物中随机抽取9件,测得其平均长度为21.4 mm。已知总体尺度差? =0.15mm,试成立该种零件平均长度的相信区间,给定相信程度为0.95。 2、 某大学从该校学生中随机抽取100人,查询拜访到他们平均每天加入体育熬炼的时间为26分钟。试以95%的相信程度估量该大学全体学生平均每天加入体育熬炼的时间(已知总体方差为36小时2)。 3、从一个正态总体中抽取一个随机样本, n = 25 ,其均值为50 ,尺度差 s = 8。成立总体均值m 的95%的相信区间。 4、某企业正在一项关于职工流动缘由的研究中,从该企业前职工的总体中随机拔取了200人构成一个样本。正在对其进行拜候时,有140人说他们分开该企业是因为同办理人员不克不及和谐相处。试对因为这种缘由而分开该企业的人员的线、一家告白公想估量某类商铺客岁所花的平均告白费用有几多。经验表白,总体方差约为1800000元2。如相信度取95%,并要使估量处正在总体平均值附近500元的范畴内,这家告白公司应抽多大的样本? 6、一家市场调研公司想估量某地域有彩色电视机的家庭所占的比例。该公司但愿对比例p的估量误差不跨越0.05,要求的靠得住程度为95%,应抽多大容量的样本(没有可操纵的p估量值)。 7、选择: (1)假定样本容量添加50%。则反复抽样平均误差:(甲)为本来的一半;(乙)为本来的81.6%。正在反复抽样时,为使误差削减50%,则样本容量:(丙)应添加三倍;(丁)应添加四倍。( ) A.甲丙 B.甲丁 C.乙丙 D.乙丁 (2)抽样估量中的抽样误差( ) A.是不成避免的 B.能够通过改良查询拜访方式避免的 C.是能够使用数学公式计较的 D.误差大小是能够加以节制的 E. 包含了登记性误差 (3)抽样平均误差目标申明( ) A.样本平均数的代表性 B.抽样目标的代表性 C.估量值取现实值的平均误差 D.样本目标相对于总体目标离差的平均程度 E.抽样误差的大小 (4)从一个全及总体中能够抽取一系列样本,所以() A.样本目标的数值不是独一确定的 B.样本目标是样本变量的函数 C.总体目标是随机变量 D.样本目标是随机变量 E.样本目标数值跟着样本的分歧而分歧 (5)影响抽样数目(样本容量)的要素有( ) A.答应误差范畴 B.抽样目标的大小 C.抽样方式 D.总体标记变异程度 E.概率程度 (6)从出产线分钟的产物进行查验,这种体例属于( ) A.等距抽样 B.类型抽样 C.整群抽样 D.简单随机抽样 7. 标记不存正在变异时,意味着:( ) A.各标记值(1或0)碰到同样的成数(0.5) B.总体所有单元都只具有某属性——只使用变量值“1” C.总体所有单元都只具有某属性——只使用变量值“0” D.所计较的方差为0 E.所计较的方差为0.25 8.抽样揣度的相信度、概率度和切确度关系表示正在( ) A.概率度增大,估量的靠得住性也增大 B.概率度增大,估量的切确度下降 C.概率度缩小,估量的切确度也缩小 D.概率度缩小,估量的靠得住性也增大 E.估量的靠得住性增大,估量的切确度也增大 计较: 1.从某大公司的10000女工中随机抽取100名,查询拜访她们每天家务劳动时间,材料如下: 2.一家公司随机抽取了100个坏帐,经计较,其平均余额为5570元,样本尺度差为725元,试以90%的概率程度估量该公司的平均坏帐余额区间。 另一家公司也为估量坏帐而抽出了100个坏帐,这些坏帐的尺度差为285.3。现在公司但愿坏帐极限误差不跨越35元,相信度95%,则应抽取几多份坏帐? 抽样设想 整群抽样 整群抽样就是将总体各单元分成若干群,然后从此中随机抽取部门群,对当选的群进行全面查询拜访的抽样组织体例。 正在总体单元数很大时,若是间接从总体中抽取总体单元,有时是很坚苦的,好比从一个大城市中的所有大学生中抽样领会大学生的根基环境,这个城市的大学生人数有几十万之众,间接抽取样本单元有很多坚苦。若是按整群抽样,以班级为抽样单元,从全数学校的所有班级中抽出部门班级,查询拜访抽中的班级,就便利多了。 抽样设想 整群抽样 设总体的全数N个单元被划分为R群,每群含有M个单元。现正在从总体R群中随机抽出r群构成样本,对当选的群中的所有单元进行全面查询拜访。群的平均数是: 样本平均是: 从上式能够看出,整群抽样本色上是以群取代总体单元,以群平均数取代总体单元标记值之后的简单随机抽样。 (i=1,2,…,r) 抽样设想 整群抽样 【例4-16】假设某水泥厂大量持续出产100公斤拆水泥,一日夜产量为14 400袋,平均每分钟产量10袋。现每隔144分钟抽取一分钟的产量(10袋为一群),一日夜共抽取100袋水泥,察看成果如下: 试按照表中的数据,计较样本平均数的抽样平均误差,并以95%的概率估量每包水泥分量的区间范畴。 抽样设想 等距抽样 等距抽样又称机械抽样或系统抽样,它是将总体各单元按某一标记进行陈列,然后按固定的间隔来抽取样本单元的抽样组织形式。 按照需要抽取的样本单元数n和总体的单元数N,能够计较出等距抽样的间隔大小: k=N/n 先从排序后挨次是1,2,…,k 的第一部门中随机抽出第i个单元,然后正在挨次是k+1,k+2,…,2k的第二部门中取出第k+i个单元,再从挨次是2k+1,2k+2,…,3k的第三部门抽取第2k+i个单元,…,最初从挨次是(n-1)k+1,(n-1)k+2,…,nk的第n部门抽取第(n-1)k +i个单元,一共n个单元形成样本。 抽样设想 等距抽样 用等距抽样体例抽取一个样本后,就能够计较样本平均数。环节是这个平均数的平均误差若何确定。一般说来,排序后总体被分成n个部门,每一部门包含k个单元,从中随机抽取一个单元,其余单元环境未知,每一部门中的方差不成计较,一般也没有汗青材料替代。因而,间接计较等距抽样的平均误差是有坚苦的,只能以间接体例计较其近似值。 抽样设想 等距抽样 若是用来列队的标记取所要研究的目标没相关系,第一个单元是随机抽取的,那么它的抽样误差就取简单随机抽样误差相接近。为了便利起见,能够采用简单随机抽样的平均误差取代等距抽样平均误差: 等距抽样一般都是不反复抽样。总体方差不知,常用样本方差取代。 抽样设想 等距抽样 【例4-17】某块麦地长300米,宽120米,包罗120条垅,每垅长300米。现从这块麦地按等距抽样的体例,抽取50个2米长垅为样本单元进行实割实测。样本距离为麦垅总长除以样本单元数,即300×120/50=720(米)。现从地角一边样本距离之半处抽取第一个样本单元,即从360米点前后各1米为第一个样本单元,当前每隔720米取一个样本单元,一曲抽取出50个样本单元为止。实测各样本单元产量如表4-8。试计较平均亩产量的抽样平均误差,并以95%的概率估量这块麦地的亩产量和总产量。 这块麦地的面积是: 300×120=36 000(平方米), 折合为360×0.15=54(亩)。 因为样本单元垅长是2米,所以每亩含样本单元数是: 1/2×总垅长/面积=1/2×36 000/54≈333个。 平均亩产量=样本平均产量×每亩含样本单元数 平均亩产量是: 1.2×18 000/54=400(公斤) 抽样设想 阶段抽样 若是总体的范畴很大,有需要采用阶段抽样的组织形式。所谓阶段抽样,就是先从总体中抽出较大的范畴的单元,再从当选的大单元中抽较小范畴的单元,顺次类推,最初从更小的范畴抽出样本根基单元。这种抽样体例正在我国的农产量查询拜访、职工家计查询拜访中都很合用:先从全国抽出各个省,再从抽中的省中抽出县、市,最初抽出样本的根基单元等等。 抽样设想 阶段抽样 为了简化问题,以下阐发两阶段抽样平均误差的节制问题。两阶段抽样正在组织手艺上能够当作是整群抽样和类型抽样的连系。设总体分成R组,每组M个单元。两阶段抽样就是:第一阶段用整群抽样体例从总体的全数R组(群)中,随机抽取r组(群);第二阶段用类型抽样体例从每个当选组中抽出m样本单元。 抽样设想 分歧抽样组织设想的比力 简单随机抽样是根基抽样组织体例 抽样揣度结果若何,依赖于所抽出样本的质量;样本的质量黑白,就看样本对总体的代表性若何。代表性好的样本,能从总体中“带出”更多相关总体的消息,样天职布取总体分布两者间存正在亲近的联系性取类似性。要做到这一点,起首就要避免抽样人员的“客不雅”影响,降服由此发生的“”,因而,抽取样本都要求满脚“随机性”。 抽样设想 分歧抽样组织设想的比力 例如,类型抽样先将总体分成分歧的部门,再从每一个部门中抽取出一些单元,配合构成样本。由于每一部门都需进行抽样,虽然划分过程不存正在随机性,可是,再从每部门中取样时,就必需服从随机准绳。 抽样设想 分歧抽样组织设想的比力 对整群抽样也是如许,虽然对抽中的群进行全面查询拜访,不存正在随机性要求,可是,群是若何抽取的?是把“群”当作抽样单位,通过简单随机抽样抽出来的,正在抽取群时,就满脚随机准绳了。任何概率揣度,抽样设想时都招考虑正在某个阶段或某个环节上服从随机性要求,不然的话,样本的代表性就值得思疑,抽样揣度就无从进行。 抽样设想 分歧抽样组织设想的比力 类型抽样取整群抽样比力 类型抽样的平均误差取组间方差无关,决定于组内方差的平均程度;整群抽样的平均误差取组内方差无关,决定于组间方差大小。总体方差等于组间方差加上组内方差平均数。我们由此可推导出减小类型抽样取整群抽样平均误差的方式。 抽样设想 分歧抽样组织设想的比力 类型抽样取整群抽样比力 减小类型抽样平均误差的法子。提高组间方差,降低组内方差。具体来说,就是使类型抽样的各部门内部单元差别尽可能地小,分歧类型间的差别尽可能地大。若是组间方差接近于总体方差,申明组内方差接近于0,这时组内单元根基上没有差别,这是一种极端环境,类型抽样的平均误差接近于0。 抽样设想 分歧抽样组织设想的比力 类型抽样取整群抽样比力 减小整群抽样平均误差的法子。为了降低抽样平均误差,该当设法降低群间方差。可通过提高群内方差方式达到降低群间方差目标。因而,类型抽样取整群抽样对总体进行分组的要求刚好是相反的: 类型抽样要尽量提高组间方差降低组内方差; 整群抽样应尽量提高组内方差降低组间方差。 也就是说,类型抽样时,尽量使各组内的单元差别减小,各组间的单元差别增大;整群抽样时刚好相反。 抽样设想 分歧抽样组织设想的比力 阶段抽样平均误差的节制 阶段抽样的特点是将抽样过程分成了几个阶段,每个阶段都有可能惹起抽样的误差,因而阶段抽样误差的节制必需落实到抽样的各个阶段,抽样过程只需有一阶段误差失控都有可能使整个抽样结果达不到抱负。两阶段抽样误差节制,要落实为第一阶段的整群抽样的误差节制取第二阶段的类型抽样的误差节制两方面。 抽样设想 分歧抽样组织设想的比力 阶段抽样平均误差的节制 现实中,人们还能够将抽样误差节制,正在各个阶段进行全体性均衡,以求达到最抱负结果。如两阶段抽样平均误差,既取决于组间方差也取决于组内平均方差,但组间方差是次要的要素。这是由于组间方差凡是大于组内方差,并且抽样平均误差是组间方差的 和组内平均方差 的决定的,前者大于后者。所以正在组织两阶段抽样时正在不异样本容量要求下,恰当添加第一阶段的组数,比添加第二阶段的单元数,能更显著地提高抽样结果。 总体参数估量 区间估量 平均数的区间估量 总体参数估量 区间估量 平均数的区间估量 关于极限误差、抽样平均误差、概率度三者间的关系,有如下成果: 或者: 按照前面正在反复取不反复抽样两种景象下所给出的抽样平均误差,对于给定的相信程度1-α,获得相信区间的公式: 反复抽样 不反复抽样 【例4-10】某地域的委托查询拜访公司估量地域内居平易近平均每日的看电视时间。查询拜访公司随机抽取了100名居平易近进行查询拜访,样本数据显示平均每人每天看电视时间是4个小时。若是已知总体的尺度差σ=1.5小时。试求: (1)该地域内居平易近每天看电视的平均时间的相信区间(相信度是95%); (2)若是要求估量的误差不跨越27分钟,这时相信度是几多? 总体参数估量 区间估量 总体方差未知(?2未知) : 当总体从命正态分布但方差未知时,可用样本的尺度差S取代总体尺度差。彩天下官网,这时统计量是: t从命的分布不是尺度正态分布,而是度为n-1的t-分布(当n很大时,近似正态分布)。因而,总体均值的区间估量是: 平均数的区间估量 总体参数估量 区间估量 总体方差未知(?2未知) : 反复抽样 不反复抽样 平均数的区间估量 总体参数估量 区间估量 平均数的区间估量 【例4-12】某工场要估量一批总数5 000件的产物的废品率,于是随机抽出400件产物进行检测,发觉有32件废品。试给出该批产物的废品率的区间估量(相信度是90%)。 第四,按照概率F(Z)确定Z,计较平均数的极限误差 。 第五,总体平均数的相信区间。 区间估量小结 (沉置抽样) (不沉置抽样) 第一,样本抽取后,计较样本成数。 第二,用样本标记方差p(1-p)或经验数据取代总体标记方差P(1-P)。 第三,计较抽样成数的平均误差: 第四,按照概率F(Z)确定Z,计较平均数的极限误差: 第五,总体平均数P的相信区间。 (沉置抽样) (不沉置抽样) 总体参数估量 样本容量简直定 正在前面我们曾经晓得,极限误差、概率度取抽样平均误差三者间的数量关系是: 。当抽样平均误差连结不变时,极限误差取概率度两者间关系是: Δ增大,z也增大了,Δ减小,z也减小了。 总体参数估量 样本容量简直定 因而,抽样估量的精度取靠得住性之间存正在矛盾: 要提高精度(Δ减小),需以概率度(z减小)为价格; 要提高概率度(z增大),又要以估量精度(Δ增大)为价格。正在 不变的环境下,这对矛盾是不成和谐的;可是,降低抽样平均误差后,就能够同时提高估量的精度取概率度。 总体参数估量 样本容量简直定 例如:通过添加样本容量n来达到降低抽样平均误差方针。 这时该当考虑,样本容量n事实取多大合适?这就是样本容量简直定问题。 估量总体均值时样本容量简直定 总体方差已知,反复抽样 这时有: 上式两边平方拾掇后可得: 这就是正在给定极限误差、概率度要求下,至多应抽取的样本容量。 估量总体均值时样本容量简直定 总体方差已知,不反复抽样 这时有: 上式两边平方拾掇后可得: 估量总体成数时样本容量简直定 反复抽样 不反复抽样 应留意的问题 计较样本容量时,一般总体的方差取成数都是未知的,可用相关材料替代: 一是用汗青材料已有的方差取成数取代; 二是正在进行正式抽样查询拜访前进行几回试验性查询拜访,用试验中方差的最大值取代总体方差; 三是成数方差正在完全缺乏材料的环境下,就用成数方差的最大值0.25取代。 应留意的问题 若是进行一次抽样查询拜访,同时估量总体均值取成数,用的公式同时计较出两个样本容量,可取一个最大的成果,同时满脚两方面的需要。 的公式计较成果若是带小数,这时样本容量不按四舍五入取整数,取比这个数大的最小整数取代。例如计较获得:n=56.03,那么,样本容量取57,而不是56。 抽样设想 抽样估量结果黑白,环节是抽样平均误差的节制。抽样平均误差小,抽样结果从全体上看就是好的;不然,抽样结果就不抱负。 畴前面的阐发晓得,抽样平均误差受以下几方面的要素影响:一是总体的变同性,即取总体的尺度差大小相关;二是样本容量;三是抽样方式(沉置取不沉置)。还有一个主要的要素,就是抽样的组织形式。 沉点控制概念 抽样设想 抽样的组织形式有:简单随机抽样、类型抽样、等距抽样、整群抽样、阶段抽样等。分歧抽样组织设想意味着对总体消息分歧程度的操纵,意味着分歧的查询拜访成本,它们之间抽样结果存正在较大的差别。前面我们会商的抽样组织形式,都是简单随机抽样。接下来我们会商其他几种抽样组织体例及其抽样平均误差。 沉点控制概念 抽样设想 类型抽样 也称为分层抽样,它是按必然标记对总体各单元进行分类,然后别离从每一类中按随机准绳抽取必然的单元形成样本。 类型抽样的前提是对总体的布局有着必然的领会,为了充实操纵这些消息,提高估量的切确性,对总体按确定标记进行分类,抽出的样本取总体尽可能连结类似的布局。 抽样设想 类型抽样 例,抽样查询拜访一个城市居平易近收入分派情况,若是汗青材料反映了该城市居平易近的布局:高收入者、中等收入者取低收入者的比例布局,我们能够按此布局分类别离从高收入者、中等收入者取低收入者中按必然的比例抽取样本。如许就能够避免样本全来自某一收入阶级所发生的系统误差。 抽样设想 类型抽样 设总体由N个单元构成,按对总体的认识,把总体分为k组,使得: N=N1++…+Nk 然后响应从各组平分别按随机体例抽出n1,n2,…,nk个单元构成样本。设样本容量为n,它满脚: n= +n1 + n2 + … + nk 采用比例抽样体例,我们从每一类Ni抽取ni时要求两者间连结合适的比例,也就是连结各组样本单元数取总体同组单元数之比,等于样本容量取总体单元数之比,即: 【例4-15】假设某农场种植小麦1 200亩,按照其地舆前提划分为甲、乙、丙三类,按5%的比例总共抽取60亩进行查询拜访,成果如表4-6所示。试以95%的概率估量农场平均亩产量的区间范畴。 表4-6 25.4 518 60 1200 合计 36 400 12 240 丙 25 460 18 360 乙 20 600 30 600 甲 亩产尺度差(斤) 抽样平均亩产(斤) 抽查面积(亩) 总面子积(亩) 麦田类别 大数取核心极限 大数 大数又称做大数。人们正在察看个体事物时,是连统一切个体的特征来察看的。个体现象受偶尔要素影响,有各自分歧的表示。可是,对总体的大量察看后进行平均,就能使偶尔要素的影响彼此抵消,消弭由个体偶尔要素惹起的极端性影响,从而使总体平均数不变下来,反映出事物变化的一般纪律,这就是大数的意义。 大数取核心极限 大数 大数:同分布的随机变量X1,X2,…,Xn,…设它们的平均数为?,方差为?2。则对肆意负数?,有: 大数取核心极限 核心极限 正态分布的再生 彼此的两个正态随机变量相加之和仍从命正态分布,这就是正态分布的再素性。 因而,从从命正态分布的总体中抽出一个容量是n 的样本,则样本平均数 也从命正态分布。若是总体的平均是?,尺度差是?(X),则样本平均数所从命的正态分布的核心仍是? ,尺度差是抽样平均误差 。 大数取核心极限 核心极限 核心极限 总体参数估量 总体参数估量概述 总体参数估量就是以样本统计量来估量总体参数。 参数估量应满脚以下两个要求:一是估量的切确度要求,二是靠得住性要求。 所谓切确度就是估量误差的最大范畴,即误差的最大值,可通过极限误差来反映; 所谓靠得住性是指估量成果准确的概率大小。 总体参数估量 总体参数估量概述 矩估量法 最小二乘法 最大似然法 挨次统计量法 估 计 方 法 点 估 计 区间估量 总体参数估量 点估量 点估量的定义 点估量就是按照总体参数取样本统计量之间的内正在联系,间接以样本统计量做为响应总体参数的估量量。正在统计中经常利用的点估量量有: 总体参数估量 点估量 【例4-9】对某企业的产物进行抽样查验,设抽出100件产物,此中不及格产物5件,试估量该企业产物的及格率是几多? 我们能够通过样本的及格率来估量企业产物的及格率。样本及格率p =95/100=95%,我们估量该企业产物的及格率是95%。 总体参数估量 点估量 点估量的评价尺度 点估量的长处是间接给出了总体参数的估量值。不脚之处是不克不及供给估量误差的消息。 样本统计量是一个随机变量,从一次抽样的成果来判断一个统计量的好坏是没有来由的,必需通过多次试验或从抽样分布的特点出发,才能判断这个估量量能否为优秀的估量量。 点估量优秀性原则次要包罗:无偏性、无效性和分歧性。 总体参数估量 点估量 无偏性 用?暗示总体的待估量参数, 是估量?的样本统计量,我们说 是?的无偏估量,指的?是满脚: 总体参数估量 点估量 无偏性 无偏性要求用来估量总体参数的样本统计量,其分布是以总体参数实值为核心的。 正在一次具体的抽样估量中,估量量或者大于总体参数,或者小于总体参数; 可是,正在进行反复抽样估量的过程中,所有估量量的平均数该当等于待估的总体参数。这申明,无偏估量要求估量量没有系统误差。 P( X ) X C A ? 无 偏 有 偏 无偏性:估量量的数学期望等于被估量的总体参数 这就是为什么样本方差用n-1的缘由! 总体参数估量 点估量 无效性 和 都是总体参数?的无偏估量量,若是, 则申明估量量 比 更无效。 总体参数估量 点估量 无效性 设总体的方差是 ,我们有: 明显,样本平均数的方差比样本中某个单元的标记值的方差要小,只是其方差的1/n,所以做为估量量,样本平均数愈加无效。 A B ? 中位数的抽样分布 均值的抽样分布 X P(X ) 无效性:一个方差较小的无偏估量量称为一个更 无效的估量量。如取其他估量量比拟, 样本均值是总体均值的更无效的估量量 总体参数估量 点估量 分歧性 分歧性是指跟着样本容量不竭增大,样本统计量接近总体参数的可能性就越来越大,或者,对于肆意给定的误差节制程度,两者间误差高于此节制程度的可能性越来越小,接近于0。 总体参数估量 点估量 分歧性 用公式暗示就是: 公式中,ε为一肆意小的数。上式申明,当n充实大时, 取?之间的误差,能够有很大的把握被节制正在肆意给定的范畴之内。当n趋于无限大时,估量量 依概率于? 。 A B 较小的样本容量 较大的样本容量 ? P(X ) X 总体参数估量 区间估量 所谓区间估量,就是估量总体参数的区间范畴,并要求给出区间估量成立的概率值。设 和 是两个统计量( ),别离做为总体参数?区间估量的下限取上限,则要求: P( )=1-α 式中α(0α1)是区间估量的显著性程度,其取值大小由现实问题确定,经常取1%、5%和10%;1-α称为相信度。 区间估量的寄义 样本统计量 (点估量) 相信区间 相信下限 相信上限 ?2 已知 ?2 未知? 均 值 方 差 比 例 置 信 区 间 ? ? x _ X X = ? ? Z?x 95% 的样本 ? -1.96 ?x ? +1.96?x 99% 的样本 ? - 2.58?x ? + 2.58?x 90%的样本 ? -1.65 ?x ? +1.65?x 均值的抽样分布 (1 - ?) % 区间包含了? ? % 的区间未包含? 1 - a a/2 a/2 总体参数估量 区间估量 总体方差已知(?2已知) : 由抽样分布晓得,若是总体从命正态分布,则样本平均数 ; 若是总体正态性不成立,可是当样本容量n充实大时,近似地也有 因而, 平均数的区间估量 总体参数估量 区间估量 平均数的区间估量 如许,对于给出的显著性程度?,通过(反)查尺度正态分布表可获得临界值Z?/2,满脚: 总体参数估量 区间估量 平均数的区间估量 留意到: 因而,总体平均数正在显著性程度是α时的区间估量为: * 样本 总体 样本统计量 例如:样本均值、比例、方差 总体均值、比例、方差 随机变量 持续型随机变量的概率分布 正态分布:若是持续型随机变量X的密度函数为 则称随机变量X从命均值为?,方差为?2的正态分布,记为X~N(?, ?2) ?=0.6 ?=1 ?=2 随机变量 持续型随机变量的概率分布 尺度正态分布:若是正态分布的密度函数中,?=0,?=1,则如许的正态分布称为尺度正态分布。 尺度正态随机变量正在区间[-Z,Z]取值的概率F(Z)可通过查尺度正态分布概率表获得。 随机变量 持续型随机变量的概率分布 例:设随机变量Z从命尺度正态分布,求以下概率的大小: (1)p(-1Z1) (2)p(0Z2) (3)p(1Z2) (4)p(Z1) 随机变量 持续型随机变量的概率分布 正态分布的尺度化变换:设随机变量X从命正态分布N(?, ?2),则随机变量Z=(X- ?)/?从命尺度正态分布,即Z~N(0,1) 例:假定学生某门学科的测验成就从命均值为60分,尺度差为12分的正态分布,问某一学生的成就正在60分到75分之间的概率应为几多? 解: 随机变量 持续型随机变量的概率分布 【例】 :设随机变量X从命正态分布N(?,?2),试别离求X落正在以?为核心,以?,1.96?,2?,3?为半径的区间内的。 解: 随机变量 持续型随机变量的概率分布 其它常见的持续分布: ?2-分布:设X1,X2,…,Xn是彼此且从命尺度正态分布的随机变量,则称随机变量?2=?Xi2所从命的分布为度为n的?2-分布。 t-分布:设X从命尺度正态分布,Y从命度为n的分布,且它们彼此,则随机变量T=X/?Y/n所从命的分布为度为n的t-分布。 当n?30时, t-分布取尺度正态分布的不同很是小,可用尺度正态分布取代。 F-分布:设X和Y是彼此的分布,度别离是m和n,则称随机变量F=(X/Y).(n/m)所从命的分布为F-分布,称为它的度。 抽样的根基概念 抽样揣度涉及的根基概念: 1.总体取样本 2.样本容量取样本个数 3.总体参数取样本统计量 4.反复抽样取不反复抽样 抽样的根基概念 样本容量取样本个数 样本容量: 指样本包含的总体单元数,一般用n暗示。 一般地说,样本容量大,抽样误差会小,但查询拜访费用会添加,反之,样本容量过小,又将导致抽样误差增大,以至得到抽样揣度的价值。因而,正在抽样设想中应按照查询拜访目标和要求认实考虑合适的样本容量。 抽样的根基概念 样本容量取样本个数 样本个数: 样本个数又称样本可能数目,它是指从一个总体中可能抽取几多个样本。样本个数的几多取抽样方式相关。关于样本个数的计较我们将正在“反复抽样取不反复抽样”中引见。 留意: 这个概念只是对无限总体成心义,对无限总体没成心义! 抽样的根基概念 总体参数取样本统计量 总体参数: 总体分布的参数往往是总体的数量特征,也是统计揣度的对象。 常见的总体参数有:总体平均数目标,总体成数(比率)目标,总体分布的方差、尺度差,等等。它们都是反映总体分布特征的主要目标。 总体成数(也称总体比率)目标是指总体中具有某性质的单元数目正在总体中所占的比沉,它反映了总体的布局特征。 抽样的根基概念 总体参数取样本统计量 样本统计量: 通俗地说,样本统计量是样本的函数。因为样本是从总体中随机地抽出来的,因而,样本统计量也是随机变量。我们操纵样本统计量来估量或揣度总体的参数和数量特征。设已有样本(X1,X2,…,Xn) ,常见的统计量有: 抽样的根基概念 总体参数取样本统计量 样本平均数 样本成数 样本方差 样本尺度差 抽样的根基概念 反复抽样取不反复抽样 反复抽样(或沉置抽样)是指从总体中抽出一个样本单元,记实其标记值后,又将其放回总体中继续加入下一轮抽样。 反复抽样的特点: n个单元形成的样本是n次试验的成果; 每次试验是的,即其试验的成果取上次、后次的成果无关; 每次试验是正在不异前提下进行的,每个单元正在每次试验当选中的机遇(概率)是不异的。 正在反复试验中,样本可能的个数是Nn,N为总体单元数,n为样本容量。 抽样的根基概念 反复抽样取不反复抽样 不反复抽样亦称为不沉置抽样,即每次从总体抽取一个单元,登记后不放回原总体,不加入下一轮抽样。下一次继续从总体中余下的单元抽取样本。 不反复抽样的特点: n个单元的样本由 n 次试验成果形成,但因为每次抽出不反复,所以本色上相当于从总体中同时抽取n个样本单元。 若是考虑挨次,其样本可能个数为 若是不考虑挨次,其样本可能个数为 抽样分布 反复抽样分布 设从总体中抽出的样本为X1,X2,…,Xn,因为是反复抽样,每个Xi,(i=1,2,…,n)都是从总体中随机抽出的,都是取总体同分布的随机变量,而且是彼此的。 我们设总体的平均数为?,方差为?2,则样本平均数的期望值取方不同离是: 样本平均数的抽样分布 抽样分布 反复抽样分布 由概率论知,若是总体是正态分布的,则样本平均数的抽样分布是如下正态分布 这是一个很是主要的结论,有普遍的使用。 40 42 44 46 48 42 44 46 48 50 46,34 46,38 46,42 46,46 46,50 50,34 50,38 50,42 50,46 50,50 34 36 38 40 42 36 38 40 42 44 38 40 42 44 46 34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50 样本平均数 样本 样本平均数 样本 例: 某班组5个工人的日工资为34、38、42、46、50元。 现用沉置抽样的方式从5人中随机抽2个形成样本。共有52=25个样本。 25 合计 1 2 3 4 5 4 3 2 1 34 36 38 40 42 44 46 48 50 频数 样本平均数 结论(反复抽样): 此目标(抽样平均数的尺度差)反映所有的样本平均数取总体平均数的平均误差,称为抽样平均误差,用 暗示。 抽样分布 反复抽样分布 总体成数p是指具有某种特征的单元正在总体中的比沉。正在前面我们曾经晓得,成数是一个特殊平均数,设总体单元总数目是N,总体中有该特征的单元数是N1。设X是0、1变量, 即:总体单元有该特征,则X取1,不然取0,则有: 样本成数的抽样分布 抽样分布 反复抽样分布 样本成数的抽样分布 现从总体中抽出n个单元,若是此中有响应特征的单元数是n1,则样本成数是: P也是一个随机变量,操纵样本平均数的分布性质结论,即有: E(P)=p 抽样分布 不反复抽样分布 样本平均数的抽样分布 某班组5个工人的日工资为34、38、42、46、50元。 现用不沉置抽样的方式从5人中随机抽2个形成样本。共有20个样本。 40 42 44 48 42 44 46 48 46,34 46,38 46,42 46,50 50,34 50,38 50,42 50,46 36 38 40 42 36 40 42 44 38 40 44 46 34,38 34,42 34,46 34,50 38,34 38,42 38,46 38,50 42,34 42,38 42,46 42,50 样本平均数 样本 样本平均数 样本 20 合计 2 2 4 4 4 2 2 36 38 40 42 44 46 48 频数 样本平均数 结论(不反复抽样): 此目标反映所有的样本平均数取总体平均数的平均误差,称为抽样平均误差,用 暗示。 抽样分布 不反复抽样分布 样本成数的抽样分布 对于(0,1)分布的总体, 总体平均数为: 总体方差为: 从总体中抽取容量为n的样本,样本成数P的分布本色是样本平均数的分布。有: 抽样平均误差为: * *

  1.本坐不应用户上传的文档完整性,不预览、不比对内容而间接下载发生的问题本坐不予受理。