󰊒返回

统计学抽样分布课件PPT

  • 类别:大学PPT模板
  • 编号:219080
  • 大小:581.00 KB
  • 文档上传者:林莽

PPT预览

  • 统计学抽样分布课件PPT

PPT摘要

统计学抽样分布课件PPT下载是由PPT宝藏(www.pptbz.com)会员林莽上传推荐的大学PPT模板, 更新时间为2018-01-16,素材编号219080。

这是统计学抽样分布课件PPT,主要介绍区分不同的抽样方法,抽样分布的概念,计算样本平均数和样本比例相关的概率,中心极限定理的重要性。架构是对组成总体的一系列条目的列举。架构是类似总体清单,目录或者地图的数据源。如果架构里没有包括总体的某些部分,不准确或者有偏的结果可能产生。 使用不同的架构得到数据会得出不同的结论。欢迎点击下载统计学抽样分布课件PPT哦。

第7章 抽样和抽样分布学习目标在本章中你将学到: 区分不同的抽样方法抽样分布的概念 计算样本平均数和样本比例相关的概率中心极限定理的重要性 为什么需要样本? 选择样本比总体(人口普查)中的每一项要节省时间。 选择样本比总体中的每一项要节省费用。 分析样本要比分析整个总体容易且更加实际。抽样过程从抽样架构开始架构是对组成总体的一系列条目的列举。架构是类似总体清单,目录或者地图的数据源。如果架构里没有包括总体的某些部分,不准确或者有偏的结果可能产生。 使用不同的架构得到数据会得出不同的结论。样本类型样本类型:非概率样本在非概率样本中,选中的条目不根据他们发生的概率。在便利抽样中,条目的选择简单,便宜,且方便抽样。在判断样本中,我们得到预先选好的专家就主题发表的意见。样本类型:概率样本在概率样本中, 样本中条目的选择基于已知的概率。概率样本:简单随机样本架构里的每一个条目都有同等的机会被选中 抽样可以放回(选择了某一个条目之后再把它放回架构里,它再次被选中的概率仍然相同)或者不放回 (选择的某一个条目,不能放回架构中)。 样本通过随机数表或随机数产生器取得使用随机数表选择简单随机样本有850条目的总体抽样架构条目名 条目号Bev R. 001 Ulan X. 002 . . . . . . . . Joann P. 849 Paul F. 850 概率样本:系统样本取决于样本容量: n 架构中N个体分成含k个体的组: k=N/n 从第一组随机选择一个个体接下来,每数到第k个数都依次选取 概率样本:分层样本根据一些常见的特征,把总体分成两个或两个以上的亚群体,即层(strata)。在每个层中根据层容量相应选择简单随机样本。分层选择的样本然后加以合并。当抽样总体是选民时,根据种族或社会经济层次分层是常用的技术。概率样本: 群样本总体分为若干个 “群样本,”每个群代表整个总体。随机选择群样本使用选中的群里的所有项目或者从群里面选取基于概率的样本。群样本的通常应用是选举,其中选择特定选区并抽样。概率样本:比较抽样方法简单随机样本和系统样本使用简单可能不能很好的代表总体的潜在特性分层样本确保代表的个体覆盖整个总体群样本成本效率更高有效性较低(需要更大的样本以取得同等程度的精确性) 估计调查价值调查的目的是什么? 调查是否基于概率样本? 覆盖误差– 合适的架构? 无回复误差– 跟随测量误差– 好的问题引出好的回复抽样误差– 一直存在调查误差类型覆盖误差或选择偏误如果有些条目组没有被包括在架构里,没有机会被选到,就会产生。无回复误差或偏误不回复的人于回复的人可能是不同的。抽样误差随着样本的不同而不同,且是一直存在的。测量误差由于问题设计的缺陷,,回答的误差和受访者回复的努力 (“霍索恩效应”) 调查误差类型覆盖误差无回复误差抽样误差测量误差抽样分布抽样分布就是选出所有可能的样本情况下结果的分布 例如, 假设根据那么学院学生的平均成绩选择50个学生。 如果得到很多不同的50个学生的样本,将计算每个样本不同平均数。我们可以计算对于任意给定的50个学生的样本,我们对所有潜在的平均成绩感兴趣。建立抽样分布假设总体… 总体容量N=4 随机样本变量, X, 是个体的年龄 X的观测值: 18, 20, 22, 24 (岁) 建立抽样分布现在考虑容量n=2的所有可能的样本所有样本平均数的抽样分布该抽样分布的概括度量: 比较总体分布与样本平均数的分布样本平均数抽样分布:平均数的标准差同样总体相同容量的不同的 样本导致不同的 样本平均数样本与 样本之间平均数的变动用平均数的标准差来度量: (这假设是有放回的抽样或者无限总体无放回的抽样) 注意平均数的标准差随着样本容量 增加而减少样本平均数抽样分布:总体服从正态分布总体服从正态分布,平均数μ 且标准差σ, 抽样分布 也服从正态分布 且 平均数抽样分布的Z值 抽样分布的Z值: 抽样分布特征 (也就是说 是无偏的 ) 抽样分布特征 随着n增加, 减小确定包括固定比例的样本平均数的区间对于µ附近对称分布的包含95%的样本平均数区间当 µ = 368, σ = 15且n = 25. 因为区间包含95% 的样本平均数 ,5% 的样本平均数 将在区间之外因为区间是对称的,2.5%将大于上边界且2.5%将小于上边界。从 标准正态分布表, 2.5% (0.0250) 低于其的Z值是 -1.96 且2.5% (0.0250) 高于其的Z值是 1.96 。确定包括固定比例的样本平均数的区间计算区间的下边界 计算区间的上边界 样本容量为25的所有样本平均数中的95%位于 362.12和373.88之间样本平均数抽样分布:总体非正态分布我们可以使用中心极限定理: 即使总体非正态分布, …总体的样本平均数 将近似正态分布只要样本容量足够的大. 抽样分布的特征 : 且中心极限定理样本平均数抽样分布:总体非正态分布多大是足够的大?对于大多数分布, n > 30 将导致抽样分布近乎正态分布对于完全对称分布, n > 15 一般足够导致抽样分布近乎正态分布对正态分布的总体,平均数的抽样分布总是服从正态分布例子假设总体的平均数μ = 8 且标准差σ = 3. 假设选中容量n = 36随机样本。 样本平均数介于7.8和8.2之间的概率是多少? 例子结论: 即使总体非正态分布, 中心极限定理可以应用 (n > 30) … 因此抽样分布近乎正态分布 … 且平均数 = 8 …且标准差 例子 结论(续): 总体比例 π = 有着某种特性的总体的比例 样本比例 ( p ) 提供π的估计: 0 ≤ p ≤ 1 当n比较大时,p 近乎正态分布 (假设是有放回的抽样或者无限总体无放回的抽样) p的抽样分布近乎正态分布分布,如果: 其中 且比例的Z值例子如果支持A主张的投票者的真正比例是π = 0.4,容量200 的样本导致样本比例介于0.40与0.45之间的概率是多少? 例子 if π = 0.4且n = 200, P(0.40 ≤ p ≤ 0.45)是多少 ? 例子 if π = 0.4且n = 200, P(0.40 ≤ p ≤ 0.45)是多少 ? 小结讨论了概率与非概率样本叙述了四种常见概率样本讨论了调查价值 和调查误差的类型介绍了抽样分布叙述了平均数的抽样分布对于正态分布总体使用中心极限定理叙述了比例的抽样分布使用抽样分布计算概率

热门推荐

推荐