未登录,请登录后再发表信息
最新评论 (0)

抽样分布

StatQuest: Sampling A Distribution

大家好 欢迎来到《征服统计学》
本频道由北卡罗莱纳大学教堂山分校
遗传学系的朋友友情提供
今天我们要谈论的是抽样分布
或者说从分布中获取样本
这是我们在《征服统计学》中一直做的事
所以我想做一个可供参考的视频
而不是一次又一次地机械重复
那么让我们开始吧
我们有一个身高测量的直方图
每个红点代表测量不同的人
直方图的最高区域显示
测量值最可能分布的区域
在这种情况下
我们测量的大多数人
都在5.7–6英尺之间
直方图的低处显示测量值出现的可能较小
这种情况下
我们没有测量到很多身高低于4.5英尺
或者高于6.5英尺的人
我们可以用平滑的曲线来近似拟合直方图
你们应该已经从《征服统计学》的统计分布
这节课中学习了相关知识
我们今天想知道的是
从一个分布中抽取样本意味着什么
这意味着我们可以利用计算机
基于直方图或近似曲线来选一个随机数
例如
如果我们想从这个分布中提取一个样本
很大概率计算机
会在直方图和曲线最高的中间区域取值
然而 有时候计算机就会从边缘处取值
也就是直方图和曲线的最低区域
为什么要从一个分布中抽样?
我们这样做是为了研究统计数据
电脑可以生成许多的样本
我们可以把它们代入到统计检验中
来看看会发生什么
因为我们知道原分布是什么
我们可以将期望值与实际值进行比较
举个例子
我从单一分布中抽取两组样本(N=3)
然后对这些样本进行t检验
在这种情况下
N等于我们在每个样本中测量的次数
因为分布是相同的
那么t检验应该给我一个很大的p值
通过大量的检验
会让我们得到t检验给出大p值的频率
如果我有两个独立的分布
t检验应该会给我一个很小的p值
如果我多次取样
我就可以做很多次的t测试
看看t检验是如何给出小p值
以及给出小p值的频率
这会告诉我是否需要增加样本量
从单分布或混合分布中抽取样本
即让计算机生成一组反映分布概率的随机数字
可以让我们确定统计检验
在无大量实际工作的情况下能做什么
本期视频到此为止
期待《征服统计学》下次更精彩的视频吧

发表评论

译制信息
视频概述

关于统计数据与t测试的重要性

听录译者

收集自网络

翻译译者

F_YF

审核员

审核员BY

视频来源

https://www.youtube.com/watch?v=XLCWeSVzHUU

相关推荐