文章目录[隐藏]
机器学习是实现人工智能的重要技术之一。在学习机器学习的过程中,我们必须掌握一些基本的数学和统计知识。在小白初学者学习数理统计的过程中,很多人对统计及其分布感到困惑,感觉一头雾水。今天借此机会整理一下关于统计学的知识,希望对大家有所帮助。本文的结构如下:首先,前言介绍了统计学与概率论的关系;然后,引入统计量的概念,并与参数进行比较。然后介绍常见的统计量及其分布;最后是总结。
序
概率论与统计
搞清楚概率论,掌握核心点就够了——概率论研究的是不确定性(一定要牢记)。一般来说,就是利用相关信息来计算具体事件发生的概率。统计学(推断统计学)研究的是利用样本推断总体,即反映局部的总体。前面几篇和概率论相关的文章,这一篇是关于统计的,不要混淆。
统计的
在介绍统计学之前,我们先明确以下总体、样本、变量的含义。
举个简单的例子,以学校学生为研究对象,学校所有学生人数为整体,然后选取100名学生进行研究,那么这就是样本。变量是研究对象的特征,如学生的年龄、身高等。每个学生的身高年龄都不一样,所以叫“变异”。
那么统计数据是什么呢?统计量是通过计算样本得到的样本的描述值。不是统计总数据得到的数量。还是那句话,统计学计算的是样本,而不是总体。也就是说,统计量是由样本数据计算出来的统计指标,是样本的函数,没有参数。
同时,很自然的,我们会想,我们把计算人口得到的描述性值叫做什么?我们称之为参数。一般来说,我们认为人口是无限的,所以参数很难找出是未知的,但可以确定。但众所周知,统计数据会发生变化。
常见统计数据及其分布
常见的统计包括样本均值、样本方差、样本标准差等。统计量的分布称为抽样分布。这里说明一下,统计学中的样本是一个随机变量,因为样本是按照一定的规则从总体中随机抽取的,它是随机的、独立的。
采样平均
样本平均值是样本的平均值。
样本方差、样本离差
它用来衡量随机变量和期望值之间的偏离程度。
样品标准偏差
样本标准差是样本方差的算术平方根。
三样本分布
统计学中三种重要的抽样分布是卡方分布、t分布和f分布。
分布
如果随机变量X1.....Xn相互独立且服从标准正态分布N(0,1),则该分布即随机变量x2 = x12...xn2服从的是自由度为n的χ2分布,也称为卡方分布。
卡方分布的结论是其均值为n,方差为2n。卡方分布可以帮助我们识别常规事件中的异常现象。
t分布
如果X1服从标准正态分布N(0,1),X2服从自由度为N的χ2分布,X1和X2相互独立,那么随机变量t=X1/(X2/n)1/2次方服从自由度为N的t分布
t分布适用于大样本和小样本。
f分布
若X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,X1和X2相互独立,则随机变量F=(X1/m)/(X2/n)服从F分布,其中第一自由度为m,第二自由度为n
摘要
统计是关于样本的统计指标。统计量的分布称为抽样分布。三种常见的抽样分布是卡方分布、t分布和f分布。这三种分布可用于假设检验。详细过程我们稍后分享。欢迎大家继续作者。
欢迎在评论区交流!#科技新星创造营# #科技新星创造营# #机器学习# #人工智能# #概率统计#
以上就是由优质生活领域创作者 深圳生活网小编 整理编辑的,如果觉得有帮助欢迎收藏转发~
本文地址:https://www.szbubu.com/2699496.html,转载请说明来源于:深圳生活网
声明:本站部分文章来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。分享目的仅供大家学习与参考,不代表本站立场。