Quant > 数据分析 > 正态分布

正态分布

收藏 纠错
正态分布 收藏 纠错

作者: 发布时间:2022-09-14

正态分布

高斯分布(Gaussian)(正态分布)的概率密度函数为一钟型曲线,即

a为均值,为标准方差,曲线关于x=a的虚线对称,决定了曲线的“胖瘦”,形状为:

 

 





 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

 

圖1                 

 

高斯型随机变量的概率分布函数,是将其密度函数取积分,即

(★), 表示随机变量A的取值小于等于x的概率。比如A的取值小于等于均值a的概率是50%。曲线为

 

 





 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


如果前面看得有些头大也没有关系,结合具体题目就很容易理解了J

  1. 一道正态分布:95%〈26,75%〈20,85%〈r,问r与23的大小,答小于

    解:   由图2,正态分布的分布函数F(x)在其期望a的右方曲线是向上凸的,此时        

    F(20)=75%,F(r)=85%,F(26)=95%,        

     

     





     

             

             

             

             

             

             

             

             


如果把曲线的片段放大就比较清楚了。O为AB的中点。

A(20, 75%)

B(26, 95%)

O(23, 85%)

C(r,  85%)

由于曲线上凸,显然C的横坐标小于O,所以r<23。

补充:如果问的是曲线的左半部分或者其他一些情况,只要画一下图就很easy了。

 

 

 

 

 

2) 正态分布题好象是:有一组数平均值9,标准方差2,另一组数平均值3,标准方差1,问分别在(5,11)和(1,4)中个数(概率)谁大,应该是相等。

解:

令图1中的曲线a=0, , 就得到了标准正态分布,曲线如图3。

 

 





 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


此时问分布在区间(x1, x2)的概率,就是图中的阴影面积。注意此时的曲线关于x=0对称。

(★)对于一般的正态分布,可以通过变换,归一化到标准的正态分布,算法为:

设原正态分布的期望为a,标准方差为,欲求分布在区间(y1, y2)的概率,可以变换为求图3中分布在(x1, x2)间的概率。其中

 

比如题目中a=9,, 区间为(5, 11),则区间归一化为(-2,1),即

同理,a=3,, 区间为(1, 4),则区间归一化后也为(-2,1)。

所以两者的分布概率相等。

估计最难的题也就是利用钟型曲线的对称性,比如归一化后的区间并不相同,

而是(-2,1)和(-1,2),但根据对称性,仍然可以比较概率的大小。

救命三招

1.代数法

往变量里分别代三个数(最大,最小,中间值)看看满足不满足

2.穷举法

分别举几个特例,不妨从最简单的举起,然后总结一下规律

3.圆整法

对付计算复杂的图表题,不妨四舍五入舍去零头,算完后看跟那个答案最接近即可


21 )