目录

一、一元高斯函数推导过程

1.一元高斯分布的基本形式

2.推导过程

二、多元高斯分布

1. 二元高斯分布

2.n元高斯分布


一、一元高斯函数推导过程

参考链接:https://zhuanlan.zhihu.com/p/647353406

1.一元高斯分布的基本形式

f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(x-\mu)^2}{2\sigma^2})

2.推导过程

假设我们在观察某一个过程中得到一系列数据,记作x_{1},x_{2},\ldots,x_{n},其平均值为 \theta=\frac{x_1+...+x_n}{n};这样每次观察产生的距离平均值的误差e_i=x_i-\theta,我们希望找到一个概率密度函数为 f(e),能够使得下面的似然函数最大。所以高斯分布的本质就是,找到一个分布,当前样本和平均值的差为这个分布的随机变量,希望找的这样的一个分布,能够使当前这个采样情况出现的概率最大!

L(\theta)=f(x_i-\theta)\ldots f(x_n-\theta)(1)

接着对似然函数取对数,之后求导,因为最大值,一定是极大值,此处导数为0,所以求导让其为0。我们的目的是当x取值为当前采样点的时候,这个时候似然函数取最大值,所以需要对x求偏导,之后将此时采样的x带入,所有的偏导为0。先取对数。

\mathrm{ln(L(\theta))=\sum^nlnf(x_i-\theta)}(2)

对上述公式(2)取偏导数,之后构造一个新函数:

g(x)=\frac{f^{\prime}(x)}{f(x)}(3)

这样,公式(2)求偏导数,之后再使用g(x)替换后结果可以转化为

\begin{aligned} \sum_1^ng(x_i-\theta)=0 \end{aligned}(4)

之后

\begin{aligned} & g^{\prime}(x_{1}-\theta)(1-\frac{1}{n})+g^{\prime}(x_{2}-\theta)(-\frac{1}{n})+\ldots+g^{\prime}(x_{n}-\theta)(-\frac{1}{n}) & & =0 \\ & g^{\prime}(x_{1}-\theta)(-\frac{1}{n})+g^{\prime}(x_{2}-\theta)(1-\frac{1}{n})+\ldots+g^{\prime}(x_{n}-\theta)(-\frac{1}{n}) & & =0 \\ & g^{\prime}(x_{1}-\theta)(-\frac{1}{n})+g^{\prime}(x_{2}-\theta)(-\frac{1}{n})+\ldots+g^{\prime}(x_{n}-\theta)(1-\frac{1}{n}) & & =0 \end{aligned}(5)

公式(7)可以写成下面的矩阵形式

求解这个齐次线性方程组可以得到一组通解

g^{\prime}(x_i-\theta)=c(1,1,\ldots1)^T

也就是说,g(x)的导数是一个常数,于是有

g(x)=cx+b,(10)

将公式(10)带入公式(5),可以得到

\sum_1^ng(x_i-\theta)=c(x_1-\theta)+\ldots+c(x_n-\theta)+nb=0

由于\theta=\frac{x_1+...+x_n}{n}那么得到b为0,于是乎

g(x)=\frac{f^{\prime}(x)}{f(x)}=cx

求解这个微分方程得出,求解过程在备注1

f(x)=ke^{\frac{1}{2}cx^2}

由于f(x)必须满足在-∞到+∞上的积分为1,那么令c=-\frac{1}{\sigma^{2}},根据备注2,可以得出

k=\frac{1}{\sqrt{2\pi}\sigma}

将x = xi-θ带入,可以得出,其中那个x表示xi,u表示θ。

二、多元高斯分布

1. 二元高斯分布

考虑到X,Y都满足一元高斯分布,X,Y相互独立的条件下,可以得到XY的混合概率密度分布为

其实上面的这个式子可以写成,其中这个\mathbf{\Sigma}表示X,Y的协方差矩阵,上述的式子等同与\mathbf{\Sigma}为对角矩阵时候的结果。当XY不是相互独立的时候也满足下面的式子,不过是\mathbf{\Sigma}非对角线不为0了,推导比较复杂。

2.n元高斯分布

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐