[推断统计] 点估计-极大似然法学习

一、极大似然原理的理解

      通俗的理解,极大似然原理含义就是,世界上之所以会发生某些事件,是因为它发生的概率大。
      例如有一个博客的例子是:假设引起XX现象和YY现象的原因有AABB两种。假设

  • AA原因情况下,XX现象发生的概率远大于YY现象发生的概率。
  • BB原因情况下,YY现象发生的概率远大于XX发生的概率。
  • 那么,假设现在观察到XX现象,即事件已经是确定的了。此时,原因是AA还是BB呢?

      :实际上AABB的可能性都存在。但是如果必须要选择一个原因的话,那么可能选择AA更为稳妥,这种思考方式就是“极大似然原理”。

二、样本的似然函数

      极大似然估计和关于极大似然估计性质的阐述是费希尔的研究成果。费希尔的思想通过下面的例子说明:如果随机选取离散随机变量YYnn个观测值y1,y2,...,yny_1,y_2,...,y_n,如果概率分布p(y)p(y)是单个参数θθ的函数,那么观测到的YY的这nn个独立值的概率是:p(y1,y2,...,yn)=p(y1)p(y1)(yn) p(y_1,y_2,...,y_n)=p(y_1)p(y_1) {\cdots} (y_n)
      费希尔称样本值y1,y2,...,yny_1,y_2,...,y_n的联合概率为L\color{red}样本的似然函数L。同时,建议应该选择使LL达到最大的值作为总体参数θθ的估计值。

相关定理

  • y1,y2,...,yny_1,y_2,...,y_n表示随机变量YYnn个观测值的样本,当YY是概率分布为p(y)p(y)\color{red}离散随机变量时,似然函数L=p(y1)p(y1)(yn)L=p(y_1)p(y_1) {\cdots} (y_n).
  • y1,y2,...,yny_1,y_2,...,y_n表示随机变量YYnn个观测值的样本,当YY是密度函数为f(y)f(y)\color{red}连续随机变量时,似然函数L=f(y1)f(y1)(fn)L=f(y_1)f(y_1) {\cdots} (f_n).

      极大似然估计,就是需要在参数空间θ^=(θ1^,θ2^,,θn^)\hat{θ}=( \hat{θ_1},\hat{θ_2}, {\cdots},\hat{θ_n})中选定一个值,使得“已发生”的事件出现的概率最大。
      那为什么似然函数要取最大值?是因为我们在试验中抽取的样本已经确定了,是发生了的,要使得似然函数尽可能地趋向于1。

三、求解步骤

结合一个例子】设y1,y2,...,yny_1,y_2,...,y_n表示随机变量YYnn个观测值的随机样本,具有指数密度函数:
f(y)={ey/ββ,0y0,其他 f(y) = \begin{cases} \frac{e^{-y /\beta}}{\beta}, & \text{若$0 \leq y \leq \infty$} \\ 0, & \text{其他} \end{cases} β\beta的极大似然估计。
步骤主要有

  1. 构造极大似然函数LL
  2. 求使LL最大的β^\hat{\beta}:由微分学知道,使L达到最大的β^\hat{\beta}值是使dL/dθ=0dL/dθ=0的值。L是一些含有β\beta的乘积,因为求一个和的导数要比求一个积的导数容易,所以会到LL取对数,LL的对数是LL的单调增函数。
    下面直接给出过程
    [推断统计] 点估计-极大似然法学习