Estimador de máxima verossimilhança da distribuição Poisson¶

Neste notebook do Jupyter vamos demonstrar a dedução matemática do estimador de máxima verossimilhança do parâmetro da distribuição Poisson. Para ver os resultados dos comandos de cada etapa coloque o mouse ao lado esquerdo da célula que tem os comandos e clique em 'Run this cell'

Preparação¶

Antes de começar importamos a biblioteca de matemática simbólica do Python. Ela permite criar expressões, como funções e suas derivadas, e manipulá-las simbolicamente.

In [17]:

from sympy import *
init_printing()

A função de densidade probabilística¶

Para uma dada observação $x_i$ a função de massa da distribuição Poisson é

In [18]:

x, L, i, n = symbols('x \lambda i n')
f = L**(Indexed(x,i))*exp(-L)*1/factorial(Indexed(x,i))
f

Out[18]:

$\displaystyle \frac{\lambda^{{x}_{i}} e^{- \lambda}}{{x}_{i}!}$

Defina a função de log-verossimilhança negativa¶

É a soma dos logarítimos dos valores da função acima sobre todos os valores dos dados ($x_i$). Primeiro calculamos o logarítmo da função de massa:

In [19]:

lf = ln(f)
lf=expand_log(lf, force=true)
lf

Out[19]:

$\displaystyle - \lambda + \log{\left(\lambda \right)} {x}_{i} - \log{\left({x}_{i}! \right)}$

e em seguida definimos a sua soma sobre todos os valores de $x_i$

In [20]:

LL = Sum(lf, (i,1,n))
LL=simplify(LL)
LL

Out[20]:

$\displaystyle - \lambda \sum_{i=1}^{n} 1 + \sum_{i=1}^{n} \left(\log{\left(\lambda \right)} {x}_{i} - \log{\left({x}_{i}! \right)}\right)$

O somatório $\sum_{i=1}^n 1$ nada mais é que $n$. Substituímos isto na função obtida acima temos a função de log-verossimilhança:

In [21]:

g=Sum(1, (i,1,n))
LL=LL.subs(g,n)      
LL

Out[21]:

$\displaystyle - \lambda n + \sum_{i=1}^{n} \left(\log{\left(\lambda \right)} {x}_{i} - \log{\left({x}_{i}! \right)}\right)$

Estimativa de máxima verossimilhança (mle)¶

É o valor do parâmetro $\lambda$ que maximiza a função de log-verossimilhança (ou minimiza a de log-verossimilhança negativa). Sabemos que as funções têm derivadas zero em seus pontos máximos e mínimos. Então o truque para achar a expressão do mle é encontrar a expressão para o valor de $\lambda$ que faz a derivada da função de log-verossimilhança ser igual a zero. São duas etapas:

Calcule a derivada da função de log-verossimlhança em relação ao parâmetro¶

Antes de calcular a derivada temos que substituir o fatorial $x_i!$ pela sua expressão contínua $\Gamma (x_i+1)$

In [22]:

LL=simplify(LL)
LL

Out[22]:

$\displaystyle - \lambda n + \sum_{i=1}^{n} \left(\log{\left(\lambda \right)} {x}_{i} - \log{\left(\Gamma\left({x}_{i} + 1\right) \right)}\right)$

E agora usamos o comando 'diff' para obter a derivada da log-verossimilhança em função do parâmetro $\lambda$:

In [23]:

dLL = diff(LL,L)
dLL=simplify(expand(dLL))
dLL

Out[23]:

$\displaystyle - n + \frac{\sum_{i=1}^{n} {x}_{i}}{\lambda}$

Resolvemos a derivada para o parâmetro¶

Agora igualamos a derivada da função de log-verossimilhança negativa a zero e resolvemos esta equação para o parãmetro $\lambda$:

In [24]:

solve(dLL,L)

Out[24]:

$\displaystyle \left[ \frac{\sum_{i=1}^{n} {x}_{i}}{n}\right]$

Que nada mais é que a média amostral!