·

Cursos Gerais ·

Inferência Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Capítulo 1 Estimação 11 Introdução CAPITULO 1 ESTIMAC AO 2 Figura 2 Interrelacao entre as areas da Estatıstica Definicao 1 Populacao Conjunto que contem todos os indivıduos objetos ou elementos a serem es tudados que apresentam uma ou mais caracterısticas em comum Por exemplo podemos citar o conjunto de idades de todos os alunos do Colegio SacreCoeur de Marie o conjunto de rendas de todos os habitantes de Joao Pessoa o conjunto de pesos de todas as criancas nascidas em Bayeux etc Definicao 2 Amostra Subconjunto extraıdo da populacao para analise devendo ser representativo daquele grupo A partir das informacoes colhidas na amostra os resultados ob tidos poderao ser utilizados para generalizar inferir ou tirar conclusoes acerca dessa populacao inferˆencia estatıstica O processo de escolha de uma amostra da populacao e denominado amostragem Definicao 3 Censo Censo ou recenseamento e o estudo dos dados relativos a todos os elementos da populacao A Organizacao das Nacoes Unidas ONU define censo como o conjunto das operacoes que consiste em recolher agrupar e publicar dados de mograficos econˆomicos e sociais relativos a determinado momento ou em certos perıodos a todos os habitantes de um paıs ou territorio Definicao 4 Variavel E uma caracterıstica ou atributo que se deseja observar medir ou contar a fim de se obter algum tipo de conclusao Como exemplos podemos citar o setor de atuacao o faturamento ou a quantidade de funcionarios de empresas listadas na Bolsa de Valores de Sao Paulo Definicao 5 Dados Os dados podem ser considerados a materiaprima de qualquer analise es tatıstica e de qualquer modelagem exploratoria ou confirmatoriaA partir de les podem ser obtidas informacoes de interesse correspondentes a uma ou mais variaveis Definição 6 Parâmetro Medidas estatísticas numéricas que precisam ser estimadas a partir de critérios ou métodos definidos pelo pesquisador para representar determinadas características da população geralmente desconhecidas Definição 7 Estatísticas ou Estimadores São medidas obtidas da amostra tornase possível neste caso utilizarmos as teorias inferências para que possamos fazer conclusões sobre a população Inferência Estatística ou Aprendizado como é chamado em Ciência da Computação é o processo de buscar dados para inferir a distribuição que gera esses dados Uma típica questão de Inferência Estatística é a seguinte Dado uma amostra Xl Xn F como inferimos F Em alguns casos podemos querer inferir apenas algumas características de F como sua média por exemplo Um modelo estatístico F é um conjunto de distribuições ou densidades ou funções de regressão Um modelo paramétrico é um conjunto F que pode ser parametrizado por um número finito de parâmetros Por exemplo se nós assumimos que os dados provém de uma distribuição Normal então o modelo é F fx µ σ 1 2πσ exp xµ 2 2σ2 µ R σ 0 Este é um modelo dois parâmetros Escrevemos a densidade como fx µ σ para mostrar que x é um valor da variável aleatória enquanto µ σ são parâmetros Em geral um modelo paramétrico assume a forma F fx θ θ Ω onde θ é um parâmetro desconhecido ou vetor de parâmetros que pode levar valores no espaço de parâmetros Ω Se θ é um vetor mas estamos apenas interessados em um componente de θ chamamos os parâmetros restantes de parâmetros incômodos Um modelo não paramétrico é um conjunto F que não pode ser parametrizado por um número finito de parâmetros 12 Estimadores Estimativas e Propriedades Seja X uma va com fdp f θ de forma funcional conhecida mas dependendo de um vetor de constante rdimensional desconhecido θ θ1 θr que é chamado de parâmetro Vamos definir Ω como conjunto de todos os valores possíveis de θ e chamálo de espaço de parâmetro Ω Rr r 1 Vamos denotar por F a família de todas as fdp cujos parâmetros θ variam em Ω isto é F f θ θ Ω CAPITULO 1 ESTIMAC AO 5 Seja X1 Xn uma amostra aleatoria de tamanho n de f θ ou seja n variaveis aleatorias independentemente distribuıdas com fdp f θ Um dos pro blemas basicos de estatıstica e fazer inferˆencias sobre o parˆametro θ como estimar θ testar hipoteses sobre θ etc com base nos valores observados x1 xn das vas X1 Xn Estatısticas Dada uma funcao T Rn R que nao dependa de θ ou outra incognita quando aplicada em uma amostra aleatoria X1 Xn T T X1 Xn e chamada de estatıstica Quando T Rn Rr T X1 Xn T1 X1 Xn Tr X1 Xnt tratase de uma estatıstica rdimensional Estimadores Vies ou Tendˆencia Definimos o vies ou tendˆencia de uma estatıstica como sendo Eθ T θ onde Eθ T significa que a esperanca de Tdeve calculada usando a fdp f θ 121 Propriedades das Estatısticas Para iniciar seja X1 Xn seja uma amostra aleatoria com fdpf θ θ Ω R e vamos introduzir a notacao T TX1 Xn para uma estimativa de θ Suficiˆencia Seja X1 Xn uma amostra aleatoria de tamanho n de f θ ou seja n va independentemente distribuıdas como X acima Um dos problemas basicos de estatıstica e fazer inferˆencias sobre o parˆametro θ com base nos valores observados x1 xn das vas X1 Xn Ao fazer isso uma questao importante precisa ser CAPÍTULO 1 ESTIMAÇÃO 6 analisada Como condensar os dados sem perder as informações transmitidas por eles sobre o parâmetro θ Ao fazer isso o conceito de suficiência desempenha um papel fundamental em nos permitir muitas vezes substancialmente densificar os dados sem nunca perder nenhuma informação transportada por eles sobre o parâmetro θ Definição 8 Sejam X1 Xn va ind e ident distr com fdp f θ θ Ω R e T TX1 Xn uma estatística Então nós dizemos que T é uma estatística Suficiente para a família F f θ θ Ω ou para o parâmetro θ se a distribuição condicional de X1 Xnt dado T t não depende de θ De uma forma generalizada esse conceito também pode ser estabelecido da seguinte forma Sejam X1 Xn va ind e ident distr com fdp f θ θ Ω Rr e T T1 Tmt onde Tj TjX1 Xn j 1 m são estatísticas Então nós dizemos que T é uma estatística Suficiente para a família F f θ θ Ω ou para o parâmetro θ se a distribuição condicional de X1 Xnt dado T t não depende de θ Exemplo 1 Sejam X1 Xn uma amostra aleatória onde Xi B1 θ θ 0 1 e TX1 Xn nj1 Xj então T é uma estatística suficiente para θ De fato fxj θ θ se xj 1 1 θ se xj 0 j 1 n como Xi B1 θ são e são indep T Bn θ logo fT t θ n t θt1 θ1t t 0 1 2 n Agora se t x1 x2 xn CAPÍTULO 1 ESTIMAÇÃO 7 Pθ X1 x1 Xn xnT t Pθ X1 x1 X2 x2 Xn xn T tPθ T t Pθ X1 x1 X2 x2 Xn xnPθ T t θx1 1 θ1x1 θxn 1 θ1xn n t θt 1 θ1t θx1 x2 xn 1 θnx1 x2 xn n t θt 1 θ1t θt1 θnt n t θt 1 θ1t 1 n t Que não depende de θ portanto T é suficiente para θ Um resultado que nos ajuda a detectar suficiência de estatística é o teorema da decomposição de FischerNeyman o qual será enunciado a seguir mas a prova não será feita nesse curso pra maiores datalhes veja o livro do Roussas Teorema 1 Fatorização de FisherNeyman Sejam X1 Xn va ind e ident distr com fdp f θ θ Ω R e seja T TX1 Xn uma estatística Então T é uma estatística suficiente para para θ se e somente se a fdp conjunta dos Xi s pode ser escrita da seguinte forma fX1Xn x1 xn θ g T x1 xn θ h x1 xn Exemplo 2 Se X1 Xn B1 p e são va ind com fdps fxi θ θxi 1 θ1xi I01xi i 1 n a distribuição conjunta de f é fx θ θt 1 θnt n i1 I01xi onde t n i1 xi CAPÍTULO 1 ESTIMAÇÃO 8 Fazendo g T x θ θt 1 θnt e hx n i1 I01xi vemos que fx θ gT x θ hx e h independe de θ portanto T n i1 Xi nXé uma estatística suficiente para θ Exemplo 3 Se X1 Xn Pθ com f xi θ eθ θxi xi xi 0 1 θ 0 fx θ enθ n i1 θxi xi enθθn i1 xi 1 n i1 xi Concluímos que fx θ g T x θ hx onde g T x θ enθθn i1 xi e hx 1 n i1 xi Portanto T n i1 Xi nX é uma estatística Suficiente para θ Exemplo 4 Se X1 Xn Expθ com fxi θ θeθxi xi 0 fx θ n i1 fxi θ θneθ n i1 xi Concluímos que fx θ g T x θ hx onde g T x θ θn eθn i1 xi e hx 1 portanto T n i1 Xi nX é uma estatística Suficiente para θ Exemplo 5 Seja X1 Xn uma amostra aleatória de uma população com distribuição Nμ σ2 fxi μ σ 1 2πσ e xiμ2 2σ2 μ R σ 0 CAPÍTULO 1 ESTIMAÇÃO Concluímos que fxσ2 g Txθ hx onde g Txθ 12πσ2n ei1nxiμ22σ2 e hx 1 portanto Tx X e Ux i1nXi X2 são estatísticas suficientes para o par μσ2 Exemplo 6 Com base em uma amostra aleatória de tamanho n X1 Xn de cada uma das fdps dadas abaixo com valores observados x1 xn determine uma estatística suficiente para θ i f xθ θxθ1 x 1 θ Ω 0 ii f xθ xθ ex22θ x 0 θ Ω 0 iii f xθ 1 θ xθ 0 x 1 θ Ω 1 iv f xθ θx2 x 0 θ Ω 0 Solução Se xmin min x1 xn e xmax max x1 xn i f xθ θxθ1 logo fxθ i1nfxiθ i1nθxiθ1 i1nI1 xi enθi1nxiθ i1n1xi I1 xmin Portanto T X i1nXi é uma estatística suficiente para θ ii Se f xθ xiθ exi22θ I1 x logo fxθ i1nfxiθ i1nxiθ exi22θ I1 xi ei1nxi22θθn i1nxi I1 xmin CAPÍTULO 1 ESTIMAÇÃO Se μ é desconhecido fxμ i1nfxiμ 12πσn ei1nxi22xiμμ22σ2 e2μi1nxiμ2σ2 12πσn ei1nxi22σ2 μ ℝ Concluímos que fxμ g Txθ hx onde g Txθ e2μi1nxiμ2σ2 12πσn e hx ei1nxi22σ2 portanto T i1nXi nX é uma estatística Suficiente para μ Observamos que Tx i1nxi e também X são estatísticas suficientes para μ Se σ2 é desconhecido fxσ2 12πσ2n ei1nxiμ22σ2 1 Concluímos que fxσ2 g Txθ hx onde g Txθ 12πσ2n ei1nxiμ22σ2 e hx 1 portanto Tx i1nxiμ2 e também Tx i1nxiμ2n são estatísticas suficientes para σ2 Finalmente se μ e σ2 é desconhecidos fxμσ2 12πσ2n ei1nxixxμ22σ2 12πσ2n ei1nxix2nxμi1nxinxμ22σ2 12πσ2n ei1nxix22σ2nxμ22σ2 CAPÍTULO 1 ESTIMAÇÃO Portanto TX i1nXi2 é uma estatística suficiente para θ iii Se f xθ 1 θ xθ I01 logo fxθ i1nfxiθ 1 θn i1nxiθ I01 xi i1n1 θn i1nxiθ I01 xmin I01 xmax Portanto TX i1nXi é uma estatística suficiente para θ iv Se f xθ θxi2 Iθ x logo fxθ i1nfxiθ i1n1xi2 Iθ xi θn 1i1nxi2 Iθ xmin Portanto Tx i1nxi2 é uma estatística suficiente para θ Completude Definição 9 Completude Seja X uma var aleatória com fdp fXθ θ Ω ℝ a família fXθθ Ω ou a var aleatória X é dita completa se para h ℝk ℝ tal que EθhX exista para todo θ Ω se EθhX 0 então hx 0 exceto possivelmente em algum conjunto 𝓐 tal que prob𝓐 0 Exemplo 7 Seja 𝓕 fθ fxθ n x θx 1 θnx θ 01 x 01n 𝓕 é completa Exemplo 8 Seja F fθ fxθ eθθx x θ 0 x 0 1 F é completa Exemplo 9 Seja F fθ fxθ 1 θ α θ α x α θ F é completa Exemplo 10 Seja X₁ Xₙ var aleat ind e id distr com distribuição Nμ σ² Se σ é conhecido e μ θ então F fθ fxθ 1 2πσ exθ²2σ² θ R F é completa Se μ é conhecido e σ² θ então F fθ fxθ 1 2πθ exθ²2θ θ 0 não é completa Teorema 2 X₁ Xₙ va ind e ident distr com fdp fθ θ Ω R e T uma estatística suficiente para θ Seja gθ a fdp de T e assuma que o conjunto de positividade de gθ é o mesmo para todo θ Ω Se V é uma outra estatística que é estocàsticamente independente de T Então a distribuição de V não depende de θ Prova Seja S t gtθ 0 para todo θ logo fvt está bem definida e também é independente de θ pela suficiência Então fVT v tθ fvtgtθ para todo v e t S enquanto que pela independência temos fVT v tθ fVvθgtθ concluindose que fVvθgtθ fvtgtθ Para todo v e t S Portanto fVvθ fvt fVv para todo v e t S Teorema 3 Basu X₁ Xₙ va ind e ident distr com fdp fθ θ Ω R e T uma estatística suficiente para θ Seja gθ a fdp de T e assuma que a família C gθ θ Ω é completa Se V é outra estatística e a distribuição de V não depende de θ então V e T são independentes Imparcialidade Definição 10 Sejam X₁ Xₙ va ind e ident distr com fdp fθ θ Ω R e T TX₁ Xₙ uma estatística Então nós dizemos que T é uma estatística Imparcial ou Não Viesada para θ se EθT θ para todo θ Ω A seguir apresentamos alguns exemplos estatísticas imparciais Exemplo 11 Sejam X₁ Xₙ uma amostra aleatória tendo uma das seguintes distribuições i Xᵢ B1θ θ 01 X é uma estatística imparcial para θ ii Xᵢ Pθ θ 0 X e VarθX₁ são estimadores imparciais para θ iii Se Xᵢ Nθ σ² com σ conhecido novamente X é uma estatística imparcial para θ iv Se Xᵢ Nμ θ com σ 0 μ conhecido então a variância amostral S² 1n Σₙᵢ₁ Xᵢ μ² é uma estatística imparcial para θ v Se Xᵢ Γθβ β 1 X é uma estatística imparcial para θ vi Se Xᵢ Γα θ α 1 X é uma estatística imparcial para θ Solução i Se Xᵢ B1θ θ 01 Eθ Xᵢ θ logo Eθ X Eθ Σₙᵢ₁Xᵢ n Σₙᵢ₁ EθXᵢ n nθ n θ Portanto X é uma estatística imparcial para θ ii Se Xᵢ Pθ θ 0 E Xᵢ θ logo Eθ X Eθ Σₙᵢ₁Xᵢ n Σₙᵢ₁ EθXᵢ n nθ n θ Se T VarθX₁ então EθT EθVarθX₁ EθX θ é uma estatística imparcial para θ iii Se Xᵢ Nθ σ² com σ conhecido Eθ Xᵢ θ logo Eθ X Eθ Σₙᵢ₁Xᵢ n Σₙᵢ₁ EXᵢ n nθ n θ Portanto X é uma estatística imparcial para θ iv Se Xᵢ Nμ θ com σ 0 μ conhecido então Xᵢ μ θ² χ²₁ consequentemente Eθ Xᵢ μ θ² 1 logo Eθ S² Eθ Σₙᵢ₁ Xᵢ μ² n θEθ 1n Σₙᵢ₁ Xᵢ μ θ² θ n Σₙᵢ₁ Eθ Xᵢ μ θ² θn n θ Portanto S² é uma estatística imparcial para θ v Se Xᵢ Γθ β β 1 X é uma estatística imparcial para θ vi Se Xᵢ Γα θ α 1 X é uma estatística imparcial para θ Teorema 4 RaoBlackwell Sejam X₁ Xₙ va ind e ident distr com fdp fθ θ Ω R e T TX₁ Xₙ uma estatística e T TX₁ Xₙ é uma estatística suficiente para θ e completa Se U UX₁ Xₙ é uma estatística imparcial de θ defina a estatística ϕT Eθ UT t CAPÍTULO 1 ESTIMAÇÃO 15 Então i A var aleat ϕT é função apenas da estatística suficiente T ii ϕT é uma estatística imparcial de θ iii σ2θ ϕT σ2θ U θ Ω provado que EθU2 Teorema 5 Unicidade Lehmann Scheffé Sejam X₁Xn va ind e ident distr com fdp fθ θ Ω R e seja F fθ θ Ω T TX₁Xn uma estatística suficiente para θ e gθ sua fdp Seja C gθ θ Ω e assuma que C é completa Seja U UT é uma estatatística imparcial de para θ e suponha que EθU2 para todo θinΩ Então U é a única estatística imparcial para θ com a menor variancia na classe de todas as estatísticas imparciais para θ no sentido que se V VT é outra estística imparcial para θ então UT VT exceto num conjunto N tal que PθT N 0 para todo θ Ω Prova Sejam ϕ₁T e ϕ₂T duas estatística construídas de acordo com o teorema de RaoBlackwell então Eθϕ₁T 0 Eθϕ₂T 0 fazendo ϕT ϕ₁T ϕ₂T temos EθϕT Eθ ϕ₁T ϕ₂T 0 Como a C é completa ϕT 0 para todo t logo ϕ₁T ϕ₂T provando a unicidade 122 A Família Exponencial Definição 11 Família Exponencial O caso Uniparamétrico Uma fdp fθ θ Ω R pertence a Família Exponencial se fxθ é da forma fxθ CθeQθTx hx onde Q é estritamente monótona e h não envolve θ Cθ é simplesmente uma constante de normalização Vejamos alguns exemplos de membros dessa família Exemplo 12 Se X Bnθ CAPÍTULO 1 ESTIMAÇÃO 16 fxθ n n x x θx 1 θnx IAx onde A 1 2 n Podemos escrever esta fdp da seguinte forma fxθ 1 θn n n x x θ 1 θx IAx 1 θn n n x x elnθ 1θx IAx 1 θn elnθ 1θx n n x x IAx Fazendo Cθ 1 θn Qθ ln θ 1θ Tx x e hx n nx x vemos que fxθ é um membro da família exponencial Exemplo 13 Se X Nμ σ2 e μ é conhecido então σ2 θ logo fXx μ σ2 12πσ exμ2 2σ2 x Se σ2 é conhecido então μ θ logo fx θ 12πσ exθ2 2σ2 x 12πσ ex22θxθ2 2σ2 x 12πσ eθ2 2σ2 eθσ2 x ex2 2σ2 x Se μ é conhecido então σ2 θ logo fx μ σ2 12πσ2 exμ2 2σ2 x fx θ 12πθ exμ2 2θ 12πθ e1 2θ xμ2 CAPÍTULO 1 ESTIMAÇÃO 17 Fazendo Cθ 12πθ Qθ 12θ Tx x μ2 e hx 1 vemos que fxθ é um membro da família exponencial Definição 12 Família Exponencial O caso Multiparamétrico Sejam X₁Xr var aleat iid e X X₁ Xrt dizemos que sua fdp conjunta pertence a a r paramétrica família exponencial se ela puder ser escrita da seguinte forma fx θ Cθ exp j1r Qjθ Tjx hx onde x x₁ xnt xi R i 1 r θ θ₁ θnt Θ Rr Cθ 0 e hx 0 para x S sendo S o conjunto onde f é positiva Teorema 6 Sejam X₁Xn var aleat iid com fdp f θ θ Ω R pertencente a família exponencial Então T j1n TXj é uma estatística suficiente para θ A fdp de T é da forma gt θ CnθeQθtht onde o conjunto de positividade de ht é independente de θ Exemplo 14 A distribuição Multinomial fx n j1r xj j1r pjxj j1r pj 1 pj 0 CAPÍTULO 1 ESTIMAÇÃO 18 fx θ nrj1 xj rj1 θj xj rj1 θj 1 θj 0 nrj1 xj θr rj1 θjθrxj nrj1 xj 1 θ1 θ2 θr1r rj1 θj1 θ1 θ2 θr1 xj 1 θ1 θ2 θr1 r exprj1 xj logθj1 θ1 θ2 θr1 nrj1 xj Fazendo Cθ 1 θ1 θ2 θr1r Tx x Qjθ logθj1 θ1 θ2 θr1 e hx nrj1 xj Exemplo 15 A distribuição Normal Se X Nθ1 θ2 vamos mostrar que X também é um membro de uma 2 paramétrica família exponencial fx θ1 θ2 12πθ2 exθ122θ2 x 12πθ2 ex22θ1xθ122θ2 eθ122θ22πθ2 e12θ2 x2 θ122θ2 x Fazendo Cθ eθ122θ22πθ2 Qθ 12θ2 θ122θ2t e Tx x2 xt podemos ver que tratase de um membro da biparamétrica família exponencial CAPITULO 1 ESTIMAC AO 19 13 Estimacao Pontual Se X uma va com fdp f θ onde θ Ω R Se θ e conhecido podemos calcular em princıpio todas as probabilidades que desejarmos Na pratica no entanto θ geralmente e desconhecido Entao surge o problema de estimar θ ou de forma mais geral estimar alguma funcao de θ digamos gθ onde g e uma funcao com valor real Agora para prosseguir vamos definir alguns conceitos como estimador e estimativa gθ Se X1 Xn var aleat indep e ident distr com distribuicao f θ Entao Definicao 13 Quando uma estatıstica T X1 Xn e usada para estimar al guma quantidade gθ ela e chamada de estimador de gθ o valor de T x1 xn de T para os valores observados de X1 Xn e chamado de estimativa de gθ Definicao 14 Seja g uma funcao real de θ Entao o estimador T T X1 Xn e chamado de estimador imparcial ou nao viesado de gθ se Eθ T gθ para todo θ gθ e dito estimavel se existir um estimador imparcial para gθ 131 Criterio para Selecionar um Estimador Imparcialidade Variancia Mınima Definicao 15 Uma estimativa Imparcial U UX1 Xn de θ e dita Impar cial de Variˆancia Mınima Uniforme EIVMU se para qualquer outra estimativa imparcial V VX1 Xn a seguinte desigualdade e valida VarθU VarθV para todo θ Θ Teorema 7 RaoBlackwell LehmannScheffe Se X1 Xn e uma amostra aleatoria com fdp f θ θ Θ R e T T X1 Xn e uma estatıstica suficiente para θ e completa Se U U X1 Xn e uma estatıstica imparcial de θ defina a estatıstica φT Eθ UT Entao CAPÍTULO 1 ESTIMAÇÃO 20 i A var aleat ϕT é função apenas da estatística suficiente T ii ϕT é uma estatística imparcial de θ iii σθ2ϕT σθ2U θ Θ provado que E0U2 iv ϕT é única EIVMUde θ 132 Estimação de Máxima Verossimilhança Motivação e Exemplos O seguinte exemplo simples destinase a esclarecer o que é intuitivo mas bastante lógico o princípio da Estimativa de Máxima Verossimilhança Exemplo 16 Sejam X1X10 vas iid da distribuição B1 θ 0 θ 1 e se X1X10 são os respectivos valores observados Por conveniência defina t x1 x10 Além disso suponha que nas 10 tentativas 6 resultaram em sucessos de modo que t 6 Então a função de verossimilhança envolvida é Lθx θ61 θ40 θ 1x x1 x10 Assim Lθx é a probabili dade de observar exatamente 6 sucessos em 10 ensaios binomiais independentes ocorrendo os sucessos nas tentativas para as quais xi 1 i 110 esta probabilidade é uma função do parâmetro desconhecido θ Vamos calcular os valores desta probabilidade para θ variando de 01 a 09 Observamos Valores de θ Valores de Lθx 01 00000006561 02 00000262144 03 00001750329 04 00005308416 05 00009765625 06 00011943936 07 00009529569 08 00004194304 09 00000531441 que os valores de Lθx são crescentes atingem seu máximo valor em θ 06 e então os valores vão diminuindo Portanto se esses 9 valores fossem os únicos valores possíveis para θ o que eles não são alguém poderia raciocinar habil mente escolha o valor de 06 como o valor de θ O valor θ 06 tem a distinção CAPÍTULO 1 ESTIMAÇÃO 21 de maximizar entre os 9 valores listados a probabilidade de atingir os 6 sucessos já observados Observamos que 06 610 tn onde n é o número de tentativas e t ó o número de sucessos Veremos no Exemplo a seguir que o valor tn na verdade maximiza a função de verossimilhança entre todos os valores de θ com 0 θ 1 Então tn será a estimativa de similaridade máxima de θ a ser denotada por θ ou seja θ tn Definição 16 Sejam X1 Xn var aleatórias independente e identicamente dis tribuídasiid com fdp fθ com θ Θ e sejam x1 xn os respectivos valores observados e x x1 xn A função de verossimilhança Lθx é definida por Lθx ni1 fxi θ o valor de θ que maximiza Lθx é chamado de Estimativa de Máxima Verossimi lhança EMV de θ Claramente a EMV depende de x e geralmente escrevemos θ θx Desse modo Lθx max Lθx θ Θ Vamos enunciar agora um resultado muito importante na determinação das EMVs Proposição 1 Dada f Ω R Ω Rn contínua Se logfx possui um máximo x em Ω então x também é máximo de f Prova Se x é um máximo de logfx então logfx logfx para todo x Ω como a função logx é estritamente crescente temos que fx fx para todo x Ω portanto x também é um máximo de f Exemplo 17 Em termos de uma amostra aleatória de tamanho n X1Xn de uma distribuição X B1 θ com valores observados x1 xn determine a EMV θ θx de θ 0 1 x x1 xn Sendo fxi θ θxi1 θ1xi xi 0 ou 1 i 1 n a função de verossimi lhança é dada por CAPÍTULO 1 ESTIMAÇÃO 22 Lθx i1n fxiθ i1n θxi 1θ1xi θt 1θnt t x1 xn como xi 0 ou 1 então t 0 1 n Portanto log Lθx tlogθ ntlog1θ derivando com relação a θ obtemos a equação que denominamos equação de verossimilhança log Lθxθ 0 obtendo para este caso log Lθxθ tθ nt1θ 0 o que concluindose que θ tn Fazendose agora o teste da derivada segunda temos ²log Lθxθ² tθ² nt1θ² como t n ²log Lθxθ² 0 para todo θ em particular para θ tn Portanto o EMV de θ é θ tn Exemplo 18 Determine o EMV θ θx de θ 0 na distribuição Pθ Poisson em termos de uma amostra aleatória X1 Xn com valores observados x1 xn Sendo fxiθ eθθxi xi xi 0 1 i 1 n a função de verossimilhança é dada por Lθx i1n fxiθ i1n eθθxixi enθ i1n θxixi log Lθx nθ nlogθi1n xi n log i1n xi derivando com relação a θ obtemos a equação que denominamos equação de verossimilhança CAPÍTULO 1 ESTIMAÇÃO 23 log Lθxθ 0 obtendo para este caso log Lθxθ n n xθ 0 o que concluindose que θ x Fazendose agora o teste da derivada segunda temos ²log Lθxθ² n x θ² como xi 0 x 0 logo ²Lθxθ² 0 para todo θ em particular para θ x Portanto o EMV de θ é θ x i1n xin Exemplo 19 Determine o EMV θ θx de θ 0 na distribuição Exponencial Expθ em termos de uma amostra aleatória X1 Xn com valores observados x1 xn Nesse caso fxiθ θeθxi xi 0 Lθx i1n θeθxi θn enθ i1n xi n θn enθx log Lθx n logθ n x θ log Lθxθ nθ n x 0 concluise que θ 1x ² log Lθxθ² nθ² 0 θ em particular para θ 1x Portanto o EMV de θ é θ 1x ni1n xi CAPÍTULO 1 ESTIMAÇÃO 24 Exemplo 20 Seja X1 Xn uma amostra aleatória de uma população com distribuição Nμσ² onde apenas um dos parâmetros é conhecido Determine a EMV do outro desconhecido parâmetro DISCUSSÃO Com x1 xn sendo valores observados de X1 Xn nós temos Lμσ x i1n 12πσ exiμ²2σ² 12πσn ei1n xiμ²2σ² μ ℝ σ 0 Se μ é desconhecido Então log Lμx n log 2πσ i1n xi μ²2σ² Fazendo log Lμxμ 0 obtemos i1n xi nμ σ² 0 e consequentemente μ x Como ² log Lμxμ² nσ² 0 para todo μ concluímos que a EMV para para μ sendo σ conhecido é μ x Se σ² é desconhecido Então log Lσ²x n log 2πσ i1n xi μ²2σ² n2 log2π n2 logσ² i1n xi μ²2σ² Fazendo logLσ2xσ20 obtemos nσ22σ4 ni1xiμ22σ40 e consequently σ2 ni1xiμ2n s2 Como 2logLσ2xσ22 n2σ4 2ni1xiμ22σ6 n2σ22 2n2σ23 ni1xiμ2n n2σ22 2n2σ23 s2 2logLσ2xσ22 σ2s2 n2s22 2n2s23 s2 n2s22 0 Portanto a EMV para paraσ2 com conhecido é σ2 ni1xiμ2n Exemplo 21 Seja X1Xn uma amostra aleatória de uma população com distribuição Uαβ onde apenas um dos parâmetros é conhecido Determine a EMV do outro desconhecido parâmetro DISCUSSÃO Com x1xn sendo valores observados de X1Xn nós temos Lαβx 1βαnni1 Iαβxi 1βαn Iαβnxmin Iαβxmax logLσ2xσ20 obtemos nσ22σ4 ni1xi μ22σ4 0 e consequentemente σ2 ni1 xi μ2n s2 Como 2logLσ2xσ22 n2σ4 2ni1xi μ22σ6 n2σ22 2n2σ23 ni1 xi μ2n n2σ22 2n2σ23 s2 2logLσ2xσ22 σ2s2 n2s22 2n2s23 s2 n2s22 0 Portanto a EMV para paraσ2 com conhecido é σ2 ni1 xi μ2n Exemplo 21 Seja X1Xn uma amostra aleatória de uma população com distribuição Uαβ onde apenas um dos parâmetros é conhecido Determine a EMV do outro desconhecido parâmetro DISCUSSÃO Com x1xn sendo valores observados de X1Xn nós temos Lαβx 1βαn ni1 Iαβxi 1βαn Iαβnxmin Iαβxmax CAPÍTULO 1 ESTIMAÇÃO A matriz Hessiana de logLμ σ2x é dada por 2logLμ σ2x nσ2 2ni1 xi nμ2σ4 ni1 xi nμσ22 n2σ22 2n2σ23 s2 Substituindo nos valores obtidos de μ e σ2 obtemos 2logLμ σ2x nσ2 0 0 n2s22 Como 2logLμ σ2x é uma matriz definida negativa o par μ σ2 é uma EMV para μ σ2 Exemplo 23 Um experimento multinomial é realizado independentemente n vezes de modo que a função de verossimilhança é dada por Lθ1θrx nni1 xi θx1 1θxr r onde xi 0 e inteiro ri1 xi n 0 pi 1 ri1 θi 1 i 1r Determine as EMVs para p DISCUSSÃO Nesse caso tratase de um problema de otimização com uma restrição de igualdade Maximize logLθ1θrx ri1 xi logθi n logni1 xi Sujeito à ri1 θi 1 θi 0 Cuja função Lagrangeana associada L ℝr ℝ ℝ é dada por Lθ λ ri1 xi logθi n logni1 xi λ ri1 θi 1 CAPÍTULO 1 ESTIMAÇÃO 28 com as seguintes condições de otimalidade de 1ª ordem Lθλ 0 xiθi λ 0 i 1r i1r θi1 xiθi λ 0 i 1r nos diz que θi xiλ como i1r θi 1 substituindo os valores de θi nessa equação obtemos λ i1r xi n obtendo finalmente θi xin Portanto θ xn uma vez que a matriz Hessiana da função ²Lθ dada por ²Lθx1θ12 0 0 xrθr2 é Semidefinida Negativa isto é i1r j1r ²Lθλθiθj vi vj i1r xiθi2 vi2 0 para todo v ℝr