· 2022/2
8
Estatística
UNESP
1
Estatística
UNESP
26
Estatística
UNESP
19
Estatística
UNESP
26
Estatística
UNESP
25
Estatística
UNESP
1
Estatística
UNESP
37
Estatística
UNESP
25
Estatística
UNESP
1
Estatística
UNESP
Texto de pré-visualização
ESTATISTICA E EXPERIMENTAC AO INFERˆENCIA ESTATISTICA ESTIMAC AO DE PARˆAMETROS Luzia A Trinca luziatrincaunespbr 1 19 Introducao a Inferˆencia Estatıstica Objetivos deste topico nesta disciplina 1 Introduzir o conceito de estimacao por intervalo 2 Apresentar a distribuicao tStudent 3 Apresentar intervalo de confianca para uma media populacional 4 Apresentar intervalo de confianca para uma proporcao de sucessos populacional 2 19 Estimativas pontuais e por intervalo Vimos que populacoes sao caracterizadas por quantidades constantes e desconhecidas chamadas parˆametros Nas pesquisas estimamos os parˆametros com base em informacoes amostrais ou experimentais Para que as estimativas tenham validade precisamos selecionar as amostras e planejar os experimentos seguindo regras que eliminam tendenciosidades erros sistematicos ou vıcios Para amostras a regra e sortear assim os elementos da amostra nao sofrem a possıvel parcialidade ou subjetivismo do pesquisador 3 19 Estimativas pontuais e por intervalo Para experimentos a regra e controle de heterogeneidade das condicoes e sorteio dos tratamentos tipos de manejo nıveis de irrigacao tipos de controle de pragas etc Detalhes sobre experimentos serao vistos em aulas posteriores O uso das regras oferece garantia de que medias amostrais desvios padroes amostrais e proporcoes amostrais sao bons estimadores dos parˆametros µ σ e p O uso das regras nos permite tambem obter o erro padrao das estimativas O erro padrao e uma medida de precisao da estimativa Associado a cada estimador temos entao o seu erro padrao precisao e o seu erro amostral ou de estimacao acuracia 4 19 Estimativas pontuais e por intervalo Resumo de algumas informacoes Uteis no processo de estimacao Erro Padrao Erro Padrao Erro de estimaao ou Par Est EP tedrico EP estimado Erro amostral wo XxX Ia wa X P feo OD gy 25005 P p a S bes a S Exemplo 1 Suponha que o peso da fruta de Annona squamosa apresenta desvio padrao de 20 gramas Se selecionarmos uma amostra aleatéria de 25 frutos para estimar o peso médio 1 esperamos cometer um erro amostral de no maximo 784 gramas para mais ou para menos Emax 784 196 Sm com probabilidade de 095 Essa probabilidade de nado errar mais do que o estipulado recebe o nome de coeficiente de confianga 519 Intervalos de confianca Dizemos que o valor obtido para estimar um parˆametro e uma estimativa por ponto daquele parˆametro Mas como a estimativa contempla um erro amostral do ponto de vista de praticidade e mais interessante calcular um intervalo que agrega o erro amostral maximo da estimativa Esse intervalo e chamado de intervalo de confianca para o parˆametro Um intervalo e definido pelo seu limite inferior a seu limite superior b a b 6 19 Intervalo de confianca para µ Assim a ideia e obter a b tal que estejamos com determinada confianca que no maximo a X εmax b X εmax Usando o resultado Z Xµ σ n encontramos que a X z α 2 σ n b X z α 2 σ n em que z α 2 e o quantil da distribuicao Normal Padrao para uma confianca de 100 1 α O valor 1 α e uma probabilidade de acerto e portanto α e uma probabilidade de erro 7 19 Intervalo de confianca para µ No Exemplo 1 suponha que a amostra aleatoria de 25 frutos forneceu um peso medio de 364 gramas x 364 Entao o intervalo com 95 de confianca para µ e 364 196 20 5 364 196 20 5 3562 3718 ICµ 95 3562 3718 Esse resultado informa que com a amostra de 25 os valores plausıveis 95 de confianca para o peso medio de frutos desta especie vao de 3562 a 3718 gramas 8 19 Intervalo de confianca para µ Figura 1 Ilustracao de possıveis IC a 95 de confianca para n 25 e σ 20 9 19 Intervalo de confianca para µ Se aumentarmos a confianca para 99 temos z0005 258 e entao o intervalo e ICµ 99 3537 3743 Note que aumentando a confianca probabilidade de acerto o intervalo ficou mais comprido menos informativo menos preciso Note tambem que o calculo exigiu o conhecimento do valor de σ o que na pratica nao ocorre Na pratica a solucao e usar uma estimativa para todo parˆametro necessario e desconhecido Se nao conhecemos σ podemos estimalo usando os dados da amostra Lembre que o estimador de σ2 e S2 Mas quando substituımos σ por s na formula da padronizacao a curva deixa de ser Normal Padrao 10 19 Intervalo de confianca para µ A teoria mostra que T X µ S n segue uma curva que recebeu um nome curioso distribuicao t de Student assim chamada por ter sido descoberta Student o pseudˆonimo de W Gosset Gosset era quımico estatıstico e cervejeiro trabalhava na Guinness fazendo experimentos e analisando dados Descobriu muito na area de estatıstica mas a Guinness nao permitia publicacoes com seu nome Daı o pseudˆonimo e o nome da curva Essa curva e muito parecida com a Normal Padrao tem media zero e simetrica mas tem a variˆancia maior que 1 que depende de n V arT n1 n2 11 19 Intervalo de confianca para µ fx 00 01 02 03 04 Z T note a área maior nas caudas da curva T 0 1 1 2 2 3 3 Figura 2 Densidade da distribuicao T de Student comparada com Normal Padrao Para n temos que T Z Note que a curva continua centrada em zero apenas o achamento muda quanto menor n mais achatada e a curva 12 19 Intervalo de confianca para lu Relembrando toda distribuicdo tem seus pardametros e o pardametro da distribuicdo tStudent é chamado de grau de liberdade e sera denotado por v Este numero esta ligado ao denominador da variancia amostral 1 Soy Xi S xX el n1 n 11 O denominador é n 1 entdo os graus de liberdade para uma amostra é v n1 No futuro estaremos trabalhando com duas amostras nj no por exemplo e os graus de liberdade da estatistica T dependerdo dos dois ns A distribuicdo tStudent esta tabelada e usamos a tabela para encontrar probabilidades e quantis de interesse 1319 Intervalo de confianca para µ Assim para obtencao de intervalos de confianca para a media populacional na pratica usamos a X tν α 2 s n b X tν α 2 s n em que tν α 2 e o quantil da distribuicao tStudent com ν graus de liberdade para uma confianca de 100 1 α Exemplo 2 Considere que a amostra de 25 frutos forneceram os pesos 2859 2810 3236 3101 2879 3142 2655 3328 2886 2879 3059 2900 2956 2872 3256 3191 2677 3057 2906 2830 3492 3014 3177 3111 2804 Estime o peso medio de frutos desta especie atraves de um intervalo com 95 de confianca ICµ 95 14 19 Intervalo de confianca para µ Primeiro calculamos a media e o desvio padrao dos dados amostrais x 3003080 s 205563 Depois buscamos o quantil na distribuicao t com ν 25 1 24 graus de liberdade e α 005 t240025 2064 Com esses valores temos a 3003080 2064 205563 25 2918223 e b 3003080 2064 205563 25 3087937 Assim o IC95 para a verdadeira media do peso de frutos de Annona squamosa e 2918 3088 15 19 Intervalo de confianca para p Analogamente ao caso de estimado de uma média populacional por intervalo de confiana podemos estimar a propordo populacional p de alguma caracteristica de interesse através de um intervalo de confianca A ideia é encontrar a Pmax b Pémaz Nesse caso temos duas alternativas um intervalo conservador que usa o maior erro padrao tedrico possivel e o intervalo otimista que usa um erro padrdo estimado Conservador a Pza22 e b P zal22 aVn aVn Otimista a P za PUT ce b P za PORP 2 n 2 n 1619 Intervalo de confianca para p O intervalo otimista 6 uma aproximacdo quanto maior a amostra melhor a aproximacao Exemplo 3 Um teste de germinacdo com uma amostra aleatdéria de 300 sementes de Baru semeadas ainda no fruto resultou na germinacado de 36 delas Estime a proporcdo de germinacao desta espécie usando uma confianca de 98 Temos que p ae 012 e z001 233 Assim o intervalo conservador para a verdadeira proporao é 05 05 012 233 012 233 0053 0187 300 a 1719 Intervalo de confianca para p Ja o otimista é 012 x 088 012 x 088 012 233 x 4 012 233 x 4 300 300 0076 0164 Note que o IC otimista é mais preciso que o conservador dai o termo otimista Note também que para o IC para p NAO usamos a distribuigao t pois essa curva nado se encaixa quando as variadveis sao bindrias Existem outros métodos para obter IC para p mas eles sao muito complexos para esta disciplina 1819 Intervalos de confianca para outros parˆametros Podemos construir intervalos de confianca para qualquer parˆametro desde que tenhamos 1 uma estimativa do parˆametro e 2 a distribuicao de referˆencia para o estimador do parˆametro A distribuicao de referˆencia pode ser especificada atraves do conhecimento das propriedades teoricas do estimador ou atraves de simulacao 19 19
8
Estatística
UNESP
1
Estatística
UNESP
26
Estatística
UNESP
19
Estatística
UNESP
26
Estatística
UNESP
25
Estatística
UNESP
1
Estatística
UNESP
37
Estatística
UNESP
25
Estatística
UNESP
1
Estatística
UNESP
Texto de pré-visualização
ESTATISTICA E EXPERIMENTAC AO INFERˆENCIA ESTATISTICA ESTIMAC AO DE PARˆAMETROS Luzia A Trinca luziatrincaunespbr 1 19 Introducao a Inferˆencia Estatıstica Objetivos deste topico nesta disciplina 1 Introduzir o conceito de estimacao por intervalo 2 Apresentar a distribuicao tStudent 3 Apresentar intervalo de confianca para uma media populacional 4 Apresentar intervalo de confianca para uma proporcao de sucessos populacional 2 19 Estimativas pontuais e por intervalo Vimos que populacoes sao caracterizadas por quantidades constantes e desconhecidas chamadas parˆametros Nas pesquisas estimamos os parˆametros com base em informacoes amostrais ou experimentais Para que as estimativas tenham validade precisamos selecionar as amostras e planejar os experimentos seguindo regras que eliminam tendenciosidades erros sistematicos ou vıcios Para amostras a regra e sortear assim os elementos da amostra nao sofrem a possıvel parcialidade ou subjetivismo do pesquisador 3 19 Estimativas pontuais e por intervalo Para experimentos a regra e controle de heterogeneidade das condicoes e sorteio dos tratamentos tipos de manejo nıveis de irrigacao tipos de controle de pragas etc Detalhes sobre experimentos serao vistos em aulas posteriores O uso das regras oferece garantia de que medias amostrais desvios padroes amostrais e proporcoes amostrais sao bons estimadores dos parˆametros µ σ e p O uso das regras nos permite tambem obter o erro padrao das estimativas O erro padrao e uma medida de precisao da estimativa Associado a cada estimador temos entao o seu erro padrao precisao e o seu erro amostral ou de estimacao acuracia 4 19 Estimativas pontuais e por intervalo Resumo de algumas informacoes Uteis no processo de estimacao Erro Padrao Erro Padrao Erro de estimaao ou Par Est EP tedrico EP estimado Erro amostral wo XxX Ia wa X P feo OD gy 25005 P p a S bes a S Exemplo 1 Suponha que o peso da fruta de Annona squamosa apresenta desvio padrao de 20 gramas Se selecionarmos uma amostra aleatéria de 25 frutos para estimar o peso médio 1 esperamos cometer um erro amostral de no maximo 784 gramas para mais ou para menos Emax 784 196 Sm com probabilidade de 095 Essa probabilidade de nado errar mais do que o estipulado recebe o nome de coeficiente de confianga 519 Intervalos de confianca Dizemos que o valor obtido para estimar um parˆametro e uma estimativa por ponto daquele parˆametro Mas como a estimativa contempla um erro amostral do ponto de vista de praticidade e mais interessante calcular um intervalo que agrega o erro amostral maximo da estimativa Esse intervalo e chamado de intervalo de confianca para o parˆametro Um intervalo e definido pelo seu limite inferior a seu limite superior b a b 6 19 Intervalo de confianca para µ Assim a ideia e obter a b tal que estejamos com determinada confianca que no maximo a X εmax b X εmax Usando o resultado Z Xµ σ n encontramos que a X z α 2 σ n b X z α 2 σ n em que z α 2 e o quantil da distribuicao Normal Padrao para uma confianca de 100 1 α O valor 1 α e uma probabilidade de acerto e portanto α e uma probabilidade de erro 7 19 Intervalo de confianca para µ No Exemplo 1 suponha que a amostra aleatoria de 25 frutos forneceu um peso medio de 364 gramas x 364 Entao o intervalo com 95 de confianca para µ e 364 196 20 5 364 196 20 5 3562 3718 ICµ 95 3562 3718 Esse resultado informa que com a amostra de 25 os valores plausıveis 95 de confianca para o peso medio de frutos desta especie vao de 3562 a 3718 gramas 8 19 Intervalo de confianca para µ Figura 1 Ilustracao de possıveis IC a 95 de confianca para n 25 e σ 20 9 19 Intervalo de confianca para µ Se aumentarmos a confianca para 99 temos z0005 258 e entao o intervalo e ICµ 99 3537 3743 Note que aumentando a confianca probabilidade de acerto o intervalo ficou mais comprido menos informativo menos preciso Note tambem que o calculo exigiu o conhecimento do valor de σ o que na pratica nao ocorre Na pratica a solucao e usar uma estimativa para todo parˆametro necessario e desconhecido Se nao conhecemos σ podemos estimalo usando os dados da amostra Lembre que o estimador de σ2 e S2 Mas quando substituımos σ por s na formula da padronizacao a curva deixa de ser Normal Padrao 10 19 Intervalo de confianca para µ A teoria mostra que T X µ S n segue uma curva que recebeu um nome curioso distribuicao t de Student assim chamada por ter sido descoberta Student o pseudˆonimo de W Gosset Gosset era quımico estatıstico e cervejeiro trabalhava na Guinness fazendo experimentos e analisando dados Descobriu muito na area de estatıstica mas a Guinness nao permitia publicacoes com seu nome Daı o pseudˆonimo e o nome da curva Essa curva e muito parecida com a Normal Padrao tem media zero e simetrica mas tem a variˆancia maior que 1 que depende de n V arT n1 n2 11 19 Intervalo de confianca para µ fx 00 01 02 03 04 Z T note a área maior nas caudas da curva T 0 1 1 2 2 3 3 Figura 2 Densidade da distribuicao T de Student comparada com Normal Padrao Para n temos que T Z Note que a curva continua centrada em zero apenas o achamento muda quanto menor n mais achatada e a curva 12 19 Intervalo de confianca para lu Relembrando toda distribuicdo tem seus pardametros e o pardametro da distribuicdo tStudent é chamado de grau de liberdade e sera denotado por v Este numero esta ligado ao denominador da variancia amostral 1 Soy Xi S xX el n1 n 11 O denominador é n 1 entdo os graus de liberdade para uma amostra é v n1 No futuro estaremos trabalhando com duas amostras nj no por exemplo e os graus de liberdade da estatistica T dependerdo dos dois ns A distribuicdo tStudent esta tabelada e usamos a tabela para encontrar probabilidades e quantis de interesse 1319 Intervalo de confianca para µ Assim para obtencao de intervalos de confianca para a media populacional na pratica usamos a X tν α 2 s n b X tν α 2 s n em que tν α 2 e o quantil da distribuicao tStudent com ν graus de liberdade para uma confianca de 100 1 α Exemplo 2 Considere que a amostra de 25 frutos forneceram os pesos 2859 2810 3236 3101 2879 3142 2655 3328 2886 2879 3059 2900 2956 2872 3256 3191 2677 3057 2906 2830 3492 3014 3177 3111 2804 Estime o peso medio de frutos desta especie atraves de um intervalo com 95 de confianca ICµ 95 14 19 Intervalo de confianca para µ Primeiro calculamos a media e o desvio padrao dos dados amostrais x 3003080 s 205563 Depois buscamos o quantil na distribuicao t com ν 25 1 24 graus de liberdade e α 005 t240025 2064 Com esses valores temos a 3003080 2064 205563 25 2918223 e b 3003080 2064 205563 25 3087937 Assim o IC95 para a verdadeira media do peso de frutos de Annona squamosa e 2918 3088 15 19 Intervalo de confianca para p Analogamente ao caso de estimado de uma média populacional por intervalo de confiana podemos estimar a propordo populacional p de alguma caracteristica de interesse através de um intervalo de confianca A ideia é encontrar a Pmax b Pémaz Nesse caso temos duas alternativas um intervalo conservador que usa o maior erro padrao tedrico possivel e o intervalo otimista que usa um erro padrdo estimado Conservador a Pza22 e b P zal22 aVn aVn Otimista a P za PUT ce b P za PORP 2 n 2 n 1619 Intervalo de confianca para p O intervalo otimista 6 uma aproximacdo quanto maior a amostra melhor a aproximacao Exemplo 3 Um teste de germinacdo com uma amostra aleatdéria de 300 sementes de Baru semeadas ainda no fruto resultou na germinacado de 36 delas Estime a proporcdo de germinacao desta espécie usando uma confianca de 98 Temos que p ae 012 e z001 233 Assim o intervalo conservador para a verdadeira proporao é 05 05 012 233 012 233 0053 0187 300 a 1719 Intervalo de confianca para p Ja o otimista é 012 x 088 012 x 088 012 233 x 4 012 233 x 4 300 300 0076 0164 Note que o IC otimista é mais preciso que o conservador dai o termo otimista Note também que para o IC para p NAO usamos a distribuigao t pois essa curva nado se encaixa quando as variadveis sao bindrias Existem outros métodos para obter IC para p mas eles sao muito complexos para esta disciplina 1819 Intervalos de confianca para outros parˆametros Podemos construir intervalos de confianca para qualquer parˆametro desde que tenhamos 1 uma estimativa do parˆametro e 2 a distribuicao de referˆencia para o estimador do parˆametro A distribuicao de referˆencia pode ser especificada atraves do conhecimento das propriedades teoricas do estimador ou atraves de simulacao 19 19