·

Medicina Veterinária ·

Bioestatística

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta
Equipe Meu Guru

Prefere sua atividade resolvida por um tutor especialista?

  • Receba resolvida até o seu prazo
  • Converse com o tutor pelo chat
  • Garantia de 7 dias contra erros

Texto de pré-visualização

Universidade Federal do Recôncavo da Bahia Centro de Ciências Exatas e Tecnológicas Cruz das Almas 2023 Thailany de Almeida Magalhães Noções de Inferência Estatística INTRODUÇÃO OBJETIVO Fazer afirmações sobre características de uma população baseandose em resultados de uma amostra Na inferência estatística a incerteza está sempre presente No entanto essa incerteza pode ser medida A incerteza é medida em termos de probabilidades INTRODUÇÃO Exemplo 1 Em um estudo antropométrico em nível nacional uma amostra de 5000 adultos é selecionada dentre os adultos brasileiros e uma das variáveis de estudo é a altura Medir as alturas de todos os brasileiros adultos População Todos os brasileiros adultos Interesse Altura dos brasileiros Variável aleatória X altura do adulto brasileiro Densidade normal X N μ σ2 INTRODUÇÃO Precisamos saber como a média amostral 𝑿 se relaciona com a média populacional 𝝁 Distribuição de probabilidade da média amostral 𝑋 Dados INTRODUÇÃO POPULAÇÃO Amostragem Obtenção dos dados Análise exploratória Teoria da Probabilidade Inferência RELEMBRANDO População é o conjunto de elementos que têm pelo menos uma característica comum observável Amostra é um subconjunto de elementos extraídos de uma população Parâmetro qualquer valor calculado com base em todos os elementos da população Estimador uma estatística destinada a estimar um parâmetro populacional Estimativa é o valor numérico do estimador com base nas observações amostrais Elemento Variáveis Aleatórias Altura m Peso kg Cor dos olhos População Parâmetros populacionais 𝚯 μ Média populacional σ Desvio padrão populacional Amostra Estimadores amostrais 𝚯 𝑥 Média amostral s Desvio padrão amostral Inferência RELEMBRANDO X 2 pˆ s2 P Estimador Média Variância Proporções Parâmetro X 2 pˆ ERROS AMOSTRAIS E NÃO AMOSTRAIS Erro Diferença entre o valor de certa característica na amostra e o parâmetro de interesse na população Erro amostral Devido à amostra selecionada Desvio que aparece porque o pesquisador não levantou a população toda Erro não amostral Devido a fatores independentes do plano amostral erros de medida digitação etc DISTRIBUIÇÕES AMOSTRAIS Diferentes amostras Valor estatístico distinto Variáveis aleatórias Valores incertos A distribuição amostral de uma estatística é a distribuição dos possíveis valores dessa estatística se examinássemos todas as possíveis amostras de tamanho n extraídas aleatoriamente de uma população DISTRIBUIÇÕES AMOSTRAIS 1Distribuição Amostral da Média Distribuição Amostral da Proporção DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Consideremos uma população na qual queremos avaliar uma variável X e cujos parâmetros 𝜇 𝐸 𝑋 e 𝜎2 𝑉𝑎𝑟𝑋 sejam conhecidos Ao retirar todas as possíveis AAS de tamanho n dessa população e para cada uma das amostras calcular a média amostral dada por 𝑋 Teremos então uma Distribuição Amostral da Média X DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Seja X uma va com média μ e variância σ2 e seja X1 Xn uma AAS de X Então E X V X 2n X N μ σ2 X N μ σ2 n Caso a população tenha distribuição Normal com média e desvio padrão a distribuição amostral das médias é Normal com média e desvio padrão n DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 1 Distribuição amostral da média amostral com base em amostras de tamanho n 4 para uma população normal com média 2 e variância 9 2 Distribuição populacional é mais dispersa que a amostral de X mas ambas estão centradas no verdadeiro valor populacional μ 2 DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Exemplo 2 A capacidade máxima de um elevador é de 500 kg Se a distribuição dos pesos dos usuários é N70 100 qual é a probabilidade de que 7 pessoas ultrapassem este limite E de 6 pessoas DISTRIBUIÇÃO AMOSTRAL DA MÉDIA A distribuição amostral das médias de amostras casuais simples de tamanho n extraída de uma população não Normal com média e desvio padrão é aproximadamente normal com média e desvio padrão n quando n é suficientemente grande Para a utilização deste resultado é usual considerar que o tamanho n da amostra é suficientemente grande quando n é superior a 30 DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Considere que a proporção de elementos numa população com determinada característica é p Defina como a proporção de elementos portadores da característica na amostra isto é X n X n i 1 n n S pˆ n p p p1 N Logo temse que a distribuição amostral de 𝑝 quando n é suficientemente grande é aproximadamente Estimação Os parâmetros em geral são desconhecidos A inferência estatística consiste em através de uma amostra estimar os valores dos parâmetros populacionais ou também testar se algumas hipóteses são válidas sobre determinados parâmetros Estes são os problemas da inferência paramétrica conhecidos como problemas de estimação e testes de hipóteses respectivamente Estimação Pontual Encontrar um valor numérico único que esteja bastante próximo do verdadeiro valor do parâmetro Este procedimento não permite julgar a magnitude do erro que podemos estar cometendo OBJETIVO Estimação Pontual Parâmetro Estimador Média n 1 i i X n 1 X Variância 2 n 1 i 2 i 2 X X 1 n 1 s Desvio padrão n 1 i 2 i X X 1 n 1 s Proporção p n pˆ X onde X número de elementos da amostra que possuem a característica n tamanho da amostra Estimação Intervalar Procura determinar um intervalo que abranja o valor do parâmetro populacional com certa margem de segurança Este procedimento permite julgar a magnitude do erro que podemos estar cometendo quando afirmamos que o intervalo encontrado abrange o verdadeiro valor do parâmetro Grau de confiança é a probabilidade do intervalo de confiança conter o verdadeiro valor do parâmetro Estimação Intervalar Suponha que o parâmetro de interesse é desejamos obter um intervalo com limite inferior I e limite superior S tal que PI S 1 Onde nível de significância é um valor pequeno ou seja 1 é próximo de 1 Os limites deste intervalo são variáveis aleatórias pois dependem da amostra selecionada Um intervalo deste tipo é denominado intervalo de 1 100 confiança para o parâmetro Intervalo de Confiança para a Média de uma População 1Amostras pequenas n 30 População Normal População não Normal 2 Amostras grandes n 30 Estimação Intervalar Intervalo de Confiança para a Média de uma População Estimação Intervalar 1Amostras pequenas n 30 População Normal 𝜎2 𝜎0 2 conhecido n z X n z X o o 2 2 Estimação Intervalar Estimação Intervalar 1 2 2 2 z Z z P z Z P Notação chamaremos o valor da Dist N 01 tal que 1Amostras pequenas n 30 População Normal 𝜎2 𝜎0 2 conhecido z 2 Intervalo de Confiança para a Média de uma População Exemplo 4 O desviopadrão do teor de proteína encontrado em um tipo de ração consumida por bovinos é de 98 gkg Em 15 porções que foram selecionadas da ração observouse um teor médio de ingestão de proteína de 65 gkg Encontre um intervalo com 90 de confiança para o teor médio de proteína deste tipo de ração 691 g kg 8 60 15 89 1645 65 15 89 1645 65 Intervalo de Confiança para a Média de uma População Exemplo 5 O desviopadrão dos pesos de trutas arcoíris de um criatório é 153 g Uma amostra de 45 trutas foi selecionada aleatoriamente deste criatório e apresentaram peso médio de 255 g Calcule um intervalo com 96 de confiança para o peso médio das trutas deste criatório Resp 2503 2597 g Estimação Intervalar 1Amostras pequenas n 30 População Normal 𝜎2 desconhecido Se o desvio padrão populacional 𝜎 for desconhecido Substituise pelo desviopadrão amostral 𝑆 Isto introduz uma incerteza extra uma vez que 𝑆 varia de amostra para amostra Para superar a incerteza extra usase a distribuição T de Student Parâmetro Estimador Média n 1 i i X n 1 X Variância 2 n 1 i 2 i 2 X X 1 n 1 s Desvio padrão n 1 i 2 i X X 1 n 1 s Proporção p n pˆ X onde X número de elementos da amostra que possuem a característica n tamanho da amostra Estimação Intervalar 1Amostras pequenas n 30 População Normal 𝜎2 desconhecido Distribuição de Student É contínua e simétrica com média igual a zero Aparência é bastante parecida com a distribuição Normal Padrão Qualificação com n1 graus de liberdade para cada valor diferente do tamanho da amostra n O número de graus de liberdade gl é o parâmetro da distribuição de Student Estimação Intervalar 1Amostras pequenas n 30 População Normal 𝜎2 desconhecido A distribuição t depende de um parâmetro chamado graus de liberdade 𝑔𝑙 Número de observações que variam livremente uma vez que a média amostral for calculada 𝒈𝒍 𝒏 𝟏 Estimação Intervalar 1Amostras pequenas n 30 População Normal 𝜎2 desconhecido Ideia Número de observações que são livres uma vez que a média amostral é calculada Exemplo Suponha que a média de 3 números é 80 Seja 𝑋1 7 𝑋2 8 𝑋3 Se a média destes 3 valores é 80 então 𝑋 3 tem que ser 9 ie 𝑋3 não é livre para variar Aqui n 3 então graus de liberdade n 1 3 1 2 2 valores podem ser qualquer número mas o terceiro não é livre para variar se a média é dada Estimação Intervalar 1Amostras pequenas n 30 População Normal 𝜎2 desconhecido Estimação Intervalar 1Amostras pequenas n 30 População Normal 𝜎2 desconhecido Tabela da T de Student Estimação Intervalar 1Amostras pequenas n 30 População Normal 𝜎2 desconhecido n s t X n s t X n n 1 2 1 2 Em que 𝑡𝛼2 𝑛1 é o valor crítico de uma distribuição t com 𝑛 1 graus de liberdade e uma área de 𝛼2 em cada cauda Estimação Intervalar 1Amostras pequenas n 30 População Normal 𝜎2 desconhecido Exemplo 5 Uma amostra aleatória de uma população normal com n 25 tem média amostral 𝑋𝑛 50 e desvio padrão amostral 𝑆 8 Construa o intervalo de confiança de 95 para a média populacional 𝜇 Solução 𝑔𝑙 𝑛 1 24 𝛼 005 𝑡 002524 2064 n s t X n s t X n n 1 2 1 2 50 2064 8 5 4669853302 Estimação Intervalar 2 Amostras grandes População Normal ou não Normal n s z X n s z X 2 2 Se n é suficientemente grande em geral n 30 mesmo sem conhecermos a distribuição da população os limites do Intervalo de Confiança para a média poderão ser calculados com base na distribuição Normal padrão Neste caso o Intervalo de Confiança é Estimação Intervalar Intervalo de Confiança para a Proporção Populacional Em muitas situações pode ser de interesse construir um intervalo de confiança para a proporção de elementos da população que possuem alguma característica de interesse p n X pˆ Se o tamanho da amostra for suficientemente grande é possível construir um intervalo de confiança para p baseado na distribuição Normal n pˆ pˆ 1 z pˆ n pˆ pˆ 1 z pˆ 2 2 Estimação Intervalar Intervalo de Confiança para a Proporção Populacional 0 541 98 53 ˆ p 0459 ˆ 1 p 2 0 025 96 1 2 z 0 442 0 640 98 0 459 0 541 196 0 541 98 0 459 0 541 196 0 541 Exemplo1 Examinamse 98 animais encontrandose 53 infectados com determinado vírus Construir um intervalo de 95 de confiança para a proporção de animais infectados Solução n 98 pode ser considerada grande α 005