·

Engenharia Civil ·

Estatística para Engenharia Civil

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Inferência Estatística: decidindo na presença de incerteza Intervalo de Confiança IDEST -UFMG Inferência Estatística POPULAÇÃO Conjunto de métodos de análise estatística que permitem tirar conclusões sobre uma população com base em somente uma parte dela, a amostra. AMOSTRA x Tipos de Inferência Estatística Inferência sobre o parâmetro μ Teste de Hipóteses sobre μ Estimação de μ Intervalo de Confiança Teste de Hipóteses Estimação Exemplo: de posse de uma amostra de 1000 eleitores de um Estado, deseja-se estimar a proporção de eleitores desse Estado que votarão no candidato Fulano. Estimação pontual: Estimação intervalar:   Estimação Intervalar Estimativa Intervalar = Estimativa pontual  Margem de Erro Exemplo: Em uma amostra de 40 alunos da UFMG, encontrou-se uma renda familiar média de 1600 reais (estimativa pontual), com desvio-padrão de 323 reais. A margem de erro foi calculada em 100 reais. Assim, a estimativa intervalar para a renda familiar média do aluno da UFMG é de [1600  100] = [1500 ; 1700] reais. EXEMPLO: estimar μ, a média da renda familiar dos alunos irão variar de amostra para amostra: que ingressaram na UFMG este ano Experimento: 1. Cada um de vocês tem acesso a uma amostra de 100 calouros; 2. Cada um calcula a estimativa pontual x em sua amostra; 3. Os valores de x serão próximos a , outros não…. Alguns valores de x Nível de Confiança de uma Estimativa Intervalar A estimativa intervalar é associada a um nível de confiança (geralmente expresso em porcentagem). Ex: nível de confiança de 95%. Chamamos a Estimativa Intervalar de Intervalo de Confiança. Ex: o intervalo de 95% de confiança para a renda familiar média do aluno da UFMG vai de R$1500 a R$1700. Interpretação: Temos uma confiança de 95% de que o valor desconhecido da renda familiar média do aluno da UFMG está entre R$1500 a R$1700. O que entendemos por confiança ? EXEMPLO: estimar μ, a renda média familiar dos alunos que ingressaram na UFMG este ano Experimento: 1. Cada um de vocês tem acesso a uma amostra de 100 calouros; 2. Cada um construirá um intervalo de 95% de confiança utilizando os dados da sua amostra. Resultado esperado: Intervalos de confiança com limites e comprimentos diferentes. Cerca de 95% dos intervalos construídos por vocês irão conter o valor desconhecido de μ. Interpretação do Nível de Confiança na Estimação Intervalar 95% dos IC95% construídos de diferentes amostras de mesmo tamanho contêm o valor desconhecido de μ. Relembrando: Teorema Central do Limite Seja uma amostra aleatória x1, x2 ,..., xn , de uma variável aleatória X com média  e desvio padrão . ~ N (0,1)  / n n Z  X   α/2 α/2 μ L1 L2 2.5% 2.5% 95% X Sabemos que a distribuição de X está centrada em μ. Também sabemos que um “pequeno” percentual dos valores que pode estar distante de μ. Assim, vamos encontrar um intervalo de valores [L1 ; L2], simétrico em relação a μ, que englobe uma “grande” porcentagem dos valores que X pode assumir. X α/2 α/2 μ L2 L1 2.5% 2.5% 95% X O intervalo de valores [L1 ; L2] é o que chamamos Intervalo de Confiança para μ. No exemplo acima, [L1 ; L2] é um Intervalo de 95% de Confiança para μ. De modo geral, o intervalo de valores [L1 chamamos de ; L2] é o que Intervalo de Confiança de 100(1-α)% para μ. μ L2 L1 (1- α) X  2  2 L1 é o percentil α/2% e L2 é o percentil (1- α/2)% da distribuição de X. μ L2 L1 (1- α) X  2  2 L1 e L2 são simétricos em relação a μ. Relembrando o cálculo de percentis na distribuição Normal L1  P100/ 2  X  z( / 2)  X L2  P100(1 / 2)  X  z( / 2)  X X  z /2  n X  z/2  n  X z /2  n  X z /2  n Como X  e não conhecemos o valor de μ, substituímos μ por sua estimativa pontual, ou seja, x . L1  x z / 2  n L2  x z / 2  n e /2.   IC n   100(1)%     x  z O intervalo de 100(1-α)% de confiança para μ é dado por /2 IC 100(1)%  .     n    x  z Erro de estimação estimativa pontual de μ variabilidade de X Fator para redução da confiança Nível de confiança Intervalo de 100(1-α)% de Confiança para μ IC100(1)%    n     x  z/2. E se o desvio-padrão populacional () for desconhecido ? é preciso conhecer seu valor s / n Podemos substituir  por sua estimativa pontual, s, o desvio- padrão amostral. X   No entanto, ao fazermos isto, a variável não segue a distribuição Normal. s / n Resultado Importante: Se x1, x2, . . . xn é uma amostra aleatória de umapopulação X   Qual é a distribuição de probabilidades de Normal com média  e desvio padrão , a variável s / n tem distribuição t de Student com (n-1) graus de liberdade. T  X   ? Intervalo de 100(1-α)% de Confiança para a Média margem de erro  / 2;(n1) s   IC100(1 )%  x  t .  n    percentil da distribuição t-Student com (n -1) g.l. que deixa acima dele uma probabilidade igual a α/2 α/2 t /2;(n1) estimativa pontual de μ estimativa da variabilidade de x entre amostras de tamanho n Tabela t g.l. | α | 0.25 | 0.20 | 0.15 | 0.10 | 0.05 | 0.025 | 0.01 | 0.005 | 0.0025 | 0.001 | 0.0005 1 | 1.000 | 1.376 | 1.963 | 3.078 | 6.314 | 12.71 | 31.82 | 63.66 | 127.3 | 318.3 | 636.6 2 | 0.816 | 1.061 | 1.386 | 1.886 | 2.920 | 4.303 | 6.965 | 9.925 | 14.09 | 22.33 | 31.60 3 | 0.765 | 0.978 | 1.250 | 1.638 | 2.353 | 3.182 | 4.541 | 5.841 | 7.453 | 10.21 | 12.92 4 | 0.741 | 0.941 | 1.190 | 1.533 | 2.132 | 2.776 | 3.747 | 4.604 | 5.598 | 7.173 | 8.610 5 | 0.727 | 0.920 | 1.156 | 1.476 | 2.015 | 2.571 | 3.365 | 4.032 | 4.773 | 5.893 | 6.869 6 | 0.718 | 0.906 | 1.134 | 1.440 | 1.943 | 2.447 | 3.143 | 3.707 | 4.317 | 5.208 | 5.959 7 | 0.711 | 0.896 | 1.119 | 1.415 | 1.895 | 2.365 | 2.998 | 3.499 | 4.029 | 4.785 | 5.408 8 | 0.706 | 0.889 | 1.108 | 1.397 | 1.860 | 2.306 | 2.896 | 3.355 | 3.833 | 4.501 | 5.041 9 | 0.703 | 0.883 | 1.100 | 1.383 | 1.833 | 2.262 | 2.821 | 3.250 | 3.690 | 4.297 | 4.781 10 | 0.700 | 0.879 | 1.093 | 1.372 | 1.812 | 2.228 | 2.764 | 3.169 | 3.581 | 4.144 | 4.587 11 | 0.697 | 0.876 | 1.088 | 1.363 | 1.796 | 2.201 | 2.718 | 3.106 | 3.497 | 4.025 | 4.437 12 | 0.695 | 0.873 | 1.083 | 1.356 | 1.782 | 2.179 | 2.681 | 3.055 | 3.428 | 3.930 | 4.318 13 | 0.694 | 0.870 | 1.079 | 1.350 | 1.771 | 2.160 | 2.650 | 3.012 | 3.372 | 3.852 | 4.221 14 | 0.692 | 0.868 | 1.076 | 1.345 | 1.761 | 2.145 | 2.624 | 2.977 | 3.326 | 3.787 | 4.140 15 | 0.691 | 0.866 | 1.074 | 1.341 | 1.753 | 2.131 | 2.602 | 2.947 | 3.286 | 3.733 | 4.073 16 | 0.690 | 0.865 | 1.071 | 1.337 | 1.746 | 2.120 | 2.583 | 2.921 | 3.252 | 3.686 | 4.015 17 | 0.689 | 0.863 | 1.069 | 1.333 | 1.740 | 2.110 | 2.567 | 2.898 | 3.222 | 3.646 | 3.965 18 | 0.688 | 0.862 | 1.067 | 1.330 | 1.734 | 2.101 | 2.552 | 2.878 | 3.197 | 3.610 | 3.922 19 | 0.688 | 0.861 | 1.066 | 1.328 | 1.729 | 2.093 | 2.539 | 2.861 | 3.174 | 3.579 | 3.883 20 | 0.687 | 0.860 | 1.064 | 1.325 | 1.725 | (...continua...) Tabela t (...continuação) g.l. | α | 0.25 | 0.20 | 0.15 | 0.10 | 0.05 | 0.025 | 0.01 | 0.005 | 0.0025 | 0.001 | 0.0005 20 | 0.687 | 0.860 | 1.064 | 1.325 | 1.725 | 2.086 | 2.528 | 2.845 | 3.153 | 3.552 | 3.850 21 | 0.686 | 0.859 | 1.063 | 1.323 | 1.721 | 2.080 | 2.518 | 2.831 | 3.135 | 3.527 | 3.819 22 | 0.686 | 0.858 | 1.061 | 1.321 | 1.717 | 2.074 | 2.508 | 2.819 | 3.119 | 3.505 | 3.792 23 | 0.685 | 0.858 | 1.060 | 1.319 | 1.714 | 2.069 | 2.500 | 2.807 | 3.104 | 3.485 | 3.767 24 | 0.685 | 0.857 | 1.059 | 1.318 | 1.711 | 2.064 | 2.492 | 2.797 | 3.091 | 3.467 | 3.745 25 | 0.684 | 0.856 | 1.058 | 1.316 | 1.708 | 2.060 | 2.485 | 2.787 | 3.078 | 3.450 | 3.725 26 | 0.684 | 0.856 | 1.058 | 1.315 | 1.706 | 2.056 | 2.479 | 2.779 | 3.067 | 3.435 | 3.707 27 | 0.684 | 0.855 | 1.057 | 1.314 | 1.703 | 2.052 | 2.473 | 2.771 | 3.057 | 3.421 | 3.690 28 | 0.683 | 0.855 | 1.056 | 1.313 | 1.701 | 2.048 | 2.467 | 2.763 | 3.047 | 3.408 | 3.674 29 | 0.683 | 0.854 | 1.055 | 1.311 | 1.699 | 2.045 | 2.462 | 2.756 | 3.038 | 3.396 | 3.659 30 | 0.683 | 0.854 | 1.055 | 1.310 | 1.697 | 2.042 | 2.457 | 2.750 | 3.030 | 3.385 | 3.646 40 | 0.681 | 0.851 | 1.050 | 1.303 | 1.684 | 2.021 | 2.423 | 2.704 | 2.971 | 3.307 | 3.551 50 | 0.679 | 0.849 | 1.047 | 1.299 | 1.676 | 2.009 | 2.403 | 2.678 | 2.937 | 3.261 | 3.496 60 | 0.679 | 0.848 | 1.045 | 1.296 | 1.671 | 2.000 | 2.390 | 2.660 | 2.915 | 3.232 | 3.460 80 | 0.678 | 0.846 | 1.043 | 1.292 | 1.664 | 1.990 | 2.374 | 2.639 | 2.887 | 3.195 | 3.416 100 | 0.677 | 0.845 | 1.042 | 1.290 | 1.660 | 1.984 | 2.364 | 2.626 | 2.871 | 3.174 | 3.390 120 | 0.677 | 0.845 | 1.041 | 1.289 | 1.658 | 1.980 | 2.358 | 2.617 | 2.860 | 3.160 | 3.373 ∞ | 0.674 | 0.842 | 1.036 | 1.282 | 1.645 | 1.960 | 2.326 | 2.576 | 2.807 | 3.090 | 3.291 Exemplo: Lâmpadas Foram sorteadas 25 lâmpadas ao acaso, o tempo médio de duração das lâmpadas sorteadas foi 3200 horas com um desvio padrão de 900 horas. Construa um Intervalo de Confiança para o tempo médio das lâmpadas do lote. 𝐼𝐶𝜇 100(1−𝛼) = ҧ𝑥 ± 𝑡 𝑛−1; ൗ 𝛼 2 𝑠 𝑛 = 3200 ± 𝑡 24; ൗ 𝛼 2 900 25 = 3200 ± 𝑡 24; Τ 𝛼 2 180 Intervalo de 90% de confiança: 100(1-α)%=90% 1- = 0.90   = 0.10  /2 = 0.05  t(24;0,05) = 1.711 IC90%32001.711180 3200 307.98 IC90% 2892,02 ; 3507,98 Intervalo de 95% de confiança: 100(1-α)%=95% 1- = 0.95   = 0.05  /2 = 0.025  t(24;0,025) = 2.064 IC95%3200 2.064180 3200 371,52 IC95% 2828,48 ; 3571,52 “O tempo médio de duração para esta população de l â m p a d a s está entre 2 8 9 2 , 0 2 e 3 5 0 7 , 9 8 h o r a s , com 90% de confiança.” “O tempo médio de duração para esta população de l â m p a d a s está entre 2 8 2 8 , 4 8 e 3 5 7 1 , 5 2 h o r a s , com 95% de confiança.” Como diminuir o comprimento do IC ?  /2 100(1 .   IC x  z  )%   n   Reduzir o nível de confiança Reduzir a variabilidade da população Aumentar o tamanho da amostra Intervalo de 100(1-α)% de Confiança para a Variância 2 de uma População Normal Exemplo: Garrafas de refrigerente enchidas em máquinas automáticas. A variabilidade do volume do líquido dispensado deve ser controlada. Em uma amostra de tamanho n=30, encontrou-se variância amostral igual a s2 = 25 ml2 (desvio-padrão amostral igual s = 5 ml). O Intervalo de Confiança de 95% para a variância 2 é ; 725 45.7 16.1 725 29(25) 95% 2 [0.975;29] ; [15.9; 45.0] 2 [0.025;29] IC2    29(25)       ml2 Válido somente quando n > 30 (amostras grandes) margem de erro percentil da distribuição Normal Padrão que deixa acima dele probabilidade igual a α/2 estimativa da variabilidade de p entre amostras de tamanho n nível de confiança Exemplo: Defeitos em semicondutores. Fabricante quer mostrar que proporção de defeituosos atende especificação de < 0.05. Parâmetro: θ proporção de defeituosos. Amostra: n=200, x=4 e p=x/n=4/200=0.02. IC^90%_θ = [ p - z_0.05 √(p(1-p)/n); p + z_0.05 √(p(1-p)/n) ] = [ 0.02 - 1.645 √(0.02(0.98)/200); 0.02 + 1.645 √(0.02(0.98)/200) ] = |0.02 - 0.016; 0.02 + 0.016| = [0.004; 0.036]. Cálculo de tamanho de amostra O valor de n pode ser extraído da expressão para o erro de estimação Para o caso da média populacional μ, temos erro de estimação = z /2.  n 2 n = z .  /2 erro de estimação       Cálculo de tamanho de amostra 2 n = z/2. erro de estimação       Para o cálculo de n, precisamos do valor de , de α e do valor máximo desejado para o erro de estimação. Reformulando a pergunta …. Qual é o tamanho de amostra mínimo para que o erro de estimação de μ, em um intervalo de 100(1-α)% de confiança, seja, no máximo de a unidades? Exemplo: idade média ao falar Qual é o tamanho mínimo de amostra para se estimar o tempo médio de duração das lâmpadas, em um intervalo de 95% de confiança, com um erro de estimação máximo de 380 horas? Suponha que o desvio-padrão seja de  = 950 horas. (0.05/2) 9502 n = 380 z       24 . 01 = 25 n = 1.96  9502    Ou seja, devem ser amostradas, no mínimo, 25 lâmpadas. 380 Cálculo de tamanho de amostra para o caso da estimação de uma proporção /2 n . p(1 p) erro de estimação  z O erro de estimação depende do próprio parâmetro a ser estimado (!!!) Como fazer ??? Vamos usar uma propriedade interessante da expressão p(1 p) Propriedade de p(1 p) 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.1 0.2 0.3 0.4 0.5 p p(1 p) O valor de p(1 p) é máximo quando p=0.50. Cálculo de tamanho de amostra para o caso da estimação de uma proporção /2 n . p(1 p) erro de estimação  z O cálculo de n é feito considerando p=0.50.  p(1p)  z 2 n    /2   erro  0.52  z 2 n    /2   erro  Exemplo: estimação da proporção de pessoas curadas com um novo tratamento Qual é o tamanho mínimo de amostra para se estimar a proporção intervalo de cura com novo tratamento, de 95% de confiança, com um em um erro de estimação máximo de 0.10? 0.52  z 2 n  /2   erro   1.962 2 0.5  96.04 n    0.10 Ou seja, devem ser amostradas, no mínimo, 97 pessoas. Se o erro máximo fosse de 0.05, seriam necessárias, no mínimo, 385 pessoas. Estimação da média  com variância desconhecida (população Normal) 𝐿𝐼𝐶𝜇 100 1−𝛼 % = ҧ𝑥 − 𝑡 ൗ 𝛼 2;𝑛−1 𝑠 𝑛 𝐿𝑆𝐶𝜇 100 1−𝛼 % = ҧ𝑥 + 𝑡 ൗ 𝛼 2;𝑛−1 𝑠 𝑛 Estimação da variância 2 (população Normal) 𝐿𝐼𝐶𝜎2 100 1−𝛼 % = 𝑛 − 1 𝑆2 𝜒 ൗ 𝛼 2;𝑛−1 2 𝐿𝑆𝐶𝜎2 100 1−𝛼 % = 𝑛 − 1 𝑆2 𝜒 1− ൗ 𝛼 2;𝑛−1 2 𝐿𝐼𝐶𝜃=𝑝 100 1−𝛼 % = Ƹ𝑝 − 𝑧 ൗ 𝛼 2 𝑝(1 − 𝑝) 𝑛 𝐿𝑆𝐶𝜃=𝑝 100 1−𝛼 % = Ƹ𝑝 + 𝑧 ൗ 𝛼 2 𝑝(1 − 𝑝) 𝑛