·
Engenharia Elétrica ·
Probabilidade e Estatística 1
Send your question to AI and receive an answer instantly
Recommended for you
1
Lista de Exercicios Resolvidos - Probabilidade e Estatistica - Distribuicao de Variaveis Continuas
Probabilidade e Estatística 1
UNIFEI
6
Aproximação da Binomial e Poisson pela Normal - Resumo Completo
Probabilidade e Estatística 1
UNIFEI
2
Exercícios Resolvidos Teste de Hipótese Estatística - Nível Superior
Probabilidade e Estatística 1
UNIFEI
2
Gabarito Lista 5 Estatística - Respostas Detalhadas para Exercícios
Probabilidade e Estatística 1
UNIFEI
2
Tabela Distribuição Normal Padrão - Tabela P Z
Probabilidade e Estatística 1
UNIFEI
1
Lista de Exercícios Resolvidos - Distribuição Normal - Estatística
Probabilidade e Estatística 1
UNIFEI
4
Lista de Exercícios Resolvidos Estatística - Distribuição Normal e Amostral
Probabilidade e Estatística 1
UNIFEI
1
Tabela-t-de-Student-Valores-de-Probabilidade-e-Graus-de-Liberdade
Probabilidade e Estatística 1
UNIFEI
27
Teste de Hipótese - Conceitos e Exemplos Estatísticos
Probabilidade e Estatística 1
UNIFEI
2
Lista de Exercicios - Intervalo de Confianca - Estatistica
Probabilidade e Estatística 1
UNIFEI
Preview text
Estimativas e Tamanho Amostral Introdução Essência da inferência estatística é usar dados amostrais para fazer inferência sobre populações Aplicações As duas maiores aplicações da inferência estatística envolvem o uso de dados amostrais para Estimar o valor de um parâmetro populacional Testar alguma afirmação ou hipótese sobre uma população Definições Parâmetro As quantidades da população em geral desconhecidas sobre as quais temos interesse são denominadas parâmetros e usualmente representadas por letras gregas como entre outras Definições Estimador e estimativa À combinação dos elementos da amostra construída com a finalidade de representar ou estimar um parâmetro de interesse na população denominamos de estimador Denotamos por etc Aos valores numéricos assumidos pelos estimadores denominamos estimativas pontuais ou simplesmente estimativas Bons Estimadores de Parâmetros Para usar uma estatística amostral para estimar um parâmetro populacional algumas estatísticas são boas no sentido de que elas atingem o alvo do parâmetro populacional e então fornece bons resultados Tais estatísticas são chamadas estimadores não viesados Estatísticas que atingem o alvo Média variância e proporção Estatísticas que não atingem o alvo mediana amplitude e desvio padrão Vício ou Vies Um estimador é não viciado se o seu valor esperado coincide com o parâmetro de interesse Consistência Um estimador é consistente se a medida que o tamanho da amostra aumenta seu valor esperado converge para o parâmetro de interesse e sua variância converge para zero Estimação de Parâmetros População Amostra Distribuição de probabilidade Distribuição Amostral Parâmetros Estatísticas Valor fixo Variável Aleatória Estimar Estimação Pontual Uma estimativa pontual é um único valor ou ponto usado para aproximar um parâmetro populacional Intervalar Um intervalo de confiança ou estimativa intervalar é uma faixa de valores usada para estimar o verdadeiro valor de um parâmetro populacional Estimativa Pontual Como escolher o melhor valor para ser uma estimativa pontual Exemplo Estamos interessados na média das alturas de jovens com idade entre 15 e 18 anos nascidos na região sudeste do país Vamos coletar uma amostra e usála para tirar conclusões Para facilitar suponha que a amostra tenha somente 10 jovens escolhidos ao acaso dentre a população mencionada Amostra 165 157 172 166 171 174 181 168 160 177 Exemplo Considere uma população formada pelos números 2 3 e 4 A média da população é 3 A variância da população é 23 Estimativas Considere amostras de tamanho 2 Possíveis amostras de tamanho 2 com reposição 2 2 2 3 2 4 3 2 3 3 3 44 2 4 3 4 4 Média das médias amostrais 3 Variância 13 Média amostral frequência 2 25 3 35 4 1 2 3 2 1 0 05 1 15 2 25 3 35 2 25 3 35 4 média amostral Teorema Central do Limite Uma variável aleatória pode ter uma distribuição qualquer possuindo uma média μ e um desviopadrão σ Se ao invés de tirarmos uma única amostra tirarmos várias amostras de tamanho n e analisarmos a distribuição das médias de cada amostra de tamanho n observaremos que À medida que o tamanho n da amostra aumenta a distribuição das médias amostrais tende a uma distribuição normal A média das médias amostrais será a média populacional μ O desvio padrão das médias amostrais será s σ x n Observações importantes Quando maior o tamanho das amostras a distribuição das médias será mais próxima de uma distribuição normal Para n30 a distribuição das médias amostrais pode ser aproximada satisfatoriamente por uma distribuição normal Se a distribuição da variável x for originalmente uma distribuição normal então a distribuição das médias amostrais terá distribuição normal para qualquer tamanho amostral n Teorema Central do Limite Estimativas por Intervalos Estimativas por intervalo ou intervalo de confiança Valor do parâmetro estimativa pontual Erro de amostragem gerando um intervalo de confiança Erro de amostragem O erro de amostragem é diretamente proporcional à dispersão da população quanto mais dispersa a população maior será a variação entre as amostras diretamente proporcional à confiança dos resultados se queremos um intervalo de confiança que contenha o valor do parâmetro esse intervalo deve ser tanto maior quanto se aumenta a certeza de que ele conterá o valor do parâmetro Erro de amostragem Por outro lado quanto maior o intervalo menos informação se obtêm para esse parâmetro A situação desejável é obter um intervalo relativamente pequeno com uma confiança elevada Nível de confiança O nível de confiança é a probabilidade 1α em geral expressa o valor equivalente em porcentagem que é a proporção de vezes que o intervalo de confiança realmente contém o parâmetro populacional supondo que o processo de estimação seja repetido um grande número de vezes O nível de confiança é também chamado de grau de confiança ou coeficiente de confiança As escolhas mais comuns são 90 α01 95 α005 e 99 α001 Esquema 0 002 004 006 008 01 012 014 0 5 10 15 20 0 01 N z z 2 2 1 Intervalo de confiança para a média da população quando σ é conhecido Suponha que a distribuição amostral do estimador x é normal Isso ocorrerá se a população for normalmente distribuída ou com boa aproximação se a amostra for suficientemente grande Devemos construir um intervalo em torno de x de forma que esse intervalo contenha o valor do parâmetro com confiança 1 α Notação μ média da população x média da amostra σ desvio padrão da população n tamanho da amostra lo semiamplitude do intervalo de confiança erro zpvalor particular da variável normal reduzida z que determina uma cauda à direita de sua distribuição com probabilidade p 0 002 004 006 008 01 012 014 0 5 10 15 20 0 01 N Intervalo de Confiança para X X n N01 Normal Padrão z z P Z z 2 2 1 1 P z Z z 1 X P z z n 1 P z X z n n 1 P X z X z n n IC para nível de significância nível de confiança 2 X N desconhecido mas 2 conhecido 2 X N n Z Intervalo de Confiança para Exemplo uma va qualquer tem uma distribuição desconhecida com média também desconhecida e variância 2 16 Retirase uma amostra de 25 valores e calculase a média amostral Construa um IC de 95 para supondo que 127 X 095 P X z X z n n 0 002 004 006 008 01 012 014 0 5 10 15 20 0 01 N 95 z z 25 25 196 4 4 127 196 127 196 095 25 25 P 127 1568 127 1568 095 P 11132 14268 095 P Como poderia obter intervalos de confiança mais estreitos ou seja com limites mais próximos a média verdadeira diminuindose o nível de confiança aumentandose o tamanho da amostra Determinação do tamanho Amostral Determinação do tamanho da amostra necessário para estimar a média sabendo o desvio padrão populacional 2 0 2 l z n Regra do arredondamento para o tamanho amostral Ao determinar o tamanho amostral n se o uso da fórmula não resulta em um número inteiro sempre aumente o valor de n para o número inteiro maior mais próximo Intervalo de confiança para a média da população quando σ é desconhecido Apresentamos um método para a construção de estimativas de intervalo de confiança de μ se a exigência de que σ seja conhecido O procedimento usual é coletar dados amostrais e achar valores das estatísticas n x e s Como esse método se baseia nessas estatísticas e não se exige conhecimento de σ é bem realista prático e muito usado Suposições Quando o desvio padrão não é conhecido e temos as seguintes condições A amostra é uma amostra aleatória simples A amostra provém de uma população normalmente distribuída ou n suficientemente grande Usaremos a distribuição t de Student Como não conhecemos o valor de σ estimamos com o valor do desvio padrão amostral s mas isso introduz uma outra fonte de incerteza especialmente com amostras pequenas Para manter o intervalo de confiança em algum nível desejado tal como 95 compensamos essa incerteza adicional fazendo o intervalo de confiança um pouco mais largo usando os valores críticos maiores fornecidos pela distribuição t de Student Distribuição t de Student 1 2 2 1 2 1 2 g g x f x x g g g 0 E X 2 g Var X g g X t lêse X tem distribuição t de Student com g graus de liberdade tg 0 Distribuição t de Student Se a distribuição de uma população é essencialmente normal aproximadamente em forma de sino então a distribuição de é essencialmente uma distribuição t de Student para todas as amostras de tamanho n A distribuição t de Student em geral chamada de distribuição t é usada para achar valores críticos denotados por tgα2 n s x t Definição O número de graus de liberdade para uma coleção de dados amostrais é o número de valores amostrais que podem variar depois que certas restrições tiverem sido impostas aos dados amostrais Exemplo Se 10 estudantes tem valores de testes com média 80 podemos livremente atribuir valores aos nove primeiros mas o décimo será determinado pois a soma dos 10 valores terá que ser 800 Dizemos que há 9 graus de liberdade disponíveis Assim definiremos o número de graus de liberdade como n 1 Propriedades da distribuição t Tem tamanhos diferentes para tamanhos de amostras diferentes Tem a mesma forma geral simétrica em sino que a distribuição normal mas reflete a maior variabilidade que se espera com pequenas amostras Tem média de t0 o desvio padrão varia com o tamanho amostral mas é maior que 1 A medida que o tamanho amostral n aumenta ela se aproxima da distribuição normal 0 002 004 006 008 01 012 014 0 5 10 15 20 0 t 0 g P T t g 01 005 0025 001 0005 1 3078 6314 12706 31821 63656 2 1886 2920 4303 6965 9925 3 1638 2353 3182 4541 5841 4 1533 2132 2776 3747 4604 5 1476 2015 2571 3365 4032 6 1440 1943 2447 3143 3707 7 1415 1895 2365 2998 3499 8 1397 1860 2306 2896 3355 9 1383 1833 2262 2821 3250 10 1372 1812 2228 2764 3169 11 1363 1796 2201 2718 3106 12 1356 1782 2179 2681 3055 13 1350 1771 2160 2650 3012 14 1345 1761 2145 2624 2977 15 1341 1753 2131 2602 2947 16 1337 1746 2120 2583 2921 17 1333 1740 2110 2567 2898 18 1330 1734 2101 2552 2878 19 1328 1729 2093 2539 2861 20 1325 1725 2086 2528 2845 21 1323 1721 2080 2518 2831 22 1321 1717 2074 2508 2819 23 1319 1714 2069 2500 2807 24 1318 1711 2064 2492 2797 25 1316 1708 2060 2485 2787 26 1315 1706 2056 2479 2779 27 1314 1703 2052 2473 2771 28 1313 1701 2048 2467 2763 29 1311 1699 2045 2462 2756 30 1310 1697 2042 2457 2750 40 1303 1684 2021 2423 2704 50 1299 1676 2009 2403 2678 60 1296 1671 2000 2390 2660 120 1289 1658 1980 2358 2617 1282 1645 1960 2326 2576 10 2764 P T 10 2764 001 P T 2 g g t P T 0 002 004 006 008 01 012 014 0 5 10 15 20 0 1 nt Intervalo de Confiança para X s n 1 nt t t 2 2 1 1 X P t t s n 1 s s P t X t n n 1 s s P X t X t n n IC para 2 X N e 2 desconhecidos T 1 P t T t Procedimento para a construção de um intervalo de confiança para μ com σ desconhecido Amostra aleatória simples população normalmente distribuída Usando n1 graus de liberdade consulte a tabela para achar o valor crítico tα2 Calcule a margem de erro E tα2 Usando o valor calculado para a margem de erro e a média amostral escreva o intervalo de confiança x E μ x E ou x E x E Arredonde os limites do intervalo de confiança para uma casa a mais dos dados originais ou para o mesmo número de casas decimais usado para a média amostral s n 095 s s P X t X t n n 0 002 004 006 008 01 012 014 0 5 10 15 20 0 24 t 95 t t 25 25 2064 4 4 127 2064 127 2064 095 25 25 P 127 16512 127 16512 095 P 110488 143512 095 P Exemplo Uma va qualquer tem uma distribuição desconhecida com média μ e σ desconhecidos Retirase uma amostra de 25 valores e calculase a média amostral e o desvio padrão amostral Construa um IC de 95 para μ sabendo que a média amostral é igual a 127 e o desvio padrão amostral é 4 Tamanho amostral Como vimos anteriormente o tamanho amostral dependia do valor do desvio padrão populacional que neste caso não é conhecido Para estimar o desvio padrão populacional usamos o desvio padrão amostral s porém se não temos uma amostra não dispomos do valor de s Para resolver esse problema temos duas alternativas 1 Trabalhar com um limitante superior para o valor do desvio padrão populacional que colocado na expressão Nos leva a um tamanho de amostra suficiente em geral superdimensionada 2 0 2 l z n 2 Escolher uma amostra piloto de n elementos para com base nela obtermos uma estimativa para s empregando na seguinte expressão Se n n a mostra piloto já terá sido suficiente para estimação Caso contrário devemos retirar ainda da população os elementos necessários para complementação do tamanho mínimo da amostra 2 0 2 l s t n g Exercícios Estimação da Variância populacional Muitas situações reais tais com controle de qualidade em processo de produção exigem que estimemos valores de variância ou de desvio padrão populacional Além de fabricar produtos com medidas que resultem em uma média desejada o fabricante deve fazer produtos de qualidade consiste Essa consistência pode ser medida pela variância ou pelo desvio padrão Condições A amostra é uma amostra aleatória simples A população deve ser normalmente distribuída mesmo que a amostra seja grande Para desenvolver estimativas de variâncias e desvios padrões usaremos uma outra distribuição denominada distribuição qui quadrado Distribuição QuiQuadrado Selecionando aleatoriamente amostras independentes de tamanho n e calculando a variância amostral s2 para cada amostra A estatística amostral x2 n1 s2 σ2 tem uma distribuição chamada distribuição QuiQuadrado 2 2 2 1 s n x Distribuição Quiquadrado 2 1 2 2 1 0 2 2 g x g f x x e x g 0 g 2 0 g 2 E X g 2 Var X g 2 g X lêse X tem distribuição quiquadrado com g graus de liberdade Propriedades Não é simétrica quanto mais o grau de liberdade aumente mais próxima fica de uma distribuição simétrica Os valores são sempre positivos A distribuição é diferente para cada número de grau de liberdade Como a distribuição não é simétrica devemos fazer cálculos diferentes para os limites inferiores e superiores do intervalo de confiança Como consultar a tabela da Distribuição 2 Distribuição 2 P2 x 0005 0010 0025 0050 0100 0900 0950 0975 0990 0995 1 788 663 502 384 271 002 000 000 000 000 2 1060 921 738 599 461 021 010 005 002 001 3 1284 1134 935 781 625 058 035 022 011 007 4 1486 1328 1114 949 778 106 071 048 030 021 5 1675 1509 1283 1107 924 161 115 083 055 041 6 1855 1681 1445 1259 1064 220 164 124 087 068 7 2028 1848 1601 1407 1202 283 217 169 124 099 8 2195 2009 1753 1551 1336 349 273 218 165 134 9 2359 2167 1902 1692 1468 417 333 270 209 173 10 2519 2321 2048 1831 1599 487 394 325 256 216 11 2676 2473 2192 1968 1728 558 457 382 305 260 12 2830 2622 2334 2103 1855 630 523 440 357 307 13 2982 2769 2474 2236 1981 704 589 501 411 357 14 3132 2914 2612 2368 2106 779 657 563 466 407 15 3280 3058 2749 2500 2231 855 726 626 523 460 16 3427 3200 2885 2630 2354 931 796 691 581 514 17 3572 3341 3019 2759 2477 1009 867 756 641 570 18 3716 3481 3153 2887 2599 1086 939 823 701 626 19 3858 3619 3285 3014 2720 1165 1012 891 763 684 20 4000 3757 3417 3141 2841 1244 1085 959 826 743 21 4140 3893 3548 3267 2962 1324 1159 1028 890 803 22 4280 4029 3678 3392 3081 1404 1234 1098 954 864 23 4418 4164 3808 3517 3201 1485 1309 1169 1020 926 24 4556 4298 3936 3642 3320 1566 1385 1240 1086 989 25 4693 4431 4065 3765 3438 1647 1461 1312 1152 1052 26 4829 4564 4192 3889 3556 1729 1538 1384 1220 1116 27 4965 4696 4319 4011 3674 1811 1615 1457 1288 1181 28 5099 4828 4446 4134 3792 1894 1693 1531 1356 1246 29 5234 4959 4572 4256 3909 1977 1771 1605 1426 1312 30 5367 5089 4698 4377 4026 2060 1849 1679 1495 1379 40 6677 6369 5934 5576 5181 2905 2651 2443 2216 2071 50 7949 7615 7142 6750 6317 3769 3476 3236 2971 2799 60 9195 8838 8330 7908 7440 4646 4319 4048 3748 3553 70 10421 10043 9502 9053 8553 5533 5174 4876 4544 4328 80 11632 11233 10663 10188 9658 6428 6039 5715 5354 5117 90 12830 12412 11814 11315 10757 7329 6913 6565 6175 5920 100 14017 13581 12956 12434 11850 8236 7793 7422 7006 6733 g 0 2 t 2 2 g t P 2 15 09 P 2 15 855 09 P Valores Críticos 1240 25 25 2 24 0 2 a 2 b 95 3936 2 ax Para calcular Temos que considerar a área total à direita desse valor que é 0975 que se obtém pela subtração 1 0025 Estimadores de σ2 A variância amostral tende ao alvo do valor da variância populacional de modo que s2 é um estimador nãoviesado de σ2 A variância amostral s2 é a melhor estimativa pontual da variância populacional σ2 Intervalo de confiança para a variância populacional σ2 2 2 2 2 2 1 1 E D x s n x s n 2 xD Onde e representam o valor crítico da cauda direita e o valor crítico da cauda esquerda respectivamente 2 xE Intervalo de Confiança para 2 Exemplo uma va qualquer tem uma distribuição desconhecida com média e variância 2 desconhecidas Retirase uma amostra de 25 valores e calculase a variância amostral Construa um IC de 95 para 2 supondo que s2 234 2 2 2 2 2 1 1 095 b a n s n s P 1240 2 24 234 24 234 095 3936 1240 P 2 143 453 095 P 25 25 2 24 0 2 a 2 b 95 3936 Intervalo de Confiança para o desvio padrão O desvio padrão é uma estimativa viesada porem quando o tamanho amostral é grande o vies é pequeno E o intervalo de confiança é obtido tirando a raiz quadrada de cada membro do IC da variância 2 2 2 2 1 1 E D x s n x s n Exercícios Intervalo de Confiança para uma proporção populacional A proporção amostral ou freqüência relativa amostral p apresenta distribuição binomial cuja média é p e cuja variância é pqn Sendo np5 e nq5 podemos em geral aproximar essa distribuição pela normal Como não conhecemos p adotaremos como condições de aproximação np 5 e n1p 5 Intervalo de confiança Considerando a amostra suficientemente grande e p como estimador para p O intervalo será da forma p lo e procedendo de forma semelhante no caso da estimação para a média temos n p p z l 1 2 0 1 1 1 2 2 n p p z p p n p p z P p Tamanho da amostra para proporção Para encontrar o tamanho n da amostra utilizamos a fórmula do erro n p p z lo 1 2 1 2 0 2 p p l z n Isolando n obtemos Porém neste caso desconhecemos p e ainda não temos a estimativa p uma vez que a amostra ainda não foi retirada Resolvemos esse problema usando uma amostra piloto ou analisando o comportamento do fator p1p para 0p1 Para amostra piloto Se conhecemos pestimativa para a proporção podemos usar p ao invés de p e obtemos o tamanho da amostra suficiente 1 2 0 2 p p l z n Estimativa Sabendo que p1p é a expressão de uma parábola e cujo ponto máximo é para p ½ Se substituirmos p1p por seu valor máximo ¼ seguramente o tamanho da amostra obtido será suficiente para a estimação da proporção 2 0 2 2 0 2 2 0 2 2 4 1 1 l z l z p p l z n Exemplos Intervalo de confiança para a diferença entre médias de duas populações normais Sejam x e y duas v a independentes Exμx Varxσx² e Eyμy Varyσy² Analogamente ao que foi realizado para o ICμ de amostras de tamanho m e n de x e y n m z y x n m z y x IC y x y x y x 2 2 2 2 2 2 1 Resumo Tabela A3 tStudent σ desconhecido e população normalmente distribuída ou n30 Tabela A4 População normalmente QuiQuadrado distribuída Desvio Padrão ou Variância Tabela A2 Normal σ conhecido e população normalmente distribuída ou n30 Média Tabela A2 Normal np 5 e nq 5 Proporção Distribuição e Erro Condições Parâmetro n p q z lo 2 n z l 2 0 n s t l 2 0 2 2 2 2 2 1 1 E D X s n X s n
Send your question to AI and receive an answer instantly
Recommended for you
1
Lista de Exercicios Resolvidos - Probabilidade e Estatistica - Distribuicao de Variaveis Continuas
Probabilidade e Estatística 1
UNIFEI
6
Aproximação da Binomial e Poisson pela Normal - Resumo Completo
Probabilidade e Estatística 1
UNIFEI
2
Exercícios Resolvidos Teste de Hipótese Estatística - Nível Superior
Probabilidade e Estatística 1
UNIFEI
2
Gabarito Lista 5 Estatística - Respostas Detalhadas para Exercícios
Probabilidade e Estatística 1
UNIFEI
2
Tabela Distribuição Normal Padrão - Tabela P Z
Probabilidade e Estatística 1
UNIFEI
1
Lista de Exercícios Resolvidos - Distribuição Normal - Estatística
Probabilidade e Estatística 1
UNIFEI
4
Lista de Exercícios Resolvidos Estatística - Distribuição Normal e Amostral
Probabilidade e Estatística 1
UNIFEI
1
Tabela-t-de-Student-Valores-de-Probabilidade-e-Graus-de-Liberdade
Probabilidade e Estatística 1
UNIFEI
27
Teste de Hipótese - Conceitos e Exemplos Estatísticos
Probabilidade e Estatística 1
UNIFEI
2
Lista de Exercicios - Intervalo de Confianca - Estatistica
Probabilidade e Estatística 1
UNIFEI
Preview text
Estimativas e Tamanho Amostral Introdução Essência da inferência estatística é usar dados amostrais para fazer inferência sobre populações Aplicações As duas maiores aplicações da inferência estatística envolvem o uso de dados amostrais para Estimar o valor de um parâmetro populacional Testar alguma afirmação ou hipótese sobre uma população Definições Parâmetro As quantidades da população em geral desconhecidas sobre as quais temos interesse são denominadas parâmetros e usualmente representadas por letras gregas como entre outras Definições Estimador e estimativa À combinação dos elementos da amostra construída com a finalidade de representar ou estimar um parâmetro de interesse na população denominamos de estimador Denotamos por etc Aos valores numéricos assumidos pelos estimadores denominamos estimativas pontuais ou simplesmente estimativas Bons Estimadores de Parâmetros Para usar uma estatística amostral para estimar um parâmetro populacional algumas estatísticas são boas no sentido de que elas atingem o alvo do parâmetro populacional e então fornece bons resultados Tais estatísticas são chamadas estimadores não viesados Estatísticas que atingem o alvo Média variância e proporção Estatísticas que não atingem o alvo mediana amplitude e desvio padrão Vício ou Vies Um estimador é não viciado se o seu valor esperado coincide com o parâmetro de interesse Consistência Um estimador é consistente se a medida que o tamanho da amostra aumenta seu valor esperado converge para o parâmetro de interesse e sua variância converge para zero Estimação de Parâmetros População Amostra Distribuição de probabilidade Distribuição Amostral Parâmetros Estatísticas Valor fixo Variável Aleatória Estimar Estimação Pontual Uma estimativa pontual é um único valor ou ponto usado para aproximar um parâmetro populacional Intervalar Um intervalo de confiança ou estimativa intervalar é uma faixa de valores usada para estimar o verdadeiro valor de um parâmetro populacional Estimativa Pontual Como escolher o melhor valor para ser uma estimativa pontual Exemplo Estamos interessados na média das alturas de jovens com idade entre 15 e 18 anos nascidos na região sudeste do país Vamos coletar uma amostra e usála para tirar conclusões Para facilitar suponha que a amostra tenha somente 10 jovens escolhidos ao acaso dentre a população mencionada Amostra 165 157 172 166 171 174 181 168 160 177 Exemplo Considere uma população formada pelos números 2 3 e 4 A média da população é 3 A variância da população é 23 Estimativas Considere amostras de tamanho 2 Possíveis amostras de tamanho 2 com reposição 2 2 2 3 2 4 3 2 3 3 3 44 2 4 3 4 4 Média das médias amostrais 3 Variância 13 Média amostral frequência 2 25 3 35 4 1 2 3 2 1 0 05 1 15 2 25 3 35 2 25 3 35 4 média amostral Teorema Central do Limite Uma variável aleatória pode ter uma distribuição qualquer possuindo uma média μ e um desviopadrão σ Se ao invés de tirarmos uma única amostra tirarmos várias amostras de tamanho n e analisarmos a distribuição das médias de cada amostra de tamanho n observaremos que À medida que o tamanho n da amostra aumenta a distribuição das médias amostrais tende a uma distribuição normal A média das médias amostrais será a média populacional μ O desvio padrão das médias amostrais será s σ x n Observações importantes Quando maior o tamanho das amostras a distribuição das médias será mais próxima de uma distribuição normal Para n30 a distribuição das médias amostrais pode ser aproximada satisfatoriamente por uma distribuição normal Se a distribuição da variável x for originalmente uma distribuição normal então a distribuição das médias amostrais terá distribuição normal para qualquer tamanho amostral n Teorema Central do Limite Estimativas por Intervalos Estimativas por intervalo ou intervalo de confiança Valor do parâmetro estimativa pontual Erro de amostragem gerando um intervalo de confiança Erro de amostragem O erro de amostragem é diretamente proporcional à dispersão da população quanto mais dispersa a população maior será a variação entre as amostras diretamente proporcional à confiança dos resultados se queremos um intervalo de confiança que contenha o valor do parâmetro esse intervalo deve ser tanto maior quanto se aumenta a certeza de que ele conterá o valor do parâmetro Erro de amostragem Por outro lado quanto maior o intervalo menos informação se obtêm para esse parâmetro A situação desejável é obter um intervalo relativamente pequeno com uma confiança elevada Nível de confiança O nível de confiança é a probabilidade 1α em geral expressa o valor equivalente em porcentagem que é a proporção de vezes que o intervalo de confiança realmente contém o parâmetro populacional supondo que o processo de estimação seja repetido um grande número de vezes O nível de confiança é também chamado de grau de confiança ou coeficiente de confiança As escolhas mais comuns são 90 α01 95 α005 e 99 α001 Esquema 0 002 004 006 008 01 012 014 0 5 10 15 20 0 01 N z z 2 2 1 Intervalo de confiança para a média da população quando σ é conhecido Suponha que a distribuição amostral do estimador x é normal Isso ocorrerá se a população for normalmente distribuída ou com boa aproximação se a amostra for suficientemente grande Devemos construir um intervalo em torno de x de forma que esse intervalo contenha o valor do parâmetro com confiança 1 α Notação μ média da população x média da amostra σ desvio padrão da população n tamanho da amostra lo semiamplitude do intervalo de confiança erro zpvalor particular da variável normal reduzida z que determina uma cauda à direita de sua distribuição com probabilidade p 0 002 004 006 008 01 012 014 0 5 10 15 20 0 01 N Intervalo de Confiança para X X n N01 Normal Padrão z z P Z z 2 2 1 1 P z Z z 1 X P z z n 1 P z X z n n 1 P X z X z n n IC para nível de significância nível de confiança 2 X N desconhecido mas 2 conhecido 2 X N n Z Intervalo de Confiança para Exemplo uma va qualquer tem uma distribuição desconhecida com média também desconhecida e variância 2 16 Retirase uma amostra de 25 valores e calculase a média amostral Construa um IC de 95 para supondo que 127 X 095 P X z X z n n 0 002 004 006 008 01 012 014 0 5 10 15 20 0 01 N 95 z z 25 25 196 4 4 127 196 127 196 095 25 25 P 127 1568 127 1568 095 P 11132 14268 095 P Como poderia obter intervalos de confiança mais estreitos ou seja com limites mais próximos a média verdadeira diminuindose o nível de confiança aumentandose o tamanho da amostra Determinação do tamanho Amostral Determinação do tamanho da amostra necessário para estimar a média sabendo o desvio padrão populacional 2 0 2 l z n Regra do arredondamento para o tamanho amostral Ao determinar o tamanho amostral n se o uso da fórmula não resulta em um número inteiro sempre aumente o valor de n para o número inteiro maior mais próximo Intervalo de confiança para a média da população quando σ é desconhecido Apresentamos um método para a construção de estimativas de intervalo de confiança de μ se a exigência de que σ seja conhecido O procedimento usual é coletar dados amostrais e achar valores das estatísticas n x e s Como esse método se baseia nessas estatísticas e não se exige conhecimento de σ é bem realista prático e muito usado Suposições Quando o desvio padrão não é conhecido e temos as seguintes condições A amostra é uma amostra aleatória simples A amostra provém de uma população normalmente distribuída ou n suficientemente grande Usaremos a distribuição t de Student Como não conhecemos o valor de σ estimamos com o valor do desvio padrão amostral s mas isso introduz uma outra fonte de incerteza especialmente com amostras pequenas Para manter o intervalo de confiança em algum nível desejado tal como 95 compensamos essa incerteza adicional fazendo o intervalo de confiança um pouco mais largo usando os valores críticos maiores fornecidos pela distribuição t de Student Distribuição t de Student 1 2 2 1 2 1 2 g g x f x x g g g 0 E X 2 g Var X g g X t lêse X tem distribuição t de Student com g graus de liberdade tg 0 Distribuição t de Student Se a distribuição de uma população é essencialmente normal aproximadamente em forma de sino então a distribuição de é essencialmente uma distribuição t de Student para todas as amostras de tamanho n A distribuição t de Student em geral chamada de distribuição t é usada para achar valores críticos denotados por tgα2 n s x t Definição O número de graus de liberdade para uma coleção de dados amostrais é o número de valores amostrais que podem variar depois que certas restrições tiverem sido impostas aos dados amostrais Exemplo Se 10 estudantes tem valores de testes com média 80 podemos livremente atribuir valores aos nove primeiros mas o décimo será determinado pois a soma dos 10 valores terá que ser 800 Dizemos que há 9 graus de liberdade disponíveis Assim definiremos o número de graus de liberdade como n 1 Propriedades da distribuição t Tem tamanhos diferentes para tamanhos de amostras diferentes Tem a mesma forma geral simétrica em sino que a distribuição normal mas reflete a maior variabilidade que se espera com pequenas amostras Tem média de t0 o desvio padrão varia com o tamanho amostral mas é maior que 1 A medida que o tamanho amostral n aumenta ela se aproxima da distribuição normal 0 002 004 006 008 01 012 014 0 5 10 15 20 0 t 0 g P T t g 01 005 0025 001 0005 1 3078 6314 12706 31821 63656 2 1886 2920 4303 6965 9925 3 1638 2353 3182 4541 5841 4 1533 2132 2776 3747 4604 5 1476 2015 2571 3365 4032 6 1440 1943 2447 3143 3707 7 1415 1895 2365 2998 3499 8 1397 1860 2306 2896 3355 9 1383 1833 2262 2821 3250 10 1372 1812 2228 2764 3169 11 1363 1796 2201 2718 3106 12 1356 1782 2179 2681 3055 13 1350 1771 2160 2650 3012 14 1345 1761 2145 2624 2977 15 1341 1753 2131 2602 2947 16 1337 1746 2120 2583 2921 17 1333 1740 2110 2567 2898 18 1330 1734 2101 2552 2878 19 1328 1729 2093 2539 2861 20 1325 1725 2086 2528 2845 21 1323 1721 2080 2518 2831 22 1321 1717 2074 2508 2819 23 1319 1714 2069 2500 2807 24 1318 1711 2064 2492 2797 25 1316 1708 2060 2485 2787 26 1315 1706 2056 2479 2779 27 1314 1703 2052 2473 2771 28 1313 1701 2048 2467 2763 29 1311 1699 2045 2462 2756 30 1310 1697 2042 2457 2750 40 1303 1684 2021 2423 2704 50 1299 1676 2009 2403 2678 60 1296 1671 2000 2390 2660 120 1289 1658 1980 2358 2617 1282 1645 1960 2326 2576 10 2764 P T 10 2764 001 P T 2 g g t P T 0 002 004 006 008 01 012 014 0 5 10 15 20 0 1 nt Intervalo de Confiança para X s n 1 nt t t 2 2 1 1 X P t t s n 1 s s P t X t n n 1 s s P X t X t n n IC para 2 X N e 2 desconhecidos T 1 P t T t Procedimento para a construção de um intervalo de confiança para μ com σ desconhecido Amostra aleatória simples população normalmente distribuída Usando n1 graus de liberdade consulte a tabela para achar o valor crítico tα2 Calcule a margem de erro E tα2 Usando o valor calculado para a margem de erro e a média amostral escreva o intervalo de confiança x E μ x E ou x E x E Arredonde os limites do intervalo de confiança para uma casa a mais dos dados originais ou para o mesmo número de casas decimais usado para a média amostral s n 095 s s P X t X t n n 0 002 004 006 008 01 012 014 0 5 10 15 20 0 24 t 95 t t 25 25 2064 4 4 127 2064 127 2064 095 25 25 P 127 16512 127 16512 095 P 110488 143512 095 P Exemplo Uma va qualquer tem uma distribuição desconhecida com média μ e σ desconhecidos Retirase uma amostra de 25 valores e calculase a média amostral e o desvio padrão amostral Construa um IC de 95 para μ sabendo que a média amostral é igual a 127 e o desvio padrão amostral é 4 Tamanho amostral Como vimos anteriormente o tamanho amostral dependia do valor do desvio padrão populacional que neste caso não é conhecido Para estimar o desvio padrão populacional usamos o desvio padrão amostral s porém se não temos uma amostra não dispomos do valor de s Para resolver esse problema temos duas alternativas 1 Trabalhar com um limitante superior para o valor do desvio padrão populacional que colocado na expressão Nos leva a um tamanho de amostra suficiente em geral superdimensionada 2 0 2 l z n 2 Escolher uma amostra piloto de n elementos para com base nela obtermos uma estimativa para s empregando na seguinte expressão Se n n a mostra piloto já terá sido suficiente para estimação Caso contrário devemos retirar ainda da população os elementos necessários para complementação do tamanho mínimo da amostra 2 0 2 l s t n g Exercícios Estimação da Variância populacional Muitas situações reais tais com controle de qualidade em processo de produção exigem que estimemos valores de variância ou de desvio padrão populacional Além de fabricar produtos com medidas que resultem em uma média desejada o fabricante deve fazer produtos de qualidade consiste Essa consistência pode ser medida pela variância ou pelo desvio padrão Condições A amostra é uma amostra aleatória simples A população deve ser normalmente distribuída mesmo que a amostra seja grande Para desenvolver estimativas de variâncias e desvios padrões usaremos uma outra distribuição denominada distribuição qui quadrado Distribuição QuiQuadrado Selecionando aleatoriamente amostras independentes de tamanho n e calculando a variância amostral s2 para cada amostra A estatística amostral x2 n1 s2 σ2 tem uma distribuição chamada distribuição QuiQuadrado 2 2 2 1 s n x Distribuição Quiquadrado 2 1 2 2 1 0 2 2 g x g f x x e x g 0 g 2 0 g 2 E X g 2 Var X g 2 g X lêse X tem distribuição quiquadrado com g graus de liberdade Propriedades Não é simétrica quanto mais o grau de liberdade aumente mais próxima fica de uma distribuição simétrica Os valores são sempre positivos A distribuição é diferente para cada número de grau de liberdade Como a distribuição não é simétrica devemos fazer cálculos diferentes para os limites inferiores e superiores do intervalo de confiança Como consultar a tabela da Distribuição 2 Distribuição 2 P2 x 0005 0010 0025 0050 0100 0900 0950 0975 0990 0995 1 788 663 502 384 271 002 000 000 000 000 2 1060 921 738 599 461 021 010 005 002 001 3 1284 1134 935 781 625 058 035 022 011 007 4 1486 1328 1114 949 778 106 071 048 030 021 5 1675 1509 1283 1107 924 161 115 083 055 041 6 1855 1681 1445 1259 1064 220 164 124 087 068 7 2028 1848 1601 1407 1202 283 217 169 124 099 8 2195 2009 1753 1551 1336 349 273 218 165 134 9 2359 2167 1902 1692 1468 417 333 270 209 173 10 2519 2321 2048 1831 1599 487 394 325 256 216 11 2676 2473 2192 1968 1728 558 457 382 305 260 12 2830 2622 2334 2103 1855 630 523 440 357 307 13 2982 2769 2474 2236 1981 704 589 501 411 357 14 3132 2914 2612 2368 2106 779 657 563 466 407 15 3280 3058 2749 2500 2231 855 726 626 523 460 16 3427 3200 2885 2630 2354 931 796 691 581 514 17 3572 3341 3019 2759 2477 1009 867 756 641 570 18 3716 3481 3153 2887 2599 1086 939 823 701 626 19 3858 3619 3285 3014 2720 1165 1012 891 763 684 20 4000 3757 3417 3141 2841 1244 1085 959 826 743 21 4140 3893 3548 3267 2962 1324 1159 1028 890 803 22 4280 4029 3678 3392 3081 1404 1234 1098 954 864 23 4418 4164 3808 3517 3201 1485 1309 1169 1020 926 24 4556 4298 3936 3642 3320 1566 1385 1240 1086 989 25 4693 4431 4065 3765 3438 1647 1461 1312 1152 1052 26 4829 4564 4192 3889 3556 1729 1538 1384 1220 1116 27 4965 4696 4319 4011 3674 1811 1615 1457 1288 1181 28 5099 4828 4446 4134 3792 1894 1693 1531 1356 1246 29 5234 4959 4572 4256 3909 1977 1771 1605 1426 1312 30 5367 5089 4698 4377 4026 2060 1849 1679 1495 1379 40 6677 6369 5934 5576 5181 2905 2651 2443 2216 2071 50 7949 7615 7142 6750 6317 3769 3476 3236 2971 2799 60 9195 8838 8330 7908 7440 4646 4319 4048 3748 3553 70 10421 10043 9502 9053 8553 5533 5174 4876 4544 4328 80 11632 11233 10663 10188 9658 6428 6039 5715 5354 5117 90 12830 12412 11814 11315 10757 7329 6913 6565 6175 5920 100 14017 13581 12956 12434 11850 8236 7793 7422 7006 6733 g 0 2 t 2 2 g t P 2 15 09 P 2 15 855 09 P Valores Críticos 1240 25 25 2 24 0 2 a 2 b 95 3936 2 ax Para calcular Temos que considerar a área total à direita desse valor que é 0975 que se obtém pela subtração 1 0025 Estimadores de σ2 A variância amostral tende ao alvo do valor da variância populacional de modo que s2 é um estimador nãoviesado de σ2 A variância amostral s2 é a melhor estimativa pontual da variância populacional σ2 Intervalo de confiança para a variância populacional σ2 2 2 2 2 2 1 1 E D x s n x s n 2 xD Onde e representam o valor crítico da cauda direita e o valor crítico da cauda esquerda respectivamente 2 xE Intervalo de Confiança para 2 Exemplo uma va qualquer tem uma distribuição desconhecida com média e variância 2 desconhecidas Retirase uma amostra de 25 valores e calculase a variância amostral Construa um IC de 95 para 2 supondo que s2 234 2 2 2 2 2 1 1 095 b a n s n s P 1240 2 24 234 24 234 095 3936 1240 P 2 143 453 095 P 25 25 2 24 0 2 a 2 b 95 3936 Intervalo de Confiança para o desvio padrão O desvio padrão é uma estimativa viesada porem quando o tamanho amostral é grande o vies é pequeno E o intervalo de confiança é obtido tirando a raiz quadrada de cada membro do IC da variância 2 2 2 2 1 1 E D x s n x s n Exercícios Intervalo de Confiança para uma proporção populacional A proporção amostral ou freqüência relativa amostral p apresenta distribuição binomial cuja média é p e cuja variância é pqn Sendo np5 e nq5 podemos em geral aproximar essa distribuição pela normal Como não conhecemos p adotaremos como condições de aproximação np 5 e n1p 5 Intervalo de confiança Considerando a amostra suficientemente grande e p como estimador para p O intervalo será da forma p lo e procedendo de forma semelhante no caso da estimação para a média temos n p p z l 1 2 0 1 1 1 2 2 n p p z p p n p p z P p Tamanho da amostra para proporção Para encontrar o tamanho n da amostra utilizamos a fórmula do erro n p p z lo 1 2 1 2 0 2 p p l z n Isolando n obtemos Porém neste caso desconhecemos p e ainda não temos a estimativa p uma vez que a amostra ainda não foi retirada Resolvemos esse problema usando uma amostra piloto ou analisando o comportamento do fator p1p para 0p1 Para amostra piloto Se conhecemos pestimativa para a proporção podemos usar p ao invés de p e obtemos o tamanho da amostra suficiente 1 2 0 2 p p l z n Estimativa Sabendo que p1p é a expressão de uma parábola e cujo ponto máximo é para p ½ Se substituirmos p1p por seu valor máximo ¼ seguramente o tamanho da amostra obtido será suficiente para a estimação da proporção 2 0 2 2 0 2 2 0 2 2 4 1 1 l z l z p p l z n Exemplos Intervalo de confiança para a diferença entre médias de duas populações normais Sejam x e y duas v a independentes Exμx Varxσx² e Eyμy Varyσy² Analogamente ao que foi realizado para o ICμ de amostras de tamanho m e n de x e y n m z y x n m z y x IC y x y x y x 2 2 2 2 2 2 1 Resumo Tabela A3 tStudent σ desconhecido e população normalmente distribuída ou n30 Tabela A4 População normalmente QuiQuadrado distribuída Desvio Padrão ou Variância Tabela A2 Normal σ conhecido e população normalmente distribuída ou n30 Média Tabela A2 Normal np 5 e nq 5 Proporção Distribuição e Erro Condições Parâmetro n p q z lo 2 n z l 2 0 n s t l 2 0 2 2 2 2 2 1 1 E D X s n X s n