·
Engenharia Civil ·
Estatística para Engenharia Civil
Send your question to AI and receive an answer instantly
Recommended for you
7
Trabalho - Ciência dos Dados - Estatística para Engenharia Civil - 2023-1
Estatística para Engenharia Civil
UFMG
2
Lista 2 - Estatística 2022-1
Estatística para Engenharia Civil
UFMG
40
Slide - Espaço Amostral e Eventos 2022-2
Estatística para Engenharia Civil
UFMG
17
Slide 9-2 - Comparando Duas Populações Introdução
Estatística para Engenharia Civil
UFMG
48
Slide - Interpretações e Axiomas de Probabilidade 2022-2
Estatística para Engenharia Civil
UFMG
6
Lista 2 - Estatística para Engenharia Civil 2022-1
Estatística para Engenharia Civil
UFMG
38
Slide 8-3 - Intervalo de Confiança
Estatística para Engenharia Civil
UFMG
7
Questões - Estatística para Engenharia 2022 2
Estatística para Engenharia Civil
UFMG
6
Lista 2 - Estatística para Engenharia Civil 2022 1
Estatística para Engenharia Civil
UFMG
4
Lista 3 - Estatística para Engenharia Civil 2022-2
Estatística para Engenharia Civil
UFMG
Preview text
Inferência Estatística: decidindo na presença de incerteza Teste de Hipóteses Exemplo Inicial Um comprador de tijolos acha que a qualidade dos tijolos está diminuindo. De experiências anteriores, considera-se a resistência média ao desmoronamento de tais tijolos igual a 200kg, com desvio padrão de 10kg. Uma amostra de 100 tijolos, escolhidos ao acaso, forneceu uma média de 195kg. Temos que nos decidir por uma de duas hipóteses … H1: Resistência media é igual a 200 (𝜇 = 200) H2: Resistência media é menor a 200 (𝜇 < 200) … na presença de uma única amostra da população de interesse. Teste de Hipóteses Teste de Hipóteses : decidindo na presença de incerteza Hipótese é uma afirmação sobre um parâmetro da população, sobre a média de uma variável na população (μ) ou sobre uma proporção populacional (p) ou sobre a variância (𝜎2). Teste de Hipóteses é o processo de decisão entre duas hipóteses sobre um parâmetro da população. - Hipótese Nula (H0): ponto de partida - Hipótese Alternativa (HA): hipótese do pesquisador Teste de Hipóteses : decidindo na presença de incerteza Vamos utilizar as informações sobre o parâmetro contidas na amostra para testar H0 versus HA. Exemplo Inicial: 𝜇 = resistência média ao desmoronamento. Hipótese do pesquisador: resistência média está diminuindo (𝜇< 200) Hipótese nula: resistência média não está diminuindo (𝜇= 200) Usando as informações da amostra de 100 tijolos, decide-se entre H0: 𝜇 =200 e HA: 𝜇 <200 Erros associados a um Teste de Hipóteses Decisão baseada no teste Situação real (desconhecida) H0 é verdadeira H0 é falsa Rejeitar H0 Não rejeitar H0 Erro tipo I: Rejeitar H0 quando H0 é verdadeira. Erro tipo II: Não rejeitar H0 quando H0 é falsa. Decisão incorreta (Erro Tipo I) Decisão incorreta (Erro Tipo II) Decisão correta Decisão correta Erros associados a um Teste de Hipóteses H0: 𝝁 = 200 (a resistência não diminui) HA: 𝝁 < 200 (a resistência diminui) Exemplo Inicial: 𝝁 = resistência média ao desmoronamento. Erro tipo I: Dizer que a resistência do tijolo diminui, quando na realidade ela não diminui; Erro tipo II: Dizer que a resistência do tijolo não diminui, quando na realidade ela diminui. Erros associados a um Teste de Hipóteses O Erro Tipo I geralmente é o mais grave. Assim pretende-se “controlá-lo”, pré-fixando sua probabilidade de ocorrência em um valor pequeno α : P(Erro tipo I) = P(Rejeitar H0 quando H0 é verdadeira) = α. Este valor pré-fixado para a probabilidade do Erro Tipo I é chamado nível de significância do teste. Usualmente tem-se: α = 0.10 ou α = 0.05 ou α = 0.01. Se for fixado o valor de α = 0.05, diz-se que “é um teste de hipóteses ao nível de significância de 5%”. Erros associados a um Teste de Hipóteses P(Erro tipo II) = P(Não rejeitar H0 quando H0 é falsa) = β. β é reduzido aumentando-se o tamanho da amostra Poder do teste =P(Rejeitar H0 quando H0 é falsa) = 1- β. Um teste de hipótese com um poder de 90%, por exemplo, rejeitará H0, quando ela for falsa, com 90% de probabilidade. Componentes de um Teste de Hipóteses Hipótese nula: é a afirmação sobre o valor de um parâmetro populacional: média (μ), variância (s2) ou proporção (p). Usualmente, H0 expressa a condição de igualdade. H0: μ = μ0 Hipótese alternativa: é a afirmação verdadeira para o caso de a hipótese nula ser falsa. Assume uma de três formas: HA: μ ≠ μ0 , HA: μ > μ0 ou HA: μ < μ0. Nível de significância do teste: Probabilidade máxima tolerada para o Erro Tipo I (rejeitar H0 se ela é verdadeira). Componentes de um Teste de Hipóteses Estatística de teste: mede a distância entre o que foi observado na amostra e o que seria esperado se a hipótese nula fosse verdadeira. 5.2 5.5 0.3 2.73 0.11 / 0.55/ 25 o obs x T s n n p p p p Zobs ) 1( ˆ 0 0 0 H0: μ = μ0 Teste sobre uma média : Teste sobre uma proporção p: H0: p = p0 H0: s2 = s2 0 Teste sobre uma variância s2: Distribuição de Referência: conforme o parâmetro testado, uma distribuição de probabilidades é associada à estatística de teste. 5.2 5.5 0.3 2.73 0.11 / 0.55/ 25 o obs x T s n H0: μ = μ0 Teste sobre uma média : n p p p p Zobs ) 1( ˆ 0 0 0 Teste sobre uma proporção p: H0: p = p0 T-Student (n-1) g.l. Normal Padrão Se H0 é verdadeira, a estatística de teste segue a distribuição de referência, ou seja, se H0 é verdadeira, então o valor da estatística de teste deve ser um valor típico da distribuição de referência. Teste sobre uma variância s2: H0: s2 = s2 0 Qui-Quadrado (n-1) g.l. Exemplo 1: Uma indústria farmacêutica especifica que em certo analgésico a quantidade média de ácido acetilsalicílico deve ser 5.5 mg por comprimido. A indústria suspeita que houve problemas na produção de um determinado lote e que, nesse lote, a quantidade média dessa substância está diferente da especificada. Para verificar essa suspeita, a indústria selecionou uma amostra aleatória de 50 comprimidos desse lote, observando uma quantidade média de ácido acetilsalicílico igual a 5.8 mg e um desvio-padrão de 0.85 mg. Os dados da amostra confirmam a suspeita da indústria, ao nível de 2% de significância? Exemplo 1: Teste de Hipóteses sobre uma Média Parâmetro: μ = quantidade média de ácido acetilsalicílico (em mg) de certo analgésico da indústria farmacêutica. Valor de comparação: μ0 = 5.5 Hipóteses H0: μ = 5.5 Ha: μ ≠ 5.5 Estatística de teste: 5.2 5.5 0.3 2.73 0.11 / 0.55/ 25 o obs x T s n Dados amostrais: n=50, , s=0.85. 5.8 x Nível de significância: α = 0.02 Conclusão em termos do problema: “Ao nível de significância de 2%, há evidências estatísticas suficientes nesta amostra para se dizer que a quantidade média de ácido acetil salicílico por comprimido é diferente de 5.5 mg”. 2.41 -2.41 0.01 0.01 Estatística de teste: tobs = 2.50 Conclusão: Rejeitar a hipótese nula de que μ = 5.5 (em favor da hipótese alternativa μ ≠ 5.5). T49 Nível de significância: α = 0.02 2.50 tobs não é “típico” Formas das hipóteses Sobre a média populacional μ: H0: μ = μ0 HA: μ< μ0 H0: μ = μ0 HA: μ > μ0 H0: μ = μ0 HA: μ μ0 5.2 5.5 0.3 2.73 0.11 / 0.55/ 25 o obs x T s n Valor p: probabilidade de cometer o Erro Tipo I com base nos dados amostrais, ou seja, é a propabilidade de errar ao rejeitar a hipótese nula nesta amostra. É calculado na distribuição de referência da estatística de teste. O valor P é menor do que o valor do que o nível de significância (α)? NÃO SIM Conclusão: a amostra não contém evidências suficientes para a rejeição da afirmação da hipótese nula. Conclusão: a amostra contém evidências suficientes para a rejeição da hipótese nula. Probabilidade de Significância (Valor P) Lembrando que o nível de significância (α) é o valor máximo pré-fixado para a probabilidade de Erro Tipo I; o valor de α é arbitrário e definido pelo pesquisador. De posse dos dados amostrais, podemos perguntar: Qual é a probabilidade de errarmos ao rejeitar a hipótese nula com esses dados amostrais ? Essa probabilidade é o valor P do teste Então, o Valor P é a probabilidade de errar ao decidir pela rejeição da hipótese nula com base nos dados observados. Se valor p < α Rejeita-se H0 ao nível de significância α Se valor p α Não se rejeita H0 ao nível de significância α Método do valor P Raciocínio no qual se baseia o método do valor p Se o valor p é “pequeno”, a probabilidade de cometermos um erro ao rejeitarmos H0 é pequena. Então, devemos rejeitar H0. Se o valor p é “grande”, a probabilidade de cometermos um erro ao rejeitarmos H0 é grande. Então, não devemos rejeitar H0. “pequeno” “grande” α em comparação com Exemplo 1: O valor observado para a estatística de teste pode ser considerado “grande” ? NÃO SIM Conclusão: a amostra não contém evidências suficientes para a rejeição da afirmação da hipótese nula. Conclusão: a amostra contém evidências suficientes para a rejeição da hipótese nula. O valor da estatística de teste é comparado aos valores da distribuição de referência. Distribuição t com n-1 g.l. Se estiver entre os α% maiores, será considerado grande. 2.41 -2.41 0.01 0.01 T49 Como calcular o valor p de um teste de hipóteses? O valor p é a probabilidade de a estatística de teste ter valores mais “extremos” do que seu valor calculado com os dados amostrais, supondo H0 verdadeira. Exemplo 1 (cálculo do valor-p): H0: μ = 5.5 Ha: μ ≠ 5.5 2.50 Tobs α = 0.02 Valores “mais extremos” do que Tobs -2.50 2.50 menores maiores Valor p = P[t49 < -2.50] + P[t49 > 2.50] = 2 x P[t49< -2.50] 2 x P[Z< -2.50] = 0.013 Como o valor p é menor do que o nível de significância adotado (0.013 < 0.02), então rejeita-se H0 ao nível de 2% de significância. Tabela Normal-padrão x Segunda casa decimal de x -2,9 0019 0018 0018 0017 0016 0016 0015 0015 0014 0014 -2,8 0026 0025 0024 0023 0023 0022 0021 0021 0020 0019 -2,7 0035 0034 0033 0032 0031 0030 0030 0029 0028 0027 -2,6 0047 0045 0044 0043 0041 0040 0040 0039 0038 0037 -2,5 0062 0060 0059 0057 0055 0054 0052 0051 0049 0048 -2,4 0082 0080 0078 0075 0073 0071 0069 0066 0064 0063 -2,3 0107 0104 0102 0099 0096 0094 0091 0089 0087 0084 -2,2 0139 0136 0132 0129 0126 0122 0119 0116 0113 0110 -2,1 0179 0174 0170 0166 0162 0158 0154 0150 0146 0143 -2,0 0228 0222 0217 0212 0206 0201 0197 0192 0188 0183 -1,9 0287 0281 0274 0268 0260 0256 0250 0244 0239 0233 -1,8 0359 0351 0344 0336 0329 0322 0314 0307 0301 0294 -1,7 0446 0436 0427 0418 0409 0401 0392 0384 0375 0367 -1,6 0548 0537 0525 0516 0505 0495 0485 0475 0465 0455 -1,5 0668 0655 0643 0630 0618 0606 0594 0582 0571 0559 -1,4 0808 0793 0778 0764 0749 0735 0721 0708 0694 0681 -1,3 0968 0951 0934 0916 0900 0885 0869 0853 0838 0823 -1,2 1151 1131 1112 1093 1075 1056 1038 1020 1003 0985 -1,1 1353 1333 1310 1285 1271 1251 1231 1211 1190 1170 -1,0 1587 1562 1539 1515 1492 1469 1446 1423 1401 1379 -0,9 1841 1814 1788 1762 1736 1711 1685 1660 1635 1611 -0,8 2119 2090 2061 2033 2005 1977 1949 1922 1894 1867 -0,7 2420 2389 2358 2327 2296 2266 2236 2206 2177 2148 -0,6 2743 2709 2676 2643 2611 2578 2546 2514 2483 2451 -0,5 3085 3050 3015 2981 2946 2912 2877 2843 2810 2776 -0,4 3446 3409 3372 3336 3300 3264 3228 3192 3156 3121 -0,3 3821 3783 3745 3707 3669 3632 3594 3557 3520 3483 -0,2 4207 4168 4129 4090 4052 4013 3974 3936 3897 3859 -0,1 4602 4562 4522 4488 4448 4444 4403 4364 4325 4286 4247 0,0 4960 4920 4880 4840 4801 4761 4721 4681 4641 z De maneira geral Hipóteses Rejeita-se H0 (ao n.s = α) Região de Rejeição de H0 Valor p H0: μ = μ0 HA: μ< μ0 P( T(n-1) < Tobs ) H0: μ = μ0 HA: μ > μ0 P( T(n-1) > Tobs ) H0: μ = μ0 HA: μ μ0 2 x P(T(n-1) > |Tobs |) ) ;1 ( t n Tobs ) ;1 ( t n Tobs ;1 2 ) ( t n Tobs ;1 2) ( t n Tobs ou n s x T o obs Teste de Hipóteses para a Variância de uma População Normal Resultado: Se X_1, X_2, \cdots , X_n \text{ é uma a.a. } N(\mu, \sigma^2), \text{ então } X^2 = \frac{(n-1)S^2}{\sigma^2} tem distribuição qui-quadrado com n-1 graus de liberdade. Assim, se H_0 : \sigma^2 = \sigma^2_0 \text{ é verdadeira, a estatística de teste } X^2_0 = \frac{(n-1)S^2}{\sigma^2_0} tem distribuição qui-quadrado com n-1 graus de liberdade. H_0 : \sigma^2 = \sigma^2_0 \\ H_1 : \sigma^2 \neq \sigma^2_0 \chi^2_0 < \chi^2_{[1-\alpha/2; n-1]} \\ \chi^2_0 > \chi^2_{[\alpha/2; n-1]} H_0 : \sigma^2 = \sigma^2_0 \\ H_1 : \sigma^2 < \sigma^2_0 \chi^2_0 < \chi^2_{[1-\alpha; n-1]} H_0 : \sigma^2 = \sigma^2_0 \\ H_1 : \sigma^2 > \sigma^2_0 \chi^2_0 > \chi^2_{[\alpha; n-1]} Exemplo: Máquina automática de encher garrafas com detergente líquido. A variância σ^2 do volume dispensado não deve exceder 0.01 (onça fluida)^2 H_0: σ^2 = 0.01 H_1: σ^2 > 0.01. Em uma amostra com n=20 valores, encontrou-se s^2 = 0.0153. Com α = 0.05, rejeita-se H_0 se χ^2_0 > χ^2_[0.05, 19] = 30.14. X^2_0 = \frac{(n-1)s^2}{σ^2_0} = \frac{(19)0.0153}{0.01} = 29.07. Resultado: como 29.07 < 30.14 não se rejeita H_0 ao n.s. de 5%. Conclui-se que não há evidências nesta amostra para se concluir que a variância do volume dispensado pela máquina exceda 0.01. Valor P H_0: σ^2 = σ^2_0 valor p = P(χ^2_{n-1} ≤ X^2_0) H_1: σ^2 < σ^2_0 H_0: σ^2 = σ^2_0 valor p = P(χ^2_{n-1} ≥ X^2_0) H_1: σ^2 > σ^2_0 H_0: σ^2 = σ^2_0 valor p = 2⋅P(χ^2_{n-1} < X^2_0) se X^2_0 < χ^2_[0.50] H_1: σ^2 ≠ σ^2_0 valor p = 2⋅P(χ^2_{n-1} > X^2_0) se X^2_0 > χ^2_[0.50] Exemplo: Máquina automática de encher garrafas. H_0: σ^2 = 0.01 H_1: σ^2 > 0.01. valor p = P(χ^2_{n-1} > X^2_0) = P(χ^2_{19} > 29.07) = 0.065, que foi obtido em um programa computacional. Mas e se eu tiver apenas uma tabela qui-quadrado ? Na tabela qui-quadrado, na linha com 19 g.l., temos que P(χ^2_{19} > 27.204) = 0.10, P(χ^2_{19} > 30.144) = 0.05, Como 27.204 < 29.07 < 30.144, Então P(χ^2_{19} > 30.144) < P(χ^2_{19} > 29.07) < P(χ^2_{19} > 27.204) ou seja, 0.05 < valor p < 0.10. Resultado: como valor p > 0.05 não se rejeita H_0 ao n.s. de 5%. Teste de Hipóteses para a Proporção Em algumas situações, precisamos do I.C. e de um T.H. sobre uma proporção p de uma variável aleatória binomial. Ex.: processo de produção que fabrica itens classificados como aceitáveis ou defeituosos, p é a proporção de defeituosos. Em uma amostra aleatória Y₁, Y₂, ..., Yₙ, onde Yᵢ = 1, se a característica está presente; Yᵢ = 0 , caso contrário; denotamos X = Σⁿᵢ₌₁ Yᵢ. e um estimador não viciado de p é a proporção amostral ˆ p = X/n. Vamos fazer testes de hipóteses do tipo H₀ : p = p₀ ou H₀ : p = p₀ ou H₀ : p = p₀ H₁ : p ≠ p₀ H₁ : p < p₀ H₁ : p > p₀, usando a estatística de teste ˆ Z₀ = (p - p₀) ______________ √(p₀(1-p₀)/n) ~ N(0,1) se H₀ é verdadeira * *Aproximação binomial pela normal: se n é grande e p não é próximo de 0 ou 1, ˆ p ≈ N ( p, (p(1-p)/n) ). Hipóteses, Região Crítica e Valor P H₀ : p = p₀ H₁ : p ≠ p₀ H₀ : p = p₀ H₁ : p < p₀ H₀ : p = p₀ H₁ : p > p₀ Z₀ < -Zₐ/₂ Z₀ > Zₐ/₂ Z₀ < -Zₐ Z₀ > Zₐ valor p = 2P(Z > |Z₀|) valor p = P(Z < Z₀) valor p = P(Z > Z₀) Exemplo: Defeitos em semicondutores. Fabricante quer mostrar que proporção de defeituosos atende especificação de < 0.05. Parâmetro: p proporção de defeituosos. Hipóteses: H_0 : p = 0.05 \ vs \ H_1 : p < 0.05. Nível de significância: \alpha = 0.05. Estatística de teste: Z_0 = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}}. Região de rejeição: Z_0 < -Z_{0.05} = -1.645. Amostra: n=200, x=4 \ e \ \hat{p} = x/n = 4/200 = 0.02. Cálculos: Z_0 = \frac{0.02 - 0.05}{\sqrt{0.05(0.95)/200}} = -1.95. Resultado: Como -1.95 < -1.645, rejeita-se H_0 ao n.s. de 5%. Conclusão: A indústria atende às especificações. V\ \text{alor}\ p = P(Z < Z_0) = P(Z < -1.95) = 0.0256 \ (< \alpha). Passos para Teste de Hipóteses 1) Definir o parâmetro (média ou proporção) sobre o qual é feito o teste. 2) Definir a hipótese do pesquisador. 3) Definir a hipótese nula (H0) e hipótese alternativa (HA). 4) Escolher um valor α para o nível de significância do teste. 5) Definir a estatística de teste. 6) Calcular o valor observado da estatística de teste na amostra retirada da população. Intervalos de Confiança e Testes de Hipóteses Intervalos de Confiança podem ser usados para se fazer Testes de Hipóteses Bilaterais. H0: μ = μ0 HA: μ ≠ μ0 A região de não-rejeição de um teste bilateral sobre μ é o intervalo de confiança para μ. ( 1; 2 ) n Tobs t ;1 2) ( t n Tobs OU ( 1; ) ( 1; ) 2 2 n n obs t T t Intervalos de Confiança e Testes de Hipóteses Se um intervalo com 100(1-α)% de confiança é usado para se fazer um teste bilateral, o nível de significância associado ao teste é α%. Região de Rejeição Região de Não-Rejeição ( 1; ) ( 1; ) 2 2 / o n n x t t s n Como usar um Intervalo de Confiança para fazer um Teste de Hipóteses ? O intervalo de 100(1-α)% de confiança para μ contém o valor μ0 ? NÃO SIM rejeitamos H0 ao nível de α% de significância não rejeitamos H0 ao nível de α% de significância H0: μ = μ0 HA: μ ≠ μ0 Exemplo: energia de impacto em placas de aço A238 O teste Charpy V-notch (CVN) mede a energia de impacto (em J) e é frequentemente usado para determinar se um material experimenta ou não uma transição dúctil-frágil com um decréscimo de temperatura. Em um experimento com 10 corpos-de-prova de aço A238, cortados a 60o C, a energia de impacto média foi de 64,46 J e o desvio-padrão foi de 1.07 J. Considerando que a energia de impacto seja normalmente distribuída, a energia de impacto média nas placas de aço A238 está entre 63.84 J e 65.08 J, com 95% de confiança. Supondo que uma norma de qualidade determine que a energia de impacto média seja de 64.0 J. Os resultados do experimento mostram evidências estatísticas contra a hipótese de que as placas de aço do lote atendem à norma de qualidade?
Send your question to AI and receive an answer instantly
Recommended for you
7
Trabalho - Ciência dos Dados - Estatística para Engenharia Civil - 2023-1
Estatística para Engenharia Civil
UFMG
2
Lista 2 - Estatística 2022-1
Estatística para Engenharia Civil
UFMG
40
Slide - Espaço Amostral e Eventos 2022-2
Estatística para Engenharia Civil
UFMG
17
Slide 9-2 - Comparando Duas Populações Introdução
Estatística para Engenharia Civil
UFMG
48
Slide - Interpretações e Axiomas de Probabilidade 2022-2
Estatística para Engenharia Civil
UFMG
6
Lista 2 - Estatística para Engenharia Civil 2022-1
Estatística para Engenharia Civil
UFMG
38
Slide 8-3 - Intervalo de Confiança
Estatística para Engenharia Civil
UFMG
7
Questões - Estatística para Engenharia 2022 2
Estatística para Engenharia Civil
UFMG
6
Lista 2 - Estatística para Engenharia Civil 2022 1
Estatística para Engenharia Civil
UFMG
4
Lista 3 - Estatística para Engenharia Civil 2022-2
Estatística para Engenharia Civil
UFMG
Preview text
Inferência Estatística: decidindo na presença de incerteza Teste de Hipóteses Exemplo Inicial Um comprador de tijolos acha que a qualidade dos tijolos está diminuindo. De experiências anteriores, considera-se a resistência média ao desmoronamento de tais tijolos igual a 200kg, com desvio padrão de 10kg. Uma amostra de 100 tijolos, escolhidos ao acaso, forneceu uma média de 195kg. Temos que nos decidir por uma de duas hipóteses … H1: Resistência media é igual a 200 (𝜇 = 200) H2: Resistência media é menor a 200 (𝜇 < 200) … na presença de uma única amostra da população de interesse. Teste de Hipóteses Teste de Hipóteses : decidindo na presença de incerteza Hipótese é uma afirmação sobre um parâmetro da população, sobre a média de uma variável na população (μ) ou sobre uma proporção populacional (p) ou sobre a variância (𝜎2). Teste de Hipóteses é o processo de decisão entre duas hipóteses sobre um parâmetro da população. - Hipótese Nula (H0): ponto de partida - Hipótese Alternativa (HA): hipótese do pesquisador Teste de Hipóteses : decidindo na presença de incerteza Vamos utilizar as informações sobre o parâmetro contidas na amostra para testar H0 versus HA. Exemplo Inicial: 𝜇 = resistência média ao desmoronamento. Hipótese do pesquisador: resistência média está diminuindo (𝜇< 200) Hipótese nula: resistência média não está diminuindo (𝜇= 200) Usando as informações da amostra de 100 tijolos, decide-se entre H0: 𝜇 =200 e HA: 𝜇 <200 Erros associados a um Teste de Hipóteses Decisão baseada no teste Situação real (desconhecida) H0 é verdadeira H0 é falsa Rejeitar H0 Não rejeitar H0 Erro tipo I: Rejeitar H0 quando H0 é verdadeira. Erro tipo II: Não rejeitar H0 quando H0 é falsa. Decisão incorreta (Erro Tipo I) Decisão incorreta (Erro Tipo II) Decisão correta Decisão correta Erros associados a um Teste de Hipóteses H0: 𝝁 = 200 (a resistência não diminui) HA: 𝝁 < 200 (a resistência diminui) Exemplo Inicial: 𝝁 = resistência média ao desmoronamento. Erro tipo I: Dizer que a resistência do tijolo diminui, quando na realidade ela não diminui; Erro tipo II: Dizer que a resistência do tijolo não diminui, quando na realidade ela diminui. Erros associados a um Teste de Hipóteses O Erro Tipo I geralmente é o mais grave. Assim pretende-se “controlá-lo”, pré-fixando sua probabilidade de ocorrência em um valor pequeno α : P(Erro tipo I) = P(Rejeitar H0 quando H0 é verdadeira) = α. Este valor pré-fixado para a probabilidade do Erro Tipo I é chamado nível de significância do teste. Usualmente tem-se: α = 0.10 ou α = 0.05 ou α = 0.01. Se for fixado o valor de α = 0.05, diz-se que “é um teste de hipóteses ao nível de significância de 5%”. Erros associados a um Teste de Hipóteses P(Erro tipo II) = P(Não rejeitar H0 quando H0 é falsa) = β. β é reduzido aumentando-se o tamanho da amostra Poder do teste =P(Rejeitar H0 quando H0 é falsa) = 1- β. Um teste de hipótese com um poder de 90%, por exemplo, rejeitará H0, quando ela for falsa, com 90% de probabilidade. Componentes de um Teste de Hipóteses Hipótese nula: é a afirmação sobre o valor de um parâmetro populacional: média (μ), variância (s2) ou proporção (p). Usualmente, H0 expressa a condição de igualdade. H0: μ = μ0 Hipótese alternativa: é a afirmação verdadeira para o caso de a hipótese nula ser falsa. Assume uma de três formas: HA: μ ≠ μ0 , HA: μ > μ0 ou HA: μ < μ0. Nível de significância do teste: Probabilidade máxima tolerada para o Erro Tipo I (rejeitar H0 se ela é verdadeira). Componentes de um Teste de Hipóteses Estatística de teste: mede a distância entre o que foi observado na amostra e o que seria esperado se a hipótese nula fosse verdadeira. 5.2 5.5 0.3 2.73 0.11 / 0.55/ 25 o obs x T s n n p p p p Zobs ) 1( ˆ 0 0 0 H0: μ = μ0 Teste sobre uma média : Teste sobre uma proporção p: H0: p = p0 H0: s2 = s2 0 Teste sobre uma variância s2: Distribuição de Referência: conforme o parâmetro testado, uma distribuição de probabilidades é associada à estatística de teste. 5.2 5.5 0.3 2.73 0.11 / 0.55/ 25 o obs x T s n H0: μ = μ0 Teste sobre uma média : n p p p p Zobs ) 1( ˆ 0 0 0 Teste sobre uma proporção p: H0: p = p0 T-Student (n-1) g.l. Normal Padrão Se H0 é verdadeira, a estatística de teste segue a distribuição de referência, ou seja, se H0 é verdadeira, então o valor da estatística de teste deve ser um valor típico da distribuição de referência. Teste sobre uma variância s2: H0: s2 = s2 0 Qui-Quadrado (n-1) g.l. Exemplo 1: Uma indústria farmacêutica especifica que em certo analgésico a quantidade média de ácido acetilsalicílico deve ser 5.5 mg por comprimido. A indústria suspeita que houve problemas na produção de um determinado lote e que, nesse lote, a quantidade média dessa substância está diferente da especificada. Para verificar essa suspeita, a indústria selecionou uma amostra aleatória de 50 comprimidos desse lote, observando uma quantidade média de ácido acetilsalicílico igual a 5.8 mg e um desvio-padrão de 0.85 mg. Os dados da amostra confirmam a suspeita da indústria, ao nível de 2% de significância? Exemplo 1: Teste de Hipóteses sobre uma Média Parâmetro: μ = quantidade média de ácido acetilsalicílico (em mg) de certo analgésico da indústria farmacêutica. Valor de comparação: μ0 = 5.5 Hipóteses H0: μ = 5.5 Ha: μ ≠ 5.5 Estatística de teste: 5.2 5.5 0.3 2.73 0.11 / 0.55/ 25 o obs x T s n Dados amostrais: n=50, , s=0.85. 5.8 x Nível de significância: α = 0.02 Conclusão em termos do problema: “Ao nível de significância de 2%, há evidências estatísticas suficientes nesta amostra para se dizer que a quantidade média de ácido acetil salicílico por comprimido é diferente de 5.5 mg”. 2.41 -2.41 0.01 0.01 Estatística de teste: tobs = 2.50 Conclusão: Rejeitar a hipótese nula de que μ = 5.5 (em favor da hipótese alternativa μ ≠ 5.5). T49 Nível de significância: α = 0.02 2.50 tobs não é “típico” Formas das hipóteses Sobre a média populacional μ: H0: μ = μ0 HA: μ< μ0 H0: μ = μ0 HA: μ > μ0 H0: μ = μ0 HA: μ μ0 5.2 5.5 0.3 2.73 0.11 / 0.55/ 25 o obs x T s n Valor p: probabilidade de cometer o Erro Tipo I com base nos dados amostrais, ou seja, é a propabilidade de errar ao rejeitar a hipótese nula nesta amostra. É calculado na distribuição de referência da estatística de teste. O valor P é menor do que o valor do que o nível de significância (α)? NÃO SIM Conclusão: a amostra não contém evidências suficientes para a rejeição da afirmação da hipótese nula. Conclusão: a amostra contém evidências suficientes para a rejeição da hipótese nula. Probabilidade de Significância (Valor P) Lembrando que o nível de significância (α) é o valor máximo pré-fixado para a probabilidade de Erro Tipo I; o valor de α é arbitrário e definido pelo pesquisador. De posse dos dados amostrais, podemos perguntar: Qual é a probabilidade de errarmos ao rejeitar a hipótese nula com esses dados amostrais ? Essa probabilidade é o valor P do teste Então, o Valor P é a probabilidade de errar ao decidir pela rejeição da hipótese nula com base nos dados observados. Se valor p < α Rejeita-se H0 ao nível de significância α Se valor p α Não se rejeita H0 ao nível de significância α Método do valor P Raciocínio no qual se baseia o método do valor p Se o valor p é “pequeno”, a probabilidade de cometermos um erro ao rejeitarmos H0 é pequena. Então, devemos rejeitar H0. Se o valor p é “grande”, a probabilidade de cometermos um erro ao rejeitarmos H0 é grande. Então, não devemos rejeitar H0. “pequeno” “grande” α em comparação com Exemplo 1: O valor observado para a estatística de teste pode ser considerado “grande” ? NÃO SIM Conclusão: a amostra não contém evidências suficientes para a rejeição da afirmação da hipótese nula. Conclusão: a amostra contém evidências suficientes para a rejeição da hipótese nula. O valor da estatística de teste é comparado aos valores da distribuição de referência. Distribuição t com n-1 g.l. Se estiver entre os α% maiores, será considerado grande. 2.41 -2.41 0.01 0.01 T49 Como calcular o valor p de um teste de hipóteses? O valor p é a probabilidade de a estatística de teste ter valores mais “extremos” do que seu valor calculado com os dados amostrais, supondo H0 verdadeira. Exemplo 1 (cálculo do valor-p): H0: μ = 5.5 Ha: μ ≠ 5.5 2.50 Tobs α = 0.02 Valores “mais extremos” do que Tobs -2.50 2.50 menores maiores Valor p = P[t49 < -2.50] + P[t49 > 2.50] = 2 x P[t49< -2.50] 2 x P[Z< -2.50] = 0.013 Como o valor p é menor do que o nível de significância adotado (0.013 < 0.02), então rejeita-se H0 ao nível de 2% de significância. Tabela Normal-padrão x Segunda casa decimal de x -2,9 0019 0018 0018 0017 0016 0016 0015 0015 0014 0014 -2,8 0026 0025 0024 0023 0023 0022 0021 0021 0020 0019 -2,7 0035 0034 0033 0032 0031 0030 0030 0029 0028 0027 -2,6 0047 0045 0044 0043 0041 0040 0040 0039 0038 0037 -2,5 0062 0060 0059 0057 0055 0054 0052 0051 0049 0048 -2,4 0082 0080 0078 0075 0073 0071 0069 0066 0064 0063 -2,3 0107 0104 0102 0099 0096 0094 0091 0089 0087 0084 -2,2 0139 0136 0132 0129 0126 0122 0119 0116 0113 0110 -2,1 0179 0174 0170 0166 0162 0158 0154 0150 0146 0143 -2,0 0228 0222 0217 0212 0206 0201 0197 0192 0188 0183 -1,9 0287 0281 0274 0268 0260 0256 0250 0244 0239 0233 -1,8 0359 0351 0344 0336 0329 0322 0314 0307 0301 0294 -1,7 0446 0436 0427 0418 0409 0401 0392 0384 0375 0367 -1,6 0548 0537 0525 0516 0505 0495 0485 0475 0465 0455 -1,5 0668 0655 0643 0630 0618 0606 0594 0582 0571 0559 -1,4 0808 0793 0778 0764 0749 0735 0721 0708 0694 0681 -1,3 0968 0951 0934 0916 0900 0885 0869 0853 0838 0823 -1,2 1151 1131 1112 1093 1075 1056 1038 1020 1003 0985 -1,1 1353 1333 1310 1285 1271 1251 1231 1211 1190 1170 -1,0 1587 1562 1539 1515 1492 1469 1446 1423 1401 1379 -0,9 1841 1814 1788 1762 1736 1711 1685 1660 1635 1611 -0,8 2119 2090 2061 2033 2005 1977 1949 1922 1894 1867 -0,7 2420 2389 2358 2327 2296 2266 2236 2206 2177 2148 -0,6 2743 2709 2676 2643 2611 2578 2546 2514 2483 2451 -0,5 3085 3050 3015 2981 2946 2912 2877 2843 2810 2776 -0,4 3446 3409 3372 3336 3300 3264 3228 3192 3156 3121 -0,3 3821 3783 3745 3707 3669 3632 3594 3557 3520 3483 -0,2 4207 4168 4129 4090 4052 4013 3974 3936 3897 3859 -0,1 4602 4562 4522 4488 4448 4444 4403 4364 4325 4286 4247 0,0 4960 4920 4880 4840 4801 4761 4721 4681 4641 z De maneira geral Hipóteses Rejeita-se H0 (ao n.s = α) Região de Rejeição de H0 Valor p H0: μ = μ0 HA: μ< μ0 P( T(n-1) < Tobs ) H0: μ = μ0 HA: μ > μ0 P( T(n-1) > Tobs ) H0: μ = μ0 HA: μ μ0 2 x P(T(n-1) > |Tobs |) ) ;1 ( t n Tobs ) ;1 ( t n Tobs ;1 2 ) ( t n Tobs ;1 2) ( t n Tobs ou n s x T o obs Teste de Hipóteses para a Variância de uma População Normal Resultado: Se X_1, X_2, \cdots , X_n \text{ é uma a.a. } N(\mu, \sigma^2), \text{ então } X^2 = \frac{(n-1)S^2}{\sigma^2} tem distribuição qui-quadrado com n-1 graus de liberdade. Assim, se H_0 : \sigma^2 = \sigma^2_0 \text{ é verdadeira, a estatística de teste } X^2_0 = \frac{(n-1)S^2}{\sigma^2_0} tem distribuição qui-quadrado com n-1 graus de liberdade. H_0 : \sigma^2 = \sigma^2_0 \\ H_1 : \sigma^2 \neq \sigma^2_0 \chi^2_0 < \chi^2_{[1-\alpha/2; n-1]} \\ \chi^2_0 > \chi^2_{[\alpha/2; n-1]} H_0 : \sigma^2 = \sigma^2_0 \\ H_1 : \sigma^2 < \sigma^2_0 \chi^2_0 < \chi^2_{[1-\alpha; n-1]} H_0 : \sigma^2 = \sigma^2_0 \\ H_1 : \sigma^2 > \sigma^2_0 \chi^2_0 > \chi^2_{[\alpha; n-1]} Exemplo: Máquina automática de encher garrafas com detergente líquido. A variância σ^2 do volume dispensado não deve exceder 0.01 (onça fluida)^2 H_0: σ^2 = 0.01 H_1: σ^2 > 0.01. Em uma amostra com n=20 valores, encontrou-se s^2 = 0.0153. Com α = 0.05, rejeita-se H_0 se χ^2_0 > χ^2_[0.05, 19] = 30.14. X^2_0 = \frac{(n-1)s^2}{σ^2_0} = \frac{(19)0.0153}{0.01} = 29.07. Resultado: como 29.07 < 30.14 não se rejeita H_0 ao n.s. de 5%. Conclui-se que não há evidências nesta amostra para se concluir que a variância do volume dispensado pela máquina exceda 0.01. Valor P H_0: σ^2 = σ^2_0 valor p = P(χ^2_{n-1} ≤ X^2_0) H_1: σ^2 < σ^2_0 H_0: σ^2 = σ^2_0 valor p = P(χ^2_{n-1} ≥ X^2_0) H_1: σ^2 > σ^2_0 H_0: σ^2 = σ^2_0 valor p = 2⋅P(χ^2_{n-1} < X^2_0) se X^2_0 < χ^2_[0.50] H_1: σ^2 ≠ σ^2_0 valor p = 2⋅P(χ^2_{n-1} > X^2_0) se X^2_0 > χ^2_[0.50] Exemplo: Máquina automática de encher garrafas. H_0: σ^2 = 0.01 H_1: σ^2 > 0.01. valor p = P(χ^2_{n-1} > X^2_0) = P(χ^2_{19} > 29.07) = 0.065, que foi obtido em um programa computacional. Mas e se eu tiver apenas uma tabela qui-quadrado ? Na tabela qui-quadrado, na linha com 19 g.l., temos que P(χ^2_{19} > 27.204) = 0.10, P(χ^2_{19} > 30.144) = 0.05, Como 27.204 < 29.07 < 30.144, Então P(χ^2_{19} > 30.144) < P(χ^2_{19} > 29.07) < P(χ^2_{19} > 27.204) ou seja, 0.05 < valor p < 0.10. Resultado: como valor p > 0.05 não se rejeita H_0 ao n.s. de 5%. Teste de Hipóteses para a Proporção Em algumas situações, precisamos do I.C. e de um T.H. sobre uma proporção p de uma variável aleatória binomial. Ex.: processo de produção que fabrica itens classificados como aceitáveis ou defeituosos, p é a proporção de defeituosos. Em uma amostra aleatória Y₁, Y₂, ..., Yₙ, onde Yᵢ = 1, se a característica está presente; Yᵢ = 0 , caso contrário; denotamos X = Σⁿᵢ₌₁ Yᵢ. e um estimador não viciado de p é a proporção amostral ˆ p = X/n. Vamos fazer testes de hipóteses do tipo H₀ : p = p₀ ou H₀ : p = p₀ ou H₀ : p = p₀ H₁ : p ≠ p₀ H₁ : p < p₀ H₁ : p > p₀, usando a estatística de teste ˆ Z₀ = (p - p₀) ______________ √(p₀(1-p₀)/n) ~ N(0,1) se H₀ é verdadeira * *Aproximação binomial pela normal: se n é grande e p não é próximo de 0 ou 1, ˆ p ≈ N ( p, (p(1-p)/n) ). Hipóteses, Região Crítica e Valor P H₀ : p = p₀ H₁ : p ≠ p₀ H₀ : p = p₀ H₁ : p < p₀ H₀ : p = p₀ H₁ : p > p₀ Z₀ < -Zₐ/₂ Z₀ > Zₐ/₂ Z₀ < -Zₐ Z₀ > Zₐ valor p = 2P(Z > |Z₀|) valor p = P(Z < Z₀) valor p = P(Z > Z₀) Exemplo: Defeitos em semicondutores. Fabricante quer mostrar que proporção de defeituosos atende especificação de < 0.05. Parâmetro: p proporção de defeituosos. Hipóteses: H_0 : p = 0.05 \ vs \ H_1 : p < 0.05. Nível de significância: \alpha = 0.05. Estatística de teste: Z_0 = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}}. Região de rejeição: Z_0 < -Z_{0.05} = -1.645. Amostra: n=200, x=4 \ e \ \hat{p} = x/n = 4/200 = 0.02. Cálculos: Z_0 = \frac{0.02 - 0.05}{\sqrt{0.05(0.95)/200}} = -1.95. Resultado: Como -1.95 < -1.645, rejeita-se H_0 ao n.s. de 5%. Conclusão: A indústria atende às especificações. V\ \text{alor}\ p = P(Z < Z_0) = P(Z < -1.95) = 0.0256 \ (< \alpha). Passos para Teste de Hipóteses 1) Definir o parâmetro (média ou proporção) sobre o qual é feito o teste. 2) Definir a hipótese do pesquisador. 3) Definir a hipótese nula (H0) e hipótese alternativa (HA). 4) Escolher um valor α para o nível de significância do teste. 5) Definir a estatística de teste. 6) Calcular o valor observado da estatística de teste na amostra retirada da população. Intervalos de Confiança e Testes de Hipóteses Intervalos de Confiança podem ser usados para se fazer Testes de Hipóteses Bilaterais. H0: μ = μ0 HA: μ ≠ μ0 A região de não-rejeição de um teste bilateral sobre μ é o intervalo de confiança para μ. ( 1; 2 ) n Tobs t ;1 2) ( t n Tobs OU ( 1; ) ( 1; ) 2 2 n n obs t T t Intervalos de Confiança e Testes de Hipóteses Se um intervalo com 100(1-α)% de confiança é usado para se fazer um teste bilateral, o nível de significância associado ao teste é α%. Região de Rejeição Região de Não-Rejeição ( 1; ) ( 1; ) 2 2 / o n n x t t s n Como usar um Intervalo de Confiança para fazer um Teste de Hipóteses ? O intervalo de 100(1-α)% de confiança para μ contém o valor μ0 ? NÃO SIM rejeitamos H0 ao nível de α% de significância não rejeitamos H0 ao nível de α% de significância H0: μ = μ0 HA: μ ≠ μ0 Exemplo: energia de impacto em placas de aço A238 O teste Charpy V-notch (CVN) mede a energia de impacto (em J) e é frequentemente usado para determinar se um material experimenta ou não uma transição dúctil-frágil com um decréscimo de temperatura. Em um experimento com 10 corpos-de-prova de aço A238, cortados a 60o C, a energia de impacto média foi de 64,46 J e o desvio-padrão foi de 1.07 J. Considerando que a energia de impacto seja normalmente distribuída, a energia de impacto média nas placas de aço A238 está entre 63.84 J e 65.08 J, com 95% de confiança. Supondo que uma norma de qualidade determine que a energia de impacto média seja de 64.0 J. Os resultados do experimento mostram evidências estatísticas contra a hipótese de que as placas de aço do lote atendem à norma de qualidade?