• Home
  • Chat IA
  • Recursos
  • Guru IA
  • Professores
Home
Recursos
Chat IA
Professores

·

Engenharia de Materiais ·

Estatística 1

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Lista 9 - Análise de Variância - Estatística 2021 1

18

Lista 9 - Análise de Variância - Estatística 2021 1

Estatística

USP

Lista 10 - Análise de Regressão Linear - Estatística 2021-1

4

Lista 10 - Análise de Regressão Linear - Estatística 2021-1

Estatística

USP

Lista 9 - Análise de Variância - Estatística 2021-1

18

Lista 9 - Análise de Variância - Estatística 2021-1

Estatística 1

USP

Lista 8 - Teste de Hipótese - Estatística 2021 1

14

Lista 8 - Teste de Hipótese - Estatística 2021 1

Estatística

USP

Lista 8 - Teste de Hipótese - Estatística 2021-1

14

Lista 8 - Teste de Hipótese - Estatística 2021-1

Estatística

USP

Exercícios - Estatística 2021-2

9

Exercícios - Estatística 2021-2

Estatística

USP

Estap 1 2024

10

Estap 1 2024

Estatística 1

UFRJ

Exercícios Pf1

6

Exercícios Pf1

Estatística 1

UFRJ

Exercícios Pf2

6

Exercícios Pf2

Estatística 1

UFRJ

P4 - 2024-1

2

P4 - 2024-1

Estatística

UNESP

Texto de pré-visualização

UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Variância de uma combinação linear. Se X1, X2, ⋯ , Xn são variáveis aleatórias e Y = c1X1+c2X2+ ⋯+ cnXn, então Var(Y) = c1²Var(X1) + c2²Var(X2) + ⋯ + cn²Var(Xn) + ∑ ∑ cicjCov(Xi, Xj). i j Se X1, X2, ⋯ , Xn forem independentes, então Var(Y) = c1²Var(X1) + c2²Var(X2) + ⋯ + cn²Var(Xn). Propriedade da distribuição normal. Se X1, X2, ⋯ , Xn são variáveis aleatórias normais indepen- dentes, com E(Xi) = μi e Var(Xi) = σi², para i = 1, 2, ⋯ , n, Y = c1X1 + c2X2 + ⋯ + cnXn é uma variável aleatória normal com E(Y) = c1μ1 + c2μ2 + ⋯ + cnμn e Var(Y) = c1²σ1² + c2²σ2² + ⋯ + cn²σn². Exercício 13. Sejam as variáveis aleatórias X1 e X2 o comprimento e a largura, respectivamente, de uma peça fabricada. Considere que X1 segue uma distribuição normal, com média de 2 centímetros e desvio-padrão igual a 0,1 centímetro, e que X2 segue uma distribuição normal, com média de 5 cen- tímetros e desvio-padrão igual a 0,2 centímetro. Também suponha que X1 e X2 sejam independentes. Determine a probabilidade do perímetro exceder 14,5 centímetros. Resp.: 0,13. Exercício 14. Latas são cheias por uma máquina automática de enchimento. O volume médio de enchimento é 12,1 mililitros, sendo o desvio-padrão igual a 0,1 mililitro. Suponha que os volumes de en- chimento das latas sejam variáveis aleatórias normais independentes. Qual a probabilidade de que o médio de 10 latas selecionadas desse processo ser menor que 12 mililitros? Resp: 0,00079. Modelos Multivariados Distribuição Multinomial: Suponha que um experimento aleatório consiste em uma série de n tenta- tivas. Considere que (1) O resultado de cada tentativa é classificado em uma das k classes. (2) A probabilidade de uma tentativa gerando um resultado na classe 1, classe 2, ⋯ , classe k é constante ao longo das tentativas e igual a p1, p2, ⋯ , pk, respectivamente. (3) As tentativas são independentes. As variáveis aleatórias X1, X2, ⋯ , Xk, que denotam o número de tentativas que resultam na classe 1, classe 2, ⋯ , classe k, respectivamente, têm uma distribuição multinomial, sendo a função de probabili- Área I Rodovia Itajubá – Lorena, Km. 74,5 – Caixa Postal 116 CEP 12602-810– Lorena – SP Fax: (Direto) (12) 3135-3124/3135-3209 USP – Lorena Área II Pólo Urbo-Industrial A.I.S. – Caixa Postal 116 CEP 12602-810 – Lorena – SP Tel. (PABX) (12) 3159-5900 9 / 12 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo (2) ∑ y P(Y = y|X = x) = 1 (3) P(Y ∈ B|X = x) = ∑ y∈B P(Y = y|X = x) para qualquer conjunto B na faixa de Y . Exercício 06. Considere o Exemplo 01 onde X e Y denotam o número de barras de potência de sinal e o número de vezes que você precisa dizer seu nome, respectivamente. Calcule: (a) P(Y = 1|X = 3). Resp: 0,454. (b) P(Y = 2|X = 3). Resp: 0,364. (c) P(Y = 3|X = 3). Resp: 0,091. (d) P(Y = 4|X = 3). Resp: 0,091. Variáveis aleatórias contínuas Se X e Y são variáveis aleatórias contínuas, com função de probabilidade conjunta fXY (x, y), então a função de probabilidade condicional de Y , dado que X = x, é fY |X(y|x) = fXY (x, y) , para fX(x) > 0. fX(x) Propriedades: (1) fY |X(y|x) ≥ 0 (2) ∫ fY |X(y|x)dy = 1 (3) P(Y ∈ B|X = x) = ∫ B fY |X(y|x)dy para qualquer conjunto B na faixa de Y . Obs: É importante estabelecer a região em que a função densidade de probabilidade conjunta, condi- cional ou marginal não é zero. Exercício 07. Considerando o Exercício 03, determine a função densidade de probabilidade condicio- nal para Y , dado que X = x. Função de distribuição acumulada condicional Variáveis aleatórias discretas Se X e Y são variáveis aleatórias discretas, com função de probabilidade conjunta P(X = x, Y = y), então a função de distribuição acumulada condicional P(Y ≤ y|X = x) é dada por P(Y ≤ y|X = x) = P(X = x, Y ≤ y) , para P(X = x) > 0. P(X = x) Da mesma forma, temos que P(Y ≤ y|X ≤ x) é dada por P(Y ≤ y|X ≤ x) = P(X ≤ x, Y ≤ y) , para P(X ≤ x) > 0. P(X ≤ x) Área I Rodovia Itajubá – Lorena, Km. 74,5 – Caixa Postal 116 CEP 12602-810– Lorena – SP Fax: (Direto) (12) 3135-3124/3135-3209 USP – Lorena Área II Pólo Urbo-Industrial A.I.S. – Caixa Postal 116 CEP 12602-810 – Lorena – SP Tel. (PABX) (12) 3159-5900 5 / 12 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Então, P(X ≤ x, Y ≤ y) = P(Y ≤ y|X ≤ x) × P(X ≤ x) ≈ ∑ k≤x P(Y ≤ y|X = k) × P(X = k). Variáveis aleatórias contínuas Se X e Y são variáveis aleatórias contínuas, com função densidade de probabilidade conjunta fXY (x, y), então a função de distribuição acumulada condicional P(Y ≤ y|X = x) é dada por FY |X(y|x) = P(Y ≤ y|X = x) = ∫ y−∞ fY |X(z|x)dz para fX(x) > 0. Média e Variância condicionais As fórmulas usuais para média e variância podem ser aplicadas a uma função de probabilidade condi- cional. A média condicional de Y , dado que X = x, denotada como E(Y |x) ou μY |X é dada por E(Y |x) = ∑ y yP(Y = y|X = x) (caso discreto) e E(Y |x) = ∫ yfY |X(y|x)dy (caso contínuo) A variância condicional de Y , dado que X = x, denotada como Var(Y |x) ou σ2 Y |X é dada por Var(Y |x) = ∑ (y − μY |X )2P(Y = y|X = x) = ∑ (y2 × P(Y = y|X = x) − μ2 Y |X ) = E(Y 2|x) − E 2(Y |x) (caso discreto). e Var(Y |x) = ∫ (y − μY |X )2fY |X(y|x)dy = ∫ y2fY |X(y|x)dy − μ2 Y|X = E(Y 2|x) − E 2 (Y |x) (caso contínuo). Exercício 08. Considere f(x, y) = { yx−1 , x = 1, 2, 3 e 0 ≤ y ≤ 1 3 0 , caso contrário (a) Calcule P(X = x) e fY (y) (b) Calcule P(X = x|Y = 1 2) (c) Calcule P(X ≤ x|Y = 1 2) (d) Calcule fY |X(y|x) = P(Y = y|X = 2) Área I Rodovia Itajubá – Lorena, Km. 74,5 – Caixa Postal 116 CEP 12602-810– Lorena – SP Fax: (Direto) (12) 3135-3124/3135-3209 USP – Lorena Área II Pólo Urbo-Industrial A.I.S. – Caixa Postal 116 CEP 12602-810 – Lorena – SP Tel. (PABX) (12) 3159-5900 6 / 12 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo (e) Calcule FY |x(y|2) = P(Y ≤ y|X = 2) Exercício 09. Para as variáveis aleatórias X e Y definidas no Exercício 03, determine: (a) A função densidade de probabilidade condicional para Y , dado que X = x. (b) A probabilidade de Y exceder 2.000 horas, dado que x = 1.500. Resp: P(Y > 2.000|X = 1.500) = 0, 368. (c) A média condicional para Y , dado que x = 1.500. Resp: E(Y |X = 1.500) = 2.000. Independência Em alguns experimentos aleatórios, o conhecimento dos valores de X não altera qualquer das proba- bilidades associadas aos valores de Y . Por analogia com eventos independentes, definimos duas variáveis aleatórias como independentes se fXY (x, y) = fX(x)fY (y) para todo x e y. Se encontrarmos um par (x, y) em que a igualdade falhe, X e Y não serão independentes. Se duas variáveis aleatórias forem independentes, então fY |x(y|x) = fXY (x, y) fX(x) = fX(x)fY (y) fX(x) = fY (y) Variáveis aleatórias discretas Para variáveis aleatórias discretas X e Y , se qualquer uma das seguintes propriedades for verdadeira, então as outras serão também verdadeiras e X e Y serão independentes. (1) P(X = x, Y = y) = P(X = x)P(Y = y) para todo x, y (2) P(Y = y|X = x) = P(Y = y) para todo x, y, com P(X = x) > 0 (3) P(X = x|Y = y) = P(X = x) para todo x, y, com P(Y = y) > 0 (4) P(X ∈ A, Y ∈ B) = P(X ∈ A)P(Y ∈ B) para quaisquer conjuntos A e B, na faixa X e Y , respectiva- mente. Variáveis aleatórias contínuas Para variáveis aleatórias contínuas X e Y , se qualquer uma das seguintes propriedades for verdadeira, então as outras serão também verdadeiras e X e Y serão independentes. (1) fXY (x, y) = fX(x)fY (y) para todo x, y (2) fY |x(y|x) = fY (y) para todo x, y, com fX(x) > 0 (3) fX|y(x|y) = fX(x) para todo x, y, com fY (y) > 0 (4) P(X ∈ A, Y ∈ B) = P(X ∈ A)P(Y ∈ B) para quaisquer conjuntos A e B, na faixa X e Y , respectiva- mente. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 7 / 12 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Exercício 10. Sejam as v.as. X e Y que correspondem aos comprimentos das duas dimensões de uma peça usinada. Suponha que X e Y sejam variáveis aleatórias independentes e, além disso, suponha que a distribuição de X seja Normal, com média 10,5 milímetros e variância 0,0025 (milímetro)2 e que a distribuição de Y seja Normal, com média 3,2 milímetros e variãncia 0,0036 (milímetro)2. Determine P(10, 4 < X < 10, 6 , 3, 15 < Y < 3, 25) = P({10, 4 < X < 10, 6} ∩ {3, 15 < Y < 3, 25}). Exercício 11. Considere que a função densidade de probabilidade conjunta de X e Y seja fXY (x, y) = 2 × 10−6 exp(−0, 001x − 0, 002y), para x ≥ 0 e y ≥ 0. (a) Mostre que X e Y são independentes. (b) Determine P(X > 1.000 , Y < 1.000). Exercício 12. Considere fX,Y (x, y) = k x , para 0 < y < x < 2. (a) Determine o valor de k. (b) Calcule fX(x) e fY (y). (c) X e Y são variáveis aleatórias independentes? (d) Calcule fX|y(x|y) e fY |x(y|x). (e) Calcule P(X < 1|Y = y). Funções lineares de variáveis aleatórias Uma variável aleatória é algumas vezes definida como uma função de uma ou mais variáveis aleatórias. Por exemplo, se as variáveis aleatórias X1 e X2 denotarem o comprimento e a largura, respectivamente, de uma peça fabricada, então Y = 2X1+2X2 é uma variável aleatória que representa o perímetro da peça. Como outro exemplo, lembre que a variável aleatória Binomial Negativa é representada como a soma de variáveis aleatórias Geométricas. Nesta seção, desenvolveremos resultados para as variáveis aleatórias que sejam combinações lineares de variáveis aleatórias. Dadas variáveis aleatórias X1, X2, · · · , Xn e as constantes c1, c2, · · · , cn, então Y = c1X1 + c2X2 + · · · + cnXn é uma combinação linear de X1, X2, · · · , Xn. Média de uma combinação linear. Se X1, X2, · · · , Xn são variáveis aleatórias e Y = c1X1 + c2X2 + · · · + cnXn, então E(Y ) = c1E(X1) + c2E(X2) + · · · + cnE(Xn). Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 8 / 12 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo dade conjunta dada por P(X1 = x1, X2 = x2, ··· , Xk = xk) = \frac{n!}{x1!x2!···xk!} px1_1 px2_2 ··· pxk_k para x1 + x2 + ··· + xk = n e p1 + p2 + ··· + pk = 1. Obs: A distribuição multinomial é considerada uma versão multivariada da distribuição binomial. Se X1, X2, ··· , Xk têm uma distribuição multinomial, a distribuição de probabilidades marginais de Xi é Binomial com E(Xi) = npi e Var(Xi) = npi(1 − pi). Distribuição Normal bivariada: A função densidade de probabilidade de uma distribuição normal bivariada é fXY (x,y) = \frac{1}{2πσXσY √1 − ρ²} exp \left[ −\frac{1}{2(1 − ρ²)} [(x − µX)² \over σ²X − \frac{2ρ(x − µX)(y − µY )}{σXσY } + (y − µY )² \over σ²Y ]\right] para −∞ < x < ∞ e −∞ < y < ∞, com parâmetros σX > 0, σY > 0, −∞ < µX < ∞, −∞ < µY < ∞ e −1 < ρ < 1. Se X e Y tiverem uma distribuição normal bivariada, com densidade de probabilidade conjunta fXY (x,y), então as distribuições de probabilidades marginais de X e Y são normais, com médias µX e µY e desvios-padrão σX e σY, respectivamente. Se X e Y tiverem uma distribuição normal bivariada, a função densidade de probabilidade conjunta fXY (x,y), então a correlação entre X e Y é ρ. Obs: Se X e Y tiverem uma distribuição normal bivariada, com ρ = 0, então X e Y serão independentes. Covariância e Correlação Quando duas ou mais variáveis aleatórias são definidas em um espaço probabilístico, é útil descrever como elas variam conjuntamente; ou seja, é útil medir a relação entre as variáveis. Uma medida comum da relação entre duas variáveis aleatórias é a covariância. A covariância é defi- nida para variáveis aleatórias contínuas e discretas pela mesma fórmula. A covariância entre as variáveis aleatórias X e Y , denotada por Cov(X, Y ) ou σXY , é σXY = E[(X − E(X))(Y − E(Y ))] = E(XY ) − E(X)E(Y ) Covariância é uma medida de relação linear entre as variáveis aleatórias. Se a relação entre as variáveis aleatórias for não linear, a covariância pode não ser sensível a relação. UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Figura 2: Distribuições de probabilidades conjuntas e o sinal da covariância entre X e Y . (a) Covariância positiva (b) Covariância zero (c) Covariância negativa (d) Covariância negativa Todos os pontos têm igual probabilidade Exercício 15. Considere o Exemplo 01 onde as variáveis aleatórias X e Y são o número de barras de sinal e o número de vezes em que você tem de dizer seu nome, respectivamente. Você acha que a covariância entre X e Y é positiva ou negativa? Há outra medida da relação entre duas variáveis aleatórias que é frequentemente mais fácil de inter- pretar que a covariância. A correlação entre as variáveis aleatórias X e Y , denotada por ρXY , é ρXY = \frac{Cov(X, Y )}{√Var(X)Var(Y )} = \frac{σXY}{σXσY} Para quaisquer duas variáveis aleatórias X e Y , −1 ≤ ρXY ≤ +1. Obs: Se X e Y forem variáveis aleatórias independentes, então σXY = ρXY = 0. No entanto, se a correlação entre duas variáveis aleatórias for zero, não podemos concluir imediatamente que as variáveis aleatórias sejam independentes. A correlação só escala a covariância através do desvio padrão de cada variável. Assim, a correlação é uma grandeza adimensional que pode ser usada para comparar as relações lineares entre pares de variáveis aleatórias em diferentes unidades. Similar a covariância, a correlação é uma medida da relação linear entre as variáveis aleatórias. Área I Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 Lorena – SP CEP 12600-970 Tel: (12) 3159-5013 Tel. (Direto) (12) 3159-5143 | 3153-3209 USP – Lorena www.eel.usp.br 10 / 12 Área II Pólo Urbo-Industrial Altos – Caieiras Pte. CEP 12602-810 | Lorena – SP Fax (12) 3153-3096 Tel. (PABX) (12) 3159-5900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Exercício 16. Suponha que a variável aleatória X tenha a seguinte distribuição: P(X = 1) = 0, 2, P(X = 2) = 0, 6, P(X = 3) = 0, 2. Seja Y = 2X + 5. Ou seja, P(Y = 7) = 0, 2, P(Y = 9) = 0, 6, P(Y = 11) = 0, 2. Determine a correlação entre X e Y . Exercício 17. Suponha as variáveis X e Y tais que • X ∼ Unif{−1, 1}, ou seja, X ∈ {−1, 0, 1} com P(X = −1) = P(X = 0) = P(X = 1) = 1 3. • Y assume dois valores: Y = 0, se X = 0 ou Y = 1, caso contrário (se X ̸= 0). (a) Calcule a covariância e a correlação entre X e Y . (b) X e Y são independentes? Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 12 / 12 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Controle Estatístico da Qualidade Hoje, a qualidade de produtos e serviços tem-se tornado um fator de decisão primordial na maioria dos negócios. Quando o consumidor (que pode ser um indivíduo ou uma corporação ou um programa de defesa militar ou uma loja de varejo, etc) estiver tomando decisões de compra, ele estará propenso a considerar a qualidade como um fator essencial em sua escolha. Assim, a melhoria da qualidade tem se tornado uma preocupação importante para a grande maioria das corporações. A qualidade é determinada pela interação entre qualidade de projeto e qualidade de conformidade. Qualidade de projeto se refere aos diferentes graus ou níveis de desempenho, de confiabilidade, de serviço e de função, resultados de decisões deliberadas de engenharia e gerência. Por Qualidade de conformidade, queremos dizer a redução sistemática de variabilidade e a eliminação de defeitos até que cada unidade produzida seja idêntica e livre de defeito. Melhoria da qualidade significa a eliminação sistemática de desperdício. Exemplos de desperdícios incluem: • perda e retrabalho na fabricação, inspeção e teste; • erros em documentos (tais como desenhos de engenharia, cheques, ordens de pagamento e planos); • serviço de atendimento a consumidores; • custos de garantia; • tempo necessário para repetir coisas que poderiam ter sido feitas uma única vez. Um esforço para a melhoria da qualidade pode eliminar muito desse desperdício e conduzir a: • custos menores; • produtividades maiores; • consumidores mais satisfeitos; • aumento da reputação dos negócios; • maiores lucros para a companhia. Métodos estatísticos desempenham um papel vital na melhoria da qualidade. O controle estatístico da qualidade é uma coleção de ferramentas essenciais nas atividades de me- lhoria da qualidade. O controle estatístico da qualidade pode ser definido como os métodos estatísticos e de engenharia usados na medida, na monitoração, no controle e na melhoria da qualidade. É impraticável inspecionar qualidade em um produto. O produto tem de ser feito corretamente já na primeira vez. Para isso, o processo de fabricação tem de ser estável e capaz de operar com pouca variabi- lidade ao redor do alvo ou dimensão nominal. É costume pensar sobre controle estatístico de processo (CEP) como um conjunto de ferramentas para resolver problemas, as quais podem ser aplicadas a qual- quer processo. As ferramentas mais importantes de CEP são: Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 1 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo (1) Gráfico de controle (2) Histograma (3) Gráfico de Pareto (4) Diagrama de causa e efeito (5) Diagrama de dispersão (6) Folha de verificação Introdução aos Gráficos de Controle Em qualquer processo de produção, certa variabilidade inerente ou natural sempre existirá. Essa varia- bilidade natural ou “ruído de fundo”, chamada de “sistema estável de causas casuais”, é o efeito cumulativo de muitas causas pequenas, normalmente inevitáveis. Um processo cuja variação presente seja prove- niente apenas de causas casuais é dito estar sob controle estatístico. Em outras palavras, as causas casuais são uma parte inerente do processo. Outros tipos de variabilidade podem, ocasionalmente, estar presentes no resultado de um processo e geralmente aparece de três fontes: • máquinas não ajustadas, • erros dos operadores, ou • matérias-primas defeituosas. Tal variabilidade é geralmente grande quando comparada ao ruído de fundo, representando usualmente um nível inaceitável de desempenho de processo. Referimo-nos a essas fontes de variabilidade, que não são parte do padrão de causas casuais, como causas atribuídas. Um processo que esteja operando na presença de causas atribuídas é dito estar fora de controle. Um gráfico típico de controle, calculado a partir de uma amostra, é mostrado abaixo. O gráfico contém • uma linha central (LC), que representa o valor médio da característica da qualidade correspondendo ao estado sob controle. • duas outras linhas horizontais, chamadas de limite superior de controle (LSC) e de limite inferior de controle (LIC). Esses limites de controle são escolhidos de modo que, se o processo estiver sob controle, aproximadamente todos os pontos da amostra cairão entre eles. Em geral, se os pontos estiverem plotados dentro dos limites de controle, o processo é considerado estar sob controle, e nenhuma ação é necessária. Entretanto, pontos fora dos limites de controle são evidências de que o processo está fora de controle, havendo necessidade de investigação e ação corretiva para encontrar e eliminar a causa atribuída. Os pontos da amostra no gráfico de controle são conectados com segmentos de linha reta, para fácil visualização. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 2 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Mesmo que todos os pontos estejam dentro dos limites de controle, se eles se comportarem de ma- neira sistemática ou não aleatória, então isso é uma indicação de que o processo está fora de controle. Por exemplo, se 18 dos 20 últimos pontos estivessem acima da linha central, porém abaixo do limite superior de controle, e somente dois desses pontos estivessem abaixo da linha central, porém acima do limite infe- rior de controle, ficaríamos muito desconfiados de que alguma coisa estaria errada. Se o processo estiver sob controle, todos os pontos plotados deverão ter um padrão de comportamento essencialmente aleatório. Há uma forte conexão entre gráficos de controle e testes de hipóteses. O gráfico de controle é um teste da hipótese de que o processo está em um estado de controle estatístico. Um ponto situado dentro dos limites de controle é equivalente a não rejeitar a hipótese de controle estatístico, e um ponto situado fora dos limites de controle é equivalente a rejeitar a hipótese de controle estatístico. Podemos dar um modelo geral para um gráfico de controle: seja W uma estatística da amostra que mede alguma característica da qualidade de interesse e suponha que a média de W seja µW e o desvio-padrão de W seja σW . Então a linha central, o limite superior de controle e o limite inferior de controle se tornam LSC = µW + kσW LC = µW LIC = µW − kσW sendo k a “distância” dos limites de controle a partir da linha central, expressa em unidades de desvio- padrão. Uma escolha comum é k = 3. Os gráficos de controle podem ser classificados em dois tipos gerais: (a) gráficos de controle para variáveis: se a característica da qualidade é uma variável quantitativa, ou (b) gráficos de controle para atributos: se a característica da qualidade não é medida em uma escala quantitativa. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 3 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Análise de Padrões nos gráficos de controle Um gráfico de controle pode indicar uma condição de fora de controle quando um ou mais pontos caírem além dos limites de controle ou quando os pontos plotados exibirem algum padrão não aleatório de comportamento. No gráfico acima vemos que embora todos os 25 pontos caiam dentro dos limites de controle, os pontos não indicam controle estatístico em razão de seu padrão de não aleatoriedade. Notamos que 19 dos 25 pontos estão abaixo da linha central, enquanto somente seis deles estão acima. Se os pontos fossem aleatórios, devemos esperar uma distribuição mais uniforme deles acima e abaixo da linha central. Observando o gráfico de controle abaixo, notamos que as médias amostrais plotadas exibem um com- portamento cíclico, ainda que todas elas caiam dentro dos limites de controle. Tal padrão de comporta- mento pode indicar um problema com o processo, como fadiga do operador, desenvolvimento de calor ou tensão, etc. O resultado pode ser melhorado, eliminando ou reduzindo as fontes de variabilidade que causam esse comportamento cíclico. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 4 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo O problema é reconhecer o padrão de comportamento; isto é, reconhecer os padrões sistemáticos ou não aleatórios no gráfico de controle e identificar a razão para esse comportamento. A habilidade para interpretar um padrão particular de comportamento em termos de causas atribuídas requer experiência e conhecimento do processo. Ou seja, temos não somente de conhecer os princípios estatísticos de gráficos de controle, mas também temos de ter um bom entendimento do processo. O livro Western Electric Handbook (1956) sugere um conjunto de regras de decisão para detectar padrões não aleatórios de comportamento nos gráficos de controle. Especificamente, as regras Western Electric concluem que o processo está fora de controle, se: (1) Um ponto cair fora dos limites 3-sigma. (2) Dois de três pontos consecutivos caírem além do limite 2-sigma. (3) Quatro de cinco pontos consecutivos caírem a uma distância maior ou igual a 1-sigma da linha central. (4) Oito pontos consecutivos caírem em um dos lados da linha central. Na prática, as regras (2) e (3) se aplicam a um lado da linha central de cada vez, ou seja, um ponto acima do limite superior 2-sigma, seguido imediatamente por um ponto abaixo do limite inferior 2-sigma, não sinalizaria um alarme de fora de controle. Observe que esses limites internos (algumas vezes chama- dos de limites de advertência) dividem o gráfico de controle em três zonas A, B e C, em cada lado da linha central. No gráfico abaixo, qual seria a nossa conclusão? Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 5 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Resp: os quatro últimos pontos caem na zona B ou além. Assim, uma vez que quatro dos cinco pontos consecutivos excedem o limite 1-sigma, o procedimento Western Electric concluirá que o padrão de comportamento é não aleatório, estando o processo fora de controle. Outras ferramentas para a solução de problemas de CEP Embora o gráfico de controle seja uma ferramenta muito poderosa para investigar as causas de varia- ção em um processo, ele é mais efetivo quando usado com outras ferramentas para resolver problemas de CEP. Considere o seguinte exemplo: Exemplo: Placas de circuito impresso são montadas por uma combinação de montagem manual e automática. Uma Tecnologia de Montagem da Superfície (TMS) é usada para fazer as conexões mecânicas e elétricas dos componentes na placa. A cada hora, cinco placas são selecionadas e inspecionadas para finalidades de controle de processo. O número de defeitos em cada amostra de cinco placas é anotado. Os resultados para 20 amostras são mostrados na tabela abaixo: Abaixo temos um gráfico para o número de defeitos em amostras de cinco placas de circuito impresso. O gráfico exibe controle estatístico, mas o número de defeitos tem de ser reduzido, pois o número médio de defeitos por placa é 8/5 = 1,6. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 6 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo A primeira etapa para resolver esse problema é construir um diagrama de Pareto dos tipos individuais de defeitos. O diagrama de Pareto, abaixo, indica que soldagem insuficiente e bolas de solda são os defeitos mais frequentemente encontrados, considerando (109/160)100 = 68% dos defeitos observados. Além disso, as cinco primeiras categorias de defeitos no gráfico de Pareto são todas defeitos relacionados com a solda. Isso aponta para o processo de soldagem contínua como uma oportunidade potencial para melhoria. Para melhorar o processo de montagem na superfície, uma comissão estuda as causas potenciais de defeitos de soldagem. Essas pessoas conduzem uma sessão de discussão (brainstorming) e produzem o diagrama de causa e efeito, mostrado abaixo. O diagrama de causa e efeito é largamente usado para mostrar as várias causas potenciais de defeitos em produtos e suas inter-relações. Ele é útil em resumir o conhecimento acerca do processo. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 7 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Como um resultado da sessão de discussão, a comissão identifica, por tentativa, as seguintes variáveis como potencialmente influenciáveis em criar os defeitos de soldagem: (1) Densidade de fluxo (2) Temperatura de refluxo (3) Velocidade do rolo (4) Ângulo do rolo (5) Altura da pasta (6) Pressão do rolo (7) Método de carregamento da placa Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 8 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 Fatores para os Limites de Controle Gráfico \bar{X} Gráfico R Gráfico S n° A₂ A₃ d₂ D₃ D₄ C₄ n 2 3.760 1.880 1.128 0 3.267 0.799 2 3 2.394 1.023 1.693 0 2.575 0.886 3 4 1.880 0.729 2.059 0 2.282 0.9213 4 5 1.596 0.577 2.326 0 2.115 0.9400 5 6 1.410 0.483 2.534 0.076 2.004 0.9515 6 7 1.277 0.419 2.704 0.136 1.924 0.9594 7 8 1.175 0.373 2.847 0.184 1.864 0.9650 8 9 1.094 0.337 2.970 0.223 1.816 0.9693 9 10 1.028 0.308 3.078 0.252 1.777 0.9727 10 11 0.973 0.285 3.173 0.284 1.744 0.9754 11 12 0.925 0.266 3.258 0.284 1.716 0.9776 12 13 0.884 0.249 3.336 0.308 1.692 0.9794 13 14 0.848 0.235 3.407 0.329 1.671 0.9810 14 15 0.816 0.223 3.472 0.348 1.652 0.9823 15 16 0.788 0.212 3.532 0.364 1.636 0.9835 16 17 0.762 0.203 3.588 0.379 1.622 0.9845 17 18 0.738 0.194 3.640 0.392 1.608 0.9854 18 19 0.717 0.187 3.689 0.404 1.597 0.9862 19 20 0.698 0.180 3.735 0.414 1.586 0.9869 20 21 0.679 0.173 3.778 0.424 1.576 0.9876 21 22 0.662 0.167 3.819 0.433 1.566 0.9882 22 23 0.647 0.162 3.858 0.443 1.557 0.9887 23 24 0.632 0.157 3.895 0.452 1.548 0.9892 24 25 0.619 0.153 3.931 0.459 1.541 0.9896 25 Distribui¸c˜ao Normal p 0 zt Z 0 1 2 3 4 5 6 7 8 9 0,0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586 0,1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535 0,2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409 0,3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173 0,4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793 0,5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.22240 0,6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.25490 0,7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.28524 0,8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327 0,9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891 1,0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214 1,1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.38298 1,2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147 1,3 0.40320 0.40490 0.40658 0.40824 0.40988 0.41149 0.41309 0.41466 0.41621 0.41774 1,4 0.41924 0.42073 0.42220 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189 1,5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408 1,6 0.44520 0.44630 0.44738 0.44845 0.44950 0.45053 0.45154 0.45254 0.45352 0.45449 1,7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46080 0.46164 0.46246 0.46327 1,8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062 1,9 0.47128 0.47193 0.47257 0.47320 0.47381 0.47441 0.47500 0.47558 0.47615 0.47670 2,0 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.48030 0.48077 0.48124 0.48169 2,1 0.48214 0.48257 0.48300 0.48341 0.48382 0.48422 0.48461 0.48500 0.48537 0.48574 2,2 0.48610 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.48840 0.48870 0.48899 2,3 0.48928 0.48956 0.48983 0.49010 0.49036 0.49061 0.49086 0.49111 0.49134 0.49158 2,4 0.49180 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361 2,5 0.49379 0.49396 0.49413 0.49430 0.49446 0.49461 0.49477 0.49492 0.49506 0.49520 2,6 0.49534 0.49547 0.49560 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.49643 2,7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.49720 0.49728 0.49736 2,8 0.49744 0.49752 0.49760 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807 2,9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.49861 3,0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.49900 3,1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929 3,2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.49950 3,3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.49965 3,4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976 3,5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.49983 3,6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989 3,7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992 3,8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995 3,9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997 Tabela 1: Probabilidades p = P[0 ≤ Z ≤ Zt] da Distribui¸c˜ao Normal padr˜ao com valores de Zt dados nas margens da tabela 1 Distribui¸c˜ao t de Student p/2 p/2 0 tt t 90% 80% 70% 60% 50% 40% 30% 20% 10% 9% 8% 7% 6% 5% 4% 3% 2% 1% 0.5% 0.2% 0.1% 2 0.142 0.289 0.445 0.617 0.816 1.061 1.386 1.886 2.920 3.104 3.320 3.578 3.896 4.303 4.849 5.643 6.965 9.925 14.089 22.327 31.599 3 0.137 0.277 0.424 0.584 0.765 0.978 1.250 1.638 2.353 2.471 2.605 2.763 2.951 3.182 3.482 3.896 4.541 5.841 7.453 10.215 12.924 4 0.134 0.271 0.414 0.569 0.741 0.941 1.190 1.533 2.132 2.226 2.333 2.456 2.601 2.776 2.999 3.298 3.747 4.604 5.598 7.173 8.610 5 0.132 0.267 0.408 0.559 0.727 0.920 1.156 1.476 2.015 2.098 2.191 2.297 2.422 2.571 2.757 3.003 3.365 4.032 4.773 5.893 6.869 6 0.131 0.265 0.404 0.553 0.718 0.906 1.134 1.440 1.943 2.019 2.104 2.201 2.313 2.447 2.612 2.829 3.143 3.707 4.317 5.208 5.959 7 0.130 0.263 0.402 0.549 0.711 0.896 1.119 1.415 1.895 1.966 2.046 2.136 2.241 2.365 2.517 2.715 2.998 3.499 4.029 4.785 5.408 8 0.130 0.262 0.399 0.546 0.706 0.889 1.108 1.397 1.860 1.928 2.004 2.090 2.189 2.306 2.449 2.634 2.896 3.355 3.833 4.501 5.041 9 0.129 0.261 0.398 0.543 0.703 0.883 1.100 1.383 1.833 1.899 1.973 2.055 2.150 2.262 2.398 2.574 2.821 3.250 3.690 4.297 4.781 10 0.129 0.260 0.397 0.542 0.700 0.879 1.093 1.372 1.812 1.877 1.948 2.028 2.120 2.228 2.359 2.527 2.764 3.169 3.581 4.144 4.587 11 0.129 0.260 0.396 0.540 0.697 0.876 1.088 1.363 1.796 1.859 1.928 2.007 2.096 2.201 2.328 2.491 2.718 3.106 3.497 4.025 4.437 12 0.128 0.259 0.395 0.539 0.695 0.873 1.083 1.356 1.782 1.844 1.912 1.989 2.076 2.179 2.303 2.461 2.681 3.055 3.428 3.930 4.318 13 0.128 0.259 0.394 0.538 0.694 0.870 1.079 1.350 1.771 1.832 1.899 1.974 2.060 2.160 2.282 2.436 2.650 3.012 3.372 3.852 4.221 14 0.128 0.258 0.393 0.537 0.692 0.868 1.076 1.345 1.761 1.821 1.887 1.962 2.046 2.145 2.264 2.415 2.624 2.977 3.326 3.787 4.140 15 0.128 0.258 0.393 0.536 0.691 0.866 1.074 1.341 1.753 1.812 1.878 1.951 2.034 2.131 2.249 2.397 2.602 2.947 3.286 3.733 4.073 16 0.128 0.258 0.392 0.535 0.690 0.865 1.071 1.337 1.746 1.805 1.869 1.942 2.024 2.120 2.235 2.382 2.583 2.921 3.252 3.686 4.015 17 0.128 0.257 0.392 0.534 0.689 0.863 1.069 1.333 1.740 1.798 1.862 1.934 2.015 2.110 2.224 2.368 2.567 2.898 3.222 3.646 3.965 18 0.127 0.257 0.392 0.534 0.688 0.862 1.067 1.330 1.734 1.792 1.855 1.926 2.007 2.101 2.214 2.356 2.552 2.878 3.197 3.610 3.922 19 0.127 0.257 0.391 0.533 0.688 0.861 1.066 1.328 1.729 1.786 1.850 1.920 2.000 2.093 2.205 2.346 2.539 2.861 3.174 3.579 3.883 20 0.127 0.257 0.391 0.533 0.687 0.860 1.064 1.325 1.725 1.782 1.844 1.914 1.994 2.086 2.197 2.336 2.528 2.845 3.153 3.552 3.850 21 0.127 0.257 0.391 0.532 0.686 0.859 1.063 1.323 1.721 1.777 1.840 1.909 1.988 2.080 2.189 2.328 2.518 2.831 3.135 3.527 3.819 22 0.127 0.256 0.390 0.532 0.686 0.858 1.061 1.321 1.717 1.773 1.835 1.905 1.983 2.074 2.183 2.320 2.508 2.819 3.119 3.505 3.792 23 0.127 0.256 0.390 0.532 0.685 0.858 1.060 1.319 1.714 1.770 1.832 1.900 1.978 2.069 2.177 2.313 2.500 2.807 3.104 3.485 3.768 24 0.127 0.256 0.390 0.531 0.685 0.857 1.059 1.318 1.711 1.767 1.828 1.896 1.974 2.064 2.172 2.307 2.492 2.797 3.091 3.467 3.745 25 0.127 0.256 0.390 0.531 0.684 0.856 1.058 1.316 1.708 1.764 1.825 1.893 1.970 2.060 2.167 2.301 2.485 2.787 3.078 3.450 3.725 26 0.127 0.256 0.390 0.531 0.684 0.856 1.058 1.315 1.706 1.761 1.822 1.890 1.967 2.056 2.162 2.296 2.479 2.779 3.067 3.435 3.707 27 0.127 0.256 0.389 0.531 0.684 0.855 1.057 1.314 1.703 1.758 1.819 1.887 1.963 2.052 2.158 2.291 2.473 2.771 3.057 3.421 3.690 28 0.127 0.256 0.389 0.530 0.683 0.855 1.056 1.313 1.701 1.756 1.817 1.884 1.960 2.048 2.154 2.286 2.467 2.763 3.047 3.408 3.674 29 0.127 0.256 0.389 0.530 0.683 0.854 1.055 1.311 1.699 1.754 1.814 1.881 1.957 2.045 2.150 2.282 2.462 2.756 3.038 3.396 3.659 30 0.127 0.256 0.389 0.530 0.683 0.854 1.055 1.310 1.697 1.752 1.812 1.879 1.955 2.042 2.147 2.278 2.457 2.750 3.030 3.385 3.646 35 0.127 0.255 0.388 0.529 0.682 0.852 1.052 1.306 1.690 1.744 1.803 1.869 1.944 2.030 2.133 2.262 2.438 2.724 2.996 3.340 3.591 40 0.126 0.255 0.388 0.529 0.681 0.851 1.050 1.303 1.684 1.737 1.796 1.862 1.936 2.021 2.123 2.250 2.423 2.704 2.971 3.307 3.551 50 0.126 0.255 0.388 0.528 0.679 0.849 1.047 1.299 1.676 1.729 1.787 1.852 1.924 2.009 2.109 2.234 2.403 2.678 2.937 3.261 3.496 60 0.126 0.254 0.387 0.527 0.679 0.848 1.045 1.296 1.671 1.723 1.781 1.845 1.917 2.000 2.099 2.223 2.390 2.660 2.915 3.232 3.460 120 0.126 0.254 0.386 0.526 0.677 0.845 1.041 1.289 1.658 1.709 1.766 1.828 1.899 1.980 2.076 2.196 2.358 2.617 2.860 3.160 3.373 Tabela 2: Quantis da Distribui¸c˜ao t. Graus de liberdade na margem esquerda da tabela e probabilidades p dadas no topo da tabela tal que p 2 = P[t ≥ tt]. 2 Distribui¸c˜ao χ2 p χt 2 χ2 99% 98% 97.5% 95% 90% 80% 70% 60% 50% 40% 30% 20% 10% 5% 4% 2.5% 2% 1% 0.2% 0.1% 1 0.000 0.001 0.001 0.004 0.016 0.064 0.148 0.275 0.455 0.708 1.074 1.642 2.706 3.841 4.218 5.024 5.412 6.635 9.550 10.828 2 0.020 0.040 0.051 0.103 0.211 0.446 0.713 1.022 1.386 1.833 2.408 3.219 4.605 5.991 6.438 7.378 7.824 9.210 12.429 13.816 3 0.115 0.185 0.216 0.352 0.584 1.005 1.424 1.869 2.366 2.946 3.665 4.642 6.251 7.815 8.311 9.348 9.837 11.345 14.796 16.266 4 0.297 0.429 0.484 0.711 1.064 1.649 2.195 2.753 3.357 4.045 4.878 5.989 7.779 9.488 10.026 11.143 11.668 13.277 16.924 18.467 5 0.554 0.752 0.831 1.145 1.610 2.343 3.000 3.655 4.351 5.132 6.064 7.289 9.236 11.070 11.644 12.833 13.388 15.086 18.907 20.515 6 0.872 1.134 1.237 1.635 2.204 3.070 3.828 4.570 5.348 6.211 7.231 8.558 10.645 12.592 13.198 14.449 15.033 16.812 20.791 22.458 7 1.239 1.564 1.690 2.167 2.833 3.822 4.671 5.493 6.346 7.283 8.383 9.803 12.017 14.067 14.703 16.013 16.622 18.475 22.601 24.322 8 1.646 2.032 2.180 2.733 3.490 4.594 5.527 6.423 7.344 8.351 9.524 11.030 13.362 15.507 16.171 17.535 18.168 20.090 24.352 26.124 9 2.088 2.532 2.700 3.325 4.168 5.380 6.393 7.357 8.343 9.414 10.656 12.242 14.684 16.919 17.608 19.023 19.679 21.666 26.056 27.877 10 2.558 3.059 3.247 3.940 4.865 6.179 7.267 8.295 9.342 10.473 11.781 13.442 15.987 18.307 19.021 20.483 21.161 23.209 27.722 29.588 11 3.053 3.609 3.816 4.575 5.578 6.989 8.148 9.237 10.341 11.530 12.899 14.631 17.275 19.675 20.412 21.920 22.618 24.725 29.354 31.264 12 3.571 4.178 4.404 5.226 6.304 7.807 9.034 10.182 11.340 12.584 14.011 15.812 18.549 21.026 21.785 23.337 24.054 26.217 30.957 32.909 13 4.107 4.765 5.009 5.892 7.042 8.634 9.926 11.129 12.340 13.636 15.119 16.985 19.812 22.362 23.142 24.736 25.472 27.688 32.535 34.528 14 4.660 5.368 5.629 6.571 7.790 9.467 10.821 12.078 13.339 14.685 16.222 18.151 21.064 23.685 24.485 26.119 26.873 29.141 34.091 36.123 15 5.229 5.985 6.262 7.261 8.547 10.307 11.721 13.030 14.339 15.733 17.322 19.311 22.307 24.996 25.816 27.488 28.259 30.578 35.628 37.697 16 5.812 6.614 6.908 7.962 9.312 11.152 12.624 13.983 15.338 16.780 18.418 20.465 23.542 26.296 27.136 28.845 29.633 32.000 37.146 39.252 17 6.408 7.255 7.564 8.672 10.085 12.002 13.531 14.937 16.338 17.824 19.511 21.615 24.769 27.587 28.445 30.191 30.995 33.409 38.648 40.790 18 7.015 7.906 8.231 9.390 10.865 12.857 14.440 15.893 17.338 18.868 20.601 22.760 25.989 28.869 29.745 31.526 32.346 34.805 40.136 42.312 19 7.633 8.567 8.907 10.117 11.651 13.716 15.352 16.850 18.338 19.910 21.689 23.900 27.204 30.144 31.037 32.852 33.687 36.191 41.610 43.820 20 8.260 9.237 9.591 10.851 12.443 14.578 16.266 17.809 19.337 20.951 22.775 25.038 28.412 31.410 32.321 34.170 35.020 37.566 43.072 45.315 21 8.897 9.915 10.283 11.591 13.240 15.445 17.182 18.768 20.337 21.991 23.858 26.171 29.615 32.671 33.597 35.479 36.343 38.932 44.522 46.797 22 9.542 10.600 10.982 12.338 14.041 16.314 18.101 19.729 21.337 23.031 24.939 27.301 30.813 33.924 34.867 36.781 37.659 40.289 45.962 48.268 23 10.196 11.293 11.689 13.091 14.848 17.187 19.021 20.690 22.337 24.069 26.018 28.429 32.007 35.172 36.131 38.076 38.968 41.638 47.391 49.728 24 10.856 11.992 12.401 13.848 15.659 18.062 19.943 21.652 23.337 25.106 27.096 29.553 33.196 36.415 37.389 39.364 40.270 42.980 48.812 51.179 25 11.524 12.697 13.120 14.611 16.473 18.940 20.867 22.616 24.337 26.143 28.172 30.675 34.382 37.652 38.642 40.646 41.566 44.314 50.223 52.620 26 12.198 13.409 13.844 15.379 17.292 19.820 21.792 23.579 25.336 27.179 29.246 31.795 35.563 38.885 39.889 41.923 42.856 45.642 51.627 54.052 27 12.879 14.125 14.573 16.151 18.114 20.703 22.719 24.544 26.336 28.214 30.319 32.912 36.741 40.113 41.132 43.195 44.140 46.963 53.023 55.476 28 13.565 14.847 15.308 16.928 18.939 21.588 23.647 25.509 27.336 29.249 31.391 34.027 37.916 41.337 42.370 44.461 45.419 48.278 54.411 56.892 29 14.256 15.574 16.047 17.708 19.768 22.475 24.577 26.475 28.336 30.283 32.461 35.139 39.087 42.557 43.604 45.722 46.693 49.588 55.792 58.301 30 14.953 16.306 16.791 18.493 20.599 23.364 25.508 27.442 29.336 31.316 33.530 36.250 40.256 43.773 44.834 46.979 47.962 50.892 57.167 59.703 35 18.509 20.027 20.569 22.465 24.797 27.836 30.178 32.282 34.336 36.475 38.859 41.778 46.059 49.802 50.928 53.203 54.244 57.342 63.955 66.619 40 22.164 23.838 24.433 26.509 29.051 32.345 34.872 37.134 39.335 41.622 44.165 47.269 51.805 55.758 56.946 59.342 60.436 63.691 70.618 73.402 45 25.901 27.720 28.366 30.612 33.350 36.884 39.585 41.995 44.335 46.761 49.452 52.729 57.505 61.656 62.901 65.410 66.555 69.957 77.179 80.077 50 29.707 31.664 32.357 34.764 37.689 41.449 44.313 46.864 49.335 51.892 54.723 58.164 63.167 67.505 68.804 71.420 72.613 76.154 83.657 86.661 Tabela 3: Quantis da Distribui¸c˜ao χ2. Graus de liberdade na margem esquerda da tabela e probabilidades p dadas no topo da tabela tal que p = P[χ2 ≥ χ2 t]. 3 Distribui¸c˜ao F de Snedecor a 10% (p=0.10) p=0,10 F Ft 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 18 20 30 40 60 120 2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 9.40 9.41 9.41 9.42 9.42 9.43 9.44 9.44 9.46 9.47 9.47 9.48 3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 5.23 5.22 5.22 5.21 5.20 5.20 5.20 5.19 5.18 5.17 5.16 5.15 5.14 4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92 3.91 3.90 3.89 3.88 3.87 3.86 3.85 3.84 3.82 3.80 3.79 3.78 5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 3.28 3.27 3.26 3.25 3.24 3.23 3.22 3.21 3.17 3.16 3.14 3.12 6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94 2.92 2.90 2.89 2.88 2.87 2.86 2.85 2.84 2.80 2.78 2.76 2.74 7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70 2.68 2.67 2.65 2.64 2.63 2.62 2.61 2.59 2.56 2.54 2.51 2.49 8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 2.52 2.50 2.49 2.48 2.46 2.45 2.44 2.42 2.38 2.36 2.34 2.32 9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 2.40 2.38 2.36 2.35 2.34 2.33 2.31 2.30 2.25 2.23 2.21 2.18 10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 2.30 2.28 2.27 2.26 2.24 2.23 2.22 2.20 2.16 2.13 2.11 2.08 11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 2.25 2.23 2.21 2.19 2.18 2.17 2.16 2.14 2.12 2.08 2.05 2.03 2.00 12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19 2.17 2.15 2.13 2.12 2.10 2.09 2.08 2.06 2.01 1.99 1.96 1.93 13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 2.14 2.12 2.10 2.08 2.07 2.05 2.04 2.02 2.01 1.96 1.93 1.90 1.88 14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 2.10 2.07 2.05 2.04 2.02 2.01 2.00 1.98 1.96 1.91 1.89 1.86 1.83 15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 2.06 2.04 2.02 2.00 1.99 1.97 1.96 1.94 1.92 1.87 1.85 1.82 1.79 16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03 2.01 1.99 1.97 1.95 1.94 1.93 1.91 1.89 1.84 1.81 1.78 1.75 17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 2.00 1.98 1.96 1.94 1.93 1.91 1.90 1.88 1.86 1.81 1.78 1.75 1.72 18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 1.98 1.95 1.93 1.92 1.90 1.89 1.87 1.85 1.84 1.78 1.75 1.72 1.69 19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98 1.96 1.93 1.91 1.89 1.88 1.86 1.85 1.83 1.81 1.76 1.73 1.70 1.67 20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94 1.91 1.89 1.87 1.86 1.84 1.83 1.81 1.79 1.74 1.71 1.68 1.64 21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95 1.92 1.90 1.87 1.86 1.84 1.83 1.81 1.79 1.78 1.72 1.69 1.66 1.62 22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93 1.90 1.88 1.86 1.84 1.83 1.81 1.80 1.78 1.76 1.70 1.67 1.64 1.60 23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92 1.89 1.87 1.84 1.83 1.81 1.80 1.78 1.76 1.74 1.69 1.66 1.62 1.59 24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91 1.88 1.85 1.83 1.81 1.80 1.78 1.77 1.75 1.73 1.67 1.64 1.61 1.57 25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 1.87 1.84 1.82 1.80 1.79 1.77 1.76 1.74 1.72 1.66 1.63 1.59 1.56 26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88 1.86 1.83 1.81 1.79 1.77 1.76 1.75 1.72 1.71 1.65 1.61 1.58 1.54 27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87 1.85 1.82 1.80 1.78 1.76 1.75 1.74 1.71 1.70 1.64 1.60 1.57 1.53 28 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.74 1.73 1.70 1.69 1.63 1.59 1.56 1.52 29 2.89 2.50 2.28 2.15 2.06 1.99 1.93 1.89 1.86 1.83 1.80 1.78 1.76 1.75 1.73 1.72 1.69 1.68 1.62 1.58 1.55 1.51 30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 1.82 1.79 1.77 1.75 1.74 1.72 1.71 1.69 1.67 1.61 1.57 1.54 1.50 40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 1.76 1.74 1.71 1.70 1.68 1.66 1.65 1.62 1.61 1.54 1.51 1.47 1.42 60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 1.71 1.68 1.66 1.64 1.62 1.60 1.59 1.56 1.54 1.48 1.44 1.40 1.35 120 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68 1.65 1.63 1.60 1.58 1.56 1.55 1.53 1.50 1.48 1.41 1.37 1.32 1.26 Tabela 4: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 10. Graus de liberdade do numerador no topo e do denominador na margem esquerda. 4 Distribui¸c˜ao F de Snedecor a 5% (p=0.05) p=0,05 F Ft 1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 30 40 60 120 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.42 19.43 19.43 19.44 19.45 19.46 19.47 19.48 19.49 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.71 8.70 8.69 8.67 8.66 8.62 8.59 8.57 8.55 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.87 5.86 5.84 5.82 5.80 5.75 5.72 5.69 5.66 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.64 4.62 4.60 4.58 4.56 4.50 4.46 4.43 4.40 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.96 3.94 3.92 3.90 3.87 3.81 3.77 3.74 3.70 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.53 3.51 3.49 3.47 3.44 3.38 3.34 3.30 3.27 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.24 3.22 3.20 3.17 3.15 3.08 3.04 3.01 2.97 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.03 3.01 2.99 2.96 2.94 2.86 2.83 2.79 2.75 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.86 2.85 2.83 2.80 2.77 2.70 2.66 2.62 2.58 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.74 2.72 2.70 2.67 2.65 2.57 2.53 2.49 2.45 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 2.64 2.62 2.60 2.57 2.54 2.47 2.43 2.38 2.34 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60 2.55 2.53 2.51 2.48 2.46 2.38 2.34 2.30 2.25 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.48 2.46 2.44 2.41 2.39 2.31 2.27 2.22 2.18 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.42 2.40 2.38 2.35 2.33 2.25 2.20 2.16 2.11 16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.37 2.35 2.33 2.30 2.28 2.19 2.15 2.11 2.06 17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 2.33 2.31 2.29 2.26 2.23 2.15 2.10 2.06 2.01 18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.29 2.27 2.25 2.22 2.19 2.11 2.06 2.02 1.97 19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.26 2.23 2.21 2.18 2.16 2.07 2.03 1.98 1.93 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.22 2.20 2.18 2.15 2.12 2.04 1.99 1.95 1.90 21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.20 2.18 2.16 2.12 2.10 2.01 1.96 1.92 1.87 22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.17 2.15 2.13 2.10 2.07 1.98 1.94 1.89 1.84 23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.15 2.13 2.11 2.08 2.05 1.96 1.91 1.86 1.81 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.13 2.11 2.09 2.05 2.03 1.94 1.89 1.84 1.79 25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.11 2.09 2.07 2.04 2.01 1.92 1.87 1.82 1.77 26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.09 2.07 2.05 2.02 1.99 1.90 1.85 1.80 1.75 27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.08 2.06 2.04 2.00 1.97 1.88 1.84 1.79 1.73 28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.06 2.04 2.02 1.99 1.96 1.87 1.82 1.77 1.71 29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.05 2.03 2.01 1.97 1.94 1.85 1.81 1.75 1.70 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 2.04 2.01 1.99 1.96 1.93 1.84 1.79 1.74 1.68 40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.95 1.92 1.90 1.87 1.84 1.74 1.69 1.64 1.58 60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 1.86 1.84 1.82 1.78 1.75 1.65 1.59 1.53 1.47 120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.83 1.78 1.75 1.73 1.69 1.66 1.55 1.50 1.43 1.35 Tabela 5: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 05. Graus de liberdade do numerador dado no topo e do denominador na margem esquerda. 5 Distribui¸c˜ao F de Snedecor a 2,5% (p=0.025) p=0,025 F Ft 1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 30 40 60 120 2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.41 39.43 39.43 39.44 39.44 39.45 39.46 39.47 39.48 39.49 3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.34 14.28 14.25 14.23 14.20 14.17 14.08 14.04 13.99 13.95 4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.75 8.68 8.66 8.63 8.59 8.56 8.46 8.41 8.36 8.31 5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.52 6.46 6.43 6.40 6.36 6.33 6.23 6.18 6.12 6.07 6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.37 5.30 5.27 5.24 5.20 5.17 5.07 5.01 4.96 4.90 7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.67 4.60 4.57 4.54 4.50 4.47 4.36 4.31 4.25 4.20 8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.20 4.13 4.10 4.08 4.03 4.00 3.89 3.84 3.78 3.73 9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.87 3.80 3.77 3.74 3.70 3.67 3.56 3.51 3.45 3.39 10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.62 3.55 3.52 3.50 3.45 3.42 3.31 3.26 3.20 3.14 11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.43 3.36 3.33 3.30 3.26 3.23 3.12 3.06 3.00 2.94 12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.28 3.21 3.18 3.15 3.11 3.07 2.96 2.91 2.85 2.79 13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.15 3.08 3.05 3.03 2.98 2.95 2.84 2.78 2.72 2.66 14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.05 2.98 2.95 2.92 2.88 2.84 2.73 2.67 2.61 2.55 15 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 2.96 2.89 2.86 2.84 2.79 2.76 2.64 2.59 2.52 2.46 16 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.89 2.82 2.79 2.76 2.72 2.68 2.57 2.51 2.45 2.38 17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.82 2.75 2.72 2.70 2.65 2.62 2.50 2.44 2.38 2.32 18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.77 2.70 2.67 2.64 2.60 2.56 2.44 2.38 2.32 2.26 19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.72 2.65 2.62 2.59 2.55 2.51 2.39 2.33 2.27 2.20 20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.68 2.60 2.57 2.55 2.50 2.46 2.35 2.29 2.22 2.16 21 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80 2.73 2.64 2.56 2.53 2.51 2.46 2.42 2.31 2.25 2.18 2.11 22 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70 2.60 2.53 2.50 2.47 2.43 2.39 2.27 2.21 2.14 2.08 23 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81 2.73 2.67 2.57 2.50 2.47 2.44 2.39 2.36 2.24 2.18 2.11 2.04 24 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64 2.54 2.47 2.44 2.41 2.36 2.33 2.21 2.15 2.08 2.01 25 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 2.51 2.44 2.41 2.38 2.34 2.30 2.18 2.12 2.05 1.98 26 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59 2.49 2.42 2.39 2.36 2.31 2.28 2.16 2.09 2.03 1.95 27 5.63 4.24 3.65 3.31 3.08 2.92 2.80 2.71 2.63 2.57 2.47 2.39 2.36 2.34 2.29 2.25 2.13 2.07 2.00 1.93 28 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55 2.45 2.37 2.34 2.32 2.27 2.23 2.11 2.05 1.98 1.91 29 5.59 4.20 3.61 3.27 3.04 2.88 2.76 2.67 2.59 2.53 2.43 2.36 2.32 2.30 2.25 2.21 2.09 2.03 1.96 1.89 30 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.41 2.34 2.31 2.28 2.23 2.20 2.07 2.01 1.94 1.87 40 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.29 2.21 2.18 2.15 2.11 2.07 1.94 1.88 1.80 1.72 60 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 2.17 2.09 2.06 2.03 1.98 1.94 1.82 1.74 1.67 1.58 120 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16 2.05 1.98 1.94 1.92 1.87 1.82 1.69 1.61 1.53 1.43 Tabela 6: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 025. Graus de liberdade do numerador dado no topo e do denominador na margem esquerda. 6 Distribui¸c˜ao F de Snedecor a 1% (p=0.01) p=0,01 F Ft 1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 30 40 60 120 2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.42 99.43 99.43 99.44 99.44 99.45 99.47 99.47 99.48 99.49 3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.05 26.92 26.87 26.83 26.75 26.69 26.50 26.41 26.32 26.22 4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.37 14.25 14.20 14.15 14.08 14.02 13.84 13.75 13.65 13.56 5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.89 9.77 9.72 9.68 9.61 9.55 9.38 9.29 9.20 9.11 6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.60 7.56 7.52 7.45 7.40 7.23 7.14 7.06 6.97 7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.36 6.31 6.28 6.21 6.16 5.99 5.91 5.82 5.74 8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.56 5.52 5.48 5.41 5.36 5.20 5.12 5.03 4.95 9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 5.01 4.96 4.92 4.86 4.81 4.65 4.57 4.48 4.40 10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.60 4.56 4.52 4.46 4.41 4.25 4.17 4.08 4.00 11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.29 4.25 4.21 4.15 4.10 3.94 3.86 3.78 3.69 12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.05 4.01 3.97 3.91 3.86 3.70 3.62 3.54 3.45 13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.86 3.82 3.78 3.72 3.66 3.51 3.43 3.34 3.25 14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.80 3.70 3.66 3.62 3.56 3.51 3.35 3.27 3.18 3.09 15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 3.56 3.52 3.49 3.42 3.37 3.21 3.13 3.05 2.96 16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 3.45 3.41 3.37 3.31 3.26 3.10 3.02 2.93 2.84 17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 3.35 3.31 3.27 3.21 3.16 3.00 2.92 2.83 2.75 18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.27 3.23 3.19 3.13 3.08 2.92 2.84 2.75 2.66 19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 3.19 3.15 3.12 3.05 3.00 2.84 2.76 2.67 2.58 20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.13 3.09 3.05 2.99 2.94 2.78 2.69 2.61 2.52 21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.17 3.07 3.03 2.99 2.93 2.88 2.72 2.64 2.55 2.46 22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 3.02 2.98 2.94 2.88 2.83 2.67 2.58 2.50 2.40 23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.07 2.97 2.93 2.89 2.83 2.78 2.62 2.54 2.45 2.35 24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.93 2.89 2.85 2.79 2.74 2.58 2.49 2.40 2.31 25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.89 2.85 2.81 2.75 2.70 2.54 2.45 2.36 2.27 26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.86 2.81 2.78 2.72 2.66 2.50 2.42 2.33 2.23 27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.93 2.82 2.78 2.75 2.68 2.63 2.47 2.38 2.29 2.20 28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 2.79 2.75 2.72 2.65 2.60 2.44 2.35 2.26 2.17 29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.77 2.73 2.69 2.63 2.57 2.41 2.33 2.23 2.14 30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.74 2.70 2.66 2.60 2.55 2.39 2.30 2.21 2.11 40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.56 2.52 2.48 2.42 2.37 2.20 2.11 2.02 1.92 60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.39 2.35 2.31 2.25 2.20 2.03 1.94 1.84 1.73 120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.23 2.19 2.15 2.09 2.03 1.86 1.76 1.66 1.53 Tabela 7: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 01. Graus de liberdade do numerador dado no topo e do denominador na margem esquerda. 7 Distribui¸c˜ao F de Snedecor a 0,5% (p=0.005) p=0,005 F Ft 1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 30 40 60 120 2 198.50 199.00 199.17 199.25 199.30 199.33 199.36 199.37 199.39 199.40 199.42 199.43 199.43 199.44 199.44 199.45 199.47 199.47 199.48 199.49 3 55.55 49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88 43.69 43.39 43.17 43.08 43.01 42.88 42.78 42.47 42.31 42.15 41.99 4 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14 20.97 20.70 20.51 20.44 20.37 20.26 20.17 19.89 19.75 19.61 19.47 5 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62 13.38 13.21 13.15 13.09 12.98 12.90 12.66 12.53 12.40 12.27 6 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25 10.03 9.88 9.81 9.76 9.66 9.59 9.36 9.24 9.12 9.00 7 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38 8.18 8.03 7.97 7.91 7.83 7.75 7.53 7.42 7.31 7.19 8 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21 7.01 6.87 6.81 6.76 6.68 6.61 6.40 6.29 6.18 6.06 9 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42 6.23 6.09 6.03 5.98 5.90 5.83 5.62 5.52 5.41 5.30 10 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85 5.66 5.53 5.47 5.42 5.34 5.27 5.07 4.97 4.86 4.75 11 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42 5.24 5.10 5.05 5.00 4.92 4.86 4.65 4.55 4.45 4.34 12 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09 4.91 4.77 4.72 4.67 4.59 4.53 4.33 4.23 4.12 4.01 13 11.37 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.82 4.64 4.51 4.46 4.41 4.33 4.27 4.07 3.97 3.87 3.76 14 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60 4.43 4.30 4.25 4.20 4.12 4.06 3.86 3.76 3.66 3.55 15 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42 4.25 4.12 4.07 4.02 3.95 3.88 3.69 3.58 3.48 3.37 16 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.27 4.10 3.97 3.92 3.87 3.80 3.73 3.54 3.44 3.33 3.22 17 10.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.14 3.97 3.84 3.79 3.75 3.67 3.61 3.41 3.31 3.21 3.10 18 10.22 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.03 3.86 3.73 3.68 3.64 3.56 3.50 3.30 3.20 3.10 2.99 19 10.07 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.93 3.76 3.64 3.59 3.54 3.46 3.40 3.21 3.11 3.00 2.89 20 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85 3.68 3.55 3.50 3.46 3.38 3.32 3.12 3.02 2.92 2.81 21 9.83 6.89 5.73 5.09 4.68 4.39 4.18 4.01 3.88 3.77 3.60 3.48 3.43 3.38 3.31 3.24 3.05 2.95 2.84 2.73 22 9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.70 3.54 3.41 3.36 3.31 3.24 3.18 2.98 2.88 2.77 2.66 23 9.63 6.73 5.58 4.95 4.54 4.26 4.05 3.88 3.75 3.64 3.47 3.35 3.30 3.25 3.18 3.12 2.92 2.82 2.71 2.60 24 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59 3.42 3.30 3.25 3.20 3.12 3.06 2.87 2.77 2.66 2.55 25 9.48 6.60 5.46 4.84 4.43 4.15 3.94 3.78 3.64 3.54 3.37 3.25 3.20 3.15 3.08 3.01 2.82 2.72 2.61 2.50 26 9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.49 3.33 3.20 3.15 3.11 3.03 2.97 2.77 2.67 2.56 2.45 27 9.34 6.49 5.36 4.74 4.34 4.06 3.85 3.69 3.56 3.45 3.28 3.16 3.11 3.07 2.99 2.93 2.73 2.63 2.52 2.41 28 9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.41 3.25 3.12 3.07 3.03 2.95 2.89 2.69 2.59 2.48 2.37 29 9.23 6.40 5.28 4.66 4.26 3.98 3.77 3.61 3.48 3.38 3.21 3.09 3.04 2.99 2.92 2.86 2.66 2.56 2.45 2.33 30 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34 3.18 3.06 3.01 2.96 2.89 2.82 2.63 2.52 2.42 2.30 40 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12 2.95 2.83 2.78 2.74 2.66 2.60 2.40 2.30 2.18 2.06 60 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90 2.74 2.62 2.57 2.53 2.45 2.39 2.19 2.08 1.96 1.83 120 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71 2.54 2.42 2.37 2.33 2.25 2.19 1.98 1.87 1.75 1.61 Tabela 8: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 005. Graus de liberdade do numerador dado no topo e do denominador na margem esquerda. 8 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Análise bidimensional Frequentemente, estamos interessados em analisar o comportamento conjunto de duas ou mais variá- veis aleatórias. Quando consideramos duas variáveis aleatórias, podemos ter três situações: • as duas variáveis são qualitativas; • as duas variáveis são quantitativas; • uma variável é qualitativa e outra é quantitativa. As técnicas de análise de dados nas três situações são diferentes. Quando as duas variáveis são qua- litativas, os dados são resumidos em tabelas de dupla entrada onde aparecerão as frequências absolutas ou contagem de indivíduos que pertencem simultaneamente as categorias de uma e outra variável. Variáveis Qualitativas Exemplo: Suponha que queremos analisar o comportamento conjunto das variáveis sexo do aluno (X) e curso escolhido (Y ). A distribuição de frequências é representada por uma tabela de dupla entrada: Y|X Masculino Feminino Total Economia 85 35 120 Administração 55 25 80 Total 140 60 200 Além das frequências absolutas, podemos construir tabelas com as frequências relativas. Existem três possibilidades de expressarmos a proporção: (a) em relação ao total geral; (b) em relação ao total de cada linha; (c) em relação ao total de cada coluna. De acordo com o objetivo do problema em estudo, uma delas será mais conveniente. A comparação entre duas variáveis pode ser visualizada através de um gráfico de barras com a frequên- cia por sexo, dividindo de acordo com o curso. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 1 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Associação entre variáveis qualitativas De forma prática, podemos entender a existência de associação entre duas variáveis como a mudança de comportamento de uma variável na presença ou não de informação sobre a segunda variável. Um dos principais objetivos de se construir uma distribuição conjunta de duas variáveis qualitativas é descrever a associação entre elas, isto é, queremos conhecer o grau de dependência entre elas, de modo que possamos prever melhor o resultado de uma delas quando conhecermos a realização da outra. Exemplos: (a) Se quisermos estimar qual a renda de uma família de São Paulo, a informação adicional sobre a classe social a que ela pertence nos permite estimar com maior precisão essa renda, pois sabemos que existe uma dependência entre as duas variáveis: renda familiar e classe social. (b) Suponha que queremos adivinhar o sexo da pessoa sorteada aleatoriamente em São Paulo. Como a proporção de cada sexo é muito próxima, o resultados poderia ser qualquer um dos sexos. Agora, se dissessemos que a pessoa sorteada trabalha na indústria siderúrgica, então nossa resposta mais provável seria que a pessoa sorteada é do sexo masculino. Ou seja, há um grau de dependência grande entre as variáveis sexo e ramo de atividade. Voltando ao exemplo anterior, queremos verificar se existe ou não associação entre o sexo e a carreira escolhida por 200 alunos de Economia e Administração. Y|X Masculino Feminino Total Economia 85 35 120 Administração 55 25 80 Total 140 60 200 Por causa da diferença entre os totais marginais, é difícil tirar alguma conclusão. Por isso, devemos construir proporções segundo as linhas ou as colunas para podermos fazer comparações. Y|X Masculino Feminino Total Economia 85 (61%) 35 (58%) 120 (60%) Administração 55 (39%) 25 (42%) 80 (40%) Total 140 (100%) 60 (100%) 200 (100%) A partir da tabela acima, podemos observar que, independente do sexo, 60% das pessoas preferem Economia e 40% preferem Administração. Não havendo dependência entre as variáveis, esperaríamos es- sas mesmas proporções para cada sexo. Observando a tabela, vemos que a proporção do sexo masculino (61% e 39%) e do sexo feminino (58% e 42%) são próximas das marginais (60% e 40%). Esses resultados parecem indicar não haver dependência entre as duas variáveis, para o conjunto de alunos considerados. Então, nesse caso, as variáveis Sexo e Escolha do curso parecem ser não-associadas. Considere agora que queremos verificar se existe ou não associação entre o sexo e a carreira escolhida por 200 alunos de Física e Ciências Sociais. Y|X Masculino Feminino Total Física 100 (71%) 20 (33%) 120 (60%) Ciências Sociais 40 (29%) 40 (67%) 80 (40%) Total 140 (100%) 60 (100%) 200 (100%) Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 2 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Comparando a distribuição das proporções pelos cursos, independente do sexo, com as distribuições diferenciadas por sexo, observamos uma disparidade bem acentuada nas proporções. Parece haver maior concentração de homens no curso de Física e de mulheres no curso de Ciências Sociais. Portanto, nesse caso, as variáveis sexo e curso escolhido parecem ser associadas. Teste Qui-Quadrado A seguir, vamos estudar o Teste χ2 de Pearson, que é o teste utilizado para verificar se há associação entre duas variáveis aleatórias qualitativas. Considere o seguinte exemplo: Queremos verificar se a criação de determinado tipo de cooperativa está associada com algum fator regional. Tipo de Cooperativa Estado Consumidor Produtor Escola Outras Total São Paulo 214 (33%) 237 (37%) 78 (12%) 119 (18%) 648 (100%) Paraná 51 (17%) 102 (34%) 126 (42%) 22 (7%) 301 (100%) Rio Grande do Sul 111 (18%) 304 (51%) 139 (23%) 48 (8%) 602 (100%) Total 376 (24%) 643 (42%) 343 (22%) 189 (12%) 1551 (100%) A análise da tabela mostra a existência de certa dependência entre as variáveis. Caso não houvesse associação, esperaríamos que em cada estado tivessemos 24% de cooperativa de consumidores, 42% de cooperativa de produtores, 22% de escolas e 12% de outros tipos. Então, por exemplo, o número espe- rado de cooperativas de consumidores no estado de São Paulo seria 648 × 0, 24 = 156 e no Paraná seria 301 × 0, 24 = 72. A Tabela a seguir apresenta os valores esperados assumindo independência entre as duas variáveis. Tipo de Cooperativa Estado Consumidor Produtor Escola Outras Total São Paulo 156 (24%) 272 (42%) 142 (22%) 78 (12%) 648 (100%) Paraná 72 (24%) 127 (42%) 66 (22%) 36 (12%) 301 (100%) Rio Grande do Sul 144 (24%) 254 (42%) 132 (22%) 72 (12%) 602 (100%) Total 376 (24%) 643 (42%) 343 (22%) 189 (12%) 1551 (100%) A diferença entre os valores observados e os valores esperados são dados por: Tipo de Cooperativa Estado Consumidor Produtor Escola Outras São Paulo 58 -35 -64 41 Paraná -21 -25 60 -14 Rio Grande do Sul -33 50 7 -24 Note que: (a) A soma total dos resíduos é nula. (b) A casela Escola-São Paulo é a que apresenta maior desvio da suposição de não associação (-64). Nessa casela esperávamos 142 casos; a casela Escola-Paraná também tem um alto desvio (60), mas o valor esperado é bem menor (66). Assim, devemos considerar os desvios-relativos. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 3 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Levando em conta (a) e (b), podemos construir, para cada casela, a medida \(\frac{(O_i – e_i)^2}{e_i}\) (1) onde \(O_i\) é o valor observado e \(e_i\) é o valor esperado. Uma medida do afastamento global pode ser dada pela soma de todas as medidas (1). Essa medida é denominada \(\chi^2\) de Pearson. Calculando (1) para cada casela do exemplo, encontramos: Tipo de Cooperativa Estado Consumidor Produtor Escola Outras São Paulo 21,56 4,50 28,84 21,55 Paraná 6,12 4,92 54,54 5,44 Rio Grande do Sul 7,56 9,84 0,37 8,00 Teríamos então \(Q_{obs}^2 = 21,56 + 6,12 + · · · + 54,44 + 8,00 = 173,24\) Um valor grande de \(Q_{obs}^2\) indica associação entre variáveis, o que parece ser o caso. Afim de rejeitar e/ou não rejeitar a Hipótese nula, devemos compará-la com a Distribuição Qui-Quadrado com \((s − 1)(r − 1)\) graus de liberdade. Neste caso, \(\chi_{\alpha,(s−1)(r−1)}^2 = \chi_{5%;6}^2 = 12,592.\) Como \(Q_{obs}^2 > \chi^2,\) podemos concluir que há associação entre as variáveis. Se \(Q_{obs}^2 < \chi^2,\) concluímos que não há associação entre as variáveis. Fórmula Geral X\|Y B_1 B_2 ⋯ B_j ⋯ B_s Total A_1 n_11 n_12 ⋯ n_1j ⋯ n_1s n_1• A_2 n_21 n_22 ⋯ n_2j ⋯ n_2s n_2• ⋮ ⋮ A_i n_i1 n_i2 ⋯ n_ij ⋯ n_is n_i• ⋮ ⋮ A_r n_r1 n_r2 ⋯ n_rj ⋯ n_rs n_r• Total n_•1 n_•2 ⋯ n_•j ⋯ n_•s n_•• Suponha que temos duas variáveis qualitativas \(X\ e\ Y\), classificadas em \(r\) categorias \(A_1,\ ⋯ ,\ A_r,\) para \(X\) e categorias \(B_1,⋯,B_s,\para Y\). Na tabela, temos: \(n_{ij}:\) número de elementos pertencentes à i-ésima categoria de \(X\) e j-ésima categoria de \(Y.\) \(n_{i•} = \sum_{j=1}^{s} n_{ij}:\) número de elementos da i-ésima categoria de \(X.\) \(n_{•j} = \sum_{i=1}^{r} n_{ij}:\) número de elementos da j-ésima categoria de \(Y.\) \(n_{••} = \sum_{i=1}^{r}\sum_{j=1}^{s} n_{ij}:\) número total de elementos. Área 1 USP – Lorena Recepção Rua/habita – Lorena, Km 7,45 – Caixa Postal 116 Área II Pólo Urbo-Industrial A16 – Caixa Postal 16 CEP 12603-710 Lorena – SP Fax (12) 3159 – 3086 Tel. (Direto) (12) 3159-5194/3153-3209 www.eel.usp.br 4 / 8 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Sob a hipótese de que as variáveis X e Y não sejam associadas, temos que \(n_{ij}^* = \frac{n_{i.}n_{.j}}{n} \quad i = 1, \ldots , r \quad e \quad j = 1, \ldots , s. \) ou, equivalentemente, \(f_{ij} = f_{i.}f_{.j}, \quad i = 1, \ldots , r \quad e \quad j = 1, \ldots , s. \) Denotando por \(n_{ij}^*\) os valores esperados e \(n_{ij}\) os valores observados, temos que a estatística observada é dada por: \(Q_{obs}^2 = \sum_{{i=1}}^{r}\sum_{{j=1}}^{s}\frac {(n_{ij}−n_{ij}^*)^2}{n_{ij}^*}\) ou, em termos de frequências relativas, \(Q_{obs}^2 = \sum_{{i=1}}^{r}\sum_{{j=1}}^{s}\frac{(f_{ij}−f_{ij}^*)^2}{f_{ij}^*}\) Temos que, sob \(H_0, \ Q_{obs}^2\) tem distribuição assintótica Qui-Quadrado com \((s−1)(r−1)\) graus de liberdade. Pela estatística \(\chi ^2\) podemos entender qual a região crítica do teste de independência. Quando não ocorre independência, é natural que as frequências observadas \(n_{ij}\) sejam substancialmente diferentes das frequências esperadas \(n_{ij}^*\.\) Então devemos rejeitar a hipótese \(H_0\) de independência quando a estatística \(Q_{obs}^2\) é maior que um ponto crítico \(\chi_{(s−1)(r−1)}^2\.\) Tipos de Teste Qui-Quadrado • Testes de Aderência • Testes de Independência • Testes de Homogeneidade 1. Testes de Aderência Objetivo: Testar se um conjunto de dados observados se adequa a um modelo probabilístico. Exemplo 01: Queremos verificar se o número de acidentes em uma estrada muda conforme o dia da semana. O número de acidentes de uma determinada semana foram: Dia da semana Número de acidentes 2ª 20 3ª 10 4ª 10 5ª 15 6ª 30 Sábado 20 Domingo 35 Total 140 Área 1 USP – Lorena Recepção Rua/habita – Lorena, Km 7,45 – Caixa Postal 116 Área II Pólo Urbo-Industrial A16 – Caixa Postal 16 CEP 12603-710 Lorena – SP Fax (12) 3159 – 3086 Tel. (Direto) (12) 3159-5194/3153-3209 www.eel.usp.br 5 / 8 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Hipóteses a serem testadas: H0: o número de acidentes não muda conforme o dia da semana. H1: pelo menos um dos dias tem número de acidentes diferente dos demais. Se pi representa a probabilidade de ocorrência de acidentes no i dia da semana, H0 : pi = 1 7, para todo i = 1, · · · , 7. H1 : pi ̸= 1 7, para pelo menos um valor de i. Cálculos serão feitos em sala de aula. 2. Testes de Independência Objetivo: Verificar se existe independência entre duas variáveis medidas nas mesmas unidades expe- rimentais. Exemplo 02: Deseja-se verificar se existe dependência entre a renda e o número de filhos em famílias de uma cidade; 250 famílias escolhidas ao acaso forneceram a tabela a seguir: Número de filhos Renda(R$) 0 1 2 +2 Total Menos de 2.000 15 27 50 43 135 2.000 a 5.000 25 30 12 8 75 5.000 ou mais 8 13 9 10 40 Total 48 70 71 61 250 Hipóteses a serem testadas: H0: O número de filhos e a renda são independentes. H1: Existe dependência entre o número de filhos e a renda. Cálculos serão feitos em sala de aula. Exercício 03: 1237 indivíduos foram classificados segundo a pressão sanguínea (mmHg) e o nível de colesterol (mg/100 cm3). Pressão Arterial Colesterol < 127 127-166 > 166 Total < 200 117 168 22 307 200-260 204 418 63 685 > 260 67 145 33 245 Total 388 731 118 1.237 Verifique se existe independência entre essas variáveis. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 6 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo 3. Teste de Homogeneidade Objetivo: Verificar se uma variável aleatória se comporta de modo similar, ou homogêneo, em várias subpopulações. Exemplo 04: A reação ao tratamento por quimioterapia está sendo estudada em quatro grupos de pacientes com câncer. Deseja-se investigar se todos os tipos reagem da mesma maneira. Uma amostra de pacientes de cada grupo foi escolhida ao acaso e classificou-se a reação em 3 categorias: Câncer Reação Pouca Média Alta Total Tipo I 51 33 16 100 Tipo II 58 29 13 100 Tipo III 48 42 30 120 Tipo IV 26 38 16 80 Total 183 142 75 400 Hipóteses a serem testadas: \(H_0:\) O comportamento da variável é homogêneo nas subpopulações. \(H_1:\) O comportamento da variável não é homogêneo nas subpopulações. Cálculos serão feitos em sala de aula. Importante: Apesar da realização do teste ser semelhante a do Teste de Independência, uma distinção importante se refere à forma como as amostras são coletadas. No teste de homogeneidade, fixamos o tamanho da amostra em cada uma das subpopulações e selecionamos uma amostra dentro de cada uma. Medidas de associação entre variáveis qualitativas. A existência de dependência / associação entre duas variáveis qualitativas é verificada pelo Teste \(\chi ^2\) de Pearson. Já a quantificação do grau de associação entre duas variáveis é feita pelos coeficientes de associação. Essas medidas descrevem, por meio de um único número, a associação (ou dependência) entre duas variáveis. Coeficientes de associação Coeficiente de Contingência (proposto por Pearson): \(C = \sqrt{\frac{Q_{obs}^2}{Q_{obs}^2 + n}}\) Área 1 USP – Lorena Recepção Rua/habita – Lorena, Km 7,45 – Caixa Postal 116 Área II Pólo Urbo-Industrial A16 – Caixa Postal 16 CEP 12603-710 Lorena – SP Fax (12) 3159 – 3086 Tel. (Direto) (12) 3159-5194/3153-3209 www.eel.usp.br 7 / 8 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Porém, o coeficiente acima não varia entre 0 e 1. O valor máximo de C depende de r e s. Para evitar esse inconveniente, costuma-se definir um outro coeficiente, dado por: Coeficiente de Tschuprov: √ Q²obs/n T = ----------------------------- (r - 1)(s - 1) Esse coeficiente terá valor 0 no caso de independência e atinge o valor máximo 1, no caso de dependência completa, mas apenas se r = s. No exemplo de cooperativa versus fator regional, temos C=0,32 e T=0,11. Área I Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12602-970 – Lorena – SP Fax (12) 3159-3133 Tel. (PABX) (12) 3159-5131/3153-3209 USP – Lorena www.eel.usp.br 8 / 8 Área II Polo Urbo-Industrial Ale 6 – Caixa Postal 116 CEP 12602-970 – Lorena – SP Fax (12) 3153-3066 Tel. (PABX) (12) 3185 5900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Conceitos Sensibilidade e Especificidade Resultado do Resultado Real Modelo / Teste Positivo Negativo Total A + B Positivo A B Total Positivo C + D Negativo C D Total Negativo A + C B + D A + B + C + D Total Verdadeiro Total Verdadeiro Total Geral Positivo Negativo As colunas indicam a condição dos indivíduos ou elementos avaliados (real positivo ou real negativo) e as linhas indicam o resultado do modelo ou teste (positivo ou negativo). A célula A contém os verdadeiros-positivos: indivíduos da classe de resultado real “positivo” e com resultado do teste positivo. Já a célula D contém os verdadeiros-negativos: indivíduos da classe de re- sultado real “negativo” e com resultado do teste negativo. Um bom teste tem valores mínimos nas células B e C. A célula B corresponde a indivíduos com resul- tado real negativo mas que o modelo ou teste indicou positivo e denotaremos como falsos-positivos. A célula C corresponde aos falsos-negativos, pacientes com resultado real positivo mas que o modelo ou teste indicou que são negativos. A seguir, serão apresentados alguns conceitos: Sensibilidade: probabilidade de um teste ser Positivo entre aqueles com resultado real positivo, ou seja, Sensibilidade = A (A + C) × 100%. Especificidade: probabilidade de um teste ser Negativo entre aqueles com resultado real negativo, ou seja, Especificidade = D (D + B) × 100%. Prevalência: proporção de indivíduos positivos (resultado real) na população total avaliada, ou seja, Prevalência = (A + C) (A + B + C + D) × 100%. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 1 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo As medidas de associação baseadas em razões, como a razão de chances, fornecem dados sobre a força de associação entre o fator em estudo e o desfecho. Desfecho é o nome usado para designar o evento de interesse em uma pesquisa. O desfecho pode ser o surgimento de uma doença, de um determinado sintoma, o óbito ou outro evento qualquer que acon- tece no processo de saúde-doença. Já o Fator de Risco é a denominação usada em Epidemiologia para designar uma variável que se supõe possa estar associada ao desfecho. Muitas vezes, os indivíduos que apresentam o suposto fator de risco são ditos expostos. Pergunta: toda uma população é exposta a um agente químico. Ao final de um determinado período de tempo esta população apresenta incidência alta de câncer. Podemos dizer que o câncer está associado com à exposição ao agente químico? Não, sem antes responder qual seria a incidência de câncer nesta mesma população caso ela não tivesse sido submetida ao agente químico. Razão de chances A razão de chances estima a magnitude da associação entre a exposição ao fator de risco e o desfecho. Exposição Doentes Não Doentes a doença (Casos) (Controles) Total A + B Expostos A B Total Expostos C + D Não Expostos C D Total Não Expostos A + C B + D A + B + C + D Total Doentes Total Não Doentes Total Geral A chance de doença no grupo exposto é dada por Chance DE = A A + B B A + B = A B A chance de doença no grupo não-exposto é dada por Chance DNE = C C + D D C + D = C D Então a razão de chances (OR) de doença em relação à exposição será OR = Chance DE Chance DNE = A/B C/D = AD BC Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 2 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Regressão Logística Simples Quando se trata de uma grandeza medida em “situações” dicotômicas, como por exemplo “sucesso ou fracasso”, “sim ou não”, “verdadeiro ou falso”, conclui-se que a variável resposta não é mais quantitativa (como as mostradas até este ponto), tratando-se então de uma resposta qualitativa. Tal situação requer um modelo diferente de trabalho, e esta é a utilização do modelo de regressão logística. O modelo de regressão logística é baseado num modelo como o definido na equação: yi = β0 + β1xi + ϵi com i = 1, 2, ..., n, no qual a resposta yi tenha os valores 1 ou 0. Considera-se assim a variável resposta como uma variável aleatória de Bernoulli. Como cada uma das duas possibilidades de resposta possui uma probabilidade particular de acontecer, pode-se construir a seguinte tabela com a distribuição de probabilidades: Tabela 1: Distribuição das probabilidades yi Probabilidade 1 P(yi = 1) = pi 0 P(yi = 0) = 1 − pi Uma vez que o valor esperado do erro é considerado nulo, ou seja, E(ϵi)=0, e damos a cada pos- sibilidade de resposta um peso referente à sua probabilidade, o valor esperado da variável resposta yi é: E(yi) = 1 × pi + 0 × (1 − pi) = pi o que resulta na seguinte relação: E(yi) = β0 + β1xi = pi Desse modo, o que esta função traz como resposta é a probabilidade de que a variável resposta yi seja 1. Há alguns problemas relevantes com este modelo de regressão proposto. Os erros do modelo não são distribuídos normalmente (como tem sido considerado com relação aos outros modelos até este momento). Isso ocorre pois, como só existem duas possibilidades de resposta, os erros também só poderão ter dois valores: ϵi = 1 − (β0 + β1xi) ; yi = 1 ϵi = −(β0 + β1xi) ; yi = 0 Seguindo um princípio semelhante, a variância dos erros não é constante, e sim uma função da média do valor esperado, como mostrado a seguir: σ2 yi = E[yi − E(yi)]2 = (1 − pi)2pi + (0 − pi)2(1 − pi) = pi(1 − pi) que pode ser reescrito como σ2 yi = E(yi)[1 − E(yi)] Por último, existe uma restrição para os valores da função resposta, dado por: 0 ≤ E(yi) = pi ≤ 1 Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 3 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo que prejudica a definição de um modelo linear, com função de resposta linear. Quando a variável resposta é binária, existem evidências de que a forma da função resposta deve ser não linear. Funções normalmente empregadas são as funções de resposta logit (monotonicamente crescentes ou decrescentes em forma de S), que podem ser representadas pelas equações: E(yi) = exp(β0 + β1xi) (1 + exp(β0 + β1xi)) = 1 (1 + exp[−(β0 + β1xi)]) e a forma que melhor representa o modelo de regressão logística é dada por: E(yi) 1 − E(yi) = exp(β0 + β1xi) Se E(yi) = pi, que representa a probabilidade de y = 1 (sucesso / sim / verdadeiro), e (1 − E(yi)) = (1−pi), que por sua vez representa a probabilidade de y = 0, (falha / não / falso), temos que exp(β0 +β1xi) representa a razão de chances (odds ratio): exp(β0 + β1xi) = pi 1 − pi = P(yi = 1) P(yi = 0) (1) A interpretação prática do modelo é que a razão de chances, dada por (1) varia exp(β1) para cada unidade de variação da variável explicativa xi. Os parâmetros do modelo de regressão logística são geralmente estimados pelo método da máxima verossimilhança. Exemplo: Considere um conjunto de dados com 200 observações onde a variável resposta é hon, que possui valor 1 se o aluno possui licenciatura ou 0, se o aluno não possui licenciatura. Seja p = P(hon = 1). hon Masculino Feminino Total 0 74 77 151 1 17 32 49 Total 91 109 200 Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 4 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Exercício 01: (a) Qual o modelo final quando consideramos α = 10%? (b) Interprete os parâmetros do modelo dado em (a). (c) Calcule: (i) sensibilidade, (ii) especificidade, (iii) prevalência e (iv) razão de chances, a partir da tabela. (d) O modelo final se altera quando consideramos α = 5%? Outra análise: Exercício 02: (a) Qual o modelo final quando consideramos α = 10%? (b) Interprete os parâmetros do modelo dado em (a). (c) O modelo final se altera quando consideramos α = 5%? Além de avaliar a possível influência das variáveis explicativas na variável de interesse, a regressão lo- gística é utilizada para discriminar grupos, calculando a probabilidade de sucesso para valores específicos das variáveis preditoras: se pi ≥ 0, 5 considera-se pelo modelo obtido que, para estes valores específi- cos da(s) variáveis explicativas, ocorrerá sucesso (yi = 1); por outro lado, se pi < 0, 5, ocorrerá fracasso (yi = 0). Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 5 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Exemplo da Nasa: Abaixo seguem os dados sobre a temperatura de lançamento e falha do O-ring para os 24 lançamentos de ônibus espaciais antes do desastre da Challenger em janeiro de 1986. Existem seis O-rings usados no arranjo do motor de foguete para selar juntas. Figura 1: Saída Minitab. O p-valor é 0,04, indicando que a temperatura tem um efeito significativo na probabilidade de falha do O-ring. A razão de chances é 0,84; logo o aumento de 1 grau na temperatura reduz as chances de falha. Obs: A temperatura real no lançamento do Challenger era 31ºF.Esse valor está bem distante das outras temperaturas de lançamento. Por isso, nosso modelo não é apropriado para fornecer previsões altamente acuradas naquela temperatura. Mas é evidente que um lançamento a 31ºF é quase certo de resultar em uma falha no O-ring. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 6 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Figura 2: Gráficos Exemplo Challenger. Qualidade do ajuste A avaliação da qualidade de ajuste do modelo de regressão logística deve ser realizada comparando as respostas reais e os valores preditos pelo modelo. Estes resultados são expostos através da Matriz de Confusão, dada a seguir: Tabela 2: Previsto pelo Modelo versus Real Previsto pelo Real Modelo Positivo Negativo Total Positivo a b a + b (Verdadeiro Positivo) (Falso Positivo) Negativo c d c + d (Falso Negativo) (Verdadeiro Negativo) Total n1 = a + c n2 = b + d a + b + c + d A matriz de confusão, por si só, já apresenta informações valiosas sobre a qualidade do modelo de regressão logística, como por exemplo: a quantidade total de valores preditos erroneamente pelo modelo obtido, ou se há uma tendência ao erro positivo ou ao erro negativo. Além disso, a partir dos valores encontrados na matriz de confusão, é possível calcular os valores de Especificidade (taxa de acerto de negativos) e de Sensibilidade (taxa de acerto de positivos) do modelo. Note que: • Dentre os n1 pacientes com resultado positivo, o modelo previu a; • Dentre os n2 pacientes com resultado negativo, o modelo previu d. Sensibilidade: Probabilidade do modelo acertar o resultado positivo, ou seja, P(Modelo Positivo|Real Positivo). A partir da tabela pode ser estimada por Sensibilidade = a n1 . Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 7 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Especificidade: Probabilidade do modelo acertar o resultado negativo, ou seja, P(Modelo Nega- tivo|Real negativo). A partir da tabela pode ser estimada por Especificidade = d n2 . Além disso, outro método importante de avaliação de performance de um modelo de regressão logística é a curva ROC (Receiver-Operating Characteristic), que representa o trade-off (ou taxa de troca) entre a Sensibilidade e a taxa de falsos positivos (1- Especificidade). A curva ROC então se dá no formato a seguir: Figura 3: Curva ROC. A área abaixo da curva ROC, que pode variar de 0,5 (indesejado) a 1 (desejado), também é conside- rada um índice de acertos do modelo. Sendo assim, um modelo ideal apresentaria uma curva ROC que encostaria no canto superior-esquerdo do gráfico, tendo uma taxa total de verdadeiros positivos, e uma taxa nula de falsos positivos. Em geral, Faixa de AUC Poder de classificação AUC = 0, 5 Não há 0, 7 ≤ AUC ≤ 0, 8 Aceitável 0, 8 < AUC ≤ 0, 9 Muito bom AUC > 0, 9 Excelente Embora o valor da AUC seja bastante utilizado e leve em consideração o desempenho de verdadeiros positivos e falsos positivos, deve-se ter cuidado na análise dos resultados. É possível obter valores muito altos de AUC quando há ocorrência de sobreajuste (overfitting). Por isso, deve-se sempre realizar uma análise conjunta de todas as métricas. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 8 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Lista 9 - Análise de Variância - Estatística 2021 1

18

Lista 9 - Análise de Variância - Estatística 2021 1

Estatística

USP

Lista 10 - Análise de Regressão Linear - Estatística 2021-1

4

Lista 10 - Análise de Regressão Linear - Estatística 2021-1

Estatística

USP

Lista 9 - Análise de Variância - Estatística 2021-1

18

Lista 9 - Análise de Variância - Estatística 2021-1

Estatística 1

USP

Lista 8 - Teste de Hipótese - Estatística 2021 1

14

Lista 8 - Teste de Hipótese - Estatística 2021 1

Estatística

USP

Lista 8 - Teste de Hipótese - Estatística 2021-1

14

Lista 8 - Teste de Hipótese - Estatística 2021-1

Estatística

USP

Exercícios - Estatística 2021-2

9

Exercícios - Estatística 2021-2

Estatística

USP

Estap 1 2024

10

Estap 1 2024

Estatística 1

UFRJ

Exercícios Pf1

6

Exercícios Pf1

Estatística 1

UFRJ

Exercícios Pf2

6

Exercícios Pf2

Estatística 1

UFRJ

P4 - 2024-1

2

P4 - 2024-1

Estatística

UNESP

Texto de pré-visualização

UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Variância de uma combinação linear. Se X1, X2, ⋯ , Xn são variáveis aleatórias e Y = c1X1+c2X2+ ⋯+ cnXn, então Var(Y) = c1²Var(X1) + c2²Var(X2) + ⋯ + cn²Var(Xn) + ∑ ∑ cicjCov(Xi, Xj). i j Se X1, X2, ⋯ , Xn forem independentes, então Var(Y) = c1²Var(X1) + c2²Var(X2) + ⋯ + cn²Var(Xn). Propriedade da distribuição normal. Se X1, X2, ⋯ , Xn são variáveis aleatórias normais indepen- dentes, com E(Xi) = μi e Var(Xi) = σi², para i = 1, 2, ⋯ , n, Y = c1X1 + c2X2 + ⋯ + cnXn é uma variável aleatória normal com E(Y) = c1μ1 + c2μ2 + ⋯ + cnμn e Var(Y) = c1²σ1² + c2²σ2² + ⋯ + cn²σn². Exercício 13. Sejam as variáveis aleatórias X1 e X2 o comprimento e a largura, respectivamente, de uma peça fabricada. Considere que X1 segue uma distribuição normal, com média de 2 centímetros e desvio-padrão igual a 0,1 centímetro, e que X2 segue uma distribuição normal, com média de 5 cen- tímetros e desvio-padrão igual a 0,2 centímetro. Também suponha que X1 e X2 sejam independentes. Determine a probabilidade do perímetro exceder 14,5 centímetros. Resp.: 0,13. Exercício 14. Latas são cheias por uma máquina automática de enchimento. O volume médio de enchimento é 12,1 mililitros, sendo o desvio-padrão igual a 0,1 mililitro. Suponha que os volumes de en- chimento das latas sejam variáveis aleatórias normais independentes. Qual a probabilidade de que o médio de 10 latas selecionadas desse processo ser menor que 12 mililitros? Resp: 0,00079. Modelos Multivariados Distribuição Multinomial: Suponha que um experimento aleatório consiste em uma série de n tenta- tivas. Considere que (1) O resultado de cada tentativa é classificado em uma das k classes. (2) A probabilidade de uma tentativa gerando um resultado na classe 1, classe 2, ⋯ , classe k é constante ao longo das tentativas e igual a p1, p2, ⋯ , pk, respectivamente. (3) As tentativas são independentes. As variáveis aleatórias X1, X2, ⋯ , Xk, que denotam o número de tentativas que resultam na classe 1, classe 2, ⋯ , classe k, respectivamente, têm uma distribuição multinomial, sendo a função de probabili- Área I Rodovia Itajubá – Lorena, Km. 74,5 – Caixa Postal 116 CEP 12602-810– Lorena – SP Fax: (Direto) (12) 3135-3124/3135-3209 USP – Lorena Área II Pólo Urbo-Industrial A.I.S. – Caixa Postal 116 CEP 12602-810 – Lorena – SP Tel. (PABX) (12) 3159-5900 9 / 12 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo (2) ∑ y P(Y = y|X = x) = 1 (3) P(Y ∈ B|X = x) = ∑ y∈B P(Y = y|X = x) para qualquer conjunto B na faixa de Y . Exercício 06. Considere o Exemplo 01 onde X e Y denotam o número de barras de potência de sinal e o número de vezes que você precisa dizer seu nome, respectivamente. Calcule: (a) P(Y = 1|X = 3). Resp: 0,454. (b) P(Y = 2|X = 3). Resp: 0,364. (c) P(Y = 3|X = 3). Resp: 0,091. (d) P(Y = 4|X = 3). Resp: 0,091. Variáveis aleatórias contínuas Se X e Y são variáveis aleatórias contínuas, com função de probabilidade conjunta fXY (x, y), então a função de probabilidade condicional de Y , dado que X = x, é fY |X(y|x) = fXY (x, y) , para fX(x) > 0. fX(x) Propriedades: (1) fY |X(y|x) ≥ 0 (2) ∫ fY |X(y|x)dy = 1 (3) P(Y ∈ B|X = x) = ∫ B fY |X(y|x)dy para qualquer conjunto B na faixa de Y . Obs: É importante estabelecer a região em que a função densidade de probabilidade conjunta, condi- cional ou marginal não é zero. Exercício 07. Considerando o Exercício 03, determine a função densidade de probabilidade condicio- nal para Y , dado que X = x. Função de distribuição acumulada condicional Variáveis aleatórias discretas Se X e Y são variáveis aleatórias discretas, com função de probabilidade conjunta P(X = x, Y = y), então a função de distribuição acumulada condicional P(Y ≤ y|X = x) é dada por P(Y ≤ y|X = x) = P(X = x, Y ≤ y) , para P(X = x) > 0. P(X = x) Da mesma forma, temos que P(Y ≤ y|X ≤ x) é dada por P(Y ≤ y|X ≤ x) = P(X ≤ x, Y ≤ y) , para P(X ≤ x) > 0. P(X ≤ x) Área I Rodovia Itajubá – Lorena, Km. 74,5 – Caixa Postal 116 CEP 12602-810– Lorena – SP Fax: (Direto) (12) 3135-3124/3135-3209 USP – Lorena Área II Pólo Urbo-Industrial A.I.S. – Caixa Postal 116 CEP 12602-810 – Lorena – SP Tel. (PABX) (12) 3159-5900 5 / 12 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Então, P(X ≤ x, Y ≤ y) = P(Y ≤ y|X ≤ x) × P(X ≤ x) ≈ ∑ k≤x P(Y ≤ y|X = k) × P(X = k). Variáveis aleatórias contínuas Se X e Y são variáveis aleatórias contínuas, com função densidade de probabilidade conjunta fXY (x, y), então a função de distribuição acumulada condicional P(Y ≤ y|X = x) é dada por FY |X(y|x) = P(Y ≤ y|X = x) = ∫ y−∞ fY |X(z|x)dz para fX(x) > 0. Média e Variância condicionais As fórmulas usuais para média e variância podem ser aplicadas a uma função de probabilidade condi- cional. A média condicional de Y , dado que X = x, denotada como E(Y |x) ou μY |X é dada por E(Y |x) = ∑ y yP(Y = y|X = x) (caso discreto) e E(Y |x) = ∫ yfY |X(y|x)dy (caso contínuo) A variância condicional de Y , dado que X = x, denotada como Var(Y |x) ou σ2 Y |X é dada por Var(Y |x) = ∑ (y − μY |X )2P(Y = y|X = x) = ∑ (y2 × P(Y = y|X = x) − μ2 Y |X ) = E(Y 2|x) − E 2(Y |x) (caso discreto). e Var(Y |x) = ∫ (y − μY |X )2fY |X(y|x)dy = ∫ y2fY |X(y|x)dy − μ2 Y|X = E(Y 2|x) − E 2 (Y |x) (caso contínuo). Exercício 08. Considere f(x, y) = { yx−1 , x = 1, 2, 3 e 0 ≤ y ≤ 1 3 0 , caso contrário (a) Calcule P(X = x) e fY (y) (b) Calcule P(X = x|Y = 1 2) (c) Calcule P(X ≤ x|Y = 1 2) (d) Calcule fY |X(y|x) = P(Y = y|X = 2) Área I Rodovia Itajubá – Lorena, Km. 74,5 – Caixa Postal 116 CEP 12602-810– Lorena – SP Fax: (Direto) (12) 3135-3124/3135-3209 USP – Lorena Área II Pólo Urbo-Industrial A.I.S. – Caixa Postal 116 CEP 12602-810 – Lorena – SP Tel. (PABX) (12) 3159-5900 6 / 12 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo (e) Calcule FY |x(y|2) = P(Y ≤ y|X = 2) Exercício 09. Para as variáveis aleatórias X e Y definidas no Exercício 03, determine: (a) A função densidade de probabilidade condicional para Y , dado que X = x. (b) A probabilidade de Y exceder 2.000 horas, dado que x = 1.500. Resp: P(Y > 2.000|X = 1.500) = 0, 368. (c) A média condicional para Y , dado que x = 1.500. Resp: E(Y |X = 1.500) = 2.000. Independência Em alguns experimentos aleatórios, o conhecimento dos valores de X não altera qualquer das proba- bilidades associadas aos valores de Y . Por analogia com eventos independentes, definimos duas variáveis aleatórias como independentes se fXY (x, y) = fX(x)fY (y) para todo x e y. Se encontrarmos um par (x, y) em que a igualdade falhe, X e Y não serão independentes. Se duas variáveis aleatórias forem independentes, então fY |x(y|x) = fXY (x, y) fX(x) = fX(x)fY (y) fX(x) = fY (y) Variáveis aleatórias discretas Para variáveis aleatórias discretas X e Y , se qualquer uma das seguintes propriedades for verdadeira, então as outras serão também verdadeiras e X e Y serão independentes. (1) P(X = x, Y = y) = P(X = x)P(Y = y) para todo x, y (2) P(Y = y|X = x) = P(Y = y) para todo x, y, com P(X = x) > 0 (3) P(X = x|Y = y) = P(X = x) para todo x, y, com P(Y = y) > 0 (4) P(X ∈ A, Y ∈ B) = P(X ∈ A)P(Y ∈ B) para quaisquer conjuntos A e B, na faixa X e Y , respectiva- mente. Variáveis aleatórias contínuas Para variáveis aleatórias contínuas X e Y , se qualquer uma das seguintes propriedades for verdadeira, então as outras serão também verdadeiras e X e Y serão independentes. (1) fXY (x, y) = fX(x)fY (y) para todo x, y (2) fY |x(y|x) = fY (y) para todo x, y, com fX(x) > 0 (3) fX|y(x|y) = fX(x) para todo x, y, com fY (y) > 0 (4) P(X ∈ A, Y ∈ B) = P(X ∈ A)P(Y ∈ B) para quaisquer conjuntos A e B, na faixa X e Y , respectiva- mente. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 7 / 12 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Exercício 10. Sejam as v.as. X e Y que correspondem aos comprimentos das duas dimensões de uma peça usinada. Suponha que X e Y sejam variáveis aleatórias independentes e, além disso, suponha que a distribuição de X seja Normal, com média 10,5 milímetros e variância 0,0025 (milímetro)2 e que a distribuição de Y seja Normal, com média 3,2 milímetros e variãncia 0,0036 (milímetro)2. Determine P(10, 4 < X < 10, 6 , 3, 15 < Y < 3, 25) = P({10, 4 < X < 10, 6} ∩ {3, 15 < Y < 3, 25}). Exercício 11. Considere que a função densidade de probabilidade conjunta de X e Y seja fXY (x, y) = 2 × 10−6 exp(−0, 001x − 0, 002y), para x ≥ 0 e y ≥ 0. (a) Mostre que X e Y são independentes. (b) Determine P(X > 1.000 , Y < 1.000). Exercício 12. Considere fX,Y (x, y) = k x , para 0 < y < x < 2. (a) Determine o valor de k. (b) Calcule fX(x) e fY (y). (c) X e Y são variáveis aleatórias independentes? (d) Calcule fX|y(x|y) e fY |x(y|x). (e) Calcule P(X < 1|Y = y). Funções lineares de variáveis aleatórias Uma variável aleatória é algumas vezes definida como uma função de uma ou mais variáveis aleatórias. Por exemplo, se as variáveis aleatórias X1 e X2 denotarem o comprimento e a largura, respectivamente, de uma peça fabricada, então Y = 2X1+2X2 é uma variável aleatória que representa o perímetro da peça. Como outro exemplo, lembre que a variável aleatória Binomial Negativa é representada como a soma de variáveis aleatórias Geométricas. Nesta seção, desenvolveremos resultados para as variáveis aleatórias que sejam combinações lineares de variáveis aleatórias. Dadas variáveis aleatórias X1, X2, · · · , Xn e as constantes c1, c2, · · · , cn, então Y = c1X1 + c2X2 + · · · + cnXn é uma combinação linear de X1, X2, · · · , Xn. Média de uma combinação linear. Se X1, X2, · · · , Xn são variáveis aleatórias e Y = c1X1 + c2X2 + · · · + cnXn, então E(Y ) = c1E(X1) + c2E(X2) + · · · + cnE(Xn). Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 8 / 12 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo dade conjunta dada por P(X1 = x1, X2 = x2, ··· , Xk = xk) = \frac{n!}{x1!x2!···xk!} px1_1 px2_2 ··· pxk_k para x1 + x2 + ··· + xk = n e p1 + p2 + ··· + pk = 1. Obs: A distribuição multinomial é considerada uma versão multivariada da distribuição binomial. Se X1, X2, ··· , Xk têm uma distribuição multinomial, a distribuição de probabilidades marginais de Xi é Binomial com E(Xi) = npi e Var(Xi) = npi(1 − pi). Distribuição Normal bivariada: A função densidade de probabilidade de uma distribuição normal bivariada é fXY (x,y) = \frac{1}{2πσXσY √1 − ρ²} exp \left[ −\frac{1}{2(1 − ρ²)} [(x − µX)² \over σ²X − \frac{2ρ(x − µX)(y − µY )}{σXσY } + (y − µY )² \over σ²Y ]\right] para −∞ < x < ∞ e −∞ < y < ∞, com parâmetros σX > 0, σY > 0, −∞ < µX < ∞, −∞ < µY < ∞ e −1 < ρ < 1. Se X e Y tiverem uma distribuição normal bivariada, com densidade de probabilidade conjunta fXY (x,y), então as distribuições de probabilidades marginais de X e Y são normais, com médias µX e µY e desvios-padrão σX e σY, respectivamente. Se X e Y tiverem uma distribuição normal bivariada, a função densidade de probabilidade conjunta fXY (x,y), então a correlação entre X e Y é ρ. Obs: Se X e Y tiverem uma distribuição normal bivariada, com ρ = 0, então X e Y serão independentes. Covariância e Correlação Quando duas ou mais variáveis aleatórias são definidas em um espaço probabilístico, é útil descrever como elas variam conjuntamente; ou seja, é útil medir a relação entre as variáveis. Uma medida comum da relação entre duas variáveis aleatórias é a covariância. A covariância é defi- nida para variáveis aleatórias contínuas e discretas pela mesma fórmula. A covariância entre as variáveis aleatórias X e Y , denotada por Cov(X, Y ) ou σXY , é σXY = E[(X − E(X))(Y − E(Y ))] = E(XY ) − E(X)E(Y ) Covariância é uma medida de relação linear entre as variáveis aleatórias. Se a relação entre as variáveis aleatórias for não linear, a covariância pode não ser sensível a relação. UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Figura 2: Distribuições de probabilidades conjuntas e o sinal da covariância entre X e Y . (a) Covariância positiva (b) Covariância zero (c) Covariância negativa (d) Covariância negativa Todos os pontos têm igual probabilidade Exercício 15. Considere o Exemplo 01 onde as variáveis aleatórias X e Y são o número de barras de sinal e o número de vezes em que você tem de dizer seu nome, respectivamente. Você acha que a covariância entre X e Y é positiva ou negativa? Há outra medida da relação entre duas variáveis aleatórias que é frequentemente mais fácil de inter- pretar que a covariância. A correlação entre as variáveis aleatórias X e Y , denotada por ρXY , é ρXY = \frac{Cov(X, Y )}{√Var(X)Var(Y )} = \frac{σXY}{σXσY} Para quaisquer duas variáveis aleatórias X e Y , −1 ≤ ρXY ≤ +1. Obs: Se X e Y forem variáveis aleatórias independentes, então σXY = ρXY = 0. No entanto, se a correlação entre duas variáveis aleatórias for zero, não podemos concluir imediatamente que as variáveis aleatórias sejam independentes. A correlação só escala a covariância através do desvio padrão de cada variável. Assim, a correlação é uma grandeza adimensional que pode ser usada para comparar as relações lineares entre pares de variáveis aleatórias em diferentes unidades. Similar a covariância, a correlação é uma medida da relação linear entre as variáveis aleatórias. Área I Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 Lorena – SP CEP 12600-970 Tel: (12) 3159-5013 Tel. (Direto) (12) 3159-5143 | 3153-3209 USP – Lorena www.eel.usp.br 10 / 12 Área II Pólo Urbo-Industrial Altos – Caieiras Pte. CEP 12602-810 | Lorena – SP Fax (12) 3153-3096 Tel. (PABX) (12) 3159-5900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Exercício 16. Suponha que a variável aleatória X tenha a seguinte distribuição: P(X = 1) = 0, 2, P(X = 2) = 0, 6, P(X = 3) = 0, 2. Seja Y = 2X + 5. Ou seja, P(Y = 7) = 0, 2, P(Y = 9) = 0, 6, P(Y = 11) = 0, 2. Determine a correlação entre X e Y . Exercício 17. Suponha as variáveis X e Y tais que • X ∼ Unif{−1, 1}, ou seja, X ∈ {−1, 0, 1} com P(X = −1) = P(X = 0) = P(X = 1) = 1 3. • Y assume dois valores: Y = 0, se X = 0 ou Y = 1, caso contrário (se X ̸= 0). (a) Calcule a covariância e a correlação entre X e Y . (b) X e Y são independentes? Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 12 / 12 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Controle Estatístico da Qualidade Hoje, a qualidade de produtos e serviços tem-se tornado um fator de decisão primordial na maioria dos negócios. Quando o consumidor (que pode ser um indivíduo ou uma corporação ou um programa de defesa militar ou uma loja de varejo, etc) estiver tomando decisões de compra, ele estará propenso a considerar a qualidade como um fator essencial em sua escolha. Assim, a melhoria da qualidade tem se tornado uma preocupação importante para a grande maioria das corporações. A qualidade é determinada pela interação entre qualidade de projeto e qualidade de conformidade. Qualidade de projeto se refere aos diferentes graus ou níveis de desempenho, de confiabilidade, de serviço e de função, resultados de decisões deliberadas de engenharia e gerência. Por Qualidade de conformidade, queremos dizer a redução sistemática de variabilidade e a eliminação de defeitos até que cada unidade produzida seja idêntica e livre de defeito. Melhoria da qualidade significa a eliminação sistemática de desperdício. Exemplos de desperdícios incluem: • perda e retrabalho na fabricação, inspeção e teste; • erros em documentos (tais como desenhos de engenharia, cheques, ordens de pagamento e planos); • serviço de atendimento a consumidores; • custos de garantia; • tempo necessário para repetir coisas que poderiam ter sido feitas uma única vez. Um esforço para a melhoria da qualidade pode eliminar muito desse desperdício e conduzir a: • custos menores; • produtividades maiores; • consumidores mais satisfeitos; • aumento da reputação dos negócios; • maiores lucros para a companhia. Métodos estatísticos desempenham um papel vital na melhoria da qualidade. O controle estatístico da qualidade é uma coleção de ferramentas essenciais nas atividades de me- lhoria da qualidade. O controle estatístico da qualidade pode ser definido como os métodos estatísticos e de engenharia usados na medida, na monitoração, no controle e na melhoria da qualidade. É impraticável inspecionar qualidade em um produto. O produto tem de ser feito corretamente já na primeira vez. Para isso, o processo de fabricação tem de ser estável e capaz de operar com pouca variabi- lidade ao redor do alvo ou dimensão nominal. É costume pensar sobre controle estatístico de processo (CEP) como um conjunto de ferramentas para resolver problemas, as quais podem ser aplicadas a qual- quer processo. As ferramentas mais importantes de CEP são: Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 1 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo (1) Gráfico de controle (2) Histograma (3) Gráfico de Pareto (4) Diagrama de causa e efeito (5) Diagrama de dispersão (6) Folha de verificação Introdução aos Gráficos de Controle Em qualquer processo de produção, certa variabilidade inerente ou natural sempre existirá. Essa varia- bilidade natural ou “ruído de fundo”, chamada de “sistema estável de causas casuais”, é o efeito cumulativo de muitas causas pequenas, normalmente inevitáveis. Um processo cuja variação presente seja prove- niente apenas de causas casuais é dito estar sob controle estatístico. Em outras palavras, as causas casuais são uma parte inerente do processo. Outros tipos de variabilidade podem, ocasionalmente, estar presentes no resultado de um processo e geralmente aparece de três fontes: • máquinas não ajustadas, • erros dos operadores, ou • matérias-primas defeituosas. Tal variabilidade é geralmente grande quando comparada ao ruído de fundo, representando usualmente um nível inaceitável de desempenho de processo. Referimo-nos a essas fontes de variabilidade, que não são parte do padrão de causas casuais, como causas atribuídas. Um processo que esteja operando na presença de causas atribuídas é dito estar fora de controle. Um gráfico típico de controle, calculado a partir de uma amostra, é mostrado abaixo. O gráfico contém • uma linha central (LC), que representa o valor médio da característica da qualidade correspondendo ao estado sob controle. • duas outras linhas horizontais, chamadas de limite superior de controle (LSC) e de limite inferior de controle (LIC). Esses limites de controle são escolhidos de modo que, se o processo estiver sob controle, aproximadamente todos os pontos da amostra cairão entre eles. Em geral, se os pontos estiverem plotados dentro dos limites de controle, o processo é considerado estar sob controle, e nenhuma ação é necessária. Entretanto, pontos fora dos limites de controle são evidências de que o processo está fora de controle, havendo necessidade de investigação e ação corretiva para encontrar e eliminar a causa atribuída. Os pontos da amostra no gráfico de controle são conectados com segmentos de linha reta, para fácil visualização. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 2 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Mesmo que todos os pontos estejam dentro dos limites de controle, se eles se comportarem de ma- neira sistemática ou não aleatória, então isso é uma indicação de que o processo está fora de controle. Por exemplo, se 18 dos 20 últimos pontos estivessem acima da linha central, porém abaixo do limite superior de controle, e somente dois desses pontos estivessem abaixo da linha central, porém acima do limite infe- rior de controle, ficaríamos muito desconfiados de que alguma coisa estaria errada. Se o processo estiver sob controle, todos os pontos plotados deverão ter um padrão de comportamento essencialmente aleatório. Há uma forte conexão entre gráficos de controle e testes de hipóteses. O gráfico de controle é um teste da hipótese de que o processo está em um estado de controle estatístico. Um ponto situado dentro dos limites de controle é equivalente a não rejeitar a hipótese de controle estatístico, e um ponto situado fora dos limites de controle é equivalente a rejeitar a hipótese de controle estatístico. Podemos dar um modelo geral para um gráfico de controle: seja W uma estatística da amostra que mede alguma característica da qualidade de interesse e suponha que a média de W seja µW e o desvio-padrão de W seja σW . Então a linha central, o limite superior de controle e o limite inferior de controle se tornam LSC = µW + kσW LC = µW LIC = µW − kσW sendo k a “distância” dos limites de controle a partir da linha central, expressa em unidades de desvio- padrão. Uma escolha comum é k = 3. Os gráficos de controle podem ser classificados em dois tipos gerais: (a) gráficos de controle para variáveis: se a característica da qualidade é uma variável quantitativa, ou (b) gráficos de controle para atributos: se a característica da qualidade não é medida em uma escala quantitativa. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 3 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Análise de Padrões nos gráficos de controle Um gráfico de controle pode indicar uma condição de fora de controle quando um ou mais pontos caírem além dos limites de controle ou quando os pontos plotados exibirem algum padrão não aleatório de comportamento. No gráfico acima vemos que embora todos os 25 pontos caiam dentro dos limites de controle, os pontos não indicam controle estatístico em razão de seu padrão de não aleatoriedade. Notamos que 19 dos 25 pontos estão abaixo da linha central, enquanto somente seis deles estão acima. Se os pontos fossem aleatórios, devemos esperar uma distribuição mais uniforme deles acima e abaixo da linha central. Observando o gráfico de controle abaixo, notamos que as médias amostrais plotadas exibem um com- portamento cíclico, ainda que todas elas caiam dentro dos limites de controle. Tal padrão de comporta- mento pode indicar um problema com o processo, como fadiga do operador, desenvolvimento de calor ou tensão, etc. O resultado pode ser melhorado, eliminando ou reduzindo as fontes de variabilidade que causam esse comportamento cíclico. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 4 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo O problema é reconhecer o padrão de comportamento; isto é, reconhecer os padrões sistemáticos ou não aleatórios no gráfico de controle e identificar a razão para esse comportamento. A habilidade para interpretar um padrão particular de comportamento em termos de causas atribuídas requer experiência e conhecimento do processo. Ou seja, temos não somente de conhecer os princípios estatísticos de gráficos de controle, mas também temos de ter um bom entendimento do processo. O livro Western Electric Handbook (1956) sugere um conjunto de regras de decisão para detectar padrões não aleatórios de comportamento nos gráficos de controle. Especificamente, as regras Western Electric concluem que o processo está fora de controle, se: (1) Um ponto cair fora dos limites 3-sigma. (2) Dois de três pontos consecutivos caírem além do limite 2-sigma. (3) Quatro de cinco pontos consecutivos caírem a uma distância maior ou igual a 1-sigma da linha central. (4) Oito pontos consecutivos caírem em um dos lados da linha central. Na prática, as regras (2) e (3) se aplicam a um lado da linha central de cada vez, ou seja, um ponto acima do limite superior 2-sigma, seguido imediatamente por um ponto abaixo do limite inferior 2-sigma, não sinalizaria um alarme de fora de controle. Observe que esses limites internos (algumas vezes chama- dos de limites de advertência) dividem o gráfico de controle em três zonas A, B e C, em cada lado da linha central. No gráfico abaixo, qual seria a nossa conclusão? Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 5 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Resp: os quatro últimos pontos caem na zona B ou além. Assim, uma vez que quatro dos cinco pontos consecutivos excedem o limite 1-sigma, o procedimento Western Electric concluirá que o padrão de comportamento é não aleatório, estando o processo fora de controle. Outras ferramentas para a solução de problemas de CEP Embora o gráfico de controle seja uma ferramenta muito poderosa para investigar as causas de varia- ção em um processo, ele é mais efetivo quando usado com outras ferramentas para resolver problemas de CEP. Considere o seguinte exemplo: Exemplo: Placas de circuito impresso são montadas por uma combinação de montagem manual e automática. Uma Tecnologia de Montagem da Superfície (TMS) é usada para fazer as conexões mecânicas e elétricas dos componentes na placa. A cada hora, cinco placas são selecionadas e inspecionadas para finalidades de controle de processo. O número de defeitos em cada amostra de cinco placas é anotado. Os resultados para 20 amostras são mostrados na tabela abaixo: Abaixo temos um gráfico para o número de defeitos em amostras de cinco placas de circuito impresso. O gráfico exibe controle estatístico, mas o número de defeitos tem de ser reduzido, pois o número médio de defeitos por placa é 8/5 = 1,6. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 6 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo A primeira etapa para resolver esse problema é construir um diagrama de Pareto dos tipos individuais de defeitos. O diagrama de Pareto, abaixo, indica que soldagem insuficiente e bolas de solda são os defeitos mais frequentemente encontrados, considerando (109/160)100 = 68% dos defeitos observados. Além disso, as cinco primeiras categorias de defeitos no gráfico de Pareto são todas defeitos relacionados com a solda. Isso aponta para o processo de soldagem contínua como uma oportunidade potencial para melhoria. Para melhorar o processo de montagem na superfície, uma comissão estuda as causas potenciais de defeitos de soldagem. Essas pessoas conduzem uma sessão de discussão (brainstorming) e produzem o diagrama de causa e efeito, mostrado abaixo. O diagrama de causa e efeito é largamente usado para mostrar as várias causas potenciais de defeitos em produtos e suas inter-relações. Ele é útil em resumir o conhecimento acerca do processo. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 7 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Como um resultado da sessão de discussão, a comissão identifica, por tentativa, as seguintes variáveis como potencialmente influenciáveis em criar os defeitos de soldagem: (1) Densidade de fluxo (2) Temperatura de refluxo (3) Velocidade do rolo (4) Ângulo do rolo (5) Altura da pasta (6) Pressão do rolo (7) Método de carregamento da placa Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 8 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 Fatores para os Limites de Controle Gráfico \bar{X} Gráfico R Gráfico S n° A₂ A₃ d₂ D₃ D₄ C₄ n 2 3.760 1.880 1.128 0 3.267 0.799 2 3 2.394 1.023 1.693 0 2.575 0.886 3 4 1.880 0.729 2.059 0 2.282 0.9213 4 5 1.596 0.577 2.326 0 2.115 0.9400 5 6 1.410 0.483 2.534 0.076 2.004 0.9515 6 7 1.277 0.419 2.704 0.136 1.924 0.9594 7 8 1.175 0.373 2.847 0.184 1.864 0.9650 8 9 1.094 0.337 2.970 0.223 1.816 0.9693 9 10 1.028 0.308 3.078 0.252 1.777 0.9727 10 11 0.973 0.285 3.173 0.284 1.744 0.9754 11 12 0.925 0.266 3.258 0.284 1.716 0.9776 12 13 0.884 0.249 3.336 0.308 1.692 0.9794 13 14 0.848 0.235 3.407 0.329 1.671 0.9810 14 15 0.816 0.223 3.472 0.348 1.652 0.9823 15 16 0.788 0.212 3.532 0.364 1.636 0.9835 16 17 0.762 0.203 3.588 0.379 1.622 0.9845 17 18 0.738 0.194 3.640 0.392 1.608 0.9854 18 19 0.717 0.187 3.689 0.404 1.597 0.9862 19 20 0.698 0.180 3.735 0.414 1.586 0.9869 20 21 0.679 0.173 3.778 0.424 1.576 0.9876 21 22 0.662 0.167 3.819 0.433 1.566 0.9882 22 23 0.647 0.162 3.858 0.443 1.557 0.9887 23 24 0.632 0.157 3.895 0.452 1.548 0.9892 24 25 0.619 0.153 3.931 0.459 1.541 0.9896 25 Distribui¸c˜ao Normal p 0 zt Z 0 1 2 3 4 5 6 7 8 9 0,0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586 0,1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535 0,2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409 0,3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173 0,4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793 0,5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.22240 0,6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.25490 0,7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.28524 0,8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327 0,9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891 1,0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214 1,1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.38298 1,2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147 1,3 0.40320 0.40490 0.40658 0.40824 0.40988 0.41149 0.41309 0.41466 0.41621 0.41774 1,4 0.41924 0.42073 0.42220 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189 1,5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408 1,6 0.44520 0.44630 0.44738 0.44845 0.44950 0.45053 0.45154 0.45254 0.45352 0.45449 1,7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46080 0.46164 0.46246 0.46327 1,8 0.46407 0.46485 0.46562 0.46638 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062 1,9 0.47128 0.47193 0.47257 0.47320 0.47381 0.47441 0.47500 0.47558 0.47615 0.47670 2,0 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.48030 0.48077 0.48124 0.48169 2,1 0.48214 0.48257 0.48300 0.48341 0.48382 0.48422 0.48461 0.48500 0.48537 0.48574 2,2 0.48610 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.48840 0.48870 0.48899 2,3 0.48928 0.48956 0.48983 0.49010 0.49036 0.49061 0.49086 0.49111 0.49134 0.49158 2,4 0.49180 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361 2,5 0.49379 0.49396 0.49413 0.49430 0.49446 0.49461 0.49477 0.49492 0.49506 0.49520 2,6 0.49534 0.49547 0.49560 0.49573 0.49585 0.49598 0.49609 0.49621 0.49632 0.49643 2,7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.49720 0.49728 0.49736 2,8 0.49744 0.49752 0.49760 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807 2,9 0.49813 0.49819 0.49825 0.49831 0.49836 0.49841 0.49846 0.49851 0.49856 0.49861 3,0 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49896 0.49900 3,1 0.49903 0.49906 0.49910 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929 3,2 0.49931 0.49934 0.49936 0.49938 0.49940 0.49942 0.49944 0.49946 0.49948 0.49950 3,3 0.49952 0.49953 0.49955 0.49957 0.49958 0.49960 0.49961 0.49962 0.49964 0.49965 3,4 0.49966 0.49968 0.49969 0.49970 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976 3,5 0.49977 0.49978 0.49978 0.49979 0.49980 0.49981 0.49981 0.49982 0.49983 0.49983 3,6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989 3,7 0.49989 0.49990 0.49990 0.49990 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992 3,8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995 3,9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997 Tabela 1: Probabilidades p = P[0 ≤ Z ≤ Zt] da Distribui¸c˜ao Normal padr˜ao com valores de Zt dados nas margens da tabela 1 Distribui¸c˜ao t de Student p/2 p/2 0 tt t 90% 80% 70% 60% 50% 40% 30% 20% 10% 9% 8% 7% 6% 5% 4% 3% 2% 1% 0.5% 0.2% 0.1% 2 0.142 0.289 0.445 0.617 0.816 1.061 1.386 1.886 2.920 3.104 3.320 3.578 3.896 4.303 4.849 5.643 6.965 9.925 14.089 22.327 31.599 3 0.137 0.277 0.424 0.584 0.765 0.978 1.250 1.638 2.353 2.471 2.605 2.763 2.951 3.182 3.482 3.896 4.541 5.841 7.453 10.215 12.924 4 0.134 0.271 0.414 0.569 0.741 0.941 1.190 1.533 2.132 2.226 2.333 2.456 2.601 2.776 2.999 3.298 3.747 4.604 5.598 7.173 8.610 5 0.132 0.267 0.408 0.559 0.727 0.920 1.156 1.476 2.015 2.098 2.191 2.297 2.422 2.571 2.757 3.003 3.365 4.032 4.773 5.893 6.869 6 0.131 0.265 0.404 0.553 0.718 0.906 1.134 1.440 1.943 2.019 2.104 2.201 2.313 2.447 2.612 2.829 3.143 3.707 4.317 5.208 5.959 7 0.130 0.263 0.402 0.549 0.711 0.896 1.119 1.415 1.895 1.966 2.046 2.136 2.241 2.365 2.517 2.715 2.998 3.499 4.029 4.785 5.408 8 0.130 0.262 0.399 0.546 0.706 0.889 1.108 1.397 1.860 1.928 2.004 2.090 2.189 2.306 2.449 2.634 2.896 3.355 3.833 4.501 5.041 9 0.129 0.261 0.398 0.543 0.703 0.883 1.100 1.383 1.833 1.899 1.973 2.055 2.150 2.262 2.398 2.574 2.821 3.250 3.690 4.297 4.781 10 0.129 0.260 0.397 0.542 0.700 0.879 1.093 1.372 1.812 1.877 1.948 2.028 2.120 2.228 2.359 2.527 2.764 3.169 3.581 4.144 4.587 11 0.129 0.260 0.396 0.540 0.697 0.876 1.088 1.363 1.796 1.859 1.928 2.007 2.096 2.201 2.328 2.491 2.718 3.106 3.497 4.025 4.437 12 0.128 0.259 0.395 0.539 0.695 0.873 1.083 1.356 1.782 1.844 1.912 1.989 2.076 2.179 2.303 2.461 2.681 3.055 3.428 3.930 4.318 13 0.128 0.259 0.394 0.538 0.694 0.870 1.079 1.350 1.771 1.832 1.899 1.974 2.060 2.160 2.282 2.436 2.650 3.012 3.372 3.852 4.221 14 0.128 0.258 0.393 0.537 0.692 0.868 1.076 1.345 1.761 1.821 1.887 1.962 2.046 2.145 2.264 2.415 2.624 2.977 3.326 3.787 4.140 15 0.128 0.258 0.393 0.536 0.691 0.866 1.074 1.341 1.753 1.812 1.878 1.951 2.034 2.131 2.249 2.397 2.602 2.947 3.286 3.733 4.073 16 0.128 0.258 0.392 0.535 0.690 0.865 1.071 1.337 1.746 1.805 1.869 1.942 2.024 2.120 2.235 2.382 2.583 2.921 3.252 3.686 4.015 17 0.128 0.257 0.392 0.534 0.689 0.863 1.069 1.333 1.740 1.798 1.862 1.934 2.015 2.110 2.224 2.368 2.567 2.898 3.222 3.646 3.965 18 0.127 0.257 0.392 0.534 0.688 0.862 1.067 1.330 1.734 1.792 1.855 1.926 2.007 2.101 2.214 2.356 2.552 2.878 3.197 3.610 3.922 19 0.127 0.257 0.391 0.533 0.688 0.861 1.066 1.328 1.729 1.786 1.850 1.920 2.000 2.093 2.205 2.346 2.539 2.861 3.174 3.579 3.883 20 0.127 0.257 0.391 0.533 0.687 0.860 1.064 1.325 1.725 1.782 1.844 1.914 1.994 2.086 2.197 2.336 2.528 2.845 3.153 3.552 3.850 21 0.127 0.257 0.391 0.532 0.686 0.859 1.063 1.323 1.721 1.777 1.840 1.909 1.988 2.080 2.189 2.328 2.518 2.831 3.135 3.527 3.819 22 0.127 0.256 0.390 0.532 0.686 0.858 1.061 1.321 1.717 1.773 1.835 1.905 1.983 2.074 2.183 2.320 2.508 2.819 3.119 3.505 3.792 23 0.127 0.256 0.390 0.532 0.685 0.858 1.060 1.319 1.714 1.770 1.832 1.900 1.978 2.069 2.177 2.313 2.500 2.807 3.104 3.485 3.768 24 0.127 0.256 0.390 0.531 0.685 0.857 1.059 1.318 1.711 1.767 1.828 1.896 1.974 2.064 2.172 2.307 2.492 2.797 3.091 3.467 3.745 25 0.127 0.256 0.390 0.531 0.684 0.856 1.058 1.316 1.708 1.764 1.825 1.893 1.970 2.060 2.167 2.301 2.485 2.787 3.078 3.450 3.725 26 0.127 0.256 0.390 0.531 0.684 0.856 1.058 1.315 1.706 1.761 1.822 1.890 1.967 2.056 2.162 2.296 2.479 2.779 3.067 3.435 3.707 27 0.127 0.256 0.389 0.531 0.684 0.855 1.057 1.314 1.703 1.758 1.819 1.887 1.963 2.052 2.158 2.291 2.473 2.771 3.057 3.421 3.690 28 0.127 0.256 0.389 0.530 0.683 0.855 1.056 1.313 1.701 1.756 1.817 1.884 1.960 2.048 2.154 2.286 2.467 2.763 3.047 3.408 3.674 29 0.127 0.256 0.389 0.530 0.683 0.854 1.055 1.311 1.699 1.754 1.814 1.881 1.957 2.045 2.150 2.282 2.462 2.756 3.038 3.396 3.659 30 0.127 0.256 0.389 0.530 0.683 0.854 1.055 1.310 1.697 1.752 1.812 1.879 1.955 2.042 2.147 2.278 2.457 2.750 3.030 3.385 3.646 35 0.127 0.255 0.388 0.529 0.682 0.852 1.052 1.306 1.690 1.744 1.803 1.869 1.944 2.030 2.133 2.262 2.438 2.724 2.996 3.340 3.591 40 0.126 0.255 0.388 0.529 0.681 0.851 1.050 1.303 1.684 1.737 1.796 1.862 1.936 2.021 2.123 2.250 2.423 2.704 2.971 3.307 3.551 50 0.126 0.255 0.388 0.528 0.679 0.849 1.047 1.299 1.676 1.729 1.787 1.852 1.924 2.009 2.109 2.234 2.403 2.678 2.937 3.261 3.496 60 0.126 0.254 0.387 0.527 0.679 0.848 1.045 1.296 1.671 1.723 1.781 1.845 1.917 2.000 2.099 2.223 2.390 2.660 2.915 3.232 3.460 120 0.126 0.254 0.386 0.526 0.677 0.845 1.041 1.289 1.658 1.709 1.766 1.828 1.899 1.980 2.076 2.196 2.358 2.617 2.860 3.160 3.373 Tabela 2: Quantis da Distribui¸c˜ao t. Graus de liberdade na margem esquerda da tabela e probabilidades p dadas no topo da tabela tal que p 2 = P[t ≥ tt]. 2 Distribui¸c˜ao χ2 p χt 2 χ2 99% 98% 97.5% 95% 90% 80% 70% 60% 50% 40% 30% 20% 10% 5% 4% 2.5% 2% 1% 0.2% 0.1% 1 0.000 0.001 0.001 0.004 0.016 0.064 0.148 0.275 0.455 0.708 1.074 1.642 2.706 3.841 4.218 5.024 5.412 6.635 9.550 10.828 2 0.020 0.040 0.051 0.103 0.211 0.446 0.713 1.022 1.386 1.833 2.408 3.219 4.605 5.991 6.438 7.378 7.824 9.210 12.429 13.816 3 0.115 0.185 0.216 0.352 0.584 1.005 1.424 1.869 2.366 2.946 3.665 4.642 6.251 7.815 8.311 9.348 9.837 11.345 14.796 16.266 4 0.297 0.429 0.484 0.711 1.064 1.649 2.195 2.753 3.357 4.045 4.878 5.989 7.779 9.488 10.026 11.143 11.668 13.277 16.924 18.467 5 0.554 0.752 0.831 1.145 1.610 2.343 3.000 3.655 4.351 5.132 6.064 7.289 9.236 11.070 11.644 12.833 13.388 15.086 18.907 20.515 6 0.872 1.134 1.237 1.635 2.204 3.070 3.828 4.570 5.348 6.211 7.231 8.558 10.645 12.592 13.198 14.449 15.033 16.812 20.791 22.458 7 1.239 1.564 1.690 2.167 2.833 3.822 4.671 5.493 6.346 7.283 8.383 9.803 12.017 14.067 14.703 16.013 16.622 18.475 22.601 24.322 8 1.646 2.032 2.180 2.733 3.490 4.594 5.527 6.423 7.344 8.351 9.524 11.030 13.362 15.507 16.171 17.535 18.168 20.090 24.352 26.124 9 2.088 2.532 2.700 3.325 4.168 5.380 6.393 7.357 8.343 9.414 10.656 12.242 14.684 16.919 17.608 19.023 19.679 21.666 26.056 27.877 10 2.558 3.059 3.247 3.940 4.865 6.179 7.267 8.295 9.342 10.473 11.781 13.442 15.987 18.307 19.021 20.483 21.161 23.209 27.722 29.588 11 3.053 3.609 3.816 4.575 5.578 6.989 8.148 9.237 10.341 11.530 12.899 14.631 17.275 19.675 20.412 21.920 22.618 24.725 29.354 31.264 12 3.571 4.178 4.404 5.226 6.304 7.807 9.034 10.182 11.340 12.584 14.011 15.812 18.549 21.026 21.785 23.337 24.054 26.217 30.957 32.909 13 4.107 4.765 5.009 5.892 7.042 8.634 9.926 11.129 12.340 13.636 15.119 16.985 19.812 22.362 23.142 24.736 25.472 27.688 32.535 34.528 14 4.660 5.368 5.629 6.571 7.790 9.467 10.821 12.078 13.339 14.685 16.222 18.151 21.064 23.685 24.485 26.119 26.873 29.141 34.091 36.123 15 5.229 5.985 6.262 7.261 8.547 10.307 11.721 13.030 14.339 15.733 17.322 19.311 22.307 24.996 25.816 27.488 28.259 30.578 35.628 37.697 16 5.812 6.614 6.908 7.962 9.312 11.152 12.624 13.983 15.338 16.780 18.418 20.465 23.542 26.296 27.136 28.845 29.633 32.000 37.146 39.252 17 6.408 7.255 7.564 8.672 10.085 12.002 13.531 14.937 16.338 17.824 19.511 21.615 24.769 27.587 28.445 30.191 30.995 33.409 38.648 40.790 18 7.015 7.906 8.231 9.390 10.865 12.857 14.440 15.893 17.338 18.868 20.601 22.760 25.989 28.869 29.745 31.526 32.346 34.805 40.136 42.312 19 7.633 8.567 8.907 10.117 11.651 13.716 15.352 16.850 18.338 19.910 21.689 23.900 27.204 30.144 31.037 32.852 33.687 36.191 41.610 43.820 20 8.260 9.237 9.591 10.851 12.443 14.578 16.266 17.809 19.337 20.951 22.775 25.038 28.412 31.410 32.321 34.170 35.020 37.566 43.072 45.315 21 8.897 9.915 10.283 11.591 13.240 15.445 17.182 18.768 20.337 21.991 23.858 26.171 29.615 32.671 33.597 35.479 36.343 38.932 44.522 46.797 22 9.542 10.600 10.982 12.338 14.041 16.314 18.101 19.729 21.337 23.031 24.939 27.301 30.813 33.924 34.867 36.781 37.659 40.289 45.962 48.268 23 10.196 11.293 11.689 13.091 14.848 17.187 19.021 20.690 22.337 24.069 26.018 28.429 32.007 35.172 36.131 38.076 38.968 41.638 47.391 49.728 24 10.856 11.992 12.401 13.848 15.659 18.062 19.943 21.652 23.337 25.106 27.096 29.553 33.196 36.415 37.389 39.364 40.270 42.980 48.812 51.179 25 11.524 12.697 13.120 14.611 16.473 18.940 20.867 22.616 24.337 26.143 28.172 30.675 34.382 37.652 38.642 40.646 41.566 44.314 50.223 52.620 26 12.198 13.409 13.844 15.379 17.292 19.820 21.792 23.579 25.336 27.179 29.246 31.795 35.563 38.885 39.889 41.923 42.856 45.642 51.627 54.052 27 12.879 14.125 14.573 16.151 18.114 20.703 22.719 24.544 26.336 28.214 30.319 32.912 36.741 40.113 41.132 43.195 44.140 46.963 53.023 55.476 28 13.565 14.847 15.308 16.928 18.939 21.588 23.647 25.509 27.336 29.249 31.391 34.027 37.916 41.337 42.370 44.461 45.419 48.278 54.411 56.892 29 14.256 15.574 16.047 17.708 19.768 22.475 24.577 26.475 28.336 30.283 32.461 35.139 39.087 42.557 43.604 45.722 46.693 49.588 55.792 58.301 30 14.953 16.306 16.791 18.493 20.599 23.364 25.508 27.442 29.336 31.316 33.530 36.250 40.256 43.773 44.834 46.979 47.962 50.892 57.167 59.703 35 18.509 20.027 20.569 22.465 24.797 27.836 30.178 32.282 34.336 36.475 38.859 41.778 46.059 49.802 50.928 53.203 54.244 57.342 63.955 66.619 40 22.164 23.838 24.433 26.509 29.051 32.345 34.872 37.134 39.335 41.622 44.165 47.269 51.805 55.758 56.946 59.342 60.436 63.691 70.618 73.402 45 25.901 27.720 28.366 30.612 33.350 36.884 39.585 41.995 44.335 46.761 49.452 52.729 57.505 61.656 62.901 65.410 66.555 69.957 77.179 80.077 50 29.707 31.664 32.357 34.764 37.689 41.449 44.313 46.864 49.335 51.892 54.723 58.164 63.167 67.505 68.804 71.420 72.613 76.154 83.657 86.661 Tabela 3: Quantis da Distribui¸c˜ao χ2. Graus de liberdade na margem esquerda da tabela e probabilidades p dadas no topo da tabela tal que p = P[χ2 ≥ χ2 t]. 3 Distribui¸c˜ao F de Snedecor a 10% (p=0.10) p=0,10 F Ft 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 18 20 30 40 60 120 2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38 9.39 9.40 9.41 9.41 9.42 9.42 9.43 9.44 9.44 9.46 9.47 9.47 9.48 3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24 5.23 5.22 5.22 5.21 5.20 5.20 5.20 5.19 5.18 5.17 5.16 5.15 5.14 4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94 3.92 3.91 3.90 3.89 3.88 3.87 3.86 3.85 3.84 3.82 3.80 3.79 3.78 5 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32 3.30 3.28 3.27 3.26 3.25 3.24 3.23 3.22 3.21 3.17 3.16 3.14 3.12 6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96 2.94 2.92 2.90 2.89 2.88 2.87 2.86 2.85 2.84 2.80 2.78 2.76 2.74 7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72 2.70 2.68 2.67 2.65 2.64 2.63 2.62 2.61 2.59 2.56 2.54 2.51 2.49 8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56 2.54 2.52 2.50 2.49 2.48 2.46 2.45 2.44 2.42 2.38 2.36 2.34 2.32 9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44 2.42 2.40 2.38 2.36 2.35 2.34 2.33 2.31 2.30 2.25 2.23 2.21 2.18 10 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35 2.32 2.30 2.28 2.27 2.26 2.24 2.23 2.22 2.20 2.16 2.13 2.11 2.08 11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27 2.25 2.23 2.21 2.19 2.18 2.17 2.16 2.14 2.12 2.08 2.05 2.03 2.00 12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21 2.19 2.17 2.15 2.13 2.12 2.10 2.09 2.08 2.06 2.01 1.99 1.96 1.93 13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16 2.14 2.12 2.10 2.08 2.07 2.05 2.04 2.02 2.01 1.96 1.93 1.90 1.88 14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12 2.10 2.07 2.05 2.04 2.02 2.01 2.00 1.98 1.96 1.91 1.89 1.86 1.83 15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09 2.06 2.04 2.02 2.00 1.99 1.97 1.96 1.94 1.92 1.87 1.85 1.82 1.79 16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06 2.03 2.01 1.99 1.97 1.95 1.94 1.93 1.91 1.89 1.84 1.81 1.78 1.75 17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03 2.00 1.98 1.96 1.94 1.93 1.91 1.90 1.88 1.86 1.81 1.78 1.75 1.72 18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00 1.98 1.95 1.93 1.92 1.90 1.89 1.87 1.85 1.84 1.78 1.75 1.72 1.69 19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98 1.96 1.93 1.91 1.89 1.88 1.86 1.85 1.83 1.81 1.76 1.73 1.70 1.67 20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96 1.94 1.91 1.89 1.87 1.86 1.84 1.83 1.81 1.79 1.74 1.71 1.68 1.64 21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95 1.92 1.90 1.87 1.86 1.84 1.83 1.81 1.79 1.78 1.72 1.69 1.66 1.62 22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93 1.90 1.88 1.86 1.84 1.83 1.81 1.80 1.78 1.76 1.70 1.67 1.64 1.60 23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92 1.89 1.87 1.84 1.83 1.81 1.80 1.78 1.76 1.74 1.69 1.66 1.62 1.59 24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91 1.88 1.85 1.83 1.81 1.80 1.78 1.77 1.75 1.73 1.67 1.64 1.61 1.57 25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89 1.87 1.84 1.82 1.80 1.79 1.77 1.76 1.74 1.72 1.66 1.63 1.59 1.56 26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88 1.86 1.83 1.81 1.79 1.77 1.76 1.75 1.72 1.71 1.65 1.61 1.58 1.54 27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87 1.85 1.82 1.80 1.78 1.76 1.75 1.74 1.71 1.70 1.64 1.60 1.57 1.53 28 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.74 1.73 1.70 1.69 1.63 1.59 1.56 1.52 29 2.89 2.50 2.28 2.15 2.06 1.99 1.93 1.89 1.86 1.83 1.80 1.78 1.76 1.75 1.73 1.72 1.69 1.68 1.62 1.58 1.55 1.51 30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85 1.82 1.79 1.77 1.75 1.74 1.72 1.71 1.69 1.67 1.61 1.57 1.54 1.50 40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79 1.76 1.74 1.71 1.70 1.68 1.66 1.65 1.62 1.61 1.54 1.51 1.47 1.42 60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74 1.71 1.68 1.66 1.64 1.62 1.60 1.59 1.56 1.54 1.48 1.44 1.40 1.35 120 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68 1.65 1.63 1.60 1.58 1.56 1.55 1.53 1.50 1.48 1.41 1.37 1.32 1.26 Tabela 4: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 10. Graus de liberdade do numerador no topo e do denominador na margem esquerda. 4 Distribui¸c˜ao F de Snedecor a 5% (p=0.05) p=0,05 F Ft 1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 30 40 60 120 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.42 19.43 19.43 19.44 19.45 19.46 19.47 19.48 19.49 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.71 8.70 8.69 8.67 8.66 8.62 8.59 8.57 8.55 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.87 5.86 5.84 5.82 5.80 5.75 5.72 5.69 5.66 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.64 4.62 4.60 4.58 4.56 4.50 4.46 4.43 4.40 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.96 3.94 3.92 3.90 3.87 3.81 3.77 3.74 3.70 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.53 3.51 3.49 3.47 3.44 3.38 3.34 3.30 3.27 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.24 3.22 3.20 3.17 3.15 3.08 3.04 3.01 2.97 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.03 3.01 2.99 2.96 2.94 2.86 2.83 2.79 2.75 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.86 2.85 2.83 2.80 2.77 2.70 2.66 2.62 2.58 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.74 2.72 2.70 2.67 2.65 2.57 2.53 2.49 2.45 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 2.64 2.62 2.60 2.57 2.54 2.47 2.43 2.38 2.34 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60 2.55 2.53 2.51 2.48 2.46 2.38 2.34 2.30 2.25 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.48 2.46 2.44 2.41 2.39 2.31 2.27 2.22 2.18 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.42 2.40 2.38 2.35 2.33 2.25 2.20 2.16 2.11 16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.37 2.35 2.33 2.30 2.28 2.19 2.15 2.11 2.06 17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 2.33 2.31 2.29 2.26 2.23 2.15 2.10 2.06 2.01 18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.29 2.27 2.25 2.22 2.19 2.11 2.06 2.02 1.97 19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.26 2.23 2.21 2.18 2.16 2.07 2.03 1.98 1.93 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.22 2.20 2.18 2.15 2.12 2.04 1.99 1.95 1.90 21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.20 2.18 2.16 2.12 2.10 2.01 1.96 1.92 1.87 22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.17 2.15 2.13 2.10 2.07 1.98 1.94 1.89 1.84 23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.15 2.13 2.11 2.08 2.05 1.96 1.91 1.86 1.81 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.13 2.11 2.09 2.05 2.03 1.94 1.89 1.84 1.79 25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.11 2.09 2.07 2.04 2.01 1.92 1.87 1.82 1.77 26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.09 2.07 2.05 2.02 1.99 1.90 1.85 1.80 1.75 27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.08 2.06 2.04 2.00 1.97 1.88 1.84 1.79 1.73 28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.06 2.04 2.02 1.99 1.96 1.87 1.82 1.77 1.71 29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.05 2.03 2.01 1.97 1.94 1.85 1.81 1.75 1.70 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 2.04 2.01 1.99 1.96 1.93 1.84 1.79 1.74 1.68 40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.95 1.92 1.90 1.87 1.84 1.74 1.69 1.64 1.58 60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 1.86 1.84 1.82 1.78 1.75 1.65 1.59 1.53 1.47 120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.83 1.78 1.75 1.73 1.69 1.66 1.55 1.50 1.43 1.35 Tabela 5: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 05. Graus de liberdade do numerador dado no topo e do denominador na margem esquerda. 5 Distribui¸c˜ao F de Snedecor a 2,5% (p=0.025) p=0,025 F Ft 1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 30 40 60 120 2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.41 39.43 39.43 39.44 39.44 39.45 39.46 39.47 39.48 39.49 3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.34 14.28 14.25 14.23 14.20 14.17 14.08 14.04 13.99 13.95 4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.75 8.68 8.66 8.63 8.59 8.56 8.46 8.41 8.36 8.31 5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.52 6.46 6.43 6.40 6.36 6.33 6.23 6.18 6.12 6.07 6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.37 5.30 5.27 5.24 5.20 5.17 5.07 5.01 4.96 4.90 7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.67 4.60 4.57 4.54 4.50 4.47 4.36 4.31 4.25 4.20 8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.20 4.13 4.10 4.08 4.03 4.00 3.89 3.84 3.78 3.73 9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.87 3.80 3.77 3.74 3.70 3.67 3.56 3.51 3.45 3.39 10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.62 3.55 3.52 3.50 3.45 3.42 3.31 3.26 3.20 3.14 11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.43 3.36 3.33 3.30 3.26 3.23 3.12 3.06 3.00 2.94 12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.28 3.21 3.18 3.15 3.11 3.07 2.96 2.91 2.85 2.79 13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.15 3.08 3.05 3.03 2.98 2.95 2.84 2.78 2.72 2.66 14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.05 2.98 2.95 2.92 2.88 2.84 2.73 2.67 2.61 2.55 15 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 2.96 2.89 2.86 2.84 2.79 2.76 2.64 2.59 2.52 2.46 16 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.89 2.82 2.79 2.76 2.72 2.68 2.57 2.51 2.45 2.38 17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.82 2.75 2.72 2.70 2.65 2.62 2.50 2.44 2.38 2.32 18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.77 2.70 2.67 2.64 2.60 2.56 2.44 2.38 2.32 2.26 19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.72 2.65 2.62 2.59 2.55 2.51 2.39 2.33 2.27 2.20 20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.68 2.60 2.57 2.55 2.50 2.46 2.35 2.29 2.22 2.16 21 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80 2.73 2.64 2.56 2.53 2.51 2.46 2.42 2.31 2.25 2.18 2.11 22 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70 2.60 2.53 2.50 2.47 2.43 2.39 2.27 2.21 2.14 2.08 23 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81 2.73 2.67 2.57 2.50 2.47 2.44 2.39 2.36 2.24 2.18 2.11 2.04 24 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64 2.54 2.47 2.44 2.41 2.36 2.33 2.21 2.15 2.08 2.01 25 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 2.51 2.44 2.41 2.38 2.34 2.30 2.18 2.12 2.05 1.98 26 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59 2.49 2.42 2.39 2.36 2.31 2.28 2.16 2.09 2.03 1.95 27 5.63 4.24 3.65 3.31 3.08 2.92 2.80 2.71 2.63 2.57 2.47 2.39 2.36 2.34 2.29 2.25 2.13 2.07 2.00 1.93 28 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55 2.45 2.37 2.34 2.32 2.27 2.23 2.11 2.05 1.98 1.91 29 5.59 4.20 3.61 3.27 3.04 2.88 2.76 2.67 2.59 2.53 2.43 2.36 2.32 2.30 2.25 2.21 2.09 2.03 1.96 1.89 30 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.41 2.34 2.31 2.28 2.23 2.20 2.07 2.01 1.94 1.87 40 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.29 2.21 2.18 2.15 2.11 2.07 1.94 1.88 1.80 1.72 60 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 2.17 2.09 2.06 2.03 1.98 1.94 1.82 1.74 1.67 1.58 120 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16 2.05 1.98 1.94 1.92 1.87 1.82 1.69 1.61 1.53 1.43 Tabela 6: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 025. Graus de liberdade do numerador dado no topo e do denominador na margem esquerda. 6 Distribui¸c˜ao F de Snedecor a 1% (p=0.01) p=0,01 F Ft 1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 30 40 60 120 2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.42 99.43 99.43 99.44 99.44 99.45 99.47 99.47 99.48 99.49 3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.05 26.92 26.87 26.83 26.75 26.69 26.50 26.41 26.32 26.22 4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.37 14.25 14.20 14.15 14.08 14.02 13.84 13.75 13.65 13.56 5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.89 9.77 9.72 9.68 9.61 9.55 9.38 9.29 9.20 9.11 6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.60 7.56 7.52 7.45 7.40 7.23 7.14 7.06 6.97 7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.36 6.31 6.28 6.21 6.16 5.99 5.91 5.82 5.74 8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.56 5.52 5.48 5.41 5.36 5.20 5.12 5.03 4.95 9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 5.01 4.96 4.92 4.86 4.81 4.65 4.57 4.48 4.40 10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.60 4.56 4.52 4.46 4.41 4.25 4.17 4.08 4.00 11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.29 4.25 4.21 4.15 4.10 3.94 3.86 3.78 3.69 12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.05 4.01 3.97 3.91 3.86 3.70 3.62 3.54 3.45 13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.86 3.82 3.78 3.72 3.66 3.51 3.43 3.34 3.25 14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.80 3.70 3.66 3.62 3.56 3.51 3.35 3.27 3.18 3.09 15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 3.56 3.52 3.49 3.42 3.37 3.21 3.13 3.05 2.96 16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 3.45 3.41 3.37 3.31 3.26 3.10 3.02 2.93 2.84 17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 3.35 3.31 3.27 3.21 3.16 3.00 2.92 2.83 2.75 18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.27 3.23 3.19 3.13 3.08 2.92 2.84 2.75 2.66 19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 3.19 3.15 3.12 3.05 3.00 2.84 2.76 2.67 2.58 20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.13 3.09 3.05 2.99 2.94 2.78 2.69 2.61 2.52 21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.17 3.07 3.03 2.99 2.93 2.88 2.72 2.64 2.55 2.46 22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 3.02 2.98 2.94 2.88 2.83 2.67 2.58 2.50 2.40 23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.07 2.97 2.93 2.89 2.83 2.78 2.62 2.54 2.45 2.35 24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.93 2.89 2.85 2.79 2.74 2.58 2.49 2.40 2.31 25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.89 2.85 2.81 2.75 2.70 2.54 2.45 2.36 2.27 26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.86 2.81 2.78 2.72 2.66 2.50 2.42 2.33 2.23 27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.93 2.82 2.78 2.75 2.68 2.63 2.47 2.38 2.29 2.20 28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 2.79 2.75 2.72 2.65 2.60 2.44 2.35 2.26 2.17 29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.77 2.73 2.69 2.63 2.57 2.41 2.33 2.23 2.14 30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.74 2.70 2.66 2.60 2.55 2.39 2.30 2.21 2.11 40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.56 2.52 2.48 2.42 2.37 2.20 2.11 2.02 1.92 60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.39 2.35 2.31 2.25 2.20 2.03 1.94 1.84 1.73 120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.23 2.19 2.15 2.09 2.03 1.86 1.76 1.66 1.53 Tabela 7: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 01. Graus de liberdade do numerador dado no topo e do denominador na margem esquerda. 7 Distribui¸c˜ao F de Snedecor a 0,5% (p=0.005) p=0,005 F Ft 1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 30 40 60 120 2 198.50 199.00 199.17 199.25 199.30 199.33 199.36 199.37 199.39 199.40 199.42 199.43 199.43 199.44 199.44 199.45 199.47 199.47 199.48 199.49 3 55.55 49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88 43.69 43.39 43.17 43.08 43.01 42.88 42.78 42.47 42.31 42.15 41.99 4 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14 20.97 20.70 20.51 20.44 20.37 20.26 20.17 19.89 19.75 19.61 19.47 5 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62 13.38 13.21 13.15 13.09 12.98 12.90 12.66 12.53 12.40 12.27 6 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25 10.03 9.88 9.81 9.76 9.66 9.59 9.36 9.24 9.12 9.00 7 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38 8.18 8.03 7.97 7.91 7.83 7.75 7.53 7.42 7.31 7.19 8 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21 7.01 6.87 6.81 6.76 6.68 6.61 6.40 6.29 6.18 6.06 9 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42 6.23 6.09 6.03 5.98 5.90 5.83 5.62 5.52 5.41 5.30 10 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85 5.66 5.53 5.47 5.42 5.34 5.27 5.07 4.97 4.86 4.75 11 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42 5.24 5.10 5.05 5.00 4.92 4.86 4.65 4.55 4.45 4.34 12 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09 4.91 4.77 4.72 4.67 4.59 4.53 4.33 4.23 4.12 4.01 13 11.37 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.82 4.64 4.51 4.46 4.41 4.33 4.27 4.07 3.97 3.87 3.76 14 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60 4.43 4.30 4.25 4.20 4.12 4.06 3.86 3.76 3.66 3.55 15 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42 4.25 4.12 4.07 4.02 3.95 3.88 3.69 3.58 3.48 3.37 16 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.27 4.10 3.97 3.92 3.87 3.80 3.73 3.54 3.44 3.33 3.22 17 10.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.14 3.97 3.84 3.79 3.75 3.67 3.61 3.41 3.31 3.21 3.10 18 10.22 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.03 3.86 3.73 3.68 3.64 3.56 3.50 3.30 3.20 3.10 2.99 19 10.07 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.93 3.76 3.64 3.59 3.54 3.46 3.40 3.21 3.11 3.00 2.89 20 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85 3.68 3.55 3.50 3.46 3.38 3.32 3.12 3.02 2.92 2.81 21 9.83 6.89 5.73 5.09 4.68 4.39 4.18 4.01 3.88 3.77 3.60 3.48 3.43 3.38 3.31 3.24 3.05 2.95 2.84 2.73 22 9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.70 3.54 3.41 3.36 3.31 3.24 3.18 2.98 2.88 2.77 2.66 23 9.63 6.73 5.58 4.95 4.54 4.26 4.05 3.88 3.75 3.64 3.47 3.35 3.30 3.25 3.18 3.12 2.92 2.82 2.71 2.60 24 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59 3.42 3.30 3.25 3.20 3.12 3.06 2.87 2.77 2.66 2.55 25 9.48 6.60 5.46 4.84 4.43 4.15 3.94 3.78 3.64 3.54 3.37 3.25 3.20 3.15 3.08 3.01 2.82 2.72 2.61 2.50 26 9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.49 3.33 3.20 3.15 3.11 3.03 2.97 2.77 2.67 2.56 2.45 27 9.34 6.49 5.36 4.74 4.34 4.06 3.85 3.69 3.56 3.45 3.28 3.16 3.11 3.07 2.99 2.93 2.73 2.63 2.52 2.41 28 9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.41 3.25 3.12 3.07 3.03 2.95 2.89 2.69 2.59 2.48 2.37 29 9.23 6.40 5.28 4.66 4.26 3.98 3.77 3.61 3.48 3.38 3.21 3.09 3.04 2.99 2.92 2.86 2.66 2.56 2.45 2.33 30 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34 3.18 3.06 3.01 2.96 2.89 2.82 2.63 2.52 2.42 2.30 40 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12 2.95 2.83 2.78 2.74 2.66 2.60 2.40 2.30 2.18 2.06 60 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90 2.74 2.62 2.57 2.53 2.45 2.39 2.19 2.08 1.96 1.83 120 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71 2.54 2.42 2.37 2.33 2.25 2.19 1.98 1.87 1.75 1.61 Tabela 8: Quantis da Distribui¸c˜ao F para probabilidade p = P[F ≥ Ft] = 0, 005. Graus de liberdade do numerador dado no topo e do denominador na margem esquerda. 8 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Análise bidimensional Frequentemente, estamos interessados em analisar o comportamento conjunto de duas ou mais variá- veis aleatórias. Quando consideramos duas variáveis aleatórias, podemos ter três situações: • as duas variáveis são qualitativas; • as duas variáveis são quantitativas; • uma variável é qualitativa e outra é quantitativa. As técnicas de análise de dados nas três situações são diferentes. Quando as duas variáveis são qua- litativas, os dados são resumidos em tabelas de dupla entrada onde aparecerão as frequências absolutas ou contagem de indivíduos que pertencem simultaneamente as categorias de uma e outra variável. Variáveis Qualitativas Exemplo: Suponha que queremos analisar o comportamento conjunto das variáveis sexo do aluno (X) e curso escolhido (Y ). A distribuição de frequências é representada por uma tabela de dupla entrada: Y|X Masculino Feminino Total Economia 85 35 120 Administração 55 25 80 Total 140 60 200 Além das frequências absolutas, podemos construir tabelas com as frequências relativas. Existem três possibilidades de expressarmos a proporção: (a) em relação ao total geral; (b) em relação ao total de cada linha; (c) em relação ao total de cada coluna. De acordo com o objetivo do problema em estudo, uma delas será mais conveniente. A comparação entre duas variáveis pode ser visualizada através de um gráfico de barras com a frequên- cia por sexo, dividindo de acordo com o curso. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 1 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Associação entre variáveis qualitativas De forma prática, podemos entender a existência de associação entre duas variáveis como a mudança de comportamento de uma variável na presença ou não de informação sobre a segunda variável. Um dos principais objetivos de se construir uma distribuição conjunta de duas variáveis qualitativas é descrever a associação entre elas, isto é, queremos conhecer o grau de dependência entre elas, de modo que possamos prever melhor o resultado de uma delas quando conhecermos a realização da outra. Exemplos: (a) Se quisermos estimar qual a renda de uma família de São Paulo, a informação adicional sobre a classe social a que ela pertence nos permite estimar com maior precisão essa renda, pois sabemos que existe uma dependência entre as duas variáveis: renda familiar e classe social. (b) Suponha que queremos adivinhar o sexo da pessoa sorteada aleatoriamente em São Paulo. Como a proporção de cada sexo é muito próxima, o resultados poderia ser qualquer um dos sexos. Agora, se dissessemos que a pessoa sorteada trabalha na indústria siderúrgica, então nossa resposta mais provável seria que a pessoa sorteada é do sexo masculino. Ou seja, há um grau de dependência grande entre as variáveis sexo e ramo de atividade. Voltando ao exemplo anterior, queremos verificar se existe ou não associação entre o sexo e a carreira escolhida por 200 alunos de Economia e Administração. Y|X Masculino Feminino Total Economia 85 35 120 Administração 55 25 80 Total 140 60 200 Por causa da diferença entre os totais marginais, é difícil tirar alguma conclusão. Por isso, devemos construir proporções segundo as linhas ou as colunas para podermos fazer comparações. Y|X Masculino Feminino Total Economia 85 (61%) 35 (58%) 120 (60%) Administração 55 (39%) 25 (42%) 80 (40%) Total 140 (100%) 60 (100%) 200 (100%) A partir da tabela acima, podemos observar que, independente do sexo, 60% das pessoas preferem Economia e 40% preferem Administração. Não havendo dependência entre as variáveis, esperaríamos es- sas mesmas proporções para cada sexo. Observando a tabela, vemos que a proporção do sexo masculino (61% e 39%) e do sexo feminino (58% e 42%) são próximas das marginais (60% e 40%). Esses resultados parecem indicar não haver dependência entre as duas variáveis, para o conjunto de alunos considerados. Então, nesse caso, as variáveis Sexo e Escolha do curso parecem ser não-associadas. Considere agora que queremos verificar se existe ou não associação entre o sexo e a carreira escolhida por 200 alunos de Física e Ciências Sociais. Y|X Masculino Feminino Total Física 100 (71%) 20 (33%) 120 (60%) Ciências Sociais 40 (29%) 40 (67%) 80 (40%) Total 140 (100%) 60 (100%) 200 (100%) Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 2 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Comparando a distribuição das proporções pelos cursos, independente do sexo, com as distribuições diferenciadas por sexo, observamos uma disparidade bem acentuada nas proporções. Parece haver maior concentração de homens no curso de Física e de mulheres no curso de Ciências Sociais. Portanto, nesse caso, as variáveis sexo e curso escolhido parecem ser associadas. Teste Qui-Quadrado A seguir, vamos estudar o Teste χ2 de Pearson, que é o teste utilizado para verificar se há associação entre duas variáveis aleatórias qualitativas. Considere o seguinte exemplo: Queremos verificar se a criação de determinado tipo de cooperativa está associada com algum fator regional. Tipo de Cooperativa Estado Consumidor Produtor Escola Outras Total São Paulo 214 (33%) 237 (37%) 78 (12%) 119 (18%) 648 (100%) Paraná 51 (17%) 102 (34%) 126 (42%) 22 (7%) 301 (100%) Rio Grande do Sul 111 (18%) 304 (51%) 139 (23%) 48 (8%) 602 (100%) Total 376 (24%) 643 (42%) 343 (22%) 189 (12%) 1551 (100%) A análise da tabela mostra a existência de certa dependência entre as variáveis. Caso não houvesse associação, esperaríamos que em cada estado tivessemos 24% de cooperativa de consumidores, 42% de cooperativa de produtores, 22% de escolas e 12% de outros tipos. Então, por exemplo, o número espe- rado de cooperativas de consumidores no estado de São Paulo seria 648 × 0, 24 = 156 e no Paraná seria 301 × 0, 24 = 72. A Tabela a seguir apresenta os valores esperados assumindo independência entre as duas variáveis. Tipo de Cooperativa Estado Consumidor Produtor Escola Outras Total São Paulo 156 (24%) 272 (42%) 142 (22%) 78 (12%) 648 (100%) Paraná 72 (24%) 127 (42%) 66 (22%) 36 (12%) 301 (100%) Rio Grande do Sul 144 (24%) 254 (42%) 132 (22%) 72 (12%) 602 (100%) Total 376 (24%) 643 (42%) 343 (22%) 189 (12%) 1551 (100%) A diferença entre os valores observados e os valores esperados são dados por: Tipo de Cooperativa Estado Consumidor Produtor Escola Outras São Paulo 58 -35 -64 41 Paraná -21 -25 60 -14 Rio Grande do Sul -33 50 7 -24 Note que: (a) A soma total dos resíduos é nula. (b) A casela Escola-São Paulo é a que apresenta maior desvio da suposição de não associação (-64). Nessa casela esperávamos 142 casos; a casela Escola-Paraná também tem um alto desvio (60), mas o valor esperado é bem menor (66). Assim, devemos considerar os desvios-relativos. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 3 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Levando em conta (a) e (b), podemos construir, para cada casela, a medida \(\frac{(O_i – e_i)^2}{e_i}\) (1) onde \(O_i\) é o valor observado e \(e_i\) é o valor esperado. Uma medida do afastamento global pode ser dada pela soma de todas as medidas (1). Essa medida é denominada \(\chi^2\) de Pearson. Calculando (1) para cada casela do exemplo, encontramos: Tipo de Cooperativa Estado Consumidor Produtor Escola Outras São Paulo 21,56 4,50 28,84 21,55 Paraná 6,12 4,92 54,54 5,44 Rio Grande do Sul 7,56 9,84 0,37 8,00 Teríamos então \(Q_{obs}^2 = 21,56 + 6,12 + · · · + 54,44 + 8,00 = 173,24\) Um valor grande de \(Q_{obs}^2\) indica associação entre variáveis, o que parece ser o caso. Afim de rejeitar e/ou não rejeitar a Hipótese nula, devemos compará-la com a Distribuição Qui-Quadrado com \((s − 1)(r − 1)\) graus de liberdade. Neste caso, \(\chi_{\alpha,(s−1)(r−1)}^2 = \chi_{5%;6}^2 = 12,592.\) Como \(Q_{obs}^2 > \chi^2,\) podemos concluir que há associação entre as variáveis. Se \(Q_{obs}^2 < \chi^2,\) concluímos que não há associação entre as variáveis. Fórmula Geral X\|Y B_1 B_2 ⋯ B_j ⋯ B_s Total A_1 n_11 n_12 ⋯ n_1j ⋯ n_1s n_1• A_2 n_21 n_22 ⋯ n_2j ⋯ n_2s n_2• ⋮ ⋮ A_i n_i1 n_i2 ⋯ n_ij ⋯ n_is n_i• ⋮ ⋮ A_r n_r1 n_r2 ⋯ n_rj ⋯ n_rs n_r• Total n_•1 n_•2 ⋯ n_•j ⋯ n_•s n_•• Suponha que temos duas variáveis qualitativas \(X\ e\ Y\), classificadas em \(r\) categorias \(A_1,\ ⋯ ,\ A_r,\) para \(X\) e categorias \(B_1,⋯,B_s,\para Y\). Na tabela, temos: \(n_{ij}:\) número de elementos pertencentes à i-ésima categoria de \(X\) e j-ésima categoria de \(Y.\) \(n_{i•} = \sum_{j=1}^{s} n_{ij}:\) número de elementos da i-ésima categoria de \(X.\) \(n_{•j} = \sum_{i=1}^{r} n_{ij}:\) número de elementos da j-ésima categoria de \(Y.\) \(n_{••} = \sum_{i=1}^{r}\sum_{j=1}^{s} n_{ij}:\) número total de elementos. Área 1 USP – Lorena Recepção Rua/habita – Lorena, Km 7,45 – Caixa Postal 116 Área II Pólo Urbo-Industrial A16 – Caixa Postal 16 CEP 12603-710 Lorena – SP Fax (12) 3159 – 3086 Tel. (Direto) (12) 3159-5194/3153-3209 www.eel.usp.br 4 / 8 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Sob a hipótese de que as variáveis X e Y não sejam associadas, temos que \(n_{ij}^* = \frac{n_{i.}n_{.j}}{n} \quad i = 1, \ldots , r \quad e \quad j = 1, \ldots , s. \) ou, equivalentemente, \(f_{ij} = f_{i.}f_{.j}, \quad i = 1, \ldots , r \quad e \quad j = 1, \ldots , s. \) Denotando por \(n_{ij}^*\) os valores esperados e \(n_{ij}\) os valores observados, temos que a estatística observada é dada por: \(Q_{obs}^2 = \sum_{{i=1}}^{r}\sum_{{j=1}}^{s}\frac {(n_{ij}−n_{ij}^*)^2}{n_{ij}^*}\) ou, em termos de frequências relativas, \(Q_{obs}^2 = \sum_{{i=1}}^{r}\sum_{{j=1}}^{s}\frac{(f_{ij}−f_{ij}^*)^2}{f_{ij}^*}\) Temos que, sob \(H_0, \ Q_{obs}^2\) tem distribuição assintótica Qui-Quadrado com \((s−1)(r−1)\) graus de liberdade. Pela estatística \(\chi ^2\) podemos entender qual a região crítica do teste de independência. Quando não ocorre independência, é natural que as frequências observadas \(n_{ij}\) sejam substancialmente diferentes das frequências esperadas \(n_{ij}^*\.\) Então devemos rejeitar a hipótese \(H_0\) de independência quando a estatística \(Q_{obs}^2\) é maior que um ponto crítico \(\chi_{(s−1)(r−1)}^2\.\) Tipos de Teste Qui-Quadrado • Testes de Aderência • Testes de Independência • Testes de Homogeneidade 1. Testes de Aderência Objetivo: Testar se um conjunto de dados observados se adequa a um modelo probabilístico. Exemplo 01: Queremos verificar se o número de acidentes em uma estrada muda conforme o dia da semana. O número de acidentes de uma determinada semana foram: Dia da semana Número de acidentes 2ª 20 3ª 10 4ª 10 5ª 15 6ª 30 Sábado 20 Domingo 35 Total 140 Área 1 USP – Lorena Recepção Rua/habita – Lorena, Km 7,45 – Caixa Postal 116 Área II Pólo Urbo-Industrial A16 – Caixa Postal 16 CEP 12603-710 Lorena – SP Fax (12) 3159 – 3086 Tel. (Direto) (12) 3159-5194/3153-3209 www.eel.usp.br 5 / 8 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Hipóteses a serem testadas: H0: o número de acidentes não muda conforme o dia da semana. H1: pelo menos um dos dias tem número de acidentes diferente dos demais. Se pi representa a probabilidade de ocorrência de acidentes no i dia da semana, H0 : pi = 1 7, para todo i = 1, · · · , 7. H1 : pi ̸= 1 7, para pelo menos um valor de i. Cálculos serão feitos em sala de aula. 2. Testes de Independência Objetivo: Verificar se existe independência entre duas variáveis medidas nas mesmas unidades expe- rimentais. Exemplo 02: Deseja-se verificar se existe dependência entre a renda e o número de filhos em famílias de uma cidade; 250 famílias escolhidas ao acaso forneceram a tabela a seguir: Número de filhos Renda(R$) 0 1 2 +2 Total Menos de 2.000 15 27 50 43 135 2.000 a 5.000 25 30 12 8 75 5.000 ou mais 8 13 9 10 40 Total 48 70 71 61 250 Hipóteses a serem testadas: H0: O número de filhos e a renda são independentes. H1: Existe dependência entre o número de filhos e a renda. Cálculos serão feitos em sala de aula. Exercício 03: 1237 indivíduos foram classificados segundo a pressão sanguínea (mmHg) e o nível de colesterol (mg/100 cm3). Pressão Arterial Colesterol < 127 127-166 > 166 Total < 200 117 168 22 307 200-260 204 418 63 685 > 260 67 145 33 245 Total 388 731 118 1.237 Verifique se existe independência entre essas variáveis. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 6 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo 3. Teste de Homogeneidade Objetivo: Verificar se uma variável aleatória se comporta de modo similar, ou homogêneo, em várias subpopulações. Exemplo 04: A reação ao tratamento por quimioterapia está sendo estudada em quatro grupos de pacientes com câncer. Deseja-se investigar se todos os tipos reagem da mesma maneira. Uma amostra de pacientes de cada grupo foi escolhida ao acaso e classificou-se a reação em 3 categorias: Câncer Reação Pouca Média Alta Total Tipo I 51 33 16 100 Tipo II 58 29 13 100 Tipo III 48 42 30 120 Tipo IV 26 38 16 80 Total 183 142 75 400 Hipóteses a serem testadas: \(H_0:\) O comportamento da variável é homogêneo nas subpopulações. \(H_1:\) O comportamento da variável não é homogêneo nas subpopulações. Cálculos serão feitos em sala de aula. Importante: Apesar da realização do teste ser semelhante a do Teste de Independência, uma distinção importante se refere à forma como as amostras são coletadas. No teste de homogeneidade, fixamos o tamanho da amostra em cada uma das subpopulações e selecionamos uma amostra dentro de cada uma. Medidas de associação entre variáveis qualitativas. A existência de dependência / associação entre duas variáveis qualitativas é verificada pelo Teste \(\chi ^2\) de Pearson. Já a quantificação do grau de associação entre duas variáveis é feita pelos coeficientes de associação. Essas medidas descrevem, por meio de um único número, a associação (ou dependência) entre duas variáveis. Coeficientes de associação Coeficiente de Contingência (proposto por Pearson): \(C = \sqrt{\frac{Q_{obs}^2}{Q_{obs}^2 + n}}\) Área 1 USP – Lorena Recepção Rua/habita – Lorena, Km 7,45 – Caixa Postal 116 Área II Pólo Urbo-Industrial A16 – Caixa Postal 16 CEP 12603-710 Lorena – SP Fax (12) 3159 – 3086 Tel. (Direto) (12) 3159-5194/3153-3209 www.eel.usp.br 7 / 8 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Porém, o coeficiente acima não varia entre 0 e 1. O valor máximo de C depende de r e s. Para evitar esse inconveniente, costuma-se definir um outro coeficiente, dado por: Coeficiente de Tschuprov: √ Q²obs/n T = ----------------------------- (r - 1)(s - 1) Esse coeficiente terá valor 0 no caso de independência e atinge o valor máximo 1, no caso de dependência completa, mas apenas se r = s. No exemplo de cooperativa versus fator regional, temos C=0,32 e T=0,11. Área I Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12602-970 – Lorena – SP Fax (12) 3159-3133 Tel. (PABX) (12) 3159-5131/3153-3209 USP – Lorena www.eel.usp.br 8 / 8 Área II Polo Urbo-Industrial Ale 6 – Caixa Postal 116 CEP 12602-970 – Lorena – SP Fax (12) 3153-3066 Tel. (PABX) (12) 3185 5900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Conceitos Sensibilidade e Especificidade Resultado do Resultado Real Modelo / Teste Positivo Negativo Total A + B Positivo A B Total Positivo C + D Negativo C D Total Negativo A + C B + D A + B + C + D Total Verdadeiro Total Verdadeiro Total Geral Positivo Negativo As colunas indicam a condição dos indivíduos ou elementos avaliados (real positivo ou real negativo) e as linhas indicam o resultado do modelo ou teste (positivo ou negativo). A célula A contém os verdadeiros-positivos: indivíduos da classe de resultado real “positivo” e com resultado do teste positivo. Já a célula D contém os verdadeiros-negativos: indivíduos da classe de re- sultado real “negativo” e com resultado do teste negativo. Um bom teste tem valores mínimos nas células B e C. A célula B corresponde a indivíduos com resul- tado real negativo mas que o modelo ou teste indicou positivo e denotaremos como falsos-positivos. A célula C corresponde aos falsos-negativos, pacientes com resultado real positivo mas que o modelo ou teste indicou que são negativos. A seguir, serão apresentados alguns conceitos: Sensibilidade: probabilidade de um teste ser Positivo entre aqueles com resultado real positivo, ou seja, Sensibilidade = A (A + C) × 100%. Especificidade: probabilidade de um teste ser Negativo entre aqueles com resultado real negativo, ou seja, Especificidade = D (D + B) × 100%. Prevalência: proporção de indivíduos positivos (resultado real) na população total avaliada, ou seja, Prevalência = (A + C) (A + B + C + D) × 100%. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 1 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo As medidas de associação baseadas em razões, como a razão de chances, fornecem dados sobre a força de associação entre o fator em estudo e o desfecho. Desfecho é o nome usado para designar o evento de interesse em uma pesquisa. O desfecho pode ser o surgimento de uma doença, de um determinado sintoma, o óbito ou outro evento qualquer que acon- tece no processo de saúde-doença. Já o Fator de Risco é a denominação usada em Epidemiologia para designar uma variável que se supõe possa estar associada ao desfecho. Muitas vezes, os indivíduos que apresentam o suposto fator de risco são ditos expostos. Pergunta: toda uma população é exposta a um agente químico. Ao final de um determinado período de tempo esta população apresenta incidência alta de câncer. Podemos dizer que o câncer está associado com à exposição ao agente químico? Não, sem antes responder qual seria a incidência de câncer nesta mesma população caso ela não tivesse sido submetida ao agente químico. Razão de chances A razão de chances estima a magnitude da associação entre a exposição ao fator de risco e o desfecho. Exposição Doentes Não Doentes a doença (Casos) (Controles) Total A + B Expostos A B Total Expostos C + D Não Expostos C D Total Não Expostos A + C B + D A + B + C + D Total Doentes Total Não Doentes Total Geral A chance de doença no grupo exposto é dada por Chance DE = A A + B B A + B = A B A chance de doença no grupo não-exposto é dada por Chance DNE = C C + D D C + D = C D Então a razão de chances (OR) de doença em relação à exposição será OR = Chance DE Chance DNE = A/B C/D = AD BC Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 2 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Regressão Logística Simples Quando se trata de uma grandeza medida em “situações” dicotômicas, como por exemplo “sucesso ou fracasso”, “sim ou não”, “verdadeiro ou falso”, conclui-se que a variável resposta não é mais quantitativa (como as mostradas até este ponto), tratando-se então de uma resposta qualitativa. Tal situação requer um modelo diferente de trabalho, e esta é a utilização do modelo de regressão logística. O modelo de regressão logística é baseado num modelo como o definido na equação: yi = β0 + β1xi + ϵi com i = 1, 2, ..., n, no qual a resposta yi tenha os valores 1 ou 0. Considera-se assim a variável resposta como uma variável aleatória de Bernoulli. Como cada uma das duas possibilidades de resposta possui uma probabilidade particular de acontecer, pode-se construir a seguinte tabela com a distribuição de probabilidades: Tabela 1: Distribuição das probabilidades yi Probabilidade 1 P(yi = 1) = pi 0 P(yi = 0) = 1 − pi Uma vez que o valor esperado do erro é considerado nulo, ou seja, E(ϵi)=0, e damos a cada pos- sibilidade de resposta um peso referente à sua probabilidade, o valor esperado da variável resposta yi é: E(yi) = 1 × pi + 0 × (1 − pi) = pi o que resulta na seguinte relação: E(yi) = β0 + β1xi = pi Desse modo, o que esta função traz como resposta é a probabilidade de que a variável resposta yi seja 1. Há alguns problemas relevantes com este modelo de regressão proposto. Os erros do modelo não são distribuídos normalmente (como tem sido considerado com relação aos outros modelos até este momento). Isso ocorre pois, como só existem duas possibilidades de resposta, os erros também só poderão ter dois valores: ϵi = 1 − (β0 + β1xi) ; yi = 1 ϵi = −(β0 + β1xi) ; yi = 0 Seguindo um princípio semelhante, a variância dos erros não é constante, e sim uma função da média do valor esperado, como mostrado a seguir: σ2 yi = E[yi − E(yi)]2 = (1 − pi)2pi + (0 − pi)2(1 − pi) = pi(1 − pi) que pode ser reescrito como σ2 yi = E(yi)[1 − E(yi)] Por último, existe uma restrição para os valores da função resposta, dado por: 0 ≤ E(yi) = pi ≤ 1 Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 3 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo que prejudica a definição de um modelo linear, com função de resposta linear. Quando a variável resposta é binária, existem evidências de que a forma da função resposta deve ser não linear. Funções normalmente empregadas são as funções de resposta logit (monotonicamente crescentes ou decrescentes em forma de S), que podem ser representadas pelas equações: E(yi) = exp(β0 + β1xi) (1 + exp(β0 + β1xi)) = 1 (1 + exp[−(β0 + β1xi)]) e a forma que melhor representa o modelo de regressão logística é dada por: E(yi) 1 − E(yi) = exp(β0 + β1xi) Se E(yi) = pi, que representa a probabilidade de y = 1 (sucesso / sim / verdadeiro), e (1 − E(yi)) = (1−pi), que por sua vez representa a probabilidade de y = 0, (falha / não / falso), temos que exp(β0 +β1xi) representa a razão de chances (odds ratio): exp(β0 + β1xi) = pi 1 − pi = P(yi = 1) P(yi = 0) (1) A interpretação prática do modelo é que a razão de chances, dada por (1) varia exp(β1) para cada unidade de variação da variável explicativa xi. Os parâmetros do modelo de regressão logística são geralmente estimados pelo método da máxima verossimilhança. Exemplo: Considere um conjunto de dados com 200 observações onde a variável resposta é hon, que possui valor 1 se o aluno possui licenciatura ou 0, se o aluno não possui licenciatura. Seja p = P(hon = 1). hon Masculino Feminino Total 0 74 77 151 1 17 32 49 Total 91 109 200 Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 4 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Exercício 01: (a) Qual o modelo final quando consideramos α = 10%? (b) Interprete os parâmetros do modelo dado em (a). (c) Calcule: (i) sensibilidade, (ii) especificidade, (iii) prevalência e (iv) razão de chances, a partir da tabela. (d) O modelo final se altera quando consideramos α = 5%? Outra análise: Exercício 02: (a) Qual o modelo final quando consideramos α = 10%? (b) Interprete os parâmetros do modelo dado em (a). (c) O modelo final se altera quando consideramos α = 5%? Além de avaliar a possível influência das variáveis explicativas na variável de interesse, a regressão lo- gística é utilizada para discriminar grupos, calculando a probabilidade de sucesso para valores específicos das variáveis preditoras: se pi ≥ 0, 5 considera-se pelo modelo obtido que, para estes valores específi- cos da(s) variáveis explicativas, ocorrerá sucesso (yi = 1); por outro lado, se pi < 0, 5, ocorrerá fracasso (yi = 0). Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 5 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Exemplo da Nasa: Abaixo seguem os dados sobre a temperatura de lançamento e falha do O-ring para os 24 lançamentos de ônibus espaciais antes do desastre da Challenger em janeiro de 1986. Existem seis O-rings usados no arranjo do motor de foguete para selar juntas. Figura 1: Saída Minitab. O p-valor é 0,04, indicando que a temperatura tem um efeito significativo na probabilidade de falha do O-ring. A razão de chances é 0,84; logo o aumento de 1 grau na temperatura reduz as chances de falha. Obs: A temperatura real no lançamento do Challenger era 31ºF.Esse valor está bem distante das outras temperaturas de lançamento. Por isso, nosso modelo não é apropriado para fornecer previsões altamente acuradas naquela temperatura. Mas é evidente que um lançamento a 31ºF é quase certo de resultar em uma falha no O-ring. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 6 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Figura 2: Gráficos Exemplo Challenger. Qualidade do ajuste A avaliação da qualidade de ajuste do modelo de regressão logística deve ser realizada comparando as respostas reais e os valores preditos pelo modelo. Estes resultados são expostos através da Matriz de Confusão, dada a seguir: Tabela 2: Previsto pelo Modelo versus Real Previsto pelo Real Modelo Positivo Negativo Total Positivo a b a + b (Verdadeiro Positivo) (Falso Positivo) Negativo c d c + d (Falso Negativo) (Verdadeiro Negativo) Total n1 = a + c n2 = b + d a + b + c + d A matriz de confusão, por si só, já apresenta informações valiosas sobre a qualidade do modelo de regressão logística, como por exemplo: a quantidade total de valores preditos erroneamente pelo modelo obtido, ou se há uma tendência ao erro positivo ou ao erro negativo. Além disso, a partir dos valores encontrados na matriz de confusão, é possível calcular os valores de Especificidade (taxa de acerto de negativos) e de Sensibilidade (taxa de acerto de positivos) do modelo. Note que: • Dentre os n1 pacientes com resultado positivo, o modelo previu a; • Dentre os n2 pacientes com resultado negativo, o modelo previu d. Sensibilidade: Probabilidade do modelo acertar o resultado positivo, ou seja, P(Modelo Positivo|Real Positivo). A partir da tabela pode ser estimada por Sensibilidade = a n1 . Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 7 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900 UNIVERSIDADE DE SÃO PAULO Escola de Engenharia de Lorena – EEL LOB1049 - Prof. Mariana Pereira de Melo Especificidade: Probabilidade do modelo acertar o resultado negativo, ou seja, P(Modelo Nega- tivo|Real negativo). A partir da tabela pode ser estimada por Especificidade = d n2 . Além disso, outro método importante de avaliação de performance de um modelo de regressão logística é a curva ROC (Receiver-Operating Characteristic), que representa o trade-off (ou taxa de troca) entre a Sensibilidade e a taxa de falsos positivos (1- Especificidade). A curva ROC então se dá no formato a seguir: Figura 3: Curva ROC. A área abaixo da curva ROC, que pode variar de 0,5 (indesejado) a 1 (desejado), também é conside- rada um índice de acertos do modelo. Sendo assim, um modelo ideal apresentaria uma curva ROC que encostaria no canto superior-esquerdo do gráfico, tendo uma taxa total de verdadeiros positivos, e uma taxa nula de falsos positivos. Em geral, Faixa de AUC Poder de classificação AUC = 0, 5 Não há 0, 7 ≤ AUC ≤ 0, 8 Aceitável 0, 8 < AUC ≤ 0, 9 Muito bom AUC > 0, 9 Excelente Embora o valor da AUC seja bastante utilizado e leve em consideração o desempenho de verdadeiros positivos e falsos positivos, deve-se ter cuidado na análise dos resultados. É possível obter valores muito altos de AUC quando há ocorrência de sobreajuste (overfitting). Por isso, deve-se sempre realizar uma análise conjunta de todas as métricas. Área 1 Rodovia Itajubá – Lorena, Km 74,5 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3133 Tel. (Direto) (12) 3159-5314/3153-3209 USP – Lorena www.eel.usp.br 8 / 8 Área II Pólo Urbo–Industrial AI-6 – Caixa Postal 116 CEP 12600-970 – Lorena – SP Fax (12) 3153-3006 Tel. (PABX) (12) 3159-9900

Sua Nova Sala de Aula

Sua Nova Sala de Aula

Empresa

Contato Blog

Legal

Termos de uso Política de privacidade Política de cookies Código de honra

Baixe o app

4,8
(35.000 avaliações)
© 2026 Meu Guru® • 42.269.770/0001-84