·

Zootecnia ·

Bioestatística

· 2023/1

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta
Equipe Meu Guru

Prefere sua atividade resolvida por um tutor especialista?

  • Receba resolvida até o seu prazo
  • Converse com o tutor pelo chat
  • Garantia de 7 dias contra erros

Texto de pré-visualização

QA DEST eee ieee 4 ———— i Sj" Departamento de Estatistica UFPR Exercicios Complementares Testes de Hipdteses IT 1. Como parte de seu trabalho de concluséo de curso, um aluno de computacaéo resolveu verificar se dois tipos de arquiteturas de dados (chamadas de A e B) diferem quanto a velocidade de processamento, num dado sistema computacional. Para isso, realizou n4 = 25 execucgdes de um conjunto de instrugdes usando a arquitetura A, e np = 20 execucoes considerando a arquitetura B. Os tempos médios de execucaéo, em minutos, foram x4 = 10.5 e Tg = 12. Vamos admitir que os tempos de execucaéo para cada estrutura sejam normalmente distribuidos, e que as varidncias populacionais sejam conhecidas, iguais a 04 = 4 e 0% = 9. Considerando nivel de significancia de 5%, o aluno podera concluir que o tempo médio de processamento para a arquitetura A é inferior ao da arquitetura B? ¢ X,4: tempo de processamento para a arquitetura A (X4 ~ N(wa,o% = 4)) « Xz: tempo de processamento para a arquitetura B (Xg ~ N(up,o% = 9)) Hipdteses: e Hipdtese nula- Ho : w4 = UB e Hipdtese alternativa- Hy: wa < wp Estatistica teste: _ _ LA — XB Zcale = =< o oO Viet 10.5 — 12 ————. = — 1.92 4 9 V 35 + 20 Regra de decisaéo: Devemos rejeitar a hipdtese nula, em favor da alternativa, se zealc < Zq, onde Zq representa o valor (quantil) da distribuigéo normal padrao, que delimita a de probabilidade 4 esquerda. Neste caso, devemos rejeitar Ho em favor de Hy, ao nivel de significancia de 5%, se Zeale < —1.645. Conclusaéo: Como Zcajc = —1.92 < —1.645, entéo podemos concluir que o tempo de processamento para a arquitetura A é, em média, inferior ao da arquitetura B, ao nivel de significancia de 5%. Normal Curve, mean = 0 , SD = 1 Shaded Area = 0.05 x density 0.0 0.1 0.2 0.3 0.4 −1.645 0 Não rejeição Rejeição −1.92 Figura 1: Ilustração - Exercício 1 2 2. Na comparação de duas topologias de redes de computadores (C1 e C2), avaliou-se os tempos de transmissão de pacotes de dados entre duas máquinas. Foram realizados 12 ensaios em C1 e 9 ensaios em C2, cujos resultados (em centésimos de segundo) são apresentados a seguir: • Topologia C1: 09, 12, 10, 12, 11, 09, 08, 12, 13, 09, 13, 08; • Topologia C2: 14, 15, 10, 13, 16, 12, 14, 17, 14. Considerando nível de significância de 5%, há diferença significativa nos tempos médios de transmissão das duas topologias? Assuma normalidade para os tempos de transmissão de cada topologia, e que as variâncias populacionais sejam iguais. • X1 : tempo de transmissão da topologia C1 (X1 ∼ N(µ1, σ2)) • X2 : tempo de transmissão da topologia C2 (X2 ∼ N(µ2, σ2)) Com base nos resultados registrados para cada topologia, temos: n1 = 12; ¯x1 = 10.5; s2 1 = 3.55 n2 = 9; ¯x2 = 13.9; s2 2 = 4.36 Assumindo que as variâncias populacionais são iguais (σ2 1 = σ2 2 = σ2), vamos proceder com o cálculo da estimativa da variância populacional comum: s2 = (n1 − 1) × s2 1 + (n2 − 1) × s2 2 n1 + n2 − 2 = (12 − 1) × 3.55 + (9 − 1) × 4.36 12 + 9 − 2 = 3.89 Hipóteses: • Hipótese nula- H0 : µ1 = µ2 • Hipótese alternativa- Ha : µ1 ̸= µ2 3 . poe *,sEstatistica . . UFPR Estatistica teste: Ly — £2 teale = > = s s Vm tne 10.5 — 13.9 ———___—. = — 3.90 3.89 | 3.89 Vit Regra de decisao: Devemos rejeitar a hipdtese nula, em favor da alternativa, se |tealc| > ty,a/2, onde v = ny + nz -2= 19, ty,«/2 representa o valor da distribuigdo t-Student, com parametro v que delimita a/2 de probabilidade & direita. Neste caso, devemos rejeitar Ho em favor de Hj, ao nivel de significancia de 5%, se |teaic| > 2.09. Conclusao: Como |tcaic| = 3.90 > 2.09, entéo podemos concluir que ha diferenga significativa nos tempos de transmissao das duas topologia ao nivel de significéncia de 5%. t-curve, df= 19 Shaded Area = 0.0503 a oO o oO 2 3 a) S Rejeigao Nao rejeigao Rejeigao °o Oo -2.09 2.09 3.90 x Figura 2: Ilustracgao - Exercicio 2 4 . poe *,sEstatistica . . UFPR 3. No desenvolvimento de um sistema de reconhecimento de fala, fez-se um experimento para avaliar dois tipos de paraémetros actsticos (A e B). Foram observadas duas amostras independentes para cada tipo de paraémetro e anotadas as taxas de acerto (em %): e Parametro A: 78.67; 81.00; 84.67; 80.97; 81.46; 85.12; 80.32; 80.95; 84.76. e Paraémetro B: 79.67; 82.33; 82.67; 83.05; 86.76; 83.66; 86.03; 83.94; 92.75. Considerando nivel de significancia de 5%, ha difereng¢a significativa nos dois parametros actsticos, em termos da taxa média de acertos? Assuma normalidade para as taxas de acertos para os dois parémetros actsticos, e que as variadncias populacionais sejam diferentes. e X4: taxa de acerto baseada no parametro actstico A (X4 ~ N(t14,04)) ¢ Xp: taxa de acerto baseada no parametro actistico B (Xz ~ N(uB,0%)) Com base nos resultados registrados para cada parametro actstico, temos: na=9; Za =82.0; 5% =5.23 np =9; &p_ = 84.5; s% = 13.75 Hipdteses: e Hipdtese nula- Ho : w4 = UB e Hipdtese alternativa- Ha: a A UB Estatistica teste: _ _ LA XB teale = 73S = Vint 82.0 — 84.5 ———————— _ = — 1.72 5.23 | 13.75 yoo too Regra de decisaéo: Devemos rejeitar a hipdtese nula, em favor da alternativa, se |tcalc| > ty,a/2, onde: (wa twp)? na-l + np-l 5 em que ωA = s2 A nA = 5.23 9 = 0.58 e ωB = s2 B nB = 13.75 9 = 1.53 tal que: ν = (0.58 + 1.53)2 0.582 9−1 + 1.532 9−1 = 13.30 ≈ 13 Neste caso tν,α/2 representa o valor da distribuição t-Student, com parâmetro ν que delimita α/2 de probabilidade à direita. Assim, devemos rejeitar H0 em favor de Ha, ao nível de significância de 5%, se |tcalc| > 2.16. Conclusão: Como |tcalc| = 1.72 < 2.16, então não há diferença significativa nas taxas de acerto baseadas nos dois parâmetros acústicos, ao nível de significância de 5%. t−curve, df = 13 Shaded Area = 0.05 x density 0.0 0.1 0.2 0.3 0.4 −2.16 2.16 Não rejeição Rejeição Rejeição 1.72 Figura 3: Ilustração - Exercício 3 6 _ poe *,sEstatistica . . UFPR 4. Um projetista esta desenvolvendo uma nova versdéo para o aplicativo de um grande banco. Um dos aspectos a serem aperfeicoados é a facilidade de operacaéo por parte dos clientes. Para avaliar o desempenho da nova versao, n = 18 clientes foram solicitados a avaliar a facilidade de operacao de ambas as verses (antiga e nova), atribuindo notas numa escala de 0 a 10, tal que quanto maior a nota, maior facilidade de operacéo. Os resultados estéo apresentados na sequéncia. Cliente Antiga Nova Dif 1 5.0 8.0 3.0 2 6.5 7.0 0.5 3 3.5 3.5 0.0 4 5.0 7.5 2.5 5 4.0 4.0 0.0 6 5.0 6.0 1.0 7 6.0 6.5 0.5 8 5.5 7.5 2.0 9 5.5 8.5 3.0 10 4.5 8.0 3.5 11 4.0 5.5 1.5 12 4.5 2.0 -2.5 13 5.0 5.0 0.0 14 4.5 6.0 1.5 15 4.5 7.0 2.5 16 5.0 5.5 0.5 17 5.5 5.5 0.0 18 5.0 5.5 0.5 Com base nos resultados apresentados, podemos afirmar, ao nivel de 1% de significancia, que em média houve uma melhora na avaliacgéo por parte dos clientes? Hipdteses: e Hipdtese nula- Ho : w4 = Wn, ou, de maneira equivalente, upis = 0 e Hipdtese alternativa- Hy : wa < wn, ou, de maneira equivalente, pis > 0 Estatistica teste: Para o calculo da estatistica teste, vamos inicialmente calcular média e desvio padrao para as diferencgas: j= 3.0+0.5+...+0.5 —1u 18 1 Sa= Visca [(3.0 — 1.11)? + (0.5 — 1.11)? +... + (0.5 — 1.11)?] = 1.48 7 A estatística do teste é dada por: tcalc = ¯d sd/√n = 1.11 1.48/ √ 18 = 3.18 Regra de decisão: Devemos rejeitar a hipótese nula, em favor da alternativa, se tcalc > tν,α, onde ν = n − 1 = 18 − 1 = 17, e t17,α representa o valor da distribuição t-Student, com parâmetro ν = 17 que delimita α de probabilidade à direita. Neste caso, devemos rejeitar H0 em favor de Ha, ao nível de significância de 1%, se tcalc > 2.57. Conclusão: Como tcalc = 3.18 > 2.57, então podemos concluir, ao nível de significância de 1%, que houve uma melhora na avaliação por parte dos clientes. t−curve, df = 17 Shaded Area = 0.0099 x density 0.0 0.1 0.2 0.3 0.4 0 2.57 Não rejeição Rejeição 3.18 Figura 4: Ilustração - Exercício 4 8 5. Dois algoritmos de busca (A e B) estão sendo testados em um grande banco de dados. Num experimento, n = 12 registros foram localizados na base usando cada um dos algoritmos, e os tempos de resposta ao usuário registrados. Os resultados são apresentados na sequência. Registro Alg_A Alg_B Dif 1 9.2 8.3 -0.9 2 9.8 9.4 -0.4 3 9.9 9.1 -0.8 4 10.3 9.9 -0.4 5 8.9 8.2 -0.7 6 13.1 10.9 -2.2 7 12.5 11.2 -1.3 8 11.4 11.9 0.5 9 8.9 8.1 -0.8 10 9.5 8.7 -0.8 11 10.8 11.2 0.4 12 9.2 8.5 -0.7 Ao nível de significância de 5%, podemos afirmar que os tempos médios de resposta para os dois algoritmos diferem? Hipóteses: • Hipótese nula- H0 : µA = µB, ou, de maneira equivalente, µDif = 0 • Hipótese alternativa- Ha : µA ̸= µB, ou, de maneira equivalente, µDif = 0 Estatística teste: Inicialmente, a média e o desvio padrão amostrais para as diferenças são iguais, respectivamente, a ¯d = −0.675 e sd = 0.707. Logo, a estatística do teste é dada por: tcalc = ¯d sd/√n = −0.675 0.707/ √ 12 = −3.307 Regra de decisão: Devemos rejeitar a hipótese nula, em favor da alternativa, se |tcalc| > tν,α/2, onde ν = n − 1 = 12 − 1 = 11, e t11,α/2 representa o valor da distribuição t-Student, com parâmetro ν = 11 que delimita α/2 de probabilidade à direita. Neste caso, devemos rejeitar H0 em favor de Ha, ao nível de significância de 5%, se |tcalc| > 2.20. Conclusão: Como |tcalc| = 3.307 > 2.20, então podemos concluir, ao nível de significância de 5%, que há diferença nos tempos médios de resposta para os dois algoritmos. 9 t−curve, df = 11 Shaded Area = 0.0501 x density 0.0 0.1 0.2 0.3 0.4 −2.2 2.2 Não rejeição Rejeição Rejeição 3.307 Figura 5: Ilustração - Exercício 5 10 . poe *,sEstatistica . . UFPR 6. Deseja-se comparar as performances de dois algoritmos (A e B) usados na detecgao de e-mails do tipo spam. Colocados em teste, o algoritmo A foi capaz de detectar corretamente 160 de um total de 200 spams avaliados, enquanto o algoritmo B detectou corretamente 80 de 120 spams avaliados. Com base nesses resultados, podemos afirmar que os algoritmos apresentam diferentes performances quanto a probabilidade de detectar corretamente um spam? Considere nivel de significancia de 1% na sua conclusao. Vamos proceder com o teste para a comparacao das proporgoées de acertos dos dois algoritmos (pa e pp). As proporgoes amostrais sao as seguintes: 160 80 bh, = —- =0.80; pp = — = 0.67 Pa 200 PB 190 Hipdteses: e Hipdtese nula- Ho : p4 = pp ¢ Hipdtese alternativa- Hy, :p4 # pp Estatistica teste: Para o calculo da estatistica teste, vamos inicialmente calcular a proporcéo combinada: _ 160+ 80 p= ——— = 0.75 200 + 120 A estatistica do teste é dada por: Pa — PB calc SS 50"=2—T2— 0 = -\ (1 1 \/ PC — P) (4 + x) 0.80 — 0.67 = 2.6 \/0.75(1 — 0.75) (stg + a) Regra de decisaéo: Devemos rejeitar a hipétese nula, em favor da alternativa, se |Zcaic| > 2/2, onde z,/2 representa o valor da distribuigaéo normal padrao que delimita a/2 de probabilidade 4 direita. Neste caso, devemos rejeitar Ho em favor de Hj, ao nivel de significancia de 1%, se |Zcatc| > 2.57. Conclusaéo: Como Zale = 2.6 > 2.57, entaéo podemos concluir, ao nivel de significancia de 1%, que ha diferenca de performance dos dois algoritmos. 11 Normal Curve, mean = 0 , SD = 1 Shaded Area = 0.0102 x density 0.0 0.1 0.2 0.3 0.4 −2.57 2.57 Não rejeição Rejeição Rejeição 2.6 Figura 6: Ilustração - Exercício 6 12 7. Na sequência são apresentadas as médias finais de uma turma de 20 alunos do curso de Ciências da Computação nas disciplinas de algoritmos e estruturas de dados (X) e introdução à Estatística (Y). Aluno X Y 1 6.3 7.9 2 7.0 6.6 3 8.4 8.2 4 5.0 3.7 5 6.9 9.9 6 6.6 6.1 7 6.6 6.5 8 4.9 3.0 9 5.5 5.9 10 7.0 6.5 11 5.9 5.1 12 7.3 9.6 13 7.6 7.7 14 6.3 8.4 15 6.6 8.7 16 5.8 5.5 17 6.8 5.0 18 7.1 9.6 19 6.4 6.4 20 7.2 7.3 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 3 4 5 6 7 8 9 10 Algoritmos e estruturas de dados Introdução à Estatística Figura 7: Gráfico de dispersão a) Calcule o valor do coeficiente de correlação linear de Pearson para as notas nas duas disciplinas. Interprete o resultado. O coeficiente de correlação linear é definido por: 13 . poe *,sEstatistica . . UFPR C p= COvl@ 9) SxSy em que $Cov(x,y) $ representa a covaridncia amostral entre X e Y, calculada por: 1g _ _ Cov(z,y) = n-1 So(ai — £)(yi — 9), i=1 € Sz € Sy SAO Os desvios padrées amostrais de X e Y, respectivamente. Com base nos dados do exercicio, temos 7 = 6.56; y = 6.88; sz = 0.85; sy = 1.91. Vamos calcular a covaridncia amostral: 1 Cov(2,y) = 9-1 [((6.3 — 6.56)(7.9 — 6.88) + (7.0 — 6.56) (6.6 — 6.88) +... + (7.2 — 6.56) (7.3 — 6.88)] = 1.13 O coeficiente de correlacao linear, calculado com base na amostra, fica dado por: Cov(2, y) 1.13 = —_— = ———— = 0.69 " 528, 0.85 x 1.91 b) Verifique se a correlagéo encontrada no item anterior é significativa. Faca o teste ao nivel de significancia de 5%. Vamos denotar por p o coeficiente de correlacéo populacional. Hipdteses: e Hipotese nula- Ho : p =0 ¢ Hipdtese alternativa- H, : p #0 Estatistica teste: ' _tyn=2 _ 0.69V20=2 _ | os cate T=? 10.692 Regra de decisaéo: A decisaéo deve ser baseada na distribuigéo t-Student, com v = n — 2. Novamente, a regiao de rejeicgéo deve ser alocada conforme a hipotese alternativa: A esquerda (se Hy : p < 0); a direita (se Hy : p > 0); ou nas duas partes (se H, : p #0) Neste caso, Devemos rejeitar a hipdétese nula, em favor da alternativa, se |teaic| > ty,¢/2, onde v =n — 2 = 18 e ty,.q/2 representa o valor da distribuigao t-Student com paraémetro que delimita a/2 de probabilidade & direita. Neste caso, devemos rejeitar Ho em favor de Hj, ao nivel de significancia de 5%, se |teaic| > 2.10. 14 Conclusão: Como tcalc = 4.05 > 2.10, então podemos concluir, ao nível de significância de 5%, que a correlação entre as notas nas duas disciplinas é significativa. t−curve, df = 18 Shaded Area = 0.0501 x density 0.0 0.1 0.2 0.3 0.4 −2.1 2.1 Não rejeição Rejeição Rejeição 4.05 Figura 8: Ilustração - Exercício 7 15