·

Agronomia ·

Probabilidade e Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

UFMTInstituto de Saúde ColetivaUSPFaculdade de Saúde Pública Programa PQICAPES Fundamentos de Bioestatística 2003 Denise Pimentel Bergamaschi Aula 4 1 Aula 4 Correlação e regressão linear simples Análise simultânea entre duas variáveis quantitativas associação entre duas variá veis quantitativas Gráfico de dispersão deve ser feito antes da análise numérica dos dados É construído com conjuntos de pontos formados por pares de valores xy Pode indicar correlação linear positiva negativa ou inexistência de correlação Também é útil para identificar existência de valores aberrantes Ex X coeficiente de mortalidade por câncer gástrico Y consumo médio de sal Y X correlação positiva Ex X Peso ao nascer gramas Y Aumento de peso entre 70 e 100 dias como percentual de X Y X correlação negativa UFMTInstituto de Saúde ColetivaUSPFaculdade de Saúde Pública Programa PQICAPES Fundamentos de Bioestatística 2003 Denise Pimentel Bergamaschi Aula 4 2 X coeficiente de mortalidade por câncer de colo de útero Y consumo de sal X Y correlação inexistente Distinção entre associação e causação Mudanças na magnitude de uma variável são acompanhadas de mudanças na mag nitude da outra Não significa que uma variável causa a outra Coeficiente de correlação de Pearson ρ Mede o grau de associação entre 2 variáveis X e Y Definição ρ σ σ σ XY X Y onde σ XY é a covariância de X e Y dispersão conjunta σ X é o desvio padrão de X dispersão de X σY é o desvio padrão de Y dispersão de X Covariância É o valor médio do produto dos desvios de X e Y em relação às suas respectivas médias N Y Y X X i i XY σ estimador r 2 i 2 i i i y y x x y y x x r UFMTInstituto de Saúde ColetivaUSPFaculdade de Saúde Pública Programa PQICAPES Fundamentos de Bioestatística 2003 Denise Pimentel Bergamaschi Aula 4 3 Propriedades a 1 1 ρ b ρ não possui dimensão isto é não depende da unidade de medida das va riáveis X e Y c YX XY ρ ρ Gráficos de dispersão para diferentes valores do coeficiente de correlação ρ rho UFMTInstituto de Saúde ColetivaUSPFaculdade de Saúde Pública Programa PQICAPES Fundamentos de Bioestatística 2003 Denise Pimentel Bergamaschi Aula 4 4 Exemplo Os dados a seguir são provenientes de um estudo que investiga a composição corpo ral e fornece o percentual de gordura corporal idade e sexo para 18 adultos com idades entre 23 e 61 anos a Qual a relação entre a idade e o de gordura Existe alguma evidência de que a relação é diferente entre pessoas do sexo masculino e feminino Explo re os dados graficamente b Calcule o coeficiente de correlação de Pearson entre a idade e o de gordu ra para homens e mulheres Interprete os resultados Idade gordura sexo Idade gordura sexo 23 95 M 53 347 F 23 279 F 53 420 F 27 78 M 54 291 F 27 178 M 56 325 F 39 314 F 57 303 F 41 259 F 58 330 F 45 274 M 58 338 F 49 252 F 60 411 F 50 311 F 61 345 F Mmasculino F feminino Dispersão entre de gordura e idade Idade anos gordura 5 10 15 20 25 30 35 40 45 20 30 40 50 60 70 m f m m f f m f f f f f f f f f f f UFMTInstituto de Saúde ColetivaUSPFaculdade de Saúde Pública Programa PQICAPES Fundamentos de Bioestatística 2003 Denise Pimentel Bergamaschi Aula 4 5 Cálculo do coeficiente de correlação de Pearson Sexo masculino Idade gordura x x y y y y x x 2 x x 2 y y 23 95 75 613 4594 5625 3752 27 78 35 783 2739 1225 6123 27 178 35 218 761 1225 473 45 274 145 1178 17074 21025 13865 305 15625 23645 29100 24213 Coeficiente de correlação idadegordura masculino 0 89 24213 291 23645 x r Sexo feminino Idade gordura x x y y y y x x 2 x x 2 y y 23 279 2786 442 12317 77602 1955 39 314 1186 092 1093 14059 085 41 259 986 642 6330 9716 4123 49 252 186 712 1323 345 5071 50 311 086 122 105 073 149 53 347 214 238 510 459 566 53 42 214 968 2074 459 9367 54 291 314 322 1012 988 1038 56 325 514 018 092 2645 003 57 303 614 202 1242 3773 409 58 33 714 068 485 5102 046 58 338 714 148 1056 5102 219 60 411 914 878 8026 8359 7706 61 345 1014 218 2210 10288 475 5086 3232 33364 138971 31212 Coeficiente de correlação idadegordura feminino 0 51 71 31212 1389 33364 x r Coeficiente de correlação considerando homens e mulheres 0792 Estatísticas X idade Y gordura Média 4633 2861 Desvio padrão 1322 914 UFMTInstituto de Saúde ColetivaUSPFaculdade de Saúde Pública Programa PQICAPES Fundamentos de Bioestatística 2003 Denise Pimentel Bergamaschi Aula 4 6 REGRESSÃO LINEAR ADMITINDOSE Y COMO FUNÇÃO LINEAR DE X AJUSTASE A MELHOR RETA AO CONJUNTO DE DADOS EQUAÇÃO DE RETA bx a y ˆ onde yˆ valor ajustado valor médio predito x valor escolhido de X bx y a a é denominado intercepto é o valor predito para x0 x y xy s s b r b é denominado coeficiente angular slope Indica quantas unidades de Y mudam para a mudança de uma unidade de X Aplicandose aos dados do exemplo a 2861 b 4633 0 548 1322 914 0 79 x b Para aumento de 1 ano o percentual de gordura aumenta 055 Substituindose o valor b na equação de a obtémse a3221 Equação ajustada gordura 322 055 idade Com base nesta equação é possível traçar a reta que passa pelos pontos Para x 30 y 197 para x 50 y 307 OBS o coeficiente angular depende das unidades de medida de X e Y Isto de ve ser considerado na decisão da importância do coeficiente angular O coeficiente angular da equação de YfX é diferente do coeficiente angular de XfY a menos que os desvios padrão de X e Y sejam iguais y 055x 322 0 10 20 30 40 50 0 20 40 60 idade anos gordura UFMTInstituto de Saúde ColetivaUSPFaculdade de Saúde Pública Programa PQICAPES Fundamentos de Bioestatística 2003 Denise Pimentel Bergamaschi Aula 4 7 Usos da reta de regressão Predição utilizar X para predizer Y Quando a correlação for forte melhor é a predição Correlação mede o grau de relacionamento linear entre X e Y Resumir os dados cada valor de X tem um valor médio de Y Exercício 1 Peso kg e altura cm de 30 meninas de 11 aos de idade atendidas na Heaton Midldle School em Bradford Inglaterra Altura cm Peso kg Altura cm Peso kg Altura cm Peso kg 135 26 133 31 136 28 146 33 149 34 154 36 153 55 141 32 151 48 154 50 164 47 155 36 139 32 146 37 149 32 131 25 149 46 141 29 149 44 147 36 137 34 137 31 152 47 135 30 143 36 140 33 146 35 143 42 141 28 148 32 1275 y y x x 171680 x 2 x 171817 y 2 y a Fazer o diagrama de dispersão e investigue como é a relação entre as variáveis b Calcular o coeficiente de correlação de Pearson c Interprete o valor do coeficiente de correlação de Pearson Exercício 2 Considere os dados sobre peso ao nascer de 10 recém nascidos e aumento de peso no período entre 70 e 100 dias de vida calculados em percentual com relação ao pe so ao nascer Peso ao nascer onças de aumento 72 68 112 63 111 66 107 72 119 52 92 75 126 76 80 118 81 120 84 114 a apresente os dados em um diagrama de dispersão b ajuste a equação da reta de regressão do aumento de peso como função do peso ao nascer Apresente a equação e desenhea no gráfico c interprete os coeficientes da reta ajustada de regressão