·

Agronomia ·

Probabilidade e Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Aulas 4 e 5 Medidas de tendéncia central e de dispersao Média aritmética X variavel aleatoria v a N tamanho da populacao n tamanho da amostra Lt média populacional parametro geralmente desconhecido X Estatistica estimador formula X média amostral estimativa valor calculado na amostra Média aritmética é o valor que indica o centro de equilibrio de uma distribuicao de freqiiéncias de uma variavel quantitativa Definigao é a soma dos valores de uma variavel dividida pelo numero de valores Em uma amostra de tamanho n composta das observacdes x Xz Xn a média aritmética x é calculada de acordo com a apresentacdo dos dados valores a Valores individuais n x XX X4X i X uw nN nN Exemplo Niveis de concentracgiéo def endorfina no plasma pmoll de 11 corredores antes de participar de uma corrida 43 46 52 52 66 72 84 90 104 140 178 Media aritmética 434 4641404178 927 X oo 8497 843 pmol 1 11 11 p simbolo de pico denota fragao de 10 FSPUSP HEP5732 Bioestatistica 12003 30 Denise Pimentel Bergamaschi Aulas 4e5 b Valores em distribuicao de freqiiéncia k XS x i1 n Exemplo Niveis de concentragaéo de f endorfina no plasma pmoll de 11 corredores antes de participar de uma corrida 43 460 52 52 66 72 84 90 104 140 178 meédia aritmeética ConcentraaoX fi Xi fj 43 1 43 46 1 46 52 2 104 66 1 66 72 1 72 84 1 84 90 1 90 104 1 104 140 1 140 178 1 178 total 11 927 927 xX 8427 843 pmol 1 11 c valores em intervalos de classe k Xiomb y ial X n onde X ipm ponto médio do intervalo ffreqiéncia k numero de classes nm numero de observacoes FSPUSP HEPS752 Bioestatstica 12008 SCSSSzd Denise Pimentel Bergamaschi Aulas 4e5 Exemplo média aritmética valores em intervalo de classe 43 46 52 52 66 72 84 90 104 140 178 concentracao fi ponto médio Xiom Xiombi 40 80 6 6 36 80120 3 10 30 120160 1 14 14 160200 1 18 18 total 11 98 98 x 891pmol1 11 OBS e SO existe para variaveis quantitativas e seu valor é unico e 6 da mesma natureza da variavel considerada e e sofre influéncia de valores aberrantes EX 43 46 52 52 66 72 84 90 104 140 178 Média aritmética 843 pmol 46 52 52 66 72 84 90 104 140 378 Média aritmética 1025 pmoll FSPUSP HEP5732 Bioestatistica 12003 32 Denise Pimentel Bergamaschi Aulas 4e5 Mediana Med E o valor que ocupa a posicao central de uma série de 7 observacdes quando estas estado ordenadas de forma crescente ou decrescente a Valores individuais numero de observacoées n é impar a mediana é 0 valor da variavel que ocupa o posto nimero de observacoées n é par a mediana é a média aritmética dos valores da variavel que ocupam os postos n2 e 2 Exemplo Niveis de concentracdo de endorfina no plasma pmoll de 11 corredores antes de participar de uma corrida n11 impar 43 46 52 52 66 72 84 90 104 140 178 Med72 pmol a x nl 1141 s A mediana é o valor que ocupa a 6 posicao 6 Observar que os valores ja estavam ordenados b Valores em distribuicao de freqiiéncia pontual O calculo o mesmo para valores individuais entretanto devese trabalhar com o conceito de freqiéncia acumulada Exemplo Niveis de concentracdo de endorfina no plasma pmoll de 11 corredores antes de participar de uma corrida 43 46 52 52 66 72 84 90 104 140 178 FSPUSP HEP5732 Bioestatistica 12003 33 Denise Pimentel Bergamaschi Aulas 4e5 Mediana ConcentragaoX freq Freq acum 43 1 1 46 1 2 52 2 4 66 1 5 72 1 6 84 1 7 90 1 104 1 140 1 178 1 total 11 a x ntl1 1141 A mediana é o valor que ocupa a 6 posicgao Portanto a concentracao mediana é 72 pmol c Valores em intervalos de classe Para n numero de observac6es par ou mpar a mediana é dada por n 9 a f acumanterior Med L a f classemediana onde L 60 limite inferior da classe que contém a mediana a2 éa amplitude da classe que contém a mediana FT scumanterior frequéncia acumulada até a classe anterior a classe que contém a mediana Fostassemediana frequéncia da classe que contém a mediana OBS e existe para variavel quantitativa e qualitativa ordinal e da mesma natureza da variavel considerada e tornase inadequada quando ha muitos valores repetidos e nao sofre influéncia de valores aberrantes EX43 46 52 52 66 72 84 90 104 140 178 Média aritmética 843 pmoll Mediana 72 pmol 46 52 52 66 72 84 90 104 140 378 Média aritmética 1025 pmoll Mediana 72 pmol FSPUSP HEPS732 Bioestatistica 12008 CéSiCSS Denise Pimentel Bergamaschi Aulas 4e5 e pode ser calculada mesmo quando os dados estao agrupados em intervalos de classe e os extremos de algum intervalo nao esteja definido a nao ser que a mediana caia neste intervalo Moda Mo E o valor da variavel que apresenta freqiincia maxima Classe modal intervalo de classe onde se encontra a moda OBS e pode ser calculada para variavel quantitativa e qualitativa e nem sempre existe ou é Unica e da mesma natureza da variavel considerada e no caso da variavel quantitativa estar apresentada em intervalos de classes é muito afetada pela maneira como as classes foram construidas Aplicacao Os dados a seguir sao provenientes do grupo Western Collaborative Group Study criado na California em 196061 Foram estudados 3154 homens de meia idade para investigar a relagado entre padroes de comportamento e risco de doenca coronariana Os dados apresentados sao de 40 homens para os quais foram medidos os niveis de colesterol mg por 100ml e realizada uma categorizacao segundo comportamento O comportamento de tipo A é caracterizado pela urgéncia agressividade e ambicdo O de tipo B é relaxado nao competitivo e menos preocupado Tipo A nivel de colesterol 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325 Tipo B nivel de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213 Média aritmética valores individuais Tipo A 2334254442394325 4901 x ee 24505mg 100ml 20 20 FSPUSP HEPS732 Bioestatistica 12008 SSSSSCS Denise Pimentel Bergamaschi Aulas 4e5 Média aritmética valores em distribuicdo de freqiiéncia Colesterol X fi Xif 181 1 181 197 1 197 202 1 202 212 1 212 218 1 218 224 1 224 233 1 233 234 1 234 239 2 478 246 1 246 248 1 248 250 1 250 252 1 252 254 1 254 268 1 268 276 1 276 291 1 291 312 1 312 325 1 325 Total 20 4901 4901 x ot 24505mg 100ml 20 Média aritmética valores em intervalos de classe Nivel de Colesterol mg100ml xi fi 180200 2 200250 10 250300 6 300350 2 Total 20 FSPUSP HEP5732 Bioestatistica 12003 36 Denise Pimentel Bergamaschi Aulas 4e5 Mediana a valores individuais Tipo A nivel de colesterol 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325 Ordenandose os valores 181 202 218 233 239 246 250 254 276 312 197 212 224 234 239 248 252 268 291 325 Como n20 par a mediana é a média dos valores que ocupam a 10 e 11 posicdes 20 n2 22 dadas por 10 e 14 11 p S 5 e 7 Mediana as 2425mg 100ml b valores em distribuicdo de frequéncia Colesterol X fi facumulada 181 1 1 197 1 2 202 1 3 212 1 4 218 1 5 224 1 6 233 1 7 234 1 8 239 2 10 246 1 11 248 1 250 1 252 1 254 1 268 1 276 1 291 1 312 1 325 1 Total 20 Como n20 par a mediana é a média dos valores que ocupam a 10 e 11 posicdes 20 n2 22 dadas por 10 e 14 11 p S 5 e 7 5 Mediana ee 2425mg 100ml FSPUSP HEP5732 Bioestatistica 12003 37 Denise Pimentel Bergamaschi Aulas 4e5 c valores em intervalos de classe Nivel de Colesterol mg100ml x fi facumulada 180200 2 2 200250 10 12 250300 6 300350 2 Total 20 Mediana esta na classe de 200 250 mg100ml nN 9 a f acumanterior Med L a f classemediana 20 2 Med 200 502 200 40 240mg 100ml 10 FSPUSP HEP5732 Bioestatistica 12003 38 Denise Pimentel Bergamaschi Aulas 4e5 Medidas de dispersao Valores minimo e maximo valores extremos da distribuicdo Amplitude de variagao é a diferenca entre os 2 valores extremos da distribuicdo Variancia é calculada pelo quadrado médio dos desvios em relagdo a média a Valores individuais N dX XY Variancia populacional Oo x x Variancia amostral S n nN f n Oo o Desvio padrao a raiz quadrada da variancia ou seja SvS Exemplo Tipo A nivel de colesterol 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325 2 2 varidncia ORE OE 134237mg 100ml Desvio padrao s 134237 3664mg 100ml Tipo B nivel de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213 2 2 Variancia s eee 2336747mg 100ml Desvio padrao s 2336747 4834mg 100ml FSPUSP HEP5732 Bioestatistica 12003 39 Denise Pimentel Bergamaschi Aulas 4e5 c Valores em distribuicdo de frequéncias x x Si Variancia amostral S n1 Tipo A Ma oom fi Xif x x x x f mg m xi 181 1 181 410240 410240 197 1 197 230880 230880 202 1 202 185330 185330 212 1 212 109230 109230 218 1 218 73170 73170 224 1 224 44310 44310 233 1 233 14520 14520 234 1 234 12210 12210 239 2 478 3660 7321 246 1 246 090 090 248 1 248 870 870 250 1 250 2450 2450 252 1 252 4830 4830 254 1 254 8010 8010 268 1 268 52670 52670 276 1 276 95790 95790 291 1 291 211140 211140 312 1 312 448230 448230 325 1 325 639200 639200 Total 20 4901 2550495 2550495 s4 49 134237mg100ml 5 134237 3664mg 100ml FSPUSP HEP5732 Bioestatistica 12003 40 Denise Pimentel Bergamaschi Aulas 4e5 Tipo B Nivel de Colesterol mg100ml f Xifi x x x x xf xi 137 1 137 537289 537289 148 1 148 388129 388129 153 1 153 328329 328329 169 1 169 170569 170569 175 1 175 124609 124609 183 1 183 74529 74529 185 1 185 64009 64009 188 1 188 49729 49729 194 1 194 26569 26569 202 1 202 6889 6889 212 1 212 289 289 213 1 213 729 729 224 1 224 18769 18769 226 1 226 24649 24649 242 1 242 100489 100489 246 1 246 127449 127449 250 1 250 157609 157609 252 1 252 173889 173889 263 1 263 277729 277729 344 1 344 1787569 1787569 Total 20 4206 443982 443982 s 9 2336747mg100ml 5 336747 4834mg 100ml d Valores em intervalos de classe YD Sinn x xf Variancia amostral S Nivel de Colesterol fi x ponto Xipmfi Xp Xion xf mg100ml x médio Xipm 180200 2 190 380 319225 63845 200250 10 225 2250 46225 46225 250300 6 275 1650 81225 48735 300350 2 325 650 616225 123245 Total 20 4930 282050 155x0325x2 4930 2465mg 100ml 20 20 282050 si 148447mg100ml 148447 3853mg 100ml FSPUSP HEP5732 Bioestatistica 12003 41 Denise Pimentel Bergamaschi Aulas 4e5 Tipo B Nivel de fi x ponto Xipmf Xipm Xinm xf Colesterol médio Xipm mg100ml x 130180 5 155 775 3364 16820 180200 4 190 760 529 2116 200250 7 225 1575 144 1008 250300 3 275 825 3844 11532 300350 1 325 325 12544 12544 Total 20 4260 44020 155x544325xl 4260 X e 2130me 100ml 20 20 44020 si 9 231684mg100m s J231684 4813mg 100ml Coeficiente de Variacao de Pearson CV o quociente entre o desvio padrdo e a média ou seja CV S 400 xX 3664 4834 CVtipo al x100 150 CVtipog x100 230 tPA 54505 PB 5103 Quartil Valores da variavel que dividem a distribuicdo em quatro partes iguais YW YW Q1 deixa abaixo 25 das observacdes 25 Q2 deixa abaixo 50 das observacoes POMS Q3 deixa abaixo 75 das observacoes PM CT lx 3x g Coty g Font FSPUSP HEP5732 Bioestatistica 12003 42 Denise Pimentel Bergamaschi Aulas 4e5 1 3 onde x é 0 valor da variavel e CG n 1 e GC n 1 so indices que representam as posicOes ocupadas por x Os dados abaixo sao referentes ao peso ao nascer de 50 recémnascidos que tiveram sindrome de desconforto respiratorio idiopatico grave 23 criangas sobreviveram e 27 foram a Obito 1050 2500 1890 1760 2830 1175 1030 1940 1930 1410 1230 1100 2200 2015 1715 1310 1185 2270 2090 1720 1500 1225 2440 2600 2040 1600 1262 2560 2700 2200 1720 1295 2730 2950 2400 1750 1300 1130 2550 3160 1770 1550 1575 2570 3400 2275 1820 1680 3005 3640 Ordenandose os dados em cada grupo obtémse 1030 1310 2200 1680 2550 1050 1500 2270 1715 2570 1100 1550 2275 1720 2600 1175 1600 2440 1760 2700 1185 1720 2500 1930 2830 1225 1750 2560 2015 2950 1230 1770 2730 2040 3005 1262 1820 1130 2090 3160 1295 1890 1410 2200 3400 1300 1940 1575 2400 3640 Fonte van Vliet PK Gupta JM Sodium bicabornate in idiopatic respiratory distress syndrome Arch Diseases in Childhood197348 249255 Entre os recémnascidos que sobreviveram Qlx x 1720g 72340 O3x X 2830g 23 Observe que Q2 7 doa 7 12 7 22008 FSPUSP HEP5732 Bioestatistica 12003 43 Denise Pimentel Bergamaschi Aulas 4e5 Entre os recémnascidos que foram a Oobito Qlx x 1230g 271 4 3x x 2200 OQ2x x 1600g Q Com 71 Se Or i4 No calculo dos quartis os indices 6 7 12 14 18 e 21 sao valores inteiros Isto ira acontecer sempre que o numero de observac6es n for impar Se n for par o calculo do indice resultara em um valor fracionario Por exemplo para n22 Qlx X X 1 23 3 224 GD que é do caminho entre x51715 e x1720 3 Q11715 7 17201715 171882 O3x X 2241 17 a 1 17 y que é do caminho entre x72700 e x1g2830 1 Q3 2700 7830 2700 27325 FSPUSP HEP5732 Bioestatistica 12003 44 Denise Pimentel Bergamaschi Aulas 4e5 Decil Valores da variavel que dividem a distribuigdo em dez partes iguais Percentil Valores da variavel que dividem a distribuicdo em cem partes iguais Entre os recémnascidos que sobreviveram Percentil 5 PSx X X 90 734 Ooo a que é 15 do caminho entre x1130 e x21410 1 PS 1130 14101130 1186g Percentil 10 2 PINX 19 X 949 X 9 P1O14101575 1410 14762 9002 Goo 22 5 Percentil 50 P50x x X 2 on41p 1200 2 P50 2200g Percentil 75 PID X 45 1800 Xus P75 2830 231 i 100 100 Percentil 90 3 PID X o X 5160 3 P90 3160 3400 3160 33042 231 212 5 100 100 5 Percentil 95 P95x x X 4 2341 22 e24 P95 3400 5 3640 3400 3592 FSPUSP HEP5732 Bioestatistica 12003 45 Denise Pimentel Bergamaschi Aulas 4e5 FSPUSP HEP5732 Bioestatística I2003 Denise Pimentel Bergamaschi Aulas 4 e 5 46 Box Plot O box plot é um gráfico que representa os dados de forma resumida em um retângulo onde as linhas da base e do topo são o primeiro e o terceiro quartis respectivamente A linha entre estas é a mediana As linhas verticais terminam em valores adjacentes definidos da seguinte forma2 Valor adjacente superior é o maior valor das observações que é menor ou igual à Q315Q3Q1 Valor adjacente inferior é definido como o menor valor que é maior ou igual à Q115Q3 Q1 OBS Q3Q1 é denominado intervalo interquartil IIQ Exemplo Tipo A nível de colesterol 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325 Tipo B nível de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213 Box plot da variável nível de colesterol segundo tipo de personalidade 2 ChambersJM et al Graphical Methods for data analysis WadsworthBrooksCole 1983 120 140 160 180 200 220 240 260 280 300 320 340 360 380 colesterol A B Box plot e identificacao de valores aberrantes outliers pelo STATA Valores outliers valores maiores que o valor adjacente superior ou valores menores que o valor adjacente inferior Ex Nivel de colesterol segundo tipo de personalidade Tipo A Tipo A nivel de colesterol 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325 Valores em ordem crescente 181 197 202 212 218 224 233 234 239 239 246 248 250 252 254 268 276 291 312 325 n20 X X 2184 224 Para calculo de Q1 0 STATA utiliza a formula G1 221 xX tx 254 268 calculo de Q3 Q3 a 261 2 2 Intervalo InterQuartil IIQ Q3Q1 40 Valor adjacente superior maior valor abaixo de 321 onde 321 03 15x40 321 Valor adjacente inferior menor valor acima de 161 onde 161 Q115x40 161 Outlier valor 325 Tipo B Tipo B nivel de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213 Valores em ordem crescente Tipo B nivel de colesterol 137 148 153 169 175 183 185 188 194 202 212 213 224 226 242 246 250 252 263 344 FSPUSP HEP5732 Bioestatistica 12003 47 Denise Pimentel Bergamaschi Aulas 4e5 n20 175 183 Para o calculo de Q1 0 STATA utiliza a formula O1 179 03 Mis Mig 242 4246 yy 2 2 Intervalo InterQuartil IIQ Q3Q1 65 Valor adjacente superior maior valor abaixo de 3415 Q3 15x65 3415 263 Valor adjacente inferior menor valor acima de 815 Q115x65 815 137 Outlier valor 344 FSPUSP HEP5732 Bioestatistica 12003 48 Denise Pimentel Bergamaschi Aulas 4e5