• Home
  • Chat IA
  • Recursos
  • Guru IA
  • Professores
Home
Recursos
Chat IA
Professores

·

Cursos Gerais ·

Bioestatística

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Bioestatística-Distribuição-de-Probabilidade-Variável-Contínua-Normal

55

Bioestatística-Distribuição-de-Probabilidade-Variável-Contínua-Normal

Bioestatística

UFMA

Bioestatistica - Testes Nao Parametricos Mann-Whitney Mediana e Kruskal-Wallis

41

Bioestatistica - Testes Nao Parametricos Mann-Whitney Mediana e Kruskal-Wallis

Bioestatística

UFMA

Bioestatistica-Testes-Nao-Parametricos-Sinal-Wilcoxon-Mann-Whitney-Mediana

40

Bioestatistica-Testes-Nao-Parametricos-Sinal-Wilcoxon-Mann-Whitney-Mediana

Bioestatística

UFMA

Bioestatística - Origem-e-Importancia-da-Estatistica-Aula

57

Bioestatística - Origem-e-Importancia-da-Estatistica-Aula

Bioestatística

UFMA

Testes-Qui-Quadrado-Aderencia-Independencia-e-Heterogeneidade

61

Testes-Qui-Quadrado-Aderencia-Independencia-e-Heterogeneidade

Bioestatística

UFMA

Testes-Nao-Parametricos-Conceitos-e-Aplicacoes

37

Testes-Nao-Parametricos-Conceitos-e-Aplicacoes

Bioestatística

UFMA

Bioestatística-Comparação-Múltipla-Não-Paramétrica-Kruskal-Wallis

17

Bioestatística-Comparação-Múltipla-Não-Paramétrica-Kruskal-Wallis

Bioestatística

UFMA

Bioestatística-Amostragem-e-Determinação-do-Tamanho-da-Amostra

65

Bioestatística-Amostragem-e-Determinação-do-Tamanho-da-Amostra

Bioestatística

UFMA

Teste de Friedman-Analise Nao Parametrica para Amostras Dependentes

46

Teste de Friedman-Analise Nao Parametrica para Amostras Dependentes

Bioestatística

UFMA

ANOVA - Comparação-Múltipla-e-Testes-Post-Hoc-Analise-de-Variancia

28

ANOVA - Comparação-Múltipla-e-Testes-Post-Hoc-Analise-de-Variancia

Bioestatística

UFMA

Texto de pré-visualização

AULA 3 SEPARATRIZES MEDIDAS DE DISPERSÃO E VARIABILIDADE BI0ESTATÍSTICA20252 SEPARATRIZES Além das medidas de posição que estudamos há outras que consideradas individualmente não são medidas de tendência central mas estão ligadas à mediana relativamente à sua característica de separar a série em duas partes que apresentam o mesmo número de valores Essas medidas os quartis os decis e os percentis são juntamente com a mediana conhecidas pelo nome genérico de separatrizes QUARTIS Q Denominamos quartis os valores de uma série que a dividem em quatro partes iguais Precisamos portanto de 3 quartis Q1 Q2 e Q3 para dividir a série em quatro partes iguais Obs O quartil 2 Q2 SEMPRE SERÁ IGUAL A MEDIANA DA SÉRIE Quartis em dados não agrupados O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis Na realidade serão calculadas 3 medianas em uma mesma série Ex 1 Calcule os quartis da série 5 2 6 9 10 13 15 O primeiro passo a ser dado é o da ordenação crescente ou decrescente dos valores 2 5 6 9 10 13 15 O valor que divide a série acima em duas partes iguais é igual a 9 logo a Md 9 que será Q2 9 Temos agora 2 5 6 e 10 13 15 como sendo os dois grupos de valores iguais proporcionados pela mediana quartil 2 Para o cálculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da série quartil 2 Logo em 2 5 6 a mediana é 5 Ou seja será o quartil 1 Q1 5 em 10 13 15 a mediana é 13 Ou seja será o quartil 3 Q 13 Quartis para dados agrupados em classes Usamos a mesma técnica do cálculo da mediana bastando substituir na fórmula da mediana Ʃ fi 2 por k Ʃ fi 4 sendo k o número de ordem do quartil Assim temos Q1 Li Ʃ fi 4 Fa x h f Q2 Li 2 Ʃ fi 4 Fa x h f Q3 Li 3 Ʃ fi 4 Fa x h f Ex Calcule os quartis da tabela abaixo classes freqüência fi Freqüência acumulada 50 54 4 4 54 58 9 13 58 62 11 24 62 66 8 32 66 70 5 37 70 74 3 40 total 40 O quartil 2 Md logo 40 2 20 logoa classe mediana será 58 62 l 58 FAA 13 f 11 h 4 Q2 l 2 Ʃ fi 4 FAA x h f Substituindo esses valores na fórmula obtemos Md 58 20 13 x 4 11 58 2811 6054 Q2 O quartil 1 Ʃ fi 4 10 Q1 l Ʃ fi 4 FAA x h f Q1 54 10 4 x 4 9 54 266 5666 Q1 O quartil 3 3E fi 4 30 Q3 l 3 Ʃ fi 4 FAA x h f Q3 62 30 24 x 4 8 62 3 65 Q3 DECIS D A definição dos decis obedece ao mesmo princípio dos quartis com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretende calcular A fórmula básica será k Ʃ fi 10 onde k é o número de ordem do decil a ser calculado Indicamos os decis D1 D2 D9 Deste modo precisamos de 9 decis para dividirmos uma série em 10 partes iguais De especial interesse é o quinto decil que divide o conjunto em duas partes iguais Assim sendoo QUINTO DECIL É IGUAL AO SEGUNDO QUARTIL que por sua vez É IGUAL À MEDIANA Para D5 temos 5 Ʃ fi 10 Ʃ fi 2 Ex Calcule o 3º decil da tabela anterior com classes k 3 onde 3 Ʃ fi 10 3 x 40 10 12 Este resultado corresponde a 2ª classe D3 54 12 4 x 4 9 54 355 5755 D3 QUARTIS EM DADOS NÃO AGRUPADOS MEDIDAS SEPARATRIZES Quartil Valores da variável que dividem a distribuição em quatro partes iguais ¼ ½ ¾ 25 25 25 25 Q1 deixa abaixo 25 das observações 25 75 Q2 deixa abaixo 50 das observações 50 50 Q3 deixa abaixo 75 das observações 75 25 Quartis ¼ ½ ¾ 25 25 25 25 Q1 deixa abaixo 25 das observações 25 75 Posição do Q1 1º quartil n14 Quartis Posição do Q2 2º quartil n12 Quartis Posição do Q3 3º quartil ¾n1 Cálculo dos quartis 9 10 17 29 31 53 55 122 129 140 336 n11 Onde ficam os quartis Cálculo dos quartis 9 10 17 29 31 53 55 122 129 140 336 n11 Posição do Q1 1114 3ª posição Q1 17 Posição do Q2 1112 6ª posição Q2 53 Posição do Q3 31114 9ª posição Q3 129 Cálculo dos quartis 10 19 20 21 25 30 31 33 37 61 77 88 91 n13 Posição do Q1 1314 35ª posição Q1 20 052120 Q1 205 Posição do Q2 1312 7ª posição Q2 31 Posição do Q3 3 1314 105ª posição Q3 61057761 Q3 69 Analise o conjunto de dados abaixo que representa as notas de 0 a 100 que nove alunos tiraram em uma prova A primeira coisa a ser feita para encontrar os quartis é ordenar esses valores do menor ao maior Teremos o conjunto abaixo Como você pode perceber a forma de calcular quartis é bem simples No entanto ainda mais importante do que saber encontrar os valore é entender o que isso significa em um conjunto de dados Lembrese que em nosso exemplo estamos falando de notas de alunos O que o ponto 21 que encontramos significa nesse caso Significa que até o valor 21 Q1 estão agrupadas as 25 menores notas dos 9 alunos Já abaixo do valor 33 Q2 estão agrupadas as 50 menores notas acima do 33 estão as 50 maiores notas Por fim até o ponto 67 Q3 estão representadas as 75 menores notas da turma DECIS DECIS D A definição dos decis obedece ao mesmo princípio dos quartis com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretende calcular A fórmula básica será k Ʃ fi 10 onde k é o número de ordem do decil a ser calculado Indicamos os decis D1 D2 D9 Deste modo precisamos de 9 decis para dividirmos uma série em 10 partes iguais De especial interesse é o quinto decil que divide o conjunto em duas partes iguais Assim sendoo QUINTO DECIL É IGUAL AO SEGUNDO QUARTIL que por sua vez É IGUAL À MEDIANA Para D5 temos 5 Ʃ fi 10 Ʃ fi 2 Ex Calcule o 3º decil da tabela anterior com classes k 3 onde 3 Ʃ fi 10 3 x 40 10 12 Este resultado corresponde a 2ª classe D3 54 12 4 x 4 9 54 355 5755 D3 Decis são semelhantes a percentis na medida em que partem os dados em grupos de 10 O 1º decil é o 10º percentil o valor que divide os dados tal que 10 deles estão abaixo O 2º decil é o 20º percentil o valor abaixo do qual 20 dos dados estão etc You are at the 8th decile the 80th percentile PERCENTIL ou CENTIL Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma série em 100 partes iguais Indicamos P1 P2 P99 É evidente que P50 Md P25 Q1 e P75 Q3 O cálculo de um centil segue a mesma técnica do cálculo da mediana porém a fórmula será k E fi 100 Onde k é o número de ordem do centil a ser calculado PERCENTIS Percentil valor abaixo do qual está uma porcentagem dos dados Example You are the fourth tallest person in a group of 20 80 of people are shorter than you That means you are at the 80th percentile BOXPLOT BOXPLOT Limite superior Q3 15Q3 Q1 Limite Inferior Q115Q3Q1 outlier pode ter mais que 1 novo máximo novo mínimo outlier pode ter mais que 1 Q3 Q2 Q1 Exemplo bebês em UTI Bebês que sobreviveram mínimo 1130g Q1 1720g Q2 2200g Q3 2830g máximo 3640g Bebês que morreram mínimo 1030g Q1 1230g Q2 1600g Q3 2200g máximo2730g BOXPLOT Pesos separados por grupo peso grupo obito sobreviveram Median 2575 NonOutlier Range Outliers Extremes BOXPLOT Veja o boxplot típico para diferentes distribuições de dados 25 25 25 25 25 25 25 25 BIOESTATÍSTICA20251 Aula 3 Prof Antonio Carlos Leal de Castro Medidas de dispersão e variabilidade Dispersão ou Variabilidade É a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central média ou mediana tomado como ponto de comparação São medidas que complementam as medidas de tendência central trazendo informação sobre a dispersão existente no conjunto de dados A média ainda que considerada como um número que tem a faculdade de representar uma série de valores não pode por si mesma destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto MEDIDAS DE DISPERSÃO OU VARIABILIDADE Consideremos os seguintes conjuntos de valores das variáveis X Y e Z X 70 70 70 70 70 Y 68 69 70 71 72 Z 5 15 50 120 160 Observamos então que os três conjuntos apresentam a mesma média aritmética 3505 70 Entretanto é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z já que todos os valores são iguais à média O conjunto Y por sua vez é mais homogêneo que o conjunto Z pois há menor diversificação entre cada um de seus valores e a média representativa Concluímos então que o conjunto X apresenta DISPERSÃO NULA e que o conjunto Y apresenta uma DISPERSÃO MENOR que o conjunto Z 4 MEDIDAS DE DISPERSÃO ABSOLUTA AMPLITUDE TOTAL É a única medida de dispersão que não tem na média o ponto de referência Quando os dados não estão agrupados a amplitude total é a diferença entrE o maior e o menor valor observado AT X máximo X mínimo Ex Para os valores 40 45 48 62 e 70 a amplitude total será AT 70 40 30 Quando os dados estão agrupados sem intervalos de classe ainda temos AT X máximo X mínimo Ex xi fi 0 2 1 6 3 5 4 3 AT 10 4 6 A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série descuidando do conjunto de valores intermediários Fazse uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão Classes fi 4 6 6 6 8 2 8 10 3 Com intervalos de classe a AMPLITUDE TOTAL é a diferença entre o limite superior da última classe e o limite inferior da primeira classe Então AT L máximo l mínimo Ex DESVIO PADRÃO s É a medida de dispersão mais geralmente empregada pois leva em consideração a totalidade dos valores da variável em estudo É um indicador de variabilidade bastante estável O desvio padrão baseiase nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como a raiz quadrada da média aritmética dos quadrados dos desvios e é representada pela letra s A fórmula acima é empregada quando tratamos de uma população de dados nãoagrupados Quando nosso interesse não se restringe à descrição dos dados mas partindo da amostra visamos tirar inferências válidas para a respectiva população convém efetuar uma modificação que consiste em usar o divisor n 1 em lugar de n A fórmula ficará então VARIÂNCIA s2 É o desvio padrão elevado ao quadrado A variância é uma medida que tem pouca utilidade como estatística descritiva porém é extremamente importante na inferência estatística e em combinações de amostras VARIÂNCIA s2 A variância é uma medida da variação em torno da média Por definição variância é a média dos quadrados dos desvios em torno da média A variância ao contrário da Amplitude considera todos elementos do conjunto de dados no seu cálculo Quanto maior for a variação dos valores do conjunto de dados maior será a variância Variância Desvio padrão Desvio padrão populacional Desvio padrão amostral Exemplo Tipo A nível de colesterol Dados simples 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325 Variância S² 233 24505² 325 24505² 19 134237mg 100ml² Desvio padrão S 134237 3664mg 100ml Coeficiente de variação 3664 24505 x 100 1495 Tipo B nível de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213 Variância S² Desvio padrão S Coeficiente de variação ou Cálculo do desvio padrão e da variância Dados agrupados população Variância amostral Desvio padrão amostra Peso Kg f xi fxi xi x2 f xi x2 4044 2 42 84 4250772 2 4250772 4448 5 46 230 4650772 5 4650772 4852 9 50 450 5050772 9 5050772 5256 6 54 324 5450772 6 5450772 5660 4 58 232 5850772 4 5850772 X 5077 Ʃf 26 Ʃfx 1320 Ʃ f xi x2 54461 S2 2178 S 466 Cálculo da Variância Peso de 26 alunos Exemplo Calcule a variância e o desvio padrão da série abaixo representativa de uma população xi Fi xiFi xi ² xi ² Fi 2 3 6 272 817 3 5 15 042 211 4 8 32 012 098 5 4 20 182 729 Σ 20 73 1855 Primeiro calculamos a média X Σni1 xiFi Σni1 Fi 73 20 365 MEDIDAS DE DISPERSÃO RELATIVA Coeficiente de Variação de Pearson Na estatística descritiva o desvio padrão por si só tem grandes limitações Assim um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200 no entanto se a média for igual a 20 o mesmo não pode ser dito Além disso o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores relativamente à sua dispersão ou variabilidade quando expressas em unidades diferentes Para contornar essas dificuldades e limitações podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio medida essa denominada de CVP Coeficiente de Variação de Pearson É A RAZÃO ENTRE O DESVIO PADRÃO E A MÉDIA REFERENTES A DADOS DE UMA MESMA SÉRIE o resultado neste caso é expresso em percentual entretanto pode ser expresso também através de um fator decimal desprezando assim o valor 100 da fórmula Ex Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos Discriminação M É D I A DESVIO PADRÃO ESTATURAS 175 cm 50 cm PESOS 68 kg 20 kg Qual das medidas Estatura ou Peso possui maior homogeneidade Resposta Teremos que calcular o CVP da Estatura e o CVP do Peso O resultado menor será o de maior homogeneidade menor dispersão ou variabilidade CVP estatura 5 175 x 100 285 CVP peso 2 68 x 100 294 Logo nesse grupo de indivíduos as estaturas apresentam menor grau de dispersão que os pesos INTERVALO DE CONFIANÇA DA MÉDIA PX 196 σn μ X 196 σn 095 IC95 x 196 σn e x 196 σn ou x 196 σn Considerações sobre as Medidas de Variabilidade MV 1 A Amplitude á a MV mais pobre porque considera apenas os dois valores extremos do conjunto de dados 2 A Variância não é interpretada na prática devido ao problema da unidade que está ao quadrado 3 O Desviopadrão é a MV mais conhecida sendo amplamente utilizada 4 Dentre as MV estudadas sugerese que o CV seja utilizado para comparação da variabilidade entre diferentes conjuntos de dados Por não ter unidade o CV pode ser utilizado até mesmo para comparar a variabilidade entre variáveis expressas em diferentes unidades EXERCÍCIODistribuição de Frequência Os dados seguintes são referentes ao peso total mg de 60 exemplares de Penaeus schmitti Penaeidae Decapoda 56 61 57 77 62 75 63 55 64 60 60 57 61 57 67 62 69 67 68 59 65 72 65 61 68 73 65 62 75 80 66 61 69 76 72 57 75 68 83 64 69 64 66 74 65 76 65 58 65 64 65 60 65 80 66 80 68 55 66 71 Construa uma distribuição de frequência de classes de peso Determine as frequências simples e acumuladas de cada classe Determine as frequências relativas de cada classe Construa um histograma e um polígono de frequência com os dados agrupados em classe Calcule a média moda mediana Quartil 1 e Quartil 3

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Bioestatística-Distribuição-de-Probabilidade-Variável-Contínua-Normal

55

Bioestatística-Distribuição-de-Probabilidade-Variável-Contínua-Normal

Bioestatística

UFMA

Bioestatistica - Testes Nao Parametricos Mann-Whitney Mediana e Kruskal-Wallis

41

Bioestatistica - Testes Nao Parametricos Mann-Whitney Mediana e Kruskal-Wallis

Bioestatística

UFMA

Bioestatistica-Testes-Nao-Parametricos-Sinal-Wilcoxon-Mann-Whitney-Mediana

40

Bioestatistica-Testes-Nao-Parametricos-Sinal-Wilcoxon-Mann-Whitney-Mediana

Bioestatística

UFMA

Bioestatística - Origem-e-Importancia-da-Estatistica-Aula

57

Bioestatística - Origem-e-Importancia-da-Estatistica-Aula

Bioestatística

UFMA

Testes-Qui-Quadrado-Aderencia-Independencia-e-Heterogeneidade

61

Testes-Qui-Quadrado-Aderencia-Independencia-e-Heterogeneidade

Bioestatística

UFMA

Testes-Nao-Parametricos-Conceitos-e-Aplicacoes

37

Testes-Nao-Parametricos-Conceitos-e-Aplicacoes

Bioestatística

UFMA

Bioestatística-Comparação-Múltipla-Não-Paramétrica-Kruskal-Wallis

17

Bioestatística-Comparação-Múltipla-Não-Paramétrica-Kruskal-Wallis

Bioestatística

UFMA

Bioestatística-Amostragem-e-Determinação-do-Tamanho-da-Amostra

65

Bioestatística-Amostragem-e-Determinação-do-Tamanho-da-Amostra

Bioestatística

UFMA

Teste de Friedman-Analise Nao Parametrica para Amostras Dependentes

46

Teste de Friedman-Analise Nao Parametrica para Amostras Dependentes

Bioestatística

UFMA

ANOVA - Comparação-Múltipla-e-Testes-Post-Hoc-Analise-de-Variancia

28

ANOVA - Comparação-Múltipla-e-Testes-Post-Hoc-Analise-de-Variancia

Bioestatística

UFMA

Texto de pré-visualização

AULA 3 SEPARATRIZES MEDIDAS DE DISPERSÃO E VARIABILIDADE BI0ESTATÍSTICA20252 SEPARATRIZES Além das medidas de posição que estudamos há outras que consideradas individualmente não são medidas de tendência central mas estão ligadas à mediana relativamente à sua característica de separar a série em duas partes que apresentam o mesmo número de valores Essas medidas os quartis os decis e os percentis são juntamente com a mediana conhecidas pelo nome genérico de separatrizes QUARTIS Q Denominamos quartis os valores de uma série que a dividem em quatro partes iguais Precisamos portanto de 3 quartis Q1 Q2 e Q3 para dividir a série em quatro partes iguais Obs O quartil 2 Q2 SEMPRE SERÁ IGUAL A MEDIANA DA SÉRIE Quartis em dados não agrupados O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis Na realidade serão calculadas 3 medianas em uma mesma série Ex 1 Calcule os quartis da série 5 2 6 9 10 13 15 O primeiro passo a ser dado é o da ordenação crescente ou decrescente dos valores 2 5 6 9 10 13 15 O valor que divide a série acima em duas partes iguais é igual a 9 logo a Md 9 que será Q2 9 Temos agora 2 5 6 e 10 13 15 como sendo os dois grupos de valores iguais proporcionados pela mediana quartil 2 Para o cálculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da série quartil 2 Logo em 2 5 6 a mediana é 5 Ou seja será o quartil 1 Q1 5 em 10 13 15 a mediana é 13 Ou seja será o quartil 3 Q 13 Quartis para dados agrupados em classes Usamos a mesma técnica do cálculo da mediana bastando substituir na fórmula da mediana Ʃ fi 2 por k Ʃ fi 4 sendo k o número de ordem do quartil Assim temos Q1 Li Ʃ fi 4 Fa x h f Q2 Li 2 Ʃ fi 4 Fa x h f Q3 Li 3 Ʃ fi 4 Fa x h f Ex Calcule os quartis da tabela abaixo classes freqüência fi Freqüência acumulada 50 54 4 4 54 58 9 13 58 62 11 24 62 66 8 32 66 70 5 37 70 74 3 40 total 40 O quartil 2 Md logo 40 2 20 logoa classe mediana será 58 62 l 58 FAA 13 f 11 h 4 Q2 l 2 Ʃ fi 4 FAA x h f Substituindo esses valores na fórmula obtemos Md 58 20 13 x 4 11 58 2811 6054 Q2 O quartil 1 Ʃ fi 4 10 Q1 l Ʃ fi 4 FAA x h f Q1 54 10 4 x 4 9 54 266 5666 Q1 O quartil 3 3E fi 4 30 Q3 l 3 Ʃ fi 4 FAA x h f Q3 62 30 24 x 4 8 62 3 65 Q3 DECIS D A definição dos decis obedece ao mesmo princípio dos quartis com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretende calcular A fórmula básica será k Ʃ fi 10 onde k é o número de ordem do decil a ser calculado Indicamos os decis D1 D2 D9 Deste modo precisamos de 9 decis para dividirmos uma série em 10 partes iguais De especial interesse é o quinto decil que divide o conjunto em duas partes iguais Assim sendoo QUINTO DECIL É IGUAL AO SEGUNDO QUARTIL que por sua vez É IGUAL À MEDIANA Para D5 temos 5 Ʃ fi 10 Ʃ fi 2 Ex Calcule o 3º decil da tabela anterior com classes k 3 onde 3 Ʃ fi 10 3 x 40 10 12 Este resultado corresponde a 2ª classe D3 54 12 4 x 4 9 54 355 5755 D3 QUARTIS EM DADOS NÃO AGRUPADOS MEDIDAS SEPARATRIZES Quartil Valores da variável que dividem a distribuição em quatro partes iguais ¼ ½ ¾ 25 25 25 25 Q1 deixa abaixo 25 das observações 25 75 Q2 deixa abaixo 50 das observações 50 50 Q3 deixa abaixo 75 das observações 75 25 Quartis ¼ ½ ¾ 25 25 25 25 Q1 deixa abaixo 25 das observações 25 75 Posição do Q1 1º quartil n14 Quartis Posição do Q2 2º quartil n12 Quartis Posição do Q3 3º quartil ¾n1 Cálculo dos quartis 9 10 17 29 31 53 55 122 129 140 336 n11 Onde ficam os quartis Cálculo dos quartis 9 10 17 29 31 53 55 122 129 140 336 n11 Posição do Q1 1114 3ª posição Q1 17 Posição do Q2 1112 6ª posição Q2 53 Posição do Q3 31114 9ª posição Q3 129 Cálculo dos quartis 10 19 20 21 25 30 31 33 37 61 77 88 91 n13 Posição do Q1 1314 35ª posição Q1 20 052120 Q1 205 Posição do Q2 1312 7ª posição Q2 31 Posição do Q3 3 1314 105ª posição Q3 61057761 Q3 69 Analise o conjunto de dados abaixo que representa as notas de 0 a 100 que nove alunos tiraram em uma prova A primeira coisa a ser feita para encontrar os quartis é ordenar esses valores do menor ao maior Teremos o conjunto abaixo Como você pode perceber a forma de calcular quartis é bem simples No entanto ainda mais importante do que saber encontrar os valore é entender o que isso significa em um conjunto de dados Lembrese que em nosso exemplo estamos falando de notas de alunos O que o ponto 21 que encontramos significa nesse caso Significa que até o valor 21 Q1 estão agrupadas as 25 menores notas dos 9 alunos Já abaixo do valor 33 Q2 estão agrupadas as 50 menores notas acima do 33 estão as 50 maiores notas Por fim até o ponto 67 Q3 estão representadas as 75 menores notas da turma DECIS DECIS D A definição dos decis obedece ao mesmo princípio dos quartis com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretende calcular A fórmula básica será k Ʃ fi 10 onde k é o número de ordem do decil a ser calculado Indicamos os decis D1 D2 D9 Deste modo precisamos de 9 decis para dividirmos uma série em 10 partes iguais De especial interesse é o quinto decil que divide o conjunto em duas partes iguais Assim sendoo QUINTO DECIL É IGUAL AO SEGUNDO QUARTIL que por sua vez É IGUAL À MEDIANA Para D5 temos 5 Ʃ fi 10 Ʃ fi 2 Ex Calcule o 3º decil da tabela anterior com classes k 3 onde 3 Ʃ fi 10 3 x 40 10 12 Este resultado corresponde a 2ª classe D3 54 12 4 x 4 9 54 355 5755 D3 Decis são semelhantes a percentis na medida em que partem os dados em grupos de 10 O 1º decil é o 10º percentil o valor que divide os dados tal que 10 deles estão abaixo O 2º decil é o 20º percentil o valor abaixo do qual 20 dos dados estão etc You are at the 8th decile the 80th percentile PERCENTIL ou CENTIL Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma série em 100 partes iguais Indicamos P1 P2 P99 É evidente que P50 Md P25 Q1 e P75 Q3 O cálculo de um centil segue a mesma técnica do cálculo da mediana porém a fórmula será k E fi 100 Onde k é o número de ordem do centil a ser calculado PERCENTIS Percentil valor abaixo do qual está uma porcentagem dos dados Example You are the fourth tallest person in a group of 20 80 of people are shorter than you That means you are at the 80th percentile BOXPLOT BOXPLOT Limite superior Q3 15Q3 Q1 Limite Inferior Q115Q3Q1 outlier pode ter mais que 1 novo máximo novo mínimo outlier pode ter mais que 1 Q3 Q2 Q1 Exemplo bebês em UTI Bebês que sobreviveram mínimo 1130g Q1 1720g Q2 2200g Q3 2830g máximo 3640g Bebês que morreram mínimo 1030g Q1 1230g Q2 1600g Q3 2200g máximo2730g BOXPLOT Pesos separados por grupo peso grupo obito sobreviveram Median 2575 NonOutlier Range Outliers Extremes BOXPLOT Veja o boxplot típico para diferentes distribuições de dados 25 25 25 25 25 25 25 25 BIOESTATÍSTICA20251 Aula 3 Prof Antonio Carlos Leal de Castro Medidas de dispersão e variabilidade Dispersão ou Variabilidade É a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central média ou mediana tomado como ponto de comparação São medidas que complementam as medidas de tendência central trazendo informação sobre a dispersão existente no conjunto de dados A média ainda que considerada como um número que tem a faculdade de representar uma série de valores não pode por si mesma destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto MEDIDAS DE DISPERSÃO OU VARIABILIDADE Consideremos os seguintes conjuntos de valores das variáveis X Y e Z X 70 70 70 70 70 Y 68 69 70 71 72 Z 5 15 50 120 160 Observamos então que os três conjuntos apresentam a mesma média aritmética 3505 70 Entretanto é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z já que todos os valores são iguais à média O conjunto Y por sua vez é mais homogêneo que o conjunto Z pois há menor diversificação entre cada um de seus valores e a média representativa Concluímos então que o conjunto X apresenta DISPERSÃO NULA e que o conjunto Y apresenta uma DISPERSÃO MENOR que o conjunto Z 4 MEDIDAS DE DISPERSÃO ABSOLUTA AMPLITUDE TOTAL É a única medida de dispersão que não tem na média o ponto de referência Quando os dados não estão agrupados a amplitude total é a diferença entrE o maior e o menor valor observado AT X máximo X mínimo Ex Para os valores 40 45 48 62 e 70 a amplitude total será AT 70 40 30 Quando os dados estão agrupados sem intervalos de classe ainda temos AT X máximo X mínimo Ex xi fi 0 2 1 6 3 5 4 3 AT 10 4 6 A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série descuidando do conjunto de valores intermediários Fazse uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão Classes fi 4 6 6 6 8 2 8 10 3 Com intervalos de classe a AMPLITUDE TOTAL é a diferença entre o limite superior da última classe e o limite inferior da primeira classe Então AT L máximo l mínimo Ex DESVIO PADRÃO s É a medida de dispersão mais geralmente empregada pois leva em consideração a totalidade dos valores da variável em estudo É um indicador de variabilidade bastante estável O desvio padrão baseiase nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como a raiz quadrada da média aritmética dos quadrados dos desvios e é representada pela letra s A fórmula acima é empregada quando tratamos de uma população de dados nãoagrupados Quando nosso interesse não se restringe à descrição dos dados mas partindo da amostra visamos tirar inferências válidas para a respectiva população convém efetuar uma modificação que consiste em usar o divisor n 1 em lugar de n A fórmula ficará então VARIÂNCIA s2 É o desvio padrão elevado ao quadrado A variância é uma medida que tem pouca utilidade como estatística descritiva porém é extremamente importante na inferência estatística e em combinações de amostras VARIÂNCIA s2 A variância é uma medida da variação em torno da média Por definição variância é a média dos quadrados dos desvios em torno da média A variância ao contrário da Amplitude considera todos elementos do conjunto de dados no seu cálculo Quanto maior for a variação dos valores do conjunto de dados maior será a variância Variância Desvio padrão Desvio padrão populacional Desvio padrão amostral Exemplo Tipo A nível de colesterol Dados simples 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325 Variância S² 233 24505² 325 24505² 19 134237mg 100ml² Desvio padrão S 134237 3664mg 100ml Coeficiente de variação 3664 24505 x 100 1495 Tipo B nível de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213 Variância S² Desvio padrão S Coeficiente de variação ou Cálculo do desvio padrão e da variância Dados agrupados população Variância amostral Desvio padrão amostra Peso Kg f xi fxi xi x2 f xi x2 4044 2 42 84 4250772 2 4250772 4448 5 46 230 4650772 5 4650772 4852 9 50 450 5050772 9 5050772 5256 6 54 324 5450772 6 5450772 5660 4 58 232 5850772 4 5850772 X 5077 Ʃf 26 Ʃfx 1320 Ʃ f xi x2 54461 S2 2178 S 466 Cálculo da Variância Peso de 26 alunos Exemplo Calcule a variância e o desvio padrão da série abaixo representativa de uma população xi Fi xiFi xi ² xi ² Fi 2 3 6 272 817 3 5 15 042 211 4 8 32 012 098 5 4 20 182 729 Σ 20 73 1855 Primeiro calculamos a média X Σni1 xiFi Σni1 Fi 73 20 365 MEDIDAS DE DISPERSÃO RELATIVA Coeficiente de Variação de Pearson Na estatística descritiva o desvio padrão por si só tem grandes limitações Assim um desvio padrão de 2 unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200 no entanto se a média for igual a 20 o mesmo não pode ser dito Além disso o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores relativamente à sua dispersão ou variabilidade quando expressas em unidades diferentes Para contornar essas dificuldades e limitações podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio medida essa denominada de CVP Coeficiente de Variação de Pearson É A RAZÃO ENTRE O DESVIO PADRÃO E A MÉDIA REFERENTES A DADOS DE UMA MESMA SÉRIE o resultado neste caso é expresso em percentual entretanto pode ser expresso também através de um fator decimal desprezando assim o valor 100 da fórmula Ex Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos Discriminação M É D I A DESVIO PADRÃO ESTATURAS 175 cm 50 cm PESOS 68 kg 20 kg Qual das medidas Estatura ou Peso possui maior homogeneidade Resposta Teremos que calcular o CVP da Estatura e o CVP do Peso O resultado menor será o de maior homogeneidade menor dispersão ou variabilidade CVP estatura 5 175 x 100 285 CVP peso 2 68 x 100 294 Logo nesse grupo de indivíduos as estaturas apresentam menor grau de dispersão que os pesos INTERVALO DE CONFIANÇA DA MÉDIA PX 196 σn μ X 196 σn 095 IC95 x 196 σn e x 196 σn ou x 196 σn Considerações sobre as Medidas de Variabilidade MV 1 A Amplitude á a MV mais pobre porque considera apenas os dois valores extremos do conjunto de dados 2 A Variância não é interpretada na prática devido ao problema da unidade que está ao quadrado 3 O Desviopadrão é a MV mais conhecida sendo amplamente utilizada 4 Dentre as MV estudadas sugerese que o CV seja utilizado para comparação da variabilidade entre diferentes conjuntos de dados Por não ter unidade o CV pode ser utilizado até mesmo para comparar a variabilidade entre variáveis expressas em diferentes unidades EXERCÍCIODistribuição de Frequência Os dados seguintes são referentes ao peso total mg de 60 exemplares de Penaeus schmitti Penaeidae Decapoda 56 61 57 77 62 75 63 55 64 60 60 57 61 57 67 62 69 67 68 59 65 72 65 61 68 73 65 62 75 80 66 61 69 76 72 57 75 68 83 64 69 64 66 74 65 76 65 58 65 64 65 60 65 80 66 80 68 55 66 71 Construa uma distribuição de frequência de classes de peso Determine as frequências simples e acumuladas de cada classe Determine as frequências relativas de cada classe Construa um histograma e um polígono de frequência com os dados agrupados em classe Calcule a média moda mediana Quartil 1 e Quartil 3

Sua Nova Sala de Aula

Sua Nova Sala de Aula

Empresa

Central de ajuda Contato Blog

Legal

Termos de uso Política de privacidade Política de cookies Código de honra

Baixe o app

4,8
(35.000 avaliações)
© 2026 Meu Guru® • 42.269.770/0001-84