·
Nutrição ·
Bioestatística
Envie sua pergunta para a IA e receba a resposta na hora

Prefere sua atividade resolvida por um tutor especialista?
- Receba resolvida até o seu prazo
- Converse com o tutor pelo chat
- Garantia de 7 dias contra erros
Recomendado para você
6
Probabilidade Condicional e Testes Diagnósticos: O Paradoxo de Monty Hall
Bioestatística
UVV
12
Conceitos Fundamentais de Estatística: Tabelas e Gráficos
Bioestatística
UVV
6
Princípio Fundamental da Contagem e Propriedades da Probabilidade
Bioestatística
UVV
8
Distribuição de Frequências em Estatística Básica
Bioestatística
UVV
20
Medidas de Posição e de Ordenamento em Estatística Básica
Bioestatística
UVV
Texto de pré-visualização
08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 115 Medidas de Dispersão Assimetria e Curtose Estatística Básica 1 Introdução Para avaliar a variabilidade em torno da mediana utilizase a amplitude interquartil conforme já foi abordado no capítulo de Medidas de Posição Já as medidas de dispersão que serão neste Tópico abordadas são utilizadas dentre outras utilidades para descrever a variabilidade em torno da média em duas situações 1 Quando pretendese computar a variabilidade dita individual variância desvio padrão e coeficiente de variação 2 Ao computar a variabilidade em termos amostrais erro padrão e margem de erro Estatística Descritiva Medidas de Variabilidade Individual Amostral Já o coeficiente de assimetria irá elucidar os aspectos da assimetria dos dados ou seja definir se a distribuição de valores é simétrica ou assimétrica e quando assimétrica determinar o sentido da assimetria se à direita ou à esquerda e a intensidade da assimetria se forte ou fraca O coeficiente de curtose informará sobre o grau de achatamento da curva indicando o nível de dispersão dos dados 2 Medidas de Variabilidade As medidas de variabilidade individual são úteis para indicar a dispersão entre os elementos do conjunto e a média dos valores servindo para indicar essa variabilidade sem portanto se importar com a representatividade da amostra caso os dados sejam amostrais Já as medidas de variabilidade amostral atrelam seu cálculo a parâmetros da amostra de forma que indicam a variabilidade em virtude de características da amostra como uma forma de mostrar como essa amostra pode representar a população de onde ela é advinda VIEIRA 2008 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 215 3 Cálculo das Medidas de Variabilidade De acordo com Toledo e Ovalle 1986 todas as medidas de variabilidade citadas variância desvio padrão coeficiente de variação erro padrão e margem de erro têm sua origem no dimensionamento da distância desvio entre os valores do conjunto e a média aritmética Para esse dimensionamento basta subtrair cada valor do conjunto de dados pela média obtida destes dados de modo que a fórmula para cálculo dos desvios d será Assim sendo podemse calcular tantos desvios quantos forem os elementos do conjunto i 31 Conceito e Cálculo da Variância e do Desvio Padrão A ideia central é a partir do cálculo dos desvios gerar uma média entre esses desvios porém a propriedade de nulidade dos desvios da média aritmética impede que isso seja feito de maneira direta Considere o seguinte exemplo numérico para melhor entender o que foi relatado A sequência abaixo corresponde a 8 repetições amostrais de uma variável numérica idade 20 22 22 25 28 36 38 41 Objetivando calcular os desvios desse conjunto devemos iniciar pelo cálculo da média quando teríamos 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 315 Como se pode observar a soma algébrica dos desvios tomados em relação à média aritmética é nula de forma que o cálculo direto de uma média desses desvios fica impossibilitada devido a essa propriedade da média aritmética 311 Cálculo da variância para dados brutos Assim sendo uma das mais conceituadas alternativas para contornar a simetria algébrica dos desvios soma de valores negativos soma dos valores positivos é o cálculo da variância quando se realiza a exponenciação desses desvios considerando o menor expoente par no caso o 2 o quê em outras palavras seria elevar cada um dos desvios ao quadrado Depois de elevar ao quadrado devese realizar a soma e em seguida então dividir pelo número de desvios gerando a almejada média dos desvios A relevância desse método é que ele preserva as propriedades algébricas do conjunto de valores TOLEDO OVALLE 2011 Resumidamente diríamos que a variância é a média do quadrado dos desvios tomados em torno da média aritmética CRESPO 2011 Dessa maneira teríamos as seguintes fórmulas para a variância considerando se o conjunto de valores é advindo de um levantamento por censo ou por amostragem 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 415 Para o exemplo das idades aplicaríamos a fórmula para amostras fazendo primeiramente o quadrado dos desvios e sua soma De posse do somatório do quadrado dos desvios basta agora dividir essa soma por n1 312 Cálculo do desvio padrão para dados brutos Percebeu que ao elevar os desvios ao quadrado elevouse também a unidade ao quadrado de forma que para esses e muitos outros exemplos a estimativa de variabilidade via variância ficou um tanto quanto exacerbada por estar quadrática Para resolver essa questão e termos então uma medida não quadrática que fará melhor trabalho como medida de dispersão em torno da média uma vez que terá a mesma unidade que ela aplicamos a operação inversa ou seja tiramos a raiz quadrada da variância quando obteremos o desvio padrão Assim sendo 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 515 Por que calcular medidas de dispersão Como elas auxiliarão na descrição sumarizada do conjunto de dados No vídeo seguinte você terá as respostas a essa pergunta bem como poderá revisar o processo de cálculo da variância e do desvio padrão 313 Cálculo da variância e do desvio padrão para dados tabulados Assim como no cálculo da média ao imprimirmos o processo de cálculo para variância e desvio padrão quando os dados estiverem tabulados devemos realizar a ponderação pela frequência de forma que as fórmulas ajustadas ficariam assim Considere o seguinte exemplo para cálculo da variância e desvio padrão com dados tabulados Exemplo como parte de um experimento ratos de laboratório foram privados de água por 23 horas e então permitido o acesso à água por 1 uma hora Com os resultados obtidos montouse a seguinte tabela De posse da tabela para calcular a variância seguiríamos o seguinte roteiro 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 615 a Calcular a média Esse valor já foi calculado sendo da ordem de 142 ml b De posse do valor da média calcular os desvios que no caso de distribuições com intervalos de classes serão a diferença entre o ponto médio de cada classe e a média dos dados c Uma vez calculados os desvios eleválos ao quadrado ponderar pela frequência e fazer a soma d De posse do somatório dividilo por n1 por se tratarem de valores amostrais neste caso Dessa forma encontrouse consumo médio de 142 ml de água com desvio padrão de 26 ml que representa a variabilidade em torno dessa média Assim como a média a variância e o desvio padrão atendem a propriedades de interesse No vídeo a seguir relembre as propriedades da média e conheça as propriedades das medidas de variabilidade 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 715 32 Conceito e Cálculo do Coeficiente de Variação O coeficiente de variação CV vem a ser o percentual que o desvio padrão representa da média sendo portanto uma medida de dispersão relativa o que possibilita um melhor julgamento na avaliação da dimensão do desvio padrão se é grande ou pequeno sendo ainda muito útil quando se pretende comparar conjuntos distintos ou características de um mesmo conjunto a partir de sua variabilidade Sua fórmula é dada por Coeficiente de variação Uma pergunta que pode surgir é O desvio padrão calculado é grande ou pequeno Esta questão é relevante por exemplo na avaliação da precisão de métodos Um desvio padrão pode ser considerado grande ou pequeno dependendo da ordem de grandeza da variável Uma maneira de se expressar a variabilidade dos dados tirando a influência da ordem de grandeza da variável é através do coeficiente de variação definido por O CV é interpretado como a variabilidade dos dados em relação à média Quanto menor o CV mais homogêneo é o conjunto de dados adimensional isto é um número puro que será positivo se a média for positiva será zero quando não houver variabilidade entre os dados ou seja s0 Usualmente expresso em porcentagem indicando o percentual que o desvio padrão é menor 100CV 100 ou maior 100CV 100 do que a média Um CV é considerado baixo indicando um conjunto de dados razoavelmente homogêneo quando 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 815 Um CV é considerado baixo indicando um conjunto de dados razoavelmente homogêneo quando for menor ou igual a 25 Entretanto esse padrão varia de acordo com a aplicação Por exemplo em medidas vitais batimento cardíaco temperatura corporal etc esperase um CV muito menor do que 25 para que os dados sejam considerados homogêneos Pode ser difícil classificar um coeficiente de variação como baixo médio alto ou muito alto mas este pode ser bastante útil na comparação de duas variáveis ou dois grupos que a princípio não são comparáveis Exemplos 1 Em um grupo de pacientes foram tomadas as pulsações batidas por minuto e dosadas as taxas de ácido úrico mg100ml As médias e os desvios padrão foram Os coeficientes de variação são O que evidencia que a pulsação é mais estável do que o ácido úrico 2 Em experimentos para a determinação de clorofila em plantas levantouse a questão de que se o método utilizado poderia fornecer resultados mais consistentes Três métodos foram colocados à prova e 12 folhas de abacaxi foram analisadas com cada um dos métodos Os resultados foram os seguintes 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 915 Note que as médias são bastante diferentes devido às diferenças entre os métodos Entretanto os três CV são próximos o que indica que a consistência dos métodos é praticamente equivalente sendo que o método 3 mostrouse um pouco menos consistente SHIMAKURA 2012 33 Conceito e Cálculo do Erro Padrão da Média Ao escrever um texto científico muitas vezes sumarizamos os dados a partir da média acompanhada do desvio padrão dos dados da amostra ou da média com o erro padrão O desvio padrão dos dados da amostra é uma descrição da variação dos valores obtidos enquanto o erro padrão da média indica se o tamanho da amostra fornecerá uma boa estimativa da média populacional Resumidamente o erro padrão da média da amostra é uma estimativa de quão longe a média da amostra está da média populacional enquanto o desvio padrão da amostra é o grau em que os indivíduos dentro da amostra diferem da média da amostra Dessa maneira de acordo com a fórmula à medida que o tamanho da amostra aumenta o erro padrão da média diminui tendendo a zero com o aumento do tamanho da amostra considerando que quanto maior a amostra mais ela se aproxima da população O erro padrão da média possibilitará a definição da margem de erro que vem a ser uma estimativa de variação da média amostral a fim de se cercar o parâmetro a média populacional na construção dos intervalos de confiança ou seja permite sair da estimativa pontual para fazer estimativa intervalar Nessa estimativa intervalar a probabilidade de acerto é alta enquanto na pontual é baixa 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1015 Dessa forma encontrouse consumo médio de 142 ml de água com erro padrão da média de 14 ml que representa a variabilidade em torno dessa média indicando que a extensão com que a média amostral provavelmente se desviará da média populacional é dessa magnitude 34 Conceito e Cálculo do Coeficiente de Assimetria Na figura abaixo percebemos os tipos de assimetria das curvas já discutida no tópico de Medidas de Posição e de Ordenamento porém não fica facilitada a emissão de juízo sobre o grau dessa assimetria ou seja definir se a assimetria é forte ou fraca Essa definição é de grande importância para a análise estatística por indicar se a média aritmética se distanciou muito das outras medidas de posição a fim de se avaliar se a média é a medida de posição mais indicada para representar o conjunto de valores ou se deve ser substituída pela mediana O Coeficiente de Assimetria ASS permitirá esse julgamento a partir de seu cálculo e análise do resultado 341 Cálculo e interpretação do Coeficiente de Assimetria Há diferentes metodologias para cálculo do Coeficiente de Assimetria dentre as quais didaticamente destacamse Tipos de distribuições com relação à simetria 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1115 Conforme se percebeu há diversas metodologias para o cálculo do coeficiente porém independente do resultado de cada uma delas o que normalmente se pretende é avaliar o grau da assimetria e a tendência positiva ou negativa da assimetria Para tanto os resultados serão analisados considerando os seguintes pontos de corte FONSECA e MARTINS 2010 Nos 2 casos Se ASS 0 a distribuição é perfeitamente simétrica Se 015 ASS 1 a assimetria é moderada Se ASS 1 a assimetria é forte Obs o ASS em módulo representa a afirmativa tanto para valores negativos como para positivos invertendose o sinal da equação quando se multiplica por 1 Considere o exemplo dos ratos que foram privados de água Nesse exemplo já temos os valores de De posse desses resultados é possível calcular o coeficiente de assimetria utilizandose as duas metodologias Primeiramente usando a fórmula que envolve a moda a média e o desvio padrão quando teríamos 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1215 Depois usando a fórmula que envolve as separatrizes quando teríamos Com esses resultados podemos avaliar que os dados de consumo de água possuem uma assimetria moderada Neste caso continua o indicativo de uso da média para representar os dados A mediana pode passar a substituir a média quando se tem diagnóstico de assimetria forte ou seja quando ASS 1 35 Conceito e Cálculo do Coeficiente de Curtose Nas figuras percebemse três tipos de curvas com relação ao achatamento ou seja sua dispersão em torno do ponto central Curtose 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1315 a Percebese uma curva mais delgada em que há grande concentração dos valores em torno do ponto central Essa curva é denominada leptocúrtica b Percebese uma curva de achatamento intermediário em que há concentração intermediária dos valores em torno do ponto central Essa curva é denominada mesocúrtica c Percebese uma curva mais achatada que as outras duas em que há grande dispersão dos valores em torno do ponto central Essa curva é denominada platicúrtica Para se ter uma ideia de a qual tipo de distribuição os dados de um conjunto em particular aderem com relação à curtose lançase mão do cálculo e interpretação do coeficiente de curtose k cuja fórmula é Onde k coeficiente de curtose Q1 Quartil 1 Q3 Quartil 3 P10 Porcentil 10 P90 Porcentil 90 O resultado será interpretado considerandose o que se segue CRESPO 2011 Se k 0263 a curva é mesocúrtica Se k0263 a curva é leptocúrtica Se k 0263 a curva é platicúrtica Considere o exemplo dos ratos que foram privados de água Tipos de distribuições com relação à curtose 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1415 Já tendo calculado os valores de Com esse resultado determinase curva platicúrtica ou seja grande dispersão dos valores em torno do ponto central A determinação do grau de curtose é relevante para se prosseguir na análise estatística uma vez que os métodos inferenciais dependem dessa definição para que técnicas adequadas sejam aplicadas aos dados 4 Referências CRESPO Antônio Arnot Estatística Fácil 19ed São Paulo Saraiva 2011 FONSECA Jairo Simon da MARTINS Gilberto de Andrade Curso de Estatística 6ed São Paulo Atlas 2010 SHIMAKURA Silvia Laboratório de Estatística e Geoinformação 2012 Coeficiente de variação Disponível em httplegufprbrshimakurCE055node26html TOLEDO Geraldo Luciano OVALLE Ivo Izidoro Estatística básica 2 ed São Paulo SP Atlas 1986 459 p VIEIRA S Introdução à bioestatística 3 ed Rio de Janeiro Campus 2008 YouTube 2019 junho 29 Portal da Matemática Variância e Desvio Padrão 9min34 Disponível em httpswwwyoutubecomwatchvc8xZChTiLk YouTube 2019 junho 28 Khan Academy Brasil Estatística variância amostral 12min04 Disponível em httpswwwyoutubecomwatchv1in0w9bVoVc 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1515 YouTube 2019 junho 21 Gran Cursos Online Concursos Públicos Concurso Banco do Brasil Propriedades de Medidas Estatísticas 3min57 Disponível em httpswwwyoutubecomwatchvvmn6ZbYFDwU
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
6
Probabilidade Condicional e Testes Diagnósticos: O Paradoxo de Monty Hall
Bioestatística
UVV
12
Conceitos Fundamentais de Estatística: Tabelas e Gráficos
Bioestatística
UVV
6
Princípio Fundamental da Contagem e Propriedades da Probabilidade
Bioestatística
UVV
8
Distribuição de Frequências em Estatística Básica
Bioestatística
UVV
20
Medidas de Posição e de Ordenamento em Estatística Básica
Bioestatística
UVV
Texto de pré-visualização
08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 115 Medidas de Dispersão Assimetria e Curtose Estatística Básica 1 Introdução Para avaliar a variabilidade em torno da mediana utilizase a amplitude interquartil conforme já foi abordado no capítulo de Medidas de Posição Já as medidas de dispersão que serão neste Tópico abordadas são utilizadas dentre outras utilidades para descrever a variabilidade em torno da média em duas situações 1 Quando pretendese computar a variabilidade dita individual variância desvio padrão e coeficiente de variação 2 Ao computar a variabilidade em termos amostrais erro padrão e margem de erro Estatística Descritiva Medidas de Variabilidade Individual Amostral Já o coeficiente de assimetria irá elucidar os aspectos da assimetria dos dados ou seja definir se a distribuição de valores é simétrica ou assimétrica e quando assimétrica determinar o sentido da assimetria se à direita ou à esquerda e a intensidade da assimetria se forte ou fraca O coeficiente de curtose informará sobre o grau de achatamento da curva indicando o nível de dispersão dos dados 2 Medidas de Variabilidade As medidas de variabilidade individual são úteis para indicar a dispersão entre os elementos do conjunto e a média dos valores servindo para indicar essa variabilidade sem portanto se importar com a representatividade da amostra caso os dados sejam amostrais Já as medidas de variabilidade amostral atrelam seu cálculo a parâmetros da amostra de forma que indicam a variabilidade em virtude de características da amostra como uma forma de mostrar como essa amostra pode representar a população de onde ela é advinda VIEIRA 2008 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 215 3 Cálculo das Medidas de Variabilidade De acordo com Toledo e Ovalle 1986 todas as medidas de variabilidade citadas variância desvio padrão coeficiente de variação erro padrão e margem de erro têm sua origem no dimensionamento da distância desvio entre os valores do conjunto e a média aritmética Para esse dimensionamento basta subtrair cada valor do conjunto de dados pela média obtida destes dados de modo que a fórmula para cálculo dos desvios d será Assim sendo podemse calcular tantos desvios quantos forem os elementos do conjunto i 31 Conceito e Cálculo da Variância e do Desvio Padrão A ideia central é a partir do cálculo dos desvios gerar uma média entre esses desvios porém a propriedade de nulidade dos desvios da média aritmética impede que isso seja feito de maneira direta Considere o seguinte exemplo numérico para melhor entender o que foi relatado A sequência abaixo corresponde a 8 repetições amostrais de uma variável numérica idade 20 22 22 25 28 36 38 41 Objetivando calcular os desvios desse conjunto devemos iniciar pelo cálculo da média quando teríamos 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 315 Como se pode observar a soma algébrica dos desvios tomados em relação à média aritmética é nula de forma que o cálculo direto de uma média desses desvios fica impossibilitada devido a essa propriedade da média aritmética 311 Cálculo da variância para dados brutos Assim sendo uma das mais conceituadas alternativas para contornar a simetria algébrica dos desvios soma de valores negativos soma dos valores positivos é o cálculo da variância quando se realiza a exponenciação desses desvios considerando o menor expoente par no caso o 2 o quê em outras palavras seria elevar cada um dos desvios ao quadrado Depois de elevar ao quadrado devese realizar a soma e em seguida então dividir pelo número de desvios gerando a almejada média dos desvios A relevância desse método é que ele preserva as propriedades algébricas do conjunto de valores TOLEDO OVALLE 2011 Resumidamente diríamos que a variância é a média do quadrado dos desvios tomados em torno da média aritmética CRESPO 2011 Dessa maneira teríamos as seguintes fórmulas para a variância considerando se o conjunto de valores é advindo de um levantamento por censo ou por amostragem 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 415 Para o exemplo das idades aplicaríamos a fórmula para amostras fazendo primeiramente o quadrado dos desvios e sua soma De posse do somatório do quadrado dos desvios basta agora dividir essa soma por n1 312 Cálculo do desvio padrão para dados brutos Percebeu que ao elevar os desvios ao quadrado elevouse também a unidade ao quadrado de forma que para esses e muitos outros exemplos a estimativa de variabilidade via variância ficou um tanto quanto exacerbada por estar quadrática Para resolver essa questão e termos então uma medida não quadrática que fará melhor trabalho como medida de dispersão em torno da média uma vez que terá a mesma unidade que ela aplicamos a operação inversa ou seja tiramos a raiz quadrada da variância quando obteremos o desvio padrão Assim sendo 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 515 Por que calcular medidas de dispersão Como elas auxiliarão na descrição sumarizada do conjunto de dados No vídeo seguinte você terá as respostas a essa pergunta bem como poderá revisar o processo de cálculo da variância e do desvio padrão 313 Cálculo da variância e do desvio padrão para dados tabulados Assim como no cálculo da média ao imprimirmos o processo de cálculo para variância e desvio padrão quando os dados estiverem tabulados devemos realizar a ponderação pela frequência de forma que as fórmulas ajustadas ficariam assim Considere o seguinte exemplo para cálculo da variância e desvio padrão com dados tabulados Exemplo como parte de um experimento ratos de laboratório foram privados de água por 23 horas e então permitido o acesso à água por 1 uma hora Com os resultados obtidos montouse a seguinte tabela De posse da tabela para calcular a variância seguiríamos o seguinte roteiro 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 615 a Calcular a média Esse valor já foi calculado sendo da ordem de 142 ml b De posse do valor da média calcular os desvios que no caso de distribuições com intervalos de classes serão a diferença entre o ponto médio de cada classe e a média dos dados c Uma vez calculados os desvios eleválos ao quadrado ponderar pela frequência e fazer a soma d De posse do somatório dividilo por n1 por se tratarem de valores amostrais neste caso Dessa forma encontrouse consumo médio de 142 ml de água com desvio padrão de 26 ml que representa a variabilidade em torno dessa média Assim como a média a variância e o desvio padrão atendem a propriedades de interesse No vídeo a seguir relembre as propriedades da média e conheça as propriedades das medidas de variabilidade 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 715 32 Conceito e Cálculo do Coeficiente de Variação O coeficiente de variação CV vem a ser o percentual que o desvio padrão representa da média sendo portanto uma medida de dispersão relativa o que possibilita um melhor julgamento na avaliação da dimensão do desvio padrão se é grande ou pequeno sendo ainda muito útil quando se pretende comparar conjuntos distintos ou características de um mesmo conjunto a partir de sua variabilidade Sua fórmula é dada por Coeficiente de variação Uma pergunta que pode surgir é O desvio padrão calculado é grande ou pequeno Esta questão é relevante por exemplo na avaliação da precisão de métodos Um desvio padrão pode ser considerado grande ou pequeno dependendo da ordem de grandeza da variável Uma maneira de se expressar a variabilidade dos dados tirando a influência da ordem de grandeza da variável é através do coeficiente de variação definido por O CV é interpretado como a variabilidade dos dados em relação à média Quanto menor o CV mais homogêneo é o conjunto de dados adimensional isto é um número puro que será positivo se a média for positiva será zero quando não houver variabilidade entre os dados ou seja s0 Usualmente expresso em porcentagem indicando o percentual que o desvio padrão é menor 100CV 100 ou maior 100CV 100 do que a média Um CV é considerado baixo indicando um conjunto de dados razoavelmente homogêneo quando 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 815 Um CV é considerado baixo indicando um conjunto de dados razoavelmente homogêneo quando for menor ou igual a 25 Entretanto esse padrão varia de acordo com a aplicação Por exemplo em medidas vitais batimento cardíaco temperatura corporal etc esperase um CV muito menor do que 25 para que os dados sejam considerados homogêneos Pode ser difícil classificar um coeficiente de variação como baixo médio alto ou muito alto mas este pode ser bastante útil na comparação de duas variáveis ou dois grupos que a princípio não são comparáveis Exemplos 1 Em um grupo de pacientes foram tomadas as pulsações batidas por minuto e dosadas as taxas de ácido úrico mg100ml As médias e os desvios padrão foram Os coeficientes de variação são O que evidencia que a pulsação é mais estável do que o ácido úrico 2 Em experimentos para a determinação de clorofila em plantas levantouse a questão de que se o método utilizado poderia fornecer resultados mais consistentes Três métodos foram colocados à prova e 12 folhas de abacaxi foram analisadas com cada um dos métodos Os resultados foram os seguintes 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 915 Note que as médias são bastante diferentes devido às diferenças entre os métodos Entretanto os três CV são próximos o que indica que a consistência dos métodos é praticamente equivalente sendo que o método 3 mostrouse um pouco menos consistente SHIMAKURA 2012 33 Conceito e Cálculo do Erro Padrão da Média Ao escrever um texto científico muitas vezes sumarizamos os dados a partir da média acompanhada do desvio padrão dos dados da amostra ou da média com o erro padrão O desvio padrão dos dados da amostra é uma descrição da variação dos valores obtidos enquanto o erro padrão da média indica se o tamanho da amostra fornecerá uma boa estimativa da média populacional Resumidamente o erro padrão da média da amostra é uma estimativa de quão longe a média da amostra está da média populacional enquanto o desvio padrão da amostra é o grau em que os indivíduos dentro da amostra diferem da média da amostra Dessa maneira de acordo com a fórmula à medida que o tamanho da amostra aumenta o erro padrão da média diminui tendendo a zero com o aumento do tamanho da amostra considerando que quanto maior a amostra mais ela se aproxima da população O erro padrão da média possibilitará a definição da margem de erro que vem a ser uma estimativa de variação da média amostral a fim de se cercar o parâmetro a média populacional na construção dos intervalos de confiança ou seja permite sair da estimativa pontual para fazer estimativa intervalar Nessa estimativa intervalar a probabilidade de acerto é alta enquanto na pontual é baixa 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1015 Dessa forma encontrouse consumo médio de 142 ml de água com erro padrão da média de 14 ml que representa a variabilidade em torno dessa média indicando que a extensão com que a média amostral provavelmente se desviará da média populacional é dessa magnitude 34 Conceito e Cálculo do Coeficiente de Assimetria Na figura abaixo percebemos os tipos de assimetria das curvas já discutida no tópico de Medidas de Posição e de Ordenamento porém não fica facilitada a emissão de juízo sobre o grau dessa assimetria ou seja definir se a assimetria é forte ou fraca Essa definição é de grande importância para a análise estatística por indicar se a média aritmética se distanciou muito das outras medidas de posição a fim de se avaliar se a média é a medida de posição mais indicada para representar o conjunto de valores ou se deve ser substituída pela mediana O Coeficiente de Assimetria ASS permitirá esse julgamento a partir de seu cálculo e análise do resultado 341 Cálculo e interpretação do Coeficiente de Assimetria Há diferentes metodologias para cálculo do Coeficiente de Assimetria dentre as quais didaticamente destacamse Tipos de distribuições com relação à simetria 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1115 Conforme se percebeu há diversas metodologias para o cálculo do coeficiente porém independente do resultado de cada uma delas o que normalmente se pretende é avaliar o grau da assimetria e a tendência positiva ou negativa da assimetria Para tanto os resultados serão analisados considerando os seguintes pontos de corte FONSECA e MARTINS 2010 Nos 2 casos Se ASS 0 a distribuição é perfeitamente simétrica Se 015 ASS 1 a assimetria é moderada Se ASS 1 a assimetria é forte Obs o ASS em módulo representa a afirmativa tanto para valores negativos como para positivos invertendose o sinal da equação quando se multiplica por 1 Considere o exemplo dos ratos que foram privados de água Nesse exemplo já temos os valores de De posse desses resultados é possível calcular o coeficiente de assimetria utilizandose as duas metodologias Primeiramente usando a fórmula que envolve a moda a média e o desvio padrão quando teríamos 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1215 Depois usando a fórmula que envolve as separatrizes quando teríamos Com esses resultados podemos avaliar que os dados de consumo de água possuem uma assimetria moderada Neste caso continua o indicativo de uso da média para representar os dados A mediana pode passar a substituir a média quando se tem diagnóstico de assimetria forte ou seja quando ASS 1 35 Conceito e Cálculo do Coeficiente de Curtose Nas figuras percebemse três tipos de curvas com relação ao achatamento ou seja sua dispersão em torno do ponto central Curtose 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1315 a Percebese uma curva mais delgada em que há grande concentração dos valores em torno do ponto central Essa curva é denominada leptocúrtica b Percebese uma curva de achatamento intermediário em que há concentração intermediária dos valores em torno do ponto central Essa curva é denominada mesocúrtica c Percebese uma curva mais achatada que as outras duas em que há grande dispersão dos valores em torno do ponto central Essa curva é denominada platicúrtica Para se ter uma ideia de a qual tipo de distribuição os dados de um conjunto em particular aderem com relação à curtose lançase mão do cálculo e interpretação do coeficiente de curtose k cuja fórmula é Onde k coeficiente de curtose Q1 Quartil 1 Q3 Quartil 3 P10 Porcentil 10 P90 Porcentil 90 O resultado será interpretado considerandose o que se segue CRESPO 2011 Se k 0263 a curva é mesocúrtica Se k0263 a curva é leptocúrtica Se k 0263 a curva é platicúrtica Considere o exemplo dos ratos que foram privados de água Tipos de distribuições com relação à curtose 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1415 Já tendo calculado os valores de Com esse resultado determinase curva platicúrtica ou seja grande dispersão dos valores em torno do ponto central A determinação do grau de curtose é relevante para se prosseguir na análise estatística uma vez que os métodos inferenciais dependem dessa definição para que técnicas adequadas sejam aplicadas aos dados 4 Referências CRESPO Antônio Arnot Estatística Fácil 19ed São Paulo Saraiva 2011 FONSECA Jairo Simon da MARTINS Gilberto de Andrade Curso de Estatística 6ed São Paulo Atlas 2010 SHIMAKURA Silvia Laboratório de Estatística e Geoinformação 2012 Coeficiente de variação Disponível em httplegufprbrshimakurCE055node26html TOLEDO Geraldo Luciano OVALLE Ivo Izidoro Estatística básica 2 ed São Paulo SP Atlas 1986 459 p VIEIRA S Introdução à bioestatística 3 ed Rio de Janeiro Campus 2008 YouTube 2019 junho 29 Portal da Matemática Variância e Desvio Padrão 9min34 Disponível em httpswwwyoutubecomwatchvc8xZChTiLk YouTube 2019 junho 28 Khan Academy Brasil Estatística variância amostral 12min04 Disponível em httpswwwyoutubecomwatchv1in0w9bVoVc 08092022 2044 Medidas de Dispersão Assimetria e Curtose httpsceadgraduacaouvvbrconteudophpaulamedidasdedispersaoassimetriaecurtosedcpestatisticabasicatopico4 1515 YouTube 2019 junho 21 Gran Cursos Online Concursos Públicos Concurso Banco do Brasil Propriedades de Medidas Estatísticas 3min57 Disponível em httpswwwyoutubecomwatchvvmn6ZbYFDwU