·
Educação Física ·
Bioestatística
Send your question to AI and receive an answer instantly
Recommended for you
4
Exercícios - Bioestatística 2022 1
Bioestatística
UNESP
1
Lista de Exercícios - Probabilidade e Estatística
Bioestatística
UNESP
1
Revisão de Bioestatística 2023 1
Bioestatística
UNESP
4
Exercícios - Bioestatística 2022-1
Bioestatística
UNESP
1
Analise da associacao entre estado nutricional, depressao, ansiedade e problemas de saude
Bioestatística
UNESP
1
Exercícios Resolvidos Bioestatística - Média Mediana Variância Desvio Padrão
Bioestatística
UNESP
1
Lista 5 - Teste de Hipóteses - 2023-1
Bioestatística
UNESP
1
Exercicios Resolvidos Bioestatistica Probabilidade Normal Amostragem e Correlacao
Bioestatística
UNESP
1
Prova de Bioestatística - Testes de Hipóteses e Intervalos de Confiança
Bioestatística
UNESP
8
Capítulo 9 - Testes Não Paramétricos - Bioestatística
Bioestatística
UNESP
Preview text
C A P Í T U L O 6\nDistribuição normal\nEstatísticos costumam dizer que a distribuição normal é uma das mais importantes em estatística. Talvez por isso, quando um pesquisador tem em suas mãos um conjunto de dados para analisar, uma das primeiras perguntas que podem vir à sua mente é: “será que estes dados estão normalmente distribuídos?”. A importância de responder a essa pergunta reside no fato de que a normalidade da distribuição dos dados é um dos principais critérios a ser observado quando da seleção de testes de hipóteses.\n\nObjetivos\nApós ler este capítulo você deve ser capaz de:\n- descrever as características teóricas da distribuição normal;\n- analisar a normalidade de distribuição de dados a partir de avaliação de gráficos;\n- aplicar testes para avaliação da normalidade de distribuição de um conjunto de dados;\n- identificar as estratégias que se pode adotar, em termos de análise, quando os dados não seguem a distribuição normal teórica.\n\nTópicos principais\n- Distribuição normal\n- Área sob a curva normal\n- Assimetria\n- Curtose\n- Testes de normalidade\n- Transformações matemáticas Distribuição normal\nNa opinião de muitos pesquisadores e estatísticos, a probabilidade de distribuição teórica mais importante em estatística é a chamada \"distribuição normal\", também referida como \"curva normal\" ou \"distribuição Gaussiana\". Algumas das principais características de uma distribuição normal são:\n- é uma distribuição que pode ser completamente descrita por dois parâmetros, a média (μ) e a variância (σ²);\n- tem o formato de um sino (figura 17a);\n- é simétrica em relação à média;\n- a média, a mediana e a moda são iguais;\n- é unimodal;\n- assumindo variância constante, é uma distribuição que se desloca à direita se a média aumenta e à esquerda se a média diminui (figura 17b);\n- sofre achatamento quando a variância aumenta e alongamento quando a variância diminui (figura 17c). Fig 17. Distribuição normal: (a) simétrica em relação à média; (b) com médias diferentes (m2 > m1) e mesma variância; e, (c) variâncias diferentes (σ1² > σ2²) e mesma média\n\nA curva normal representa, então, uma distribuição empírica de frequências relativas que descreve o comportamento de uma variável quantitativa \"x\", representada num eixo horizontal (Petrie; Sabin, 2000). Assim, na área sob a curva, estão 100% dos dados, simetricamente distribuídos em relação à média. A área total limitada pela curva e pelo eixo horizontal é igual a um, que corresponde à probabilidade de a variável \"x\" assumir qualquer valor no eixo horizontal.\n\nHá uma infinidade de distribuições normais, que dependem do valor de μ e σ. A distribuição normal padronizada é um tipo especial de distribuição, com média igual a zero e desvio padrão igual a um, para a qual as probabilidades foram tabuladas. Sendo assim, o desvio de qualquer distribuição normal em relação à normal padronizada, denominado desvio normal padronizado (Z = [x - μ] / σ), é uma variável randômica que tem uma distribuição normal padronizada. Estes conceitos são importantes porque, dispondo-se de uma variável aleatória com distribuição normal, é possível determinar a probabilidade de essa variável assumir um valor específico em um intervalo.\n\nVejamos como proceder, por meio de um exemplo concreto. O desempenho de estudantes do ensino médio num teste para avaliação da flexibilidade (sentar e alcançar) tem distribuição normal com média de 18 cm e desvio padrão de 4 cm. Qual a probabilidade de que, num determinado dia, um estudante avaliado apresente desempenho superior a 24 cm? A solução consiste em determinar a proporção da área sob a curva normal que está acima de 24 cm. Se o valor de Z é calculado por (x - µ) / σ, logo, Z será igual a (24 - 18) / 4 ou 1,5. Comparando-se o valor calculado de Z com os valores tabelados (apêndice 6), conclui-se que há aproximadamente 6,7% de probabilidade de que um estudante avaliado quanto a sua flexibilidade venha a apresentar desempenho superior a 24 cm no teste de sentar e alcançar.\n\nConsiderando os valores tabelados de Z, observa-se que, entre a média e o primeiro desvio padrão, a área sob a curva normal corresponde a 34,13% da área total. Analogamente, entre a média e o primeiro desvio padrão negativo, estão outros 34,13% da área sob a curva ou uma probabilidade de 27,19% de um valor qualquer da distribuição estar dentro deste limite (figura 18). Vejamos a utilização da curva normal padronizada na avaliação de uma segunda situação hipotética. Suponha-se que os desempenhos de uma amostra de escolares, no teste de corrida de 12 minutos, possam ser descritos por uma distribuição normal, com média de 1.900 metros e desvio padrão de 150 metros. Pode-se calcular a proporção de escolares que apresentarão desempenho entre dois limites quaisquer, dentro da distribuição de dados, por exemplo, entre 1.750 e 2.050. Para isto, basta calcular a proporção da área sob a curva entre esses dois valores, transformando-os em escores padronizados, que podem, então, ser comparados aos valores da tabela Z (apêndice 6).\n\nNesse caso, a solução pode ser determinada através do cálculo de Z' e Z'', conforme ilustrado na figura seguinte. Os valores de Z' e Z'' correspondem a uma proporção de 34,13% da área sob a curva normal. Sendo assim, respondendo ao problema formulado, no intervalo entre 1.750 e 2.050 metros, estarão concentrados cerca de 68,26% (áreas A + B na figura 19b) dos desempenhos, no teste de 12 minutos, entre estudantes da mesma população. Desvios à normal\nNo capítulo 1, foram apresentados os conceitos de estatística paramétrica e não paramétrica. Conforme exposto, se os dados sob análise acompanham as características teóricas de uma distribuição normal, deve-se empregar procedimentos paramétricos de análise devido ao maior poder estatístico proporcionado em comparação com os seus equivalentes não paramétricos. A avaliação da normalidade da distribuição dos dados é, portanto, um aspecto fundamental em estatística.\n\nCertamente, não se espera encontrar em qualquer conjunto de dados características exatamente idênticas às que descrevem uma distribuição normal teórica. Assim, o que se procura observar é se os dados têm uma distribuição \"próxima da normalidade\". Em outras palavras, a presunção da normalidade da distribuição se baseia na medida da assimetria (desvio à direita ou à esquerda, figura 20a e 20b) e curtose (achatamento, figura 20c) da curva de dados em relação à curva normal (figura 20). Em geral, se a amostra é grande e os dados estão em escala intervalar ou de razão, é possível que estes apresentem uma distribuição que seja normal ou que se aproxime da normal (simétrica e mesocúrtica).\n\nAssimetria\nUma distribuição é dita simétrica quando apresenta o mesmo valor para a moda, a mediana e a média. Quando essas medidas não são iguais, tem-se uma distribuição assimétrica. A assimetria é o grau de afastamento que uma distribuição apresenta do seu eixo de referência ou simetria. O eixo de simetria é traçado sobre o valor da média da distribuição dos valores tem-se um quadro de assimetria. Esse afastamento pode ser para o lado direito, sendo denominado assimetria positiva, ou para o lado esquerdo, quando é denominado assimetria negativa. Assim, as distribuições podem ser simétricas (moda, média e mediana iguais ou semelhantes), assimétricas positivas (moda > mediana < média) e assimétricas negativas (moda < mediana > média). Curtose Representa o grau de achatamento da distribuição. Indica o quanto uma curva de frequência será achatada em relação à curva normal de referência. A medida de achatamento ou curtose indica a forma da curva de distribuição em relação ao seu achatamento, podendo ser classificada em mesocúrtica, platicúrtica e leptocúrtica. Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal (mais aguda em sua parte superior), ela recebe o nome de leptocúrtica. Quando a distribuição apresenta uma curva de frequência mais aberta que a normal (mais achatada na sua parte superior), ela é chamada de platicúrtica. A curva normal, que é a referencial, recebe o nome de mesocúrtica. Fig 20. Ilustração de curvas com desvios à normal (a) Assimetria positivo ou direita (b) Assimetria negativa ou esquerda (c) Distribuição achatada ou platicúrtica (d) Distribuição alongada ou leptocúrtica Testes de normalidade A avaliação da normalidade pode ser efetuada mediante cálculo das medidas de assimetria e curtose, métodos gráficos e testes estatísticos. Por exemplo, ao observar um histograma com curva normal teórica sobreposta, pode-se avaliar com relativa facilidade há assimetria ou curtose na distribuição dos dados sob análise. Como ilustrado na figura 21, a comparação do histograma com a curva normal sobreposta evidencia que há desvios entre as duas distribuições. No centro da distribuição, as frequências observadas foram inferiores à normal, enquanto que, nas extremidades, verificou-se o oposto. Além disso, as frequências observadas na extremidade esquerda da distribuição foram muito superiores à normal. Fig 21. Histograma das idades, utilizando dados da planilha 1 (apêndice 3) Histograma 50 40 30 20 10 0 16,9 25,6 34,4 43,1 51,9 60,6 69,4 78,1 Idade Curva normal sobreposta ao histograma indicando a distribuição que os dados deveriam apresentar para atender aos pressupostos de normalidade Std. Dev = 18,87 Mean = 32,1 N = 79,00 A análise do histograma permite supor, com razoável confiança, que as idades apresentadas no histograma da figura 21 têm distribuição assimétrica (desvio positivo, à direita) e achatada (platicúrtica). Apesar de ser uma opção para avaliação da normalidade, a construção de histogramas não é uma medida quantitativa precisa de assimetria e curtose. Por isso, pode-se lançar mão do cálculo de assimetria e curtose através das seguintes equações matemáticas: Assimetria (skewness) Assimetria = N (N-1)(N-2) ΣZ² EP assimetria = (6 / N²) Z assimetria = Assimetria / EP assimetria Curtose (Kurtosis) Curtose = N (N+1) (N-2)(N-3) ΣZ⁴ EP curtose = (24 / N³) Z curtose = Curtose / EP curtose Cálculos de assimetria e curtose são automaticamente efetuados quando se utiliza um programa estatístico (exemplo: SPSS, Stata) para explorar a distribuição de dados quantitativos. Se você não tem um programa desses, poderá fazer os cálculos utilizando uma planilha do programa Excel. Observe no exemplo fictício seguinte (tabela 6) uma demonstração do cálculo da assimetria e curtose. Tabela 6. Dados fictícios para ilustração do cálculo de assimetria e curtose Escore Escore Z Z³ Z⁴ 6 1,20 1,20¹ 1,71 1,20² 2,04 6 1,20 1,20¹ 1,71 1,20² 2,04 6 1,20 1,20¹ 1,71 1,20² 2,04 5 0,60 0,60¹ 0,21 0,60² 0,13 4 0,00 0,00¹ 0,00 0,00² 0,00 4 0,00 0,00¹ 0,00 0,00² 0,00 4 0,00 0,00¹ 0,00 0,00² 0,00 3 0,60 -0,60¹ -0,21 0,60² 0,13 3 0,60 -0,60¹ -0,21 0,60² 0,13 1 -1,20 -1,20¹ -1,71 1,20² 2,04 1 -1,79 -1,79¹ -5,76 1,79² 10,33 ΣZ² = -6,39 Z⁴ = 31,38 Assimetria (skewness) Assimetria = -0,49 EP assimetria = (6 / N) * (6 / 16) = 0,61 Z assimetria = Assimetria / EP assimetria = -0,49 / 0,61 = -0,80 Curtose (Kurtosis) Curtose = -0,58 EP curtose = (24 / N) * (24 / 16) = 1,22 Z curtose = Curtose / EP curtose = -0,58 / 1,22 = -0,48 Se os valores padronizados de assimetria (Z assimetria) e curtose (Z curtose) ficam entre ±2Z, não se pode rejeitar a simetria da distribuição dos dados. Portanto, em relação ao exemplo fictício ilustrado anteriormente, como as medidas padronizadas de assimetria (-0,80) e curtose (-0,48) estão dentro destes limites (> -2; < +2), a conclusão é de que os dados apresentam uma distribuição próxima da normal.\n\nHá testes estatísticos que permitem confirmar se um conjunto de dados apresenta distribuição normal. O teste de Shapiro-Wilk é utilizado quando o conjunto de observações é pequeno (até 50), enquanto, nas demais situações, recomenda-se utilizar o teste de Kolmogorov-Smirnov. A hipótese nula nesses testes é de que a variável segue distribuição normal; portanto, quando o nível de significância da estatística é inferior ao preestabelecido (usualmente 0,05), rejeita-se a normalidade dos dados.\n\nEmbora os testes de normalidade sejam úteis, sua utilização é questionável em estudos com amostras grandes, visto que os testes tendem a apresentar resultado significativo mesmo quando os dados seguem uma distribuição normal. Portanto, nestas situações, recomenda-se a verificação da normalidade dos dados por meio da representação gráfica dos dados e com base nos resultados do número de desvios dos valores padronizados de assimetria e curtose.\n\nUsando o SPSS\n\nProgramas de computador são extremamente úteis, permitindo a aplicação simultânea de métodos gráficos e testes para verificação da normalidade de distribuição de dados. Para realizar este tipo de análise utilizando o programa SPSS, deve-se selecionar, na barra principal do menu, a opção “Analyze” (análise), depois “Descriptive Statistics” (estatística descritiva) e, finalmente, o item “Explore” (análise exploratória), conforme ilustrado na figura 22. Na caixa de diálogo que se abrirá, você deve selecionar as variáveis que deseja analisar e depois clicar com o ponteiro do mouse sobre o botão “Plots” (gráficos). O último passo é habilitar as opções “Histogram” (histograma) e “Normality plots with tests”.
Send your question to AI and receive an answer instantly
Recommended for you
4
Exercícios - Bioestatística 2022 1
Bioestatística
UNESP
1
Lista de Exercícios - Probabilidade e Estatística
Bioestatística
UNESP
1
Revisão de Bioestatística 2023 1
Bioestatística
UNESP
4
Exercícios - Bioestatística 2022-1
Bioestatística
UNESP
1
Analise da associacao entre estado nutricional, depressao, ansiedade e problemas de saude
Bioestatística
UNESP
1
Exercícios Resolvidos Bioestatística - Média Mediana Variância Desvio Padrão
Bioestatística
UNESP
1
Lista 5 - Teste de Hipóteses - 2023-1
Bioestatística
UNESP
1
Exercicios Resolvidos Bioestatistica Probabilidade Normal Amostragem e Correlacao
Bioestatística
UNESP
1
Prova de Bioestatística - Testes de Hipóteses e Intervalos de Confiança
Bioestatística
UNESP
8
Capítulo 9 - Testes Não Paramétricos - Bioestatística
Bioestatística
UNESP
Preview text
C A P Í T U L O 6\nDistribuição normal\nEstatísticos costumam dizer que a distribuição normal é uma das mais importantes em estatística. Talvez por isso, quando um pesquisador tem em suas mãos um conjunto de dados para analisar, uma das primeiras perguntas que podem vir à sua mente é: “será que estes dados estão normalmente distribuídos?”. A importância de responder a essa pergunta reside no fato de que a normalidade da distribuição dos dados é um dos principais critérios a ser observado quando da seleção de testes de hipóteses.\n\nObjetivos\nApós ler este capítulo você deve ser capaz de:\n- descrever as características teóricas da distribuição normal;\n- analisar a normalidade de distribuição de dados a partir de avaliação de gráficos;\n- aplicar testes para avaliação da normalidade de distribuição de um conjunto de dados;\n- identificar as estratégias que se pode adotar, em termos de análise, quando os dados não seguem a distribuição normal teórica.\n\nTópicos principais\n- Distribuição normal\n- Área sob a curva normal\n- Assimetria\n- Curtose\n- Testes de normalidade\n- Transformações matemáticas Distribuição normal\nNa opinião de muitos pesquisadores e estatísticos, a probabilidade de distribuição teórica mais importante em estatística é a chamada \"distribuição normal\", também referida como \"curva normal\" ou \"distribuição Gaussiana\". Algumas das principais características de uma distribuição normal são:\n- é uma distribuição que pode ser completamente descrita por dois parâmetros, a média (μ) e a variância (σ²);\n- tem o formato de um sino (figura 17a);\n- é simétrica em relação à média;\n- a média, a mediana e a moda são iguais;\n- é unimodal;\n- assumindo variância constante, é uma distribuição que se desloca à direita se a média aumenta e à esquerda se a média diminui (figura 17b);\n- sofre achatamento quando a variância aumenta e alongamento quando a variância diminui (figura 17c). Fig 17. Distribuição normal: (a) simétrica em relação à média; (b) com médias diferentes (m2 > m1) e mesma variância; e, (c) variâncias diferentes (σ1² > σ2²) e mesma média\n\nA curva normal representa, então, uma distribuição empírica de frequências relativas que descreve o comportamento de uma variável quantitativa \"x\", representada num eixo horizontal (Petrie; Sabin, 2000). Assim, na área sob a curva, estão 100% dos dados, simetricamente distribuídos em relação à média. A área total limitada pela curva e pelo eixo horizontal é igual a um, que corresponde à probabilidade de a variável \"x\" assumir qualquer valor no eixo horizontal.\n\nHá uma infinidade de distribuições normais, que dependem do valor de μ e σ. A distribuição normal padronizada é um tipo especial de distribuição, com média igual a zero e desvio padrão igual a um, para a qual as probabilidades foram tabuladas. Sendo assim, o desvio de qualquer distribuição normal em relação à normal padronizada, denominado desvio normal padronizado (Z = [x - μ] / σ), é uma variável randômica que tem uma distribuição normal padronizada. Estes conceitos são importantes porque, dispondo-se de uma variável aleatória com distribuição normal, é possível determinar a probabilidade de essa variável assumir um valor específico em um intervalo.\n\nVejamos como proceder, por meio de um exemplo concreto. O desempenho de estudantes do ensino médio num teste para avaliação da flexibilidade (sentar e alcançar) tem distribuição normal com média de 18 cm e desvio padrão de 4 cm. Qual a probabilidade de que, num determinado dia, um estudante avaliado apresente desempenho superior a 24 cm? A solução consiste em determinar a proporção da área sob a curva normal que está acima de 24 cm. Se o valor de Z é calculado por (x - µ) / σ, logo, Z será igual a (24 - 18) / 4 ou 1,5. Comparando-se o valor calculado de Z com os valores tabelados (apêndice 6), conclui-se que há aproximadamente 6,7% de probabilidade de que um estudante avaliado quanto a sua flexibilidade venha a apresentar desempenho superior a 24 cm no teste de sentar e alcançar.\n\nConsiderando os valores tabelados de Z, observa-se que, entre a média e o primeiro desvio padrão, a área sob a curva normal corresponde a 34,13% da área total. Analogamente, entre a média e o primeiro desvio padrão negativo, estão outros 34,13% da área sob a curva ou uma probabilidade de 27,19% de um valor qualquer da distribuição estar dentro deste limite (figura 18). Vejamos a utilização da curva normal padronizada na avaliação de uma segunda situação hipotética. Suponha-se que os desempenhos de uma amostra de escolares, no teste de corrida de 12 minutos, possam ser descritos por uma distribuição normal, com média de 1.900 metros e desvio padrão de 150 metros. Pode-se calcular a proporção de escolares que apresentarão desempenho entre dois limites quaisquer, dentro da distribuição de dados, por exemplo, entre 1.750 e 2.050. Para isto, basta calcular a proporção da área sob a curva entre esses dois valores, transformando-os em escores padronizados, que podem, então, ser comparados aos valores da tabela Z (apêndice 6).\n\nNesse caso, a solução pode ser determinada através do cálculo de Z' e Z'', conforme ilustrado na figura seguinte. Os valores de Z' e Z'' correspondem a uma proporção de 34,13% da área sob a curva normal. Sendo assim, respondendo ao problema formulado, no intervalo entre 1.750 e 2.050 metros, estarão concentrados cerca de 68,26% (áreas A + B na figura 19b) dos desempenhos, no teste de 12 minutos, entre estudantes da mesma população. Desvios à normal\nNo capítulo 1, foram apresentados os conceitos de estatística paramétrica e não paramétrica. Conforme exposto, se os dados sob análise acompanham as características teóricas de uma distribuição normal, deve-se empregar procedimentos paramétricos de análise devido ao maior poder estatístico proporcionado em comparação com os seus equivalentes não paramétricos. A avaliação da normalidade da distribuição dos dados é, portanto, um aspecto fundamental em estatística.\n\nCertamente, não se espera encontrar em qualquer conjunto de dados características exatamente idênticas às que descrevem uma distribuição normal teórica. Assim, o que se procura observar é se os dados têm uma distribuição \"próxima da normalidade\". Em outras palavras, a presunção da normalidade da distribuição se baseia na medida da assimetria (desvio à direita ou à esquerda, figura 20a e 20b) e curtose (achatamento, figura 20c) da curva de dados em relação à curva normal (figura 20). Em geral, se a amostra é grande e os dados estão em escala intervalar ou de razão, é possível que estes apresentem uma distribuição que seja normal ou que se aproxime da normal (simétrica e mesocúrtica).\n\nAssimetria\nUma distribuição é dita simétrica quando apresenta o mesmo valor para a moda, a mediana e a média. Quando essas medidas não são iguais, tem-se uma distribuição assimétrica. A assimetria é o grau de afastamento que uma distribuição apresenta do seu eixo de referência ou simetria. O eixo de simetria é traçado sobre o valor da média da distribuição dos valores tem-se um quadro de assimetria. Esse afastamento pode ser para o lado direito, sendo denominado assimetria positiva, ou para o lado esquerdo, quando é denominado assimetria negativa. Assim, as distribuições podem ser simétricas (moda, média e mediana iguais ou semelhantes), assimétricas positivas (moda > mediana < média) e assimétricas negativas (moda < mediana > média). Curtose Representa o grau de achatamento da distribuição. Indica o quanto uma curva de frequência será achatada em relação à curva normal de referência. A medida de achatamento ou curtose indica a forma da curva de distribuição em relação ao seu achatamento, podendo ser classificada em mesocúrtica, platicúrtica e leptocúrtica. Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal (mais aguda em sua parte superior), ela recebe o nome de leptocúrtica. Quando a distribuição apresenta uma curva de frequência mais aberta que a normal (mais achatada na sua parte superior), ela é chamada de platicúrtica. A curva normal, que é a referencial, recebe o nome de mesocúrtica. Fig 20. Ilustração de curvas com desvios à normal (a) Assimetria positivo ou direita (b) Assimetria negativa ou esquerda (c) Distribuição achatada ou platicúrtica (d) Distribuição alongada ou leptocúrtica Testes de normalidade A avaliação da normalidade pode ser efetuada mediante cálculo das medidas de assimetria e curtose, métodos gráficos e testes estatísticos. Por exemplo, ao observar um histograma com curva normal teórica sobreposta, pode-se avaliar com relativa facilidade há assimetria ou curtose na distribuição dos dados sob análise. Como ilustrado na figura 21, a comparação do histograma com a curva normal sobreposta evidencia que há desvios entre as duas distribuições. No centro da distribuição, as frequências observadas foram inferiores à normal, enquanto que, nas extremidades, verificou-se o oposto. Além disso, as frequências observadas na extremidade esquerda da distribuição foram muito superiores à normal. Fig 21. Histograma das idades, utilizando dados da planilha 1 (apêndice 3) Histograma 50 40 30 20 10 0 16,9 25,6 34,4 43,1 51,9 60,6 69,4 78,1 Idade Curva normal sobreposta ao histograma indicando a distribuição que os dados deveriam apresentar para atender aos pressupostos de normalidade Std. Dev = 18,87 Mean = 32,1 N = 79,00 A análise do histograma permite supor, com razoável confiança, que as idades apresentadas no histograma da figura 21 têm distribuição assimétrica (desvio positivo, à direita) e achatada (platicúrtica). Apesar de ser uma opção para avaliação da normalidade, a construção de histogramas não é uma medida quantitativa precisa de assimetria e curtose. Por isso, pode-se lançar mão do cálculo de assimetria e curtose através das seguintes equações matemáticas: Assimetria (skewness) Assimetria = N (N-1)(N-2) ΣZ² EP assimetria = (6 / N²) Z assimetria = Assimetria / EP assimetria Curtose (Kurtosis) Curtose = N (N+1) (N-2)(N-3) ΣZ⁴ EP curtose = (24 / N³) Z curtose = Curtose / EP curtose Cálculos de assimetria e curtose são automaticamente efetuados quando se utiliza um programa estatístico (exemplo: SPSS, Stata) para explorar a distribuição de dados quantitativos. Se você não tem um programa desses, poderá fazer os cálculos utilizando uma planilha do programa Excel. Observe no exemplo fictício seguinte (tabela 6) uma demonstração do cálculo da assimetria e curtose. Tabela 6. Dados fictícios para ilustração do cálculo de assimetria e curtose Escore Escore Z Z³ Z⁴ 6 1,20 1,20¹ 1,71 1,20² 2,04 6 1,20 1,20¹ 1,71 1,20² 2,04 6 1,20 1,20¹ 1,71 1,20² 2,04 5 0,60 0,60¹ 0,21 0,60² 0,13 4 0,00 0,00¹ 0,00 0,00² 0,00 4 0,00 0,00¹ 0,00 0,00² 0,00 4 0,00 0,00¹ 0,00 0,00² 0,00 3 0,60 -0,60¹ -0,21 0,60² 0,13 3 0,60 -0,60¹ -0,21 0,60² 0,13 1 -1,20 -1,20¹ -1,71 1,20² 2,04 1 -1,79 -1,79¹ -5,76 1,79² 10,33 ΣZ² = -6,39 Z⁴ = 31,38 Assimetria (skewness) Assimetria = -0,49 EP assimetria = (6 / N) * (6 / 16) = 0,61 Z assimetria = Assimetria / EP assimetria = -0,49 / 0,61 = -0,80 Curtose (Kurtosis) Curtose = -0,58 EP curtose = (24 / N) * (24 / 16) = 1,22 Z curtose = Curtose / EP curtose = -0,58 / 1,22 = -0,48 Se os valores padronizados de assimetria (Z assimetria) e curtose (Z curtose) ficam entre ±2Z, não se pode rejeitar a simetria da distribuição dos dados. Portanto, em relação ao exemplo fictício ilustrado anteriormente, como as medidas padronizadas de assimetria (-0,80) e curtose (-0,48) estão dentro destes limites (> -2; < +2), a conclusão é de que os dados apresentam uma distribuição próxima da normal.\n\nHá testes estatísticos que permitem confirmar se um conjunto de dados apresenta distribuição normal. O teste de Shapiro-Wilk é utilizado quando o conjunto de observações é pequeno (até 50), enquanto, nas demais situações, recomenda-se utilizar o teste de Kolmogorov-Smirnov. A hipótese nula nesses testes é de que a variável segue distribuição normal; portanto, quando o nível de significância da estatística é inferior ao preestabelecido (usualmente 0,05), rejeita-se a normalidade dos dados.\n\nEmbora os testes de normalidade sejam úteis, sua utilização é questionável em estudos com amostras grandes, visto que os testes tendem a apresentar resultado significativo mesmo quando os dados seguem uma distribuição normal. Portanto, nestas situações, recomenda-se a verificação da normalidade dos dados por meio da representação gráfica dos dados e com base nos resultados do número de desvios dos valores padronizados de assimetria e curtose.\n\nUsando o SPSS\n\nProgramas de computador são extremamente úteis, permitindo a aplicação simultânea de métodos gráficos e testes para verificação da normalidade de distribuição de dados. Para realizar este tipo de análise utilizando o programa SPSS, deve-se selecionar, na barra principal do menu, a opção “Analyze” (análise), depois “Descriptive Statistics” (estatística descritiva) e, finalmente, o item “Explore” (análise exploratória), conforme ilustrado na figura 22. Na caixa de diálogo que se abrirá, você deve selecionar as variáveis que deseja analisar e depois clicar com o ponteiro do mouse sobre o botão “Plots” (gráficos). O último passo é habilitar as opções “Histogram” (histograma) e “Normality plots with tests”.