55
Bioestatística
UFMA
41
Bioestatística
UFMA
40
Bioestatística
UFMA
57
Bioestatística
UFMA
49
Bioestatística
UFMA
40
Bioestatística
UFMA
59
Bioestatística
UFMA
5
Bioestatística
UFMA
61
Bioestatística
UFMA
43
Bioestatística
UFMA
Texto de pré-visualização
BIOESTATÍSTICAAULA 1820252 Teste para k Amostras dependentes Testes Não Paramétricos para mais de dois grupos Não pareado Pareado Kruskal Wallis Friedman Teste de Friedman O teste de Friedman é usado quando se objetiva a comparação de K k2 amostras relacionadas ou dependentes É conhecido como uma Análise de V de dupla classificação por postos O teste de Friedman pode ser aplicado quando subconjuntos de unidades com as mesmas características são estudados sob K condições experimentais sendo sorteado um elemento do bloco de K unidades similares para cada tratamento Constitui uma alternativa não paramétrica para o teste de experimentos em blocos ao acaso na ANOVA regular É usado para testar diferenças entre grupos quando a variável dependente é ordinal ou variáveis quantitativas com distribuição não normal Este teste é particularmente útil quando as suposições de normalidade do teste da ANOVA de medidas repetidas não são satisfeitas e o tamanho da amostra é muito pequeno Elementos do Teste de Friedman Um grupo que é medido em três ou mais blocos de medidas ao longo do tempo condições experimentais Uma variável dependente que pode ser Ordinal Intervalar ou Razão O teste de Friedman é usado para verificar se há qualquer diferença estatisticamente significativa entre as distribuições de 3 ou mais grupos pareados Para a prova de Friedman os dados se dispõem em uma tabela de dupla entrada com n linhas e k colunas Os dados devem possuir dupla disposição as linhas representam os indivíduos e as colunas os tratamentos ou as condições experimentais As amostras precisam ter o mesmo tamanho permitindo a comparação entre todos os indivíduos submetidos ao teste Se estão sendo estudados os escores de indivíduos observados sob todas as condições então cada linha dá os escores de um indivíduo sob as k condições Os dados da prova são postos Aos escores de cada linha atribuemse postos separadamente Ou seja com 𝑘 condições em estudo os postos em qualquer linha vão de 1 a 𝑘 O teste de Friedman tem como hipótese testada a hipótese de nulidade H0 as distribuições dos 𝑘 tratamentos não diferem entre si isto é as diferentes colunas de postos amostras são provenientes da mesma população H1 ao menos um dos tratamentos difere significativamente dos demais Procedimentos para a realização do Teste de Friedman Dispor os dados em uma tabela com n linhas e k colunas onde as linhas representam os blocos de indivíduos similares e as colunas os tratamentos Atribuir ranks de 1 a K aos valores de cada linha Calcular a soma dos postos Ri por coluna Calcular a estatística Verificar o valor crítico No caso de rejeição de Ho complementar a análise calculando a diferença mínima significativa para os contrastes entre a soma dos ranks dos tratamentos Por exemplo suponhase que se queira estudar os escores de 3 grupos sob 4 condições Aqui k 4 e n 3 Cada grupo contém 4 indivíduos correspondentes um associado a cada uma das 4 condições Para aplicar a prova de Friedam a estes dados primeiro atribuise postos aos escores em cada linha Ao mais baixo escore em cada linha podese atribuir o posto 1 ao seguinte em cada linha o posto 2 etc Obtémse assim os dados mostrados na tabela 52 Notese que os postos em cada linha da tabela vão de 1 a k 4 Se a hipótese de nulidade de que todas as amostras colunas provenham da mesma população é de fato verdadeira então a distribuição de postos em cada coluna será aleatória sendo então de se esperar que os postos 1 2 3 e 4 apareçam em todas as colunas com frequências aproximadamente igual Q é o valor tabelado encontrado na tabela do teste de Tukey qαk crítico 005k1 Caso haja rejeição de Ho é necessário calcular a diferença mínima significativa para os contrastes entre soma de postos dos tratamentos Análise de Friedman de variância por Ranks aplicado aos dados de blocos ao acaso Bloco j Tratamento i 1 2 3 1 825 1 1125 3 1075 2 2 1100 1 1250 3 1175 2 3 1025 1 1200 3 1125 2 4 950 2 975 3 900 1 5 875 1 1100 3 1000 2 Soma do Rank Ri 6 15 9 Média do Rank Ri 12 30 18 k 3 n 5 0200342 60 8400 2 r0052 5991 Rejeita H0 Fazer calculo da diferença mínima significativa Para comparar o efeito de vermífugos em porcos foram usados 18 conjuntos de três animais da mesma ninhada cada um dos quais foi sorteado a um dos tratamentos sendo G1 o grupo controle sem vermífugo Após 1 mês de administração dos tratamentos foram contados ovos em 2 ml de fezes Os resultados estão na tabela a baixo K 3 n 18 blocos 2 12 18 x 3 x 4 402 4252 2552 3 x 18 x 4 2 9361 2 0052 5991 Rejeita Ho Q0053 3314 3314112x18x3x412 141 G1 x G2 400 425 25 141 G1 x G3 400 255 145 141 G2 x G3 425 255 170 141 Portanto G1 G2 G3 Teste Q de Cochran O teste Q de Cochran é utilizado para comparar três ou mais grupos relacionados quando a variável resposta é dicotônica simnão presençaausência sucesso insucesso Os grupos ou amostras devem ser relacionados o que pode ocorrer em situações experimentais como A prova Q de Cochran para K amostras relacionadas proporciona um método para comparar se três ou mais conjuntos correspondentes de frequências ou proporções diferem entre si significativamente A correspondência pode basearse em características relevantes dos diferentes indivíduos ou no fato de os mesmos indivíduos serem observados sob condições diferentes Este teste é uma extensão do teste de McNemar para k amostras relacionadas que chamaremos de blocos Não avalia a extensão da mudança apenas se a mudança ocorreu Avalia se houve ou não sucesso na aplicação dos c tratamentos nos k blocos Pressupostos A variável de interesse é dicotômica As categorias das variáveis explicativas blocos e tratamentos são mutuamente excludentes Cada um dos k tratamentos são aplicados independentemente para cada um dos blocos Em amostras muito pequenas não pode ser utilizado Utiliza frequências e não os postos TESTE DE COCHRAN I O mesmo conjunto de unidades é observado em KK2 situações diferentes extensão do experimento AntesDepois II Subconjuntos homogêneos de unidades experimentais tais como ninhada ou grupos de unidades com características relevantes similares são estudados sob K2 tratamentos sendo o tratamento sorteado dentro de cada subconjunto de unidades similares Este teste pode ser utilizado quando a variável resposta é nominal ou classificatória sucessoinsucesso ou quando é ordinal dicotomizada A prova Q de Cochran adaptase especialmente ao caso em que os dados se apresentam numa escala nominal ou sob a forma de informação ordinal dicotomizada Se os dados de estudos são organizados em uma tabela de duas entradas consistindo de N linhas e k colunas é possível testar a hipótese nula de que a proporção ou frequência de respostas de um tipo particular é a mesma em cada coluna Para dados dicotomizados atribuir o escore 1 a sucesso e 0 insucesso Dispor os dados em uma tabela com n linhas n unidades experimentais e K colunas k condições ou tratamentos Calcular a soma dos escores 0 e 1 em cada linha indicandoo como Sj j 1 2 n e a soma dos escores das colunas Ti i 1 2 K Calcular a estatística Q do teste A estatística assim calculada apresentará Distribuição de QuiQudrado com K1 graus de liberdade Verificar o valor crítico associado à estatística Q calculada e concluir Procedimentos para a realização do Teste Q de Cochran Q K 1 K Σi1n Ti2 Σi1n Ti2 K Σi1n Ti Σi1n Sj2 Qcrít χ2005K1 Paciente MÉTODO Total Linha Clínico Laboratorial 1 2 3 4 5 6 7 8 Sj 1 0 0 0 0 0 0 0 0 0 2 0 0 0 0 1 0 0 0 1 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 0 5 0 0 1 0 0 1 0 1 3 6 0 0 1 1 1 1 0 1 5 7 0 0 0 0 0 0 0 0 0 8 1 0 1 1 1 1 0 1 6 Total Coluna Ti 1 0 3 2 3 3 0 3 Ti Sj 15 EXEMPLO Q 8 1 812 02 32 22 32 32 02 32 152 8 x 15 02 12 02 02 32 52 02 62 7 x 103 49 14714 χ20057 14067 Rejeita Ho Exemplo O entrevistador visitaria 3 grupos de 18 casas aplicando o tipo 1 de entrevista a um grupo o tipo 2 a outro grupo e o 3 ao terceiro grupo Teríamos então 3 amostras relacionadas correspondentes com 18 elementos cada uma N18 Poderíamos pois comprovar se as diferenças fundamentais nos tipos de entrevista influenciariam o número de respostas afirmativas sim dadas para aceitação de participação pelos 3 grupos de correspondentes Q 167 Qcrít 2 0052 7815 Rejeita Ho o nº de respostas SIM difere significativamente em relação aos tipos 1 2 e 2 de entrevista COEFICIENTE DE CORRELAÇÃO NÃOPARAMÉTRICO CORRELAÇÃO Spearman rs QUANDO UTILIZAR Relações Lineares e NãoLineares o rs de Spearman é útil para detectar ambos os tipos de correlação entre x e y Dados Ordinais x e y devem ser medidas no nível ordinal Distribuição NãoNormal não carece que x e y sejam distribuídas normalmente na população Mais utilizado para amostras menores Igor Menezes CORRELAÇÃO Spearman rs Teste nãoparamétrico que mede a força da relação entre pares de variáveis Baseiase na ordenação de duas variáveis sem qualquer restrição quanto à distribuição dos valores rankorder Corresponde a uma correlação de Pearson entre os ranks Igor Menezes O que é relação monotônica Monotonicidade é um conceito matemático relacionado a funções entre conjuntos A relação entre X e Y é monotônica crescente quando para todos os pares de valores de X em que x1 x2 o mesmo ocorre em Y em que y1 y2 Deste modo sempre que o valor de uma variável aumenta o valor da outra variável também aumenta ou se mantém constante Se o tempo de movimento aumenta e a distância percorrida também aumenta ou se mantém igual então temos uma relação monotônica crescente CORRELAÇÃO NÃOPARAMÉTRICA Por outro lado a relação entre X e Y é monotônica decrescente quando para todos os pares de valores de X em que x1 x2 o oposto ocorre em Y em que y1 y2 Em outras palavras sempre que o valor de uma variável aumenta o valor da outra variável diminui ou se mantém constante Se o tempo de movimento aumenta e o percentual de gordura diminui ou se mantém igual então temos uma relação monotônica decrescente O ponto essencial é que a monotonicidade entre duas variáveis é um pressuposto menos restritivo que a linearidade pois leva em consideração apenas a ordem dos postos nas duas variáveis Isto é duas variáveis com relação linear também têm relação monotônica mas variáveis com relação monotônica podem não estar linearmente relacionadas Posso interpretar relações não lineares com a correlação de Spearman Uma vez que a correlação de Spearman se foca em relações monotônicas e não tem pressupostos lineares como na correlação de Pearson é possível utilizála para sumarizar relações não lineares Por isso nos dados da Figura abaixo a correlação de Spearman é mais eficaz em identificar a relação entre as variáveis que a correlação de Pearson Exemplos de variáveis com relação monotônica e linear É uma medida de associação que exige que ambas as variáveis se apresentem em escala de mensuração pelo menos ordinal Basicamente equivale ao coeficiente de correlação de Pearson aplicado a dados ordenados O coeficiente não é sensível a assimetrias na distribuição nem à presença de outliers não exigindo portanto que os dados provenham de duas populações normais Coeficiente de Correlação de Spearman Se os seus dados não atenderem às suposições para aplicação do coeficiente de correlação de Pearson você precisará do coeficiente de correlação de Spearman Para isso é necessário saber qual é a função monótona para compreendêlo Uma função monótona é aquela que nunca diminui ou nunca aumenta já que é um aumento variável independente Pode ser explicado usando a imagem abaixo Coeficiente de Correlação de Spearman A imagem explica três conceitos da função monótona Monotonicamente crescente quando a variável x aumenta e a variável y nunca diminui Diminui monotonicamente quando a variável x aumenta mas a variável y nunca aumenta Não monótono quando a variável x aumenta e a variável e às vezes aumenta e às vezes diminui A relação monótona é menos restritiva quando comparada a uma relação linear que é usada no coeficiente de correlação de Pearson Embora a monotonicidade não seja o último requisito não será significativo seguila sem realmente determinar a força e a direção de uma relação monótona se já se sabia que a relação entre a variável não é monótona Coeficiente de Correlação de Spearman O coeficiente ρ de Spearman varia entre 1 e 1 Quanto mais próximo estiver destes extremos maior será a associação entre as variáveis O sinal negativo da correlação significa que as variáveis variam em sentido contrário isto é as categorias mais elevadas de uma variável estão associadas a categorias mais baixas da outra variável Como interpretar o coeficiente de correlação de Spearman Um coeficiente de correlação próximo de zero indica que não há relação entre as duas variáveis e quanto mais eles se aproximam de 1 ou 1 mais forte é a relação Como avaliar a correlação através do coeficiente de determinação Podemos ter uma melhor noção do significado da correlação através do coeficiente de determinação rs 2 que indica o quanto uma variável encontrase associada à outra em termos de percentual de variância compartilhada O rs 2 é calculado simplesmente elevando rs ao quadrado Por exemplo se rs 2 080 então 64 da variância de uma variável pode ser explicada pela outra pois rs 2 0802 064 multiplicamos o valor por 100 para que ele seja expresso em termos percentuais Se rs 2 090 então 81 da variância de uma variável pode ser explicada pela outra pois rs 2 0902 081 A Figura 8 apresenta outros valores de coeficientes de determinação Relação entre o rs de Spearman e o coeficiente de determinação rs 2 Por isso interpretar o rs 2 pode trazer maior clareza sobre o quanto os construtos encontramse relacionados Contudo é importante atenção pois à medida que o coeficiente de correlação vai aumentando a variância compartilhada cresce exponencialmente veja a Figura 8 Por exemplo a diferença de variância explicada entre os coeficientes de correlação de 010 para 020 é de apenas 3 004 001 003 Entretanto entre rs 080 e rs 090 a diferença na variância explicada já é de 17 081 064 017 Coeficiente de Correlação de Spearman Uma fórmula fácil para calcular o coeficiente ρ de Spearman é dada por em que n é o número de pares xi yi e dipostos de xi dentre os valores de x postos de yi dentre os valores de y Como interpretar os coeficientes de correlação de Spearman Até aqui já temos uma noção de como interpretar a direção e a força da Correlação de Spearman mas pode se querer uma interpretação mais objetiva do significado dos números apresentados nos testes de correlação Contudo não existe consenso sobre a interpretação dos valores da correlação O que existem de fato são algumas recomendações Cohen 1992 por exemplo sugere os seguintes pontos de corte rs 010 correlação fraca rs 030 correlação moderada rs 050 correlação forte Por outro lado Rumsey 2023 traz a seguinte sugestão de tamanhos de efeito rs 1 relação linear perfeita rs 070 relação linear forte rs 050 relação linear moderada rs 030 relação linear fraca rs 0 ausência de relação linear Note que as interpretações são simétricas independentemente de o coeficiente ser positivo ou negativo Além disso as sugestões acima não são prescritivas Isto quer dizer portanto que pesquisadores devem sempre interpretar seus coeficientes à luz da literatura de suas respectivas áreas de pesquisa EXEMPLOS Exemplo Correlação de Spearman entre as notas brutas de matemática e biologia Zar 1999 Coeficiente de Correlação de Spearman
55
Bioestatística
UFMA
41
Bioestatística
UFMA
40
Bioestatística
UFMA
57
Bioestatística
UFMA
49
Bioestatística
UFMA
40
Bioestatística
UFMA
59
Bioestatística
UFMA
5
Bioestatística
UFMA
61
Bioestatística
UFMA
43
Bioestatística
UFMA
Texto de pré-visualização
BIOESTATÍSTICAAULA 1820252 Teste para k Amostras dependentes Testes Não Paramétricos para mais de dois grupos Não pareado Pareado Kruskal Wallis Friedman Teste de Friedman O teste de Friedman é usado quando se objetiva a comparação de K k2 amostras relacionadas ou dependentes É conhecido como uma Análise de V de dupla classificação por postos O teste de Friedman pode ser aplicado quando subconjuntos de unidades com as mesmas características são estudados sob K condições experimentais sendo sorteado um elemento do bloco de K unidades similares para cada tratamento Constitui uma alternativa não paramétrica para o teste de experimentos em blocos ao acaso na ANOVA regular É usado para testar diferenças entre grupos quando a variável dependente é ordinal ou variáveis quantitativas com distribuição não normal Este teste é particularmente útil quando as suposições de normalidade do teste da ANOVA de medidas repetidas não são satisfeitas e o tamanho da amostra é muito pequeno Elementos do Teste de Friedman Um grupo que é medido em três ou mais blocos de medidas ao longo do tempo condições experimentais Uma variável dependente que pode ser Ordinal Intervalar ou Razão O teste de Friedman é usado para verificar se há qualquer diferença estatisticamente significativa entre as distribuições de 3 ou mais grupos pareados Para a prova de Friedman os dados se dispõem em uma tabela de dupla entrada com n linhas e k colunas Os dados devem possuir dupla disposição as linhas representam os indivíduos e as colunas os tratamentos ou as condições experimentais As amostras precisam ter o mesmo tamanho permitindo a comparação entre todos os indivíduos submetidos ao teste Se estão sendo estudados os escores de indivíduos observados sob todas as condições então cada linha dá os escores de um indivíduo sob as k condições Os dados da prova são postos Aos escores de cada linha atribuemse postos separadamente Ou seja com 𝑘 condições em estudo os postos em qualquer linha vão de 1 a 𝑘 O teste de Friedman tem como hipótese testada a hipótese de nulidade H0 as distribuições dos 𝑘 tratamentos não diferem entre si isto é as diferentes colunas de postos amostras são provenientes da mesma população H1 ao menos um dos tratamentos difere significativamente dos demais Procedimentos para a realização do Teste de Friedman Dispor os dados em uma tabela com n linhas e k colunas onde as linhas representam os blocos de indivíduos similares e as colunas os tratamentos Atribuir ranks de 1 a K aos valores de cada linha Calcular a soma dos postos Ri por coluna Calcular a estatística Verificar o valor crítico No caso de rejeição de Ho complementar a análise calculando a diferença mínima significativa para os contrastes entre a soma dos ranks dos tratamentos Por exemplo suponhase que se queira estudar os escores de 3 grupos sob 4 condições Aqui k 4 e n 3 Cada grupo contém 4 indivíduos correspondentes um associado a cada uma das 4 condições Para aplicar a prova de Friedam a estes dados primeiro atribuise postos aos escores em cada linha Ao mais baixo escore em cada linha podese atribuir o posto 1 ao seguinte em cada linha o posto 2 etc Obtémse assim os dados mostrados na tabela 52 Notese que os postos em cada linha da tabela vão de 1 a k 4 Se a hipótese de nulidade de que todas as amostras colunas provenham da mesma população é de fato verdadeira então a distribuição de postos em cada coluna será aleatória sendo então de se esperar que os postos 1 2 3 e 4 apareçam em todas as colunas com frequências aproximadamente igual Q é o valor tabelado encontrado na tabela do teste de Tukey qαk crítico 005k1 Caso haja rejeição de Ho é necessário calcular a diferença mínima significativa para os contrastes entre soma de postos dos tratamentos Análise de Friedman de variância por Ranks aplicado aos dados de blocos ao acaso Bloco j Tratamento i 1 2 3 1 825 1 1125 3 1075 2 2 1100 1 1250 3 1175 2 3 1025 1 1200 3 1125 2 4 950 2 975 3 900 1 5 875 1 1100 3 1000 2 Soma do Rank Ri 6 15 9 Média do Rank Ri 12 30 18 k 3 n 5 0200342 60 8400 2 r0052 5991 Rejeita H0 Fazer calculo da diferença mínima significativa Para comparar o efeito de vermífugos em porcos foram usados 18 conjuntos de três animais da mesma ninhada cada um dos quais foi sorteado a um dos tratamentos sendo G1 o grupo controle sem vermífugo Após 1 mês de administração dos tratamentos foram contados ovos em 2 ml de fezes Os resultados estão na tabela a baixo K 3 n 18 blocos 2 12 18 x 3 x 4 402 4252 2552 3 x 18 x 4 2 9361 2 0052 5991 Rejeita Ho Q0053 3314 3314112x18x3x412 141 G1 x G2 400 425 25 141 G1 x G3 400 255 145 141 G2 x G3 425 255 170 141 Portanto G1 G2 G3 Teste Q de Cochran O teste Q de Cochran é utilizado para comparar três ou mais grupos relacionados quando a variável resposta é dicotônica simnão presençaausência sucesso insucesso Os grupos ou amostras devem ser relacionados o que pode ocorrer em situações experimentais como A prova Q de Cochran para K amostras relacionadas proporciona um método para comparar se três ou mais conjuntos correspondentes de frequências ou proporções diferem entre si significativamente A correspondência pode basearse em características relevantes dos diferentes indivíduos ou no fato de os mesmos indivíduos serem observados sob condições diferentes Este teste é uma extensão do teste de McNemar para k amostras relacionadas que chamaremos de blocos Não avalia a extensão da mudança apenas se a mudança ocorreu Avalia se houve ou não sucesso na aplicação dos c tratamentos nos k blocos Pressupostos A variável de interesse é dicotômica As categorias das variáveis explicativas blocos e tratamentos são mutuamente excludentes Cada um dos k tratamentos são aplicados independentemente para cada um dos blocos Em amostras muito pequenas não pode ser utilizado Utiliza frequências e não os postos TESTE DE COCHRAN I O mesmo conjunto de unidades é observado em KK2 situações diferentes extensão do experimento AntesDepois II Subconjuntos homogêneos de unidades experimentais tais como ninhada ou grupos de unidades com características relevantes similares são estudados sob K2 tratamentos sendo o tratamento sorteado dentro de cada subconjunto de unidades similares Este teste pode ser utilizado quando a variável resposta é nominal ou classificatória sucessoinsucesso ou quando é ordinal dicotomizada A prova Q de Cochran adaptase especialmente ao caso em que os dados se apresentam numa escala nominal ou sob a forma de informação ordinal dicotomizada Se os dados de estudos são organizados em uma tabela de duas entradas consistindo de N linhas e k colunas é possível testar a hipótese nula de que a proporção ou frequência de respostas de um tipo particular é a mesma em cada coluna Para dados dicotomizados atribuir o escore 1 a sucesso e 0 insucesso Dispor os dados em uma tabela com n linhas n unidades experimentais e K colunas k condições ou tratamentos Calcular a soma dos escores 0 e 1 em cada linha indicandoo como Sj j 1 2 n e a soma dos escores das colunas Ti i 1 2 K Calcular a estatística Q do teste A estatística assim calculada apresentará Distribuição de QuiQudrado com K1 graus de liberdade Verificar o valor crítico associado à estatística Q calculada e concluir Procedimentos para a realização do Teste Q de Cochran Q K 1 K Σi1n Ti2 Σi1n Ti2 K Σi1n Ti Σi1n Sj2 Qcrít χ2005K1 Paciente MÉTODO Total Linha Clínico Laboratorial 1 2 3 4 5 6 7 8 Sj 1 0 0 0 0 0 0 0 0 0 2 0 0 0 0 1 0 0 0 1 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 0 5 0 0 1 0 0 1 0 1 3 6 0 0 1 1 1 1 0 1 5 7 0 0 0 0 0 0 0 0 0 8 1 0 1 1 1 1 0 1 6 Total Coluna Ti 1 0 3 2 3 3 0 3 Ti Sj 15 EXEMPLO Q 8 1 812 02 32 22 32 32 02 32 152 8 x 15 02 12 02 02 32 52 02 62 7 x 103 49 14714 χ20057 14067 Rejeita Ho Exemplo O entrevistador visitaria 3 grupos de 18 casas aplicando o tipo 1 de entrevista a um grupo o tipo 2 a outro grupo e o 3 ao terceiro grupo Teríamos então 3 amostras relacionadas correspondentes com 18 elementos cada uma N18 Poderíamos pois comprovar se as diferenças fundamentais nos tipos de entrevista influenciariam o número de respostas afirmativas sim dadas para aceitação de participação pelos 3 grupos de correspondentes Q 167 Qcrít 2 0052 7815 Rejeita Ho o nº de respostas SIM difere significativamente em relação aos tipos 1 2 e 2 de entrevista COEFICIENTE DE CORRELAÇÃO NÃOPARAMÉTRICO CORRELAÇÃO Spearman rs QUANDO UTILIZAR Relações Lineares e NãoLineares o rs de Spearman é útil para detectar ambos os tipos de correlação entre x e y Dados Ordinais x e y devem ser medidas no nível ordinal Distribuição NãoNormal não carece que x e y sejam distribuídas normalmente na população Mais utilizado para amostras menores Igor Menezes CORRELAÇÃO Spearman rs Teste nãoparamétrico que mede a força da relação entre pares de variáveis Baseiase na ordenação de duas variáveis sem qualquer restrição quanto à distribuição dos valores rankorder Corresponde a uma correlação de Pearson entre os ranks Igor Menezes O que é relação monotônica Monotonicidade é um conceito matemático relacionado a funções entre conjuntos A relação entre X e Y é monotônica crescente quando para todos os pares de valores de X em que x1 x2 o mesmo ocorre em Y em que y1 y2 Deste modo sempre que o valor de uma variável aumenta o valor da outra variável também aumenta ou se mantém constante Se o tempo de movimento aumenta e a distância percorrida também aumenta ou se mantém igual então temos uma relação monotônica crescente CORRELAÇÃO NÃOPARAMÉTRICA Por outro lado a relação entre X e Y é monotônica decrescente quando para todos os pares de valores de X em que x1 x2 o oposto ocorre em Y em que y1 y2 Em outras palavras sempre que o valor de uma variável aumenta o valor da outra variável diminui ou se mantém constante Se o tempo de movimento aumenta e o percentual de gordura diminui ou se mantém igual então temos uma relação monotônica decrescente O ponto essencial é que a monotonicidade entre duas variáveis é um pressuposto menos restritivo que a linearidade pois leva em consideração apenas a ordem dos postos nas duas variáveis Isto é duas variáveis com relação linear também têm relação monotônica mas variáveis com relação monotônica podem não estar linearmente relacionadas Posso interpretar relações não lineares com a correlação de Spearman Uma vez que a correlação de Spearman se foca em relações monotônicas e não tem pressupostos lineares como na correlação de Pearson é possível utilizála para sumarizar relações não lineares Por isso nos dados da Figura abaixo a correlação de Spearman é mais eficaz em identificar a relação entre as variáveis que a correlação de Pearson Exemplos de variáveis com relação monotônica e linear É uma medida de associação que exige que ambas as variáveis se apresentem em escala de mensuração pelo menos ordinal Basicamente equivale ao coeficiente de correlação de Pearson aplicado a dados ordenados O coeficiente não é sensível a assimetrias na distribuição nem à presença de outliers não exigindo portanto que os dados provenham de duas populações normais Coeficiente de Correlação de Spearman Se os seus dados não atenderem às suposições para aplicação do coeficiente de correlação de Pearson você precisará do coeficiente de correlação de Spearman Para isso é necessário saber qual é a função monótona para compreendêlo Uma função monótona é aquela que nunca diminui ou nunca aumenta já que é um aumento variável independente Pode ser explicado usando a imagem abaixo Coeficiente de Correlação de Spearman A imagem explica três conceitos da função monótona Monotonicamente crescente quando a variável x aumenta e a variável y nunca diminui Diminui monotonicamente quando a variável x aumenta mas a variável y nunca aumenta Não monótono quando a variável x aumenta e a variável e às vezes aumenta e às vezes diminui A relação monótona é menos restritiva quando comparada a uma relação linear que é usada no coeficiente de correlação de Pearson Embora a monotonicidade não seja o último requisito não será significativo seguila sem realmente determinar a força e a direção de uma relação monótona se já se sabia que a relação entre a variável não é monótona Coeficiente de Correlação de Spearman O coeficiente ρ de Spearman varia entre 1 e 1 Quanto mais próximo estiver destes extremos maior será a associação entre as variáveis O sinal negativo da correlação significa que as variáveis variam em sentido contrário isto é as categorias mais elevadas de uma variável estão associadas a categorias mais baixas da outra variável Como interpretar o coeficiente de correlação de Spearman Um coeficiente de correlação próximo de zero indica que não há relação entre as duas variáveis e quanto mais eles se aproximam de 1 ou 1 mais forte é a relação Como avaliar a correlação através do coeficiente de determinação Podemos ter uma melhor noção do significado da correlação através do coeficiente de determinação rs 2 que indica o quanto uma variável encontrase associada à outra em termos de percentual de variância compartilhada O rs 2 é calculado simplesmente elevando rs ao quadrado Por exemplo se rs 2 080 então 64 da variância de uma variável pode ser explicada pela outra pois rs 2 0802 064 multiplicamos o valor por 100 para que ele seja expresso em termos percentuais Se rs 2 090 então 81 da variância de uma variável pode ser explicada pela outra pois rs 2 0902 081 A Figura 8 apresenta outros valores de coeficientes de determinação Relação entre o rs de Spearman e o coeficiente de determinação rs 2 Por isso interpretar o rs 2 pode trazer maior clareza sobre o quanto os construtos encontramse relacionados Contudo é importante atenção pois à medida que o coeficiente de correlação vai aumentando a variância compartilhada cresce exponencialmente veja a Figura 8 Por exemplo a diferença de variância explicada entre os coeficientes de correlação de 010 para 020 é de apenas 3 004 001 003 Entretanto entre rs 080 e rs 090 a diferença na variância explicada já é de 17 081 064 017 Coeficiente de Correlação de Spearman Uma fórmula fácil para calcular o coeficiente ρ de Spearman é dada por em que n é o número de pares xi yi e dipostos de xi dentre os valores de x postos de yi dentre os valores de y Como interpretar os coeficientes de correlação de Spearman Até aqui já temos uma noção de como interpretar a direção e a força da Correlação de Spearman mas pode se querer uma interpretação mais objetiva do significado dos números apresentados nos testes de correlação Contudo não existe consenso sobre a interpretação dos valores da correlação O que existem de fato são algumas recomendações Cohen 1992 por exemplo sugere os seguintes pontos de corte rs 010 correlação fraca rs 030 correlação moderada rs 050 correlação forte Por outro lado Rumsey 2023 traz a seguinte sugestão de tamanhos de efeito rs 1 relação linear perfeita rs 070 relação linear forte rs 050 relação linear moderada rs 030 relação linear fraca rs 0 ausência de relação linear Note que as interpretações são simétricas independentemente de o coeficiente ser positivo ou negativo Além disso as sugestões acima não são prescritivas Isto quer dizer portanto que pesquisadores devem sempre interpretar seus coeficientes à luz da literatura de suas respectivas áreas de pesquisa EXEMPLOS Exemplo Correlação de Spearman entre as notas brutas de matemática e biologia Zar 1999 Coeficiente de Correlação de Spearman