40
Bioestatística
UFMA
59
Bioestatística
UFMA
49
Bioestatística
UFMA
5
Bioestatística
UFMA
61
Bioestatística
UFMA
17
Bioestatística
UFMA
43
Bioestatística
UFMA
43
Bioestatística
UFMA
56
Bioestatística
UFMA
55
Bioestatística
UFMA
Texto de pré-visualização
TESTES NÃO PARAMÉTRICOS AULA 1420252 TESTES NÃO PARAMÉTRICOS Em estudos biológicos ambientais e oceanográficos são muito utilizados o Teste de t Student Análise de Variância Coeficiente de Correlação de Pearson Regressão linear simples Tais testes exigem para sua aplicação que a variável em análise seja numérica as hipóteses sejam feitas sobre os parâmetros Testes paramétricos TESTES PARAMÉTRICOS X TESTES NÃO PARAMÉTRICOS Nem sempre os pressupostos de normalidade e de homogeneidade de variâncias são atendidos Nestes casos podemos transformar as variáveis investigadas e avaliar se tais valores transformados atendem aos pressupostos Caso os pressupostos sejam atendidos podemos usar os valores obtidos após a transformação para realizar a análise estatística Os principais tipos de transformação são a Transformação logarítmica cada valor observado da variável é substituído pelo seu logaritmo ou seja xi log x Na equação x representa cada valor observado da variável original e xi é o respectivo valor transformado Geralmente usamos o logaritmo natural d Transformação inversa cada valor observado é substituído pelo seu inverso x i 1xi Geralmente essa transformação é utilizada para variáveis expressas em taxas Existem casos em que mesmo transformando as variáveis os pressupostos dos testes paramétricos não são atendidos Quando isso acontece precisamos utilizar um Teste não paramétrico Nos testes não paramétricos não é necessário conhecer a distribuição da variável investigada e os pressupostos de normalidade e homogeneidade de variâncias não precisam ser atendidos A lógica dos testes não paramétricos baseiase em ordenar os valores da variável investigada e atribuir um posto para cada valor O posto é um número por exemplo 1 2 3 etc que corresponde à posição de determinado valor da variável na ordenação de todos os valores A estatística dos testes não paramétricos não utiliza os valores observados da variável mas os valores dos postos Assim valores extremos que são problemáticos nos testes paramétricos por influenciarem o cálculo da média e da variância deixam de ser importantes nos testes não paramétricos Para testar hipóteses com testes não paramétricos seguimos a mesma lógica de um teste de hipóteses paramétrico ou seja precisamos i definir as hipóteses nula e alternativa ii estabelecer o nível crítico de significância iii determinar o valor crítico da estatística do teste não paramétrico iv calcular a estatística do teste não paramétrico v comparar os valores crítico e calculado da estatística do teste vi fazer a inferência estatística Quando se aplica um teste de hipóteses não paramétrico Sempre que for possível devese utilizar testes PARAMÉTRICOS são mais poderosos do ponto de vista estatístico mas possuem uma série de suposições que precisam ser satisfeitas para sua aplicação a saber primeiramente há interesse em testar os parâmetros da distribuição populacional da variável sob análise a variável sob análise TEM que ser quantitativa nível de mensuração escala de razão a variável apresenta distribuição normal na população ou então a amostra é suficientemente grande para que se possa supor que a distribuição amostral da média seja normal decorrência do Teorema Central do Limite RAZÕES PARA USAR TESTES NÃO PARAMÉTRICOS Razão 1 Sua área de estudo é mais bem representada pela mediana O fato de você poder realizar um teste paramétrico com dados não normais não significa que a média seja a melhor medida da tendência central dos seus dados Quando sua distribuição é assimétrica o suficiente a média é fortemente afetada por mudanças distantes na cauda da distribuição enquanto a mediana continua a refletir mais proximamente o centro da distribuição Razão 2 Você tem um tamanho amostral muito pequeno Se você não atender às orientações de tamanho amostral para os testes paramétricos e não tiver certeza de que os dados seguem uma distribuição normal deverá usar um teste não paramétrico Quando você tem uma amostra muito pequena pode não conseguir determinar a distribuição de seus dados porque os testes de distribuição não terão poder suficiente para proporcionar resultados significativos Nesse cenário você está em uma situação difícil sem alternativa válida Os testes não paramétricos têm menos poder para começar e ter também um tamanho amostral baixo representa aumenta o problema Razão 3 Você tem dados ordinais dados ordenados ou outliers que não podem ser removidos Os testes paramétricos típicos só podem avaliar dados contínuos e os resultados podem ser significativamente afetados por outliers Em contrapartida alguns testes não paramétricos podem manusear dados ordinais dados ordenados e não serem seriamente afetados por outliers OUTRAS CONSIDERAÇÕES A decisão geralmente depende se a média ou a mediana representa com mais precisão o centro da distribuição dos seus dados Se a média representar com precisão o centro de sua distribuição e o tamanho de sua amostra for grande o suficiente considere a realização de um teste paramétrico pois ele será mais eficiente Se a mediana representar melhor o centro da sua distribuição considere o teste não paramétrico mesmo quando tiver uma amostra grande Sendo assim aplicase um teste não paramétrico quando há interesse em testar outras características da distribuição populacional da variável sob análisepor exemplo a forma da distribuição a variável sob interesse for qualitativa nos caso em que a variável é quantitativa há interesse em testar os parâmetros da sua distribuição populacional mas sabese que a distribuição populacional não é normal ou não se conhece nada sobre ela e não é possível retirar uma amostra grande Os testes nãoparamétricos podem ser divididos em testes para Uma amostra Duas amostras emparelhadas dependentes Duas amostras independentes Várias amostras emparelhadas dependentes Várias amostras independentes Testes nãoParamétricos Dimensão Nível de Mensuração Teste nãoParamétrico Uma amostra Nominal Binomial Quiquadrado Duas amostras emparelhadas Nominal Teste de McNemar Ordinal Teste dos sinais Teste de Wilcoxon Duas amostras independentes Ordinal Teste de MannWhitney K amostras emparelhadas Nominal Q de Cochran Ordinal Teste de Friedman K amostras independentes Ordinal Teste de KruskalWallis Exigências para utilização de testes paramétricos Quando se pretende empregar um teste t de Student ou uma análise da variância para fazer comparações entre amostras testes paramétricos existe uma lista de requisitos que inclui entre outros que a variável tenha distribuição normal que a distribuição seja simétrica e mesocurtica Pressuposição de homogeneidade de variâncias Opção Sempre que não se pode admitir a simetria e a normalidade da distribuição que os dados foram recolhidos num nível de mensuração inferior ao intervalar Recorrese a testes que não incluem a normalidade da distribuição ou nível intervalar de mensuração Esses testes chamamse não paramétricos Vantagens dos testes nãoparamétricos Não exigem suposições numerosas ou restringentes em relação à distribuição dos dados nãoexigência normalidade Podem ser utilizados mesmo quando os seus dados só podem ser medidos num nível ordinal ié quando for apenas possível ordenálos por ordem de grandeza podem ser utilizados mesmo quando os seus dados são apenas nominais ie quando os sujeitos podem apenas ser classificados em categorias Envolvem cálculos mais simples e consequentemente apresentam maior facilidade de aprendizado e aplicação Em consequência Ao rejeitarse a H0 sem preencher as exigências mínimas dos testes paramétricos é mais provável que essa rejeição seja falsa se rejeitar H0 quando ela é verdadeira cometese um erro do tipo I Se aceitar H0 quando ela é falsa cometese um erro do tipo II Quando os requisitos de um teste paramétrico são violados tornase impossível conhecer o seu poder e a sua dimensão Como varia o poder de um teste O poder varia de um teste para o outro os testes mais poderosos os que têm maior probabilidade de rejeição de H0 são testes que possuem prérequisitos mais difíceis de satisfazer testes paramétricos como t e F As alternativas não paramétricas exigem muito menos pré requisitos mas produzem testes de significância com menos poder que os correspondentes paramétricos Poder de um teste o poder de um teste é a probabilidade de rejeitarmos H0 quando ela é realmente nula Para se entender a importância dos testes é necessário entender o conceito de poder A estatística nãoparamétrica para dados qualitativos ordinais ou quantitativos sem distribuição normal é baseada na conversão dos dados originais da amostra em postos ranks ou sinais positivos ou negativos Um posto é considerado como sendo a posição de um determinado dado quando todos os valores que compõem a amostra estão ordenados de forma crescente ou decrescente Nos testes de hipóteses as estatísticas dos testes não paramétricos não dependem diretamente dos valores das observações mas sim de outras características como por exemplo a relação de ordem e a graduação das observações O posto de uma observação é a sua posição relativa às demais observações quando os dados estão em ordem crescente ou decrescente É uma forma de medir a posição relativa da observação sem usar o valor observado diretamente Os postos correspondentes às observações de uma variável X1 X2 Xn Colocamse as observações em ordem crescente X1 X2 Xn Associamse valores correspondendo às suas posições relativas na amostra O primeiro elemento recebe o valor 1 o segundo o valor 2 e assim por diante até que a maior observação receba o valor n Se todas as observações são distintas ou seja se Xi Xj para todo i j os postos R1 R2Rn são iguais aos valores associados às observações no passo anterior Para observações iguais associamse postos iguais à média de suas posições relativas na amostra A estatística não paramétrica é de distribuição livre Não incorpora as suposições restritivas características dos testes paramétricos Os dados não precisam estar normalmente distribuídos Free Distribution É necessário apenas que eles sejam ordenáveis São baseados em postos das observações e não em seus valores como no caso dos paramétricos Podem ser aplicados para variáveis quantitativas falsas intervalares também chamadas de semiquantitativas e qualitativas Vantagens 1 São menos exigentes do que os outros testes paramétricos pois têm distribuição livre isto é não dependem da forma de distribuição da população original 2 Podem ser aplicados quando é difícil estabelecer uma verdadeira escala qualitativa dos dados 3 Têm pequeno volume de cálculo 4 São muito úteis em amostras pequenas 5 Existem testes nãoparamétricos para lidar com amostras de população com distribuições diferentes Desvantagens 1 Menos sensíveis aos erros de medida e rápidos para pequenas amostras 2 Se as suposições básicas de um teste paramétrico são satisfeitas então os testes nãoparamétricos são menos poderosos do que a técnica paramétrica correspondente exigirá uma amostra maior 3 As hipóteses testadas por testes nãoparamétricos tendem ser menos específicas 4 Por usarem postos em vez do valor da observação esses testes não aproveitam toda a informação disponível sobre a distribuição dos dados 5 Se existem muitas distribuições empatadas as estatísticas serão superestimadas exigindo correções 6 Têm menos poder que os paramétricos quando a população pode ser definida na sua forma de distribuição 7 Não são muito eficientes para rejeitar uma hipótese nula 8 Não levam em consideração a magnitude precisa dos dados Tipo de Mensuração dos dados escala de mensuração aEscala Nominal É o mais baixo nível de mensuração Utiliza símbolos ou números simplesmente para distinguir elementos em diferentes categorias como um nome não havendo entre eles geralmente possibilidade de comparação do tipo maiormenor melhorpior Exemplos Masculino M Feminino F Perfeito 1 Defeituosa 0 Europeu 1 Americano2 Africano 3 Asiático4 Tipo de Mensuração dos dados escala de mensuração b Escala Ordinal Utiliza números apenas para classificarmos elementos numa ordem crescente ou decrescente Existe assim algum tipo de relação entre as categorias embora a diferença entre elas seja de difícil quantificação Exemplos Classes sócio econômicas A B C D E Patentes do Exército soldado cabo sargento etc Opinião de um determinado produto Ruim Regular Bom Muito bom Excelente Tipo de Mensuração dos dados escala de mensuração c Escala de Razão Ocorre quando a escala tem as características da escala ordinal e ainda é possível quantificar a diferença entre dois números desta escala Exemplo Peso Volume Altura Densidade Biomassa Rendimentos Exemplo Considere uma amostra de 8 idades de crianças do ambulatório do IC apresentada na tabela abaixo Os postos devem ser cuidadosamente atribuídos pois os testes serão baseados nesses valores Com distúrbios Unidade amostral Riqueza de espécies Posto 1 1 1 2 7 2 3 8 3 4 9 4 5 10 55 6 10 55 7 12 7 8 13 8 9 15 10 10 16 115 Sem distúrbios Unidade amostral Riqueza de espécies Posto 11 14 9 12 16 115 13 17 135 14 17 135 15 18 15 16 19 16 17 20 17 18 21 18 19 23 19 20 42 20 Teste Binomial Amostra independente em que a variável é binária ou dicotômica sucesso ou fracasso Compara as frequências observadas com as frequências esperadas em uma distribuição binomial Para grandes amostras N 20 a distribuição binomial se aproxima da distribuição normal padrão Teste Binomial Estes testes são úteis para verificar se determinada amostra pode provir de uma população especificada se ajusta a uma distribuição de probabilidade São usualmente conhecidos como testes de aderência ou bondade do ajuste Neste caso retirase uma amostra aleatória e comparase a distribuição amostral observada com a distribuição teórica de interesse É aplicado em amostras provenientes de populações que se constituem de apenas 2 categorias variáveis dicotômicas Os experimentos binomiais se caracterizam por n repetições independentes com probabilidade constante de sucesso Exemplo masculino feminino negativo positivo defeituoso perfeita Pode ser útil para verificar se a proporção de sucesso p observada na amostra indicando que ela pode pertencer a uma população com uma determinada probabilidade de sucesso p Pressupostos Cada observação é classificada como sucesso ou fracasso A probabilidade p de sucesso não se altera com a repetição do experimento As n tentativas são independentes Este método irá calcular a probabilidade da variável de interesse apresentar resultados mais extremos do que os observados Iniciase com a formulação das hipóteses Determinar n número de repetições Determinar a frequência observada x Calculase a probabilidade de ocorrência de valores mais extremos do que o observado número de sucessos dependendo da hipótese alternativa Esta probabilidade equivale ao pvalor Caso p α rejeitase H0 Em uma amostra de tamanho 30 foram observados 5 sucessos Testar se p02 com nível de significância de 5 HipótesesH0p02 H1p02 Teste Binomial Exemplo uma moeda será lançada 40 vezes esperase que não tenha vícios A tabela apresenta os resultados obtidos Teste a hipótese nula ao nível de significância de 5 Eventos Cara 1 Coroa 0 Total Teste Binomial Procedimento para aplicação do teste 1 A hipótese nula é H0 p ½ não existe diferença entra a probabilidade de cara p e coroa q A Hipótese alternativa é H1 p ½ 2 O nível de significância α 5 3 Como N 20 e Np 7 usar a tabela normal padrão 4 Fixar a região crítica da tabela Z é 196 5 Calcular o valor real de z z 𝑁𝑝 𝑁𝑝 05 𝑁𝑝𝑞 40 04 40 05 05 40 05 05 1107 6 Conclusão como 196 z 196 não rejeitamos H0 A moeda não é viciada Exercício Admitindose a proporção de 31 em F1 da lei de Mendel para 80 observações obtevese o seguinte resultado Dominante 56 Recessivo 24 Verifique se esses dados estão de acordo com a lei Uma empresa lançou recentemente no mercado uma dieta de emagrecimento e pretende fazer o controle do peso dos seus seguidores Para tal procedeuse à recolha dos pesos de 60 indivíduos escolhidos aleatoriamente entre os seus seguidores Para tal houve escolha aleatória de 16 indivíduos entre os adeptos da nova dieta e apurouse que apenas 5 tinham idade superior a 60 anos Pretendese averiguar se a proporção de seguidores com idades superiores a 60 anos é significativamente maior que 30
40
Bioestatística
UFMA
59
Bioestatística
UFMA
49
Bioestatística
UFMA
5
Bioestatística
UFMA
61
Bioestatística
UFMA
17
Bioestatística
UFMA
43
Bioestatística
UFMA
43
Bioestatística
UFMA
56
Bioestatística
UFMA
55
Bioestatística
UFMA
Texto de pré-visualização
TESTES NÃO PARAMÉTRICOS AULA 1420252 TESTES NÃO PARAMÉTRICOS Em estudos biológicos ambientais e oceanográficos são muito utilizados o Teste de t Student Análise de Variância Coeficiente de Correlação de Pearson Regressão linear simples Tais testes exigem para sua aplicação que a variável em análise seja numérica as hipóteses sejam feitas sobre os parâmetros Testes paramétricos TESTES PARAMÉTRICOS X TESTES NÃO PARAMÉTRICOS Nem sempre os pressupostos de normalidade e de homogeneidade de variâncias são atendidos Nestes casos podemos transformar as variáveis investigadas e avaliar se tais valores transformados atendem aos pressupostos Caso os pressupostos sejam atendidos podemos usar os valores obtidos após a transformação para realizar a análise estatística Os principais tipos de transformação são a Transformação logarítmica cada valor observado da variável é substituído pelo seu logaritmo ou seja xi log x Na equação x representa cada valor observado da variável original e xi é o respectivo valor transformado Geralmente usamos o logaritmo natural d Transformação inversa cada valor observado é substituído pelo seu inverso x i 1xi Geralmente essa transformação é utilizada para variáveis expressas em taxas Existem casos em que mesmo transformando as variáveis os pressupostos dos testes paramétricos não são atendidos Quando isso acontece precisamos utilizar um Teste não paramétrico Nos testes não paramétricos não é necessário conhecer a distribuição da variável investigada e os pressupostos de normalidade e homogeneidade de variâncias não precisam ser atendidos A lógica dos testes não paramétricos baseiase em ordenar os valores da variável investigada e atribuir um posto para cada valor O posto é um número por exemplo 1 2 3 etc que corresponde à posição de determinado valor da variável na ordenação de todos os valores A estatística dos testes não paramétricos não utiliza os valores observados da variável mas os valores dos postos Assim valores extremos que são problemáticos nos testes paramétricos por influenciarem o cálculo da média e da variância deixam de ser importantes nos testes não paramétricos Para testar hipóteses com testes não paramétricos seguimos a mesma lógica de um teste de hipóteses paramétrico ou seja precisamos i definir as hipóteses nula e alternativa ii estabelecer o nível crítico de significância iii determinar o valor crítico da estatística do teste não paramétrico iv calcular a estatística do teste não paramétrico v comparar os valores crítico e calculado da estatística do teste vi fazer a inferência estatística Quando se aplica um teste de hipóteses não paramétrico Sempre que for possível devese utilizar testes PARAMÉTRICOS são mais poderosos do ponto de vista estatístico mas possuem uma série de suposições que precisam ser satisfeitas para sua aplicação a saber primeiramente há interesse em testar os parâmetros da distribuição populacional da variável sob análise a variável sob análise TEM que ser quantitativa nível de mensuração escala de razão a variável apresenta distribuição normal na população ou então a amostra é suficientemente grande para que se possa supor que a distribuição amostral da média seja normal decorrência do Teorema Central do Limite RAZÕES PARA USAR TESTES NÃO PARAMÉTRICOS Razão 1 Sua área de estudo é mais bem representada pela mediana O fato de você poder realizar um teste paramétrico com dados não normais não significa que a média seja a melhor medida da tendência central dos seus dados Quando sua distribuição é assimétrica o suficiente a média é fortemente afetada por mudanças distantes na cauda da distribuição enquanto a mediana continua a refletir mais proximamente o centro da distribuição Razão 2 Você tem um tamanho amostral muito pequeno Se você não atender às orientações de tamanho amostral para os testes paramétricos e não tiver certeza de que os dados seguem uma distribuição normal deverá usar um teste não paramétrico Quando você tem uma amostra muito pequena pode não conseguir determinar a distribuição de seus dados porque os testes de distribuição não terão poder suficiente para proporcionar resultados significativos Nesse cenário você está em uma situação difícil sem alternativa válida Os testes não paramétricos têm menos poder para começar e ter também um tamanho amostral baixo representa aumenta o problema Razão 3 Você tem dados ordinais dados ordenados ou outliers que não podem ser removidos Os testes paramétricos típicos só podem avaliar dados contínuos e os resultados podem ser significativamente afetados por outliers Em contrapartida alguns testes não paramétricos podem manusear dados ordinais dados ordenados e não serem seriamente afetados por outliers OUTRAS CONSIDERAÇÕES A decisão geralmente depende se a média ou a mediana representa com mais precisão o centro da distribuição dos seus dados Se a média representar com precisão o centro de sua distribuição e o tamanho de sua amostra for grande o suficiente considere a realização de um teste paramétrico pois ele será mais eficiente Se a mediana representar melhor o centro da sua distribuição considere o teste não paramétrico mesmo quando tiver uma amostra grande Sendo assim aplicase um teste não paramétrico quando há interesse em testar outras características da distribuição populacional da variável sob análisepor exemplo a forma da distribuição a variável sob interesse for qualitativa nos caso em que a variável é quantitativa há interesse em testar os parâmetros da sua distribuição populacional mas sabese que a distribuição populacional não é normal ou não se conhece nada sobre ela e não é possível retirar uma amostra grande Os testes nãoparamétricos podem ser divididos em testes para Uma amostra Duas amostras emparelhadas dependentes Duas amostras independentes Várias amostras emparelhadas dependentes Várias amostras independentes Testes nãoParamétricos Dimensão Nível de Mensuração Teste nãoParamétrico Uma amostra Nominal Binomial Quiquadrado Duas amostras emparelhadas Nominal Teste de McNemar Ordinal Teste dos sinais Teste de Wilcoxon Duas amostras independentes Ordinal Teste de MannWhitney K amostras emparelhadas Nominal Q de Cochran Ordinal Teste de Friedman K amostras independentes Ordinal Teste de KruskalWallis Exigências para utilização de testes paramétricos Quando se pretende empregar um teste t de Student ou uma análise da variância para fazer comparações entre amostras testes paramétricos existe uma lista de requisitos que inclui entre outros que a variável tenha distribuição normal que a distribuição seja simétrica e mesocurtica Pressuposição de homogeneidade de variâncias Opção Sempre que não se pode admitir a simetria e a normalidade da distribuição que os dados foram recolhidos num nível de mensuração inferior ao intervalar Recorrese a testes que não incluem a normalidade da distribuição ou nível intervalar de mensuração Esses testes chamamse não paramétricos Vantagens dos testes nãoparamétricos Não exigem suposições numerosas ou restringentes em relação à distribuição dos dados nãoexigência normalidade Podem ser utilizados mesmo quando os seus dados só podem ser medidos num nível ordinal ié quando for apenas possível ordenálos por ordem de grandeza podem ser utilizados mesmo quando os seus dados são apenas nominais ie quando os sujeitos podem apenas ser classificados em categorias Envolvem cálculos mais simples e consequentemente apresentam maior facilidade de aprendizado e aplicação Em consequência Ao rejeitarse a H0 sem preencher as exigências mínimas dos testes paramétricos é mais provável que essa rejeição seja falsa se rejeitar H0 quando ela é verdadeira cometese um erro do tipo I Se aceitar H0 quando ela é falsa cometese um erro do tipo II Quando os requisitos de um teste paramétrico são violados tornase impossível conhecer o seu poder e a sua dimensão Como varia o poder de um teste O poder varia de um teste para o outro os testes mais poderosos os que têm maior probabilidade de rejeição de H0 são testes que possuem prérequisitos mais difíceis de satisfazer testes paramétricos como t e F As alternativas não paramétricas exigem muito menos pré requisitos mas produzem testes de significância com menos poder que os correspondentes paramétricos Poder de um teste o poder de um teste é a probabilidade de rejeitarmos H0 quando ela é realmente nula Para se entender a importância dos testes é necessário entender o conceito de poder A estatística nãoparamétrica para dados qualitativos ordinais ou quantitativos sem distribuição normal é baseada na conversão dos dados originais da amostra em postos ranks ou sinais positivos ou negativos Um posto é considerado como sendo a posição de um determinado dado quando todos os valores que compõem a amostra estão ordenados de forma crescente ou decrescente Nos testes de hipóteses as estatísticas dos testes não paramétricos não dependem diretamente dos valores das observações mas sim de outras características como por exemplo a relação de ordem e a graduação das observações O posto de uma observação é a sua posição relativa às demais observações quando os dados estão em ordem crescente ou decrescente É uma forma de medir a posição relativa da observação sem usar o valor observado diretamente Os postos correspondentes às observações de uma variável X1 X2 Xn Colocamse as observações em ordem crescente X1 X2 Xn Associamse valores correspondendo às suas posições relativas na amostra O primeiro elemento recebe o valor 1 o segundo o valor 2 e assim por diante até que a maior observação receba o valor n Se todas as observações são distintas ou seja se Xi Xj para todo i j os postos R1 R2Rn são iguais aos valores associados às observações no passo anterior Para observações iguais associamse postos iguais à média de suas posições relativas na amostra A estatística não paramétrica é de distribuição livre Não incorpora as suposições restritivas características dos testes paramétricos Os dados não precisam estar normalmente distribuídos Free Distribution É necessário apenas que eles sejam ordenáveis São baseados em postos das observações e não em seus valores como no caso dos paramétricos Podem ser aplicados para variáveis quantitativas falsas intervalares também chamadas de semiquantitativas e qualitativas Vantagens 1 São menos exigentes do que os outros testes paramétricos pois têm distribuição livre isto é não dependem da forma de distribuição da população original 2 Podem ser aplicados quando é difícil estabelecer uma verdadeira escala qualitativa dos dados 3 Têm pequeno volume de cálculo 4 São muito úteis em amostras pequenas 5 Existem testes nãoparamétricos para lidar com amostras de população com distribuições diferentes Desvantagens 1 Menos sensíveis aos erros de medida e rápidos para pequenas amostras 2 Se as suposições básicas de um teste paramétrico são satisfeitas então os testes nãoparamétricos são menos poderosos do que a técnica paramétrica correspondente exigirá uma amostra maior 3 As hipóteses testadas por testes nãoparamétricos tendem ser menos específicas 4 Por usarem postos em vez do valor da observação esses testes não aproveitam toda a informação disponível sobre a distribuição dos dados 5 Se existem muitas distribuições empatadas as estatísticas serão superestimadas exigindo correções 6 Têm menos poder que os paramétricos quando a população pode ser definida na sua forma de distribuição 7 Não são muito eficientes para rejeitar uma hipótese nula 8 Não levam em consideração a magnitude precisa dos dados Tipo de Mensuração dos dados escala de mensuração aEscala Nominal É o mais baixo nível de mensuração Utiliza símbolos ou números simplesmente para distinguir elementos em diferentes categorias como um nome não havendo entre eles geralmente possibilidade de comparação do tipo maiormenor melhorpior Exemplos Masculino M Feminino F Perfeito 1 Defeituosa 0 Europeu 1 Americano2 Africano 3 Asiático4 Tipo de Mensuração dos dados escala de mensuração b Escala Ordinal Utiliza números apenas para classificarmos elementos numa ordem crescente ou decrescente Existe assim algum tipo de relação entre as categorias embora a diferença entre elas seja de difícil quantificação Exemplos Classes sócio econômicas A B C D E Patentes do Exército soldado cabo sargento etc Opinião de um determinado produto Ruim Regular Bom Muito bom Excelente Tipo de Mensuração dos dados escala de mensuração c Escala de Razão Ocorre quando a escala tem as características da escala ordinal e ainda é possível quantificar a diferença entre dois números desta escala Exemplo Peso Volume Altura Densidade Biomassa Rendimentos Exemplo Considere uma amostra de 8 idades de crianças do ambulatório do IC apresentada na tabela abaixo Os postos devem ser cuidadosamente atribuídos pois os testes serão baseados nesses valores Com distúrbios Unidade amostral Riqueza de espécies Posto 1 1 1 2 7 2 3 8 3 4 9 4 5 10 55 6 10 55 7 12 7 8 13 8 9 15 10 10 16 115 Sem distúrbios Unidade amostral Riqueza de espécies Posto 11 14 9 12 16 115 13 17 135 14 17 135 15 18 15 16 19 16 17 20 17 18 21 18 19 23 19 20 42 20 Teste Binomial Amostra independente em que a variável é binária ou dicotômica sucesso ou fracasso Compara as frequências observadas com as frequências esperadas em uma distribuição binomial Para grandes amostras N 20 a distribuição binomial se aproxima da distribuição normal padrão Teste Binomial Estes testes são úteis para verificar se determinada amostra pode provir de uma população especificada se ajusta a uma distribuição de probabilidade São usualmente conhecidos como testes de aderência ou bondade do ajuste Neste caso retirase uma amostra aleatória e comparase a distribuição amostral observada com a distribuição teórica de interesse É aplicado em amostras provenientes de populações que se constituem de apenas 2 categorias variáveis dicotômicas Os experimentos binomiais se caracterizam por n repetições independentes com probabilidade constante de sucesso Exemplo masculino feminino negativo positivo defeituoso perfeita Pode ser útil para verificar se a proporção de sucesso p observada na amostra indicando que ela pode pertencer a uma população com uma determinada probabilidade de sucesso p Pressupostos Cada observação é classificada como sucesso ou fracasso A probabilidade p de sucesso não se altera com a repetição do experimento As n tentativas são independentes Este método irá calcular a probabilidade da variável de interesse apresentar resultados mais extremos do que os observados Iniciase com a formulação das hipóteses Determinar n número de repetições Determinar a frequência observada x Calculase a probabilidade de ocorrência de valores mais extremos do que o observado número de sucessos dependendo da hipótese alternativa Esta probabilidade equivale ao pvalor Caso p α rejeitase H0 Em uma amostra de tamanho 30 foram observados 5 sucessos Testar se p02 com nível de significância de 5 HipótesesH0p02 H1p02 Teste Binomial Exemplo uma moeda será lançada 40 vezes esperase que não tenha vícios A tabela apresenta os resultados obtidos Teste a hipótese nula ao nível de significância de 5 Eventos Cara 1 Coroa 0 Total Teste Binomial Procedimento para aplicação do teste 1 A hipótese nula é H0 p ½ não existe diferença entra a probabilidade de cara p e coroa q A Hipótese alternativa é H1 p ½ 2 O nível de significância α 5 3 Como N 20 e Np 7 usar a tabela normal padrão 4 Fixar a região crítica da tabela Z é 196 5 Calcular o valor real de z z 𝑁𝑝 𝑁𝑝 05 𝑁𝑝𝑞 40 04 40 05 05 40 05 05 1107 6 Conclusão como 196 z 196 não rejeitamos H0 A moeda não é viciada Exercício Admitindose a proporção de 31 em F1 da lei de Mendel para 80 observações obtevese o seguinte resultado Dominante 56 Recessivo 24 Verifique se esses dados estão de acordo com a lei Uma empresa lançou recentemente no mercado uma dieta de emagrecimento e pretende fazer o controle do peso dos seus seguidores Para tal procedeuse à recolha dos pesos de 60 indivíduos escolhidos aleatoriamente entre os seus seguidores Para tal houve escolha aleatória de 16 indivíduos entre os adeptos da nova dieta e apurouse que apenas 5 tinham idade superior a 60 anos Pretendese averiguar se a proporção de seguidores com idades superiores a 60 anos é significativamente maior que 30