·

Química ·

Probabilidade e Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

8 Comparação entre as médias de duas amostras independentes Quando o objetivo é comparar duas populações quanto a uma variável quantitativa é muito comum que os pesquisadores não conheçam os parâmetros de nenhuma delas isto é sejam desconhecidas as médias e também os desvios padrão populacionais Às vezes a média de uma das populações é conhecida mas as condições dos indivíduos que vão constituir a amostra não são comparáveis às dessa população que se pretende tomar como referência Por exemplo admita que a taxa média de creatinina em urina de 24 horas é 13 g em adultos normais¹ Se um pesquisador deseja verificar que alterações sofre essa variável em crianças com nefrite não pode comparar a média de uma amostra de crianças com tal problema com aquela dos adultos pois uma possível diferença poderia ser explicada por dois fatores que não podem ser separados idade e doença Por isso muitos dos experimentos biológicos e da área da saúde são realizados com duas amostras independentes de indivíduos denominadas grupo experimental e grupocontrole respectivamente Os indivíduos que constituem esses grupos devem diferir entre si apenas quanto ao fator que vai ser estudado como é o caso da nefrite procurandose que sejam o mais possível semelhantes quanto a outras características por exemplo a idade que possam interferir nos resultados Os estatísticos às vezes identificam tais grupos dizendo que o primeiro corresponde ao tratamento A e o segundo ao tratamento B Eles usam o termo tratamento com o sentido estatístico e não o terapêutico esse hábito vem do fato de que muitas das técnicas estatísticas foram desenvolvidas para experimentos agronômicos nos quais os tratamentos podiam ser adubos ou outras formas de tratar o solo Assim se dois grupos diferem apenas quanto ao fator doença o tratamento A pode identificar os doentes e o B um grupo controle de indivíduos sãos Também nesse caso o objetivo do pesquisador é comparar duas médias populacionais mas a diferença com o método visto anteriormente é que aqui ambas as médias são desconhecidas Além disso também não se conhece como varia a característica da população σ Exemplo 1 A troca entre as cromátidesirmãs de um cromossomo é um fenômeno raro na divisão mitótica Sua presença em frequências altas é usada ¹ Dicionário de Especialidades Farmacêuticas 1997 p 1046 A taxa de creatinina na urina é um indicador da função renal como indicador genético da toxicidade de um produto químico Doulot e colaboradores 1992 desejando estudar o efeito genético de pesticidas em floricultores argentinos contaram o número de trocas entre cromátidesirmãs TCI em 14 indivíduos que apresentavam sintomas de intoxicação crônica e em 13 floricultores sem tais sintomas Os dados obtidos estão apresentados na Tabela 81 A média do TCI nos floricultores nãointoxicados foi 548 enquanto nos intoxicados foi 645 Com base nesses dados podem os autores afirmar que a intoxicação com pesticidas altera a frequência de trocas entre cromátidesirmãs RACIOCÍNIO DO TESTE A hipótese que os autores desejam testar é a de que a intoxicação crônica determinada pela exposição a pesticidas é acompanhada de uma alteração no TCI Evidentemente não haveria necessidade de teste estatístico se os valores médios obtidos fossem relativos à população de floricultores saudáveis e à população de floricultores intoxicados respectivamente pois então verificarseia de maneira clara que μsaudáveis difere de μintoxicados No entanto as médias de que se dispõem são amostrais e portanto cada uma delas pode ser igual ou diferir aleatoriamente do parâmetro que está representando Como consequência a diferença observada de 097 no TCI pode representar uma diferença real entre as populações ou pode ser apenas uma diferença casual entre amostras O teste estatístico neste caso parte da hipótese de nulidade de que as médias das duas populações μA e μB são iguais isto é H0 μA μB Se esta suposição for verdadeira a diferença μA μB é zero No entanto sabese que quando se obtém aleatoriamente duas amostras de tais populações TABELA 81 Número de trocas entre cromátidesirmãs TCI média de 25 células observado em floricultores com e sem sintomas de intoxicação crônica Floricultores sem sintomas Floricultores com sintomas Indivíduo nº TCI xA Indivíduo nº TCI xB 20 29 11 48 08 46 37 49 06 48 34 53 25 52 24 54 33 53 15 56 01 57 02 63 05 57 04 64 32 58 12 64 19 58 14 66 09 58 07 69 35 59 13 70 10 66 30 78 16 71 03 81 27 88 nA 13 xA 548 sA 1019 nB 14 xB 645 sB 1206 Fonte Doulot e colaboradores 1992 as médias amostrais podem diferir ao acaso mesmo que μA e μB sejam iguais A pergunta é até que ponto considerase a diferença observada como casual As diferenças xA xB oriundas de amostras retiradas de populações de média igual têm distribuição normal com média μA μB 0 Para testar a hipótese formulada basta então estipular α e a partir daí determinar por quantos erros padrão a diferença obtida xA xB 097 podese desviar de zero por simples acaso Como a variância de x é desconhecida ela terá de ser estimada por meio das amostras por isso o número crítico de erros padrão para o teste de hipóteses é dado por tαgl A Figura 81 ilustra a distribuição amostral das diferenças e a distribuição t correspondente ambas com região de significância sombreada O teste de hipóteses para os dados da Tabela 81 será apresentado a seguir ETAPAS DO TESTE DE HIPÓTESES QUE COMPARA DUAS MÉDIAS A sequência de passos para a realização desse teste é semelhante à vista anteriormente para o teste de uma média 1 Estabelecimento das hipóteses estatísticas H0 μA μB ou μA μB 0 HA μA μB ou μA μB 0 2 Escolha do nível de significância α 005 3 Determinação do valor crítico do teste Neste teste gl nA nB 2 onde nA e nB são os tamanhos das amostras A e B Então gl 13 14 2 25 e t00525 2060 4 Determinação do valor calculado do teste tcalc xA xB μA μB s0²1nA 1nB xA xB s0²1nA 1nB pois μA μB 0 O denominador dessa expressão é o erro padrão da diferença entre médias amostrais Para calculálo é necessário estimar a variância de x na popula FIGURA 81 À esquerda distribuição das diferenças entre duas médias amostrais xA xB obtidas de duas populações de médias supostamente iguais À direita distribuição t correspondente para 25 graus de liberdade com a região crítica para α 005 sombreada ção Pressupondo que a variabilidade de x é a mesma nas duas populações estimase σ² usando os dados das duas amostras Tal estimativa da variância comum às duas populações denominada s₀² é obtida pela média ponderada das variâncias amostrais do seguinte modo s₀² nA 1sA² nB 1sB² nA nB 2 onde sA² e sB² são as variâncias das duas amostras estudadas A variância comum estimada para os dados do Exemplo 1 é s₀² 1311019² 1411202² 13 14 2 1254 Deste modo o valor calculado de t é tcalc 548 645 1254113 114 097 0186 2249 5 Decisão Como tcalc 2249 t00525 2060 rejeitase H₀ A interpretação de tcalc é a seguinte a diferença entre as médias amostrais 097 está 225 erros padrão afastada da diferença entre as médias populacionais considerada na H₀ zero Como o nível se significância escolhido estipula um máximo de 206 para uma diferença nãosignificativa devese rejeitar a hipótese de que as médias das duas populações sejam iguais e admitir que as amostras são procedentes de populações de médias diferentes com probabilidade de erro calculada em 005 6 Conclusão As médias das duas amostras diferem significativamente entre si levando a crer que o número de troças entre cromátidesirmãs está alterado aumentado nos floricultores com intoxicação crônica quando comparado com os que não estão intoxicados α 005 OBSERVAÇÃO Teoricamente este poderia ser um teste unilateral já que o TCI é usado como um indicador de toxicidade Um teste bilateral por outro lado propicia aos pesquisadores a identificação tanto de um possível aumento quanto de uma eventual diminuição nos valores da variável que os autores poderiam querer relatar caso ocorresse PRESSUPOSTÕES AO USO DO TESTE t PARA DUAS AMOSTRAS INDEPENDENTES Para que o resultado de um teste t para amostras independentes seja válido além de as amostras serem aleatórias é necessário satisfazer duas pressuposições A primeira delas é a de que xA e xB separadamente têm distribuição normal ou aproximadamente normal Este pressuposto garante que a diferença entre as médias amostrais tenha uma distribuição normal e portanto se possa realizar o teste t como foi visto acima De modo geral o teste t é bastante robusto pode ser usado até com desvios consideráveis da normalidade desde que as amostras sejam iguais ou aproximadamente iguais em tamanho e o teste seja bilateral Se as variáveis não apresentarem distribuição normal podese tentar uma transformação nos dados Conforme indicado anteriormente x lnx x x x 1x e x x² são transformações comuns Outro tipo de solução é usar uma técnica nãoparamétrica de análise estatística o teste de WilcoxonMannWhitney A segunda pressuposição importante é a de que as variâncias populacionais são iguais isto é se o tratamento A produzir um efeito diferente daquele do tratamento B o efeito altera uniformemente os valores de modo que a dispersão dos dados seja a mesma nas duas condições Por exemplo se com a dieta A o peso de animais de laboratório varia entre 250 e 300 g e com a B entre 300 e 350 g não há diferença de variabilidade entre os grupos embora os animais submetidos à dieta B tenham um peso maior do que os que se alimentam da forma A A Figura 43 ilustra um caso em que duas distribuições têm médias diferentes mas variâncias iguais curvas A e B e outro em que os grupos têm médias diferentes e variabilidades também diferentes curvas A e C Se a pressuposição de igualdade de variâncias não for satisfeita o nível de significância do teste se altera e o pesquisador imagina estar realizando um teste com α 005 por exemplo quando na realidade não está Devese portanto testar a homogeneidade das variâncias antes de se realizar o teste t para amostras independentes COMPARAÇÃO ENTRE DUAS VARIÂNCIAS O conjunto de hipóteses usado no teste que compara duas variâncias é H₀ σA² σB² H₁ σA² σB² Este teste é sempre bilateral ou seja rejeitase H₀ se σA² σB² ou se σA² σB² Se as variâncias populacionais são iguais então σA² σB² 1 No entanto os dados de experimentos são relativos a amostras de modo que mesmo que as variân cias populacionais sejam iguais a razão sA² sB² pode apresentar alguma diferença aleatória em relação a 1 Como nos testes anteriores é necessário estabelecer um limite a partir do qual a diferença entre sA² e sB² é grande demais para ser atribuída ao acaso devendo ser atribuída a uma diferença real entre os parâmetros A estatística calculada para o teste é a razão entre as variâncias amostrais e é denominada F Os valores de Fcalc sA² sB² seguem uma distribuição assimétrica que foi estudada por RA Fisher e posteriormente denominada distribuição F em sua homenagem Um exemplo de distribuição F está apresentada na Figura 82 A forma dessa distribuição varia conforme o número de graus de liberdade envolvidos O valor esperado é 1 se as duas variâncias forem iguais Na extremidade esquerda da curva estão os casos em que sA² é muito menor do que sB² e na cauda direita os casos em que sA² é muito maior do que sB² Para facilitar o teste convencionouse colocar no numerador a variância maior que não é necessariamente a da amostra maior de modo que o valor de Fcalc será sempre um valor igual ou maior do que 1 A estatística F é calculada então do seguinte modo Fcalc s²Maior s²menor O valor crítico de F depende do nível de significância usado α e do número de graus de liberdade n 1 de cada amostra sendo indicado por Fαglngld onde glN significa graus de liberdade da variância do numerador e glD o mesmo para o denominador As Tabelas A31 e A32 apresentam os valores críticos para um teste bilateral de comparação entre duas variâncias O teste t realizado para os dados do Exemplo 1 deveria ter sido precedido por um teste de homogeneidade de variâncias para justificar sua aplicação A seguir está apresentada a seqüência de passos para o teste F Exemplo 1 continuação Na Tabela 81 as variâncias observadas e respectivos tamanhos amostrais foram Nãointoxicados n 13 s² 1019² 1038 Intoxicados n 14 s² 1206² 1454 Realizando para esses dados o teste de comparação entre variâncias temse 1 Hipótese estatísticas H₀ σA² σB² ou H₀ σA² σB² 1 HA σA² σB² ou H₀ σA² σB² 1 2 Escolha do nível de significância α 005 3 Determinação do valor calculado Fcalc s²Maior s²menor 1454 1038 1401 4 Determinação do valor crítico glN nN 1 14 1 13 glD nD 1 13 1 12 Fαglngld F0051312 325 como F0051312 não está tabelado usouse a média entre F0051212 328 e F0051412 321 Tabela A31 O valor F005 325 significa que uma razão entre variâncias com valor até 325 será interpretada como casual a partir de F 325 a probabilidade de que a diferença seja casual é menor do que 005 e então a razão F é considerada estatisticamente significativa isto é suficiente para admitir que as variâncias populacionais são diferentes 5 Como Fcalc 1401 F0051312 325 não se rejeita H0 e concluise que não há evidência de que as variâncias populacionais sejam diferentes podendose portanto aplicar o teste t conforme apresentado acima TESTE t QUANDO AS VARIÂNCIAS POPULACIONAIS DIFEREM Exemplo 2 Gross e colaboradores 1993 compararam a taxa de creatinina urinária em pacientes diabéticos com e sem proteinúria excreção excessiva de proteínas na urina O grupo com proteinúria era constituído de 53 diabéticos e a média desvio padrão foi 15 08 enquanto no grupo controle com 64 pacientes os valores foram 11 02 Comparando as variâncias dos dois grupos verificase que Fcalc 082 022 064004 16 é estatisticamente significativo para α 005 pois o valor crítico bilateral F0055263 é 168 Neste caso o teste t na forma como foi visto anteriormente não pode ser utilizado A comparação entre duas médias quando σA2 σB2 é chamado o problema de BehrensFisher Zar 1999128 Foram propostas várias soluções para resolvêlo Uma das mais fáceis de aplicar é atribuída a Smith 1936 e será apresentada a seguir O símbolo t será usado para indicar o valor de t obtido da seguinte forma tcalc x A xB sA2 nA sB2 nB A diferença em relação à fórmula anterior é a de que naquela se utilizava a estimativa de uma variância comum s02 enquanto aqui se usam as variâncias observadas nas duas amostras O valor de t para os dados de Gross e colaboradores 1993 é tcalc xA xB sA2 nA sB2 nB 15 11 06453 00464 04 0012 0001 04 0114 3508 Neste procedimento o número de graus de liberdade gl não é mais dado por nA nB 2 mas deve ser calculado do seguinte modo gl wA wB2 wA2 nA 1 wB2 nB 1 onde w s2 n em cada amostra É mais conveniente obter inicialmente os valores de w para depois calcular gl Assim wA sA2 nA 0012 e wB sB2 nB 0001 O número de graus de liberdade corrigido gl para variâncias populacionais diferentes neste exemplo é gl wA wB2 wA2 nA 1 wB2 nB 1 0012 00012 00122 52 00012 63 0000169 0000003 56 O valor crítico de t para um nível de significância de 001 e 56 graus de liberdade é t00156 2660 Sendo o valor de tcalc 3508 maior do que o crítico 2660 podese concluir que a taxa de creatinina difere significativamente entre diabéticos sem proteinúria e diabéticos com proteinúria sendo mais elevada nos últimos Uma outra possibilidade de análise quando as variâncias são significativamente diferentes seria utilizar um teste nãoparamétrico Foi exatamente o que os autores do artigo fizeram chegando à mesma conclusão Exemplo 3 O efeito da retirada do pâncreas e da hipófise sobre o nível de glicose no sangue glicemia foi estudado na tartaruga Chrysemys dOrbignyi por Foglia e colaboradores 1955 que encontraram diferenças aparentemente importantes entre animais íntegros e indivíduos dos quais foram retiradas essas glândulas Desejase testar a significância estatística destes resultados A Tabela 82 apresenta os dados obtidos pelos pesquisadores e a análise estatística realizada com um programa de computador Tendo identificado o problema como o de uma comparação entre dois grupos independentes a primeira coisa a fazer é comparar as variâncias para verificar que modalidade de teste t deve ser aplicada Como o Fcalc 2522 é muito maior do que F005311 463 concluise que as variâncias diferem significativamente entre si e então o teste adequado nessas circunstâncias é o t para variâncias desiguais t A Tabela 82 informa que o valor de tcalc é 412 e o número corrigido de graus de liberdade é gl 3 Como t 412 t0053 3182 rejeitase a hipótese de igualdade entre as médias podendo os autores afirmar que a retirada do pâncreas e da hipófise está associada a um aumento na glicemia em tartarugas da espécie Chrysemys dOrbignyi Tal afirmativa é válida para α 005 apenas para α 001 a conclusão deve ser a de que não há efeito da retirada dessas glândulas Note que se for usado no teste o valor de t obtido pela fórmula clássica t 765 o resultado será que existe diferença significativa para α 0001 Esta TABELA 82 Níveis de glicemia mg100 mL em jejum de 24 horas em tartarugas da espécie Chrysemys dOrbignyi Grupo de tartarugas n Glicemia Média DP Análises estatísticas Fcalc 2522 gl 3 e 11 Íntegras 12 86 85 t 412 gl 3 Hipófise e pâncreas retirados 4 364 1350 t 765 gl 14 Fonte Foglia e colaboradores 1955 conclusão no entanto não se justifica porque a estatística de teste empregada não é a correta nas circunstâncias² UM COMENTÁRIO FINAL IMPORTANTE Muitas pessoas pensam que se um resultado é estatisticamente significativo isso representa automaticamente significância biológica ou clínica o que não é verdadeiro Considere por exemplo a seguinte situação hipotética um pesquisador possui dados de 4 mil estudantes da universidade A do sexo masculino com idade entre 20 e 22 anos A média da estatura nesses estudantes foi 175 cm e o desvio padrão 65 cm Ele possui também dados de 4 mil alunos da mesma faixa etária da universidade B onde a média foi 1753 e o desvio padrão 65 cm Comparando as amostras entre si ele obtém uma diferença de 03 cm estatisticamente significativa tcalc 206 t0057998 196 Conclui então com uma probabilidade de erro pequena que os alunos da universidade B são em média 3 mm mais altos do que os da outra universidade Qual o significado prático desse resultado Provavelmente nenhum uma diferença de 3 mm na estatura média dessas pessoas não tem a menor importância prática O que dizer então sobre a significância estatística do resultado Ela não é conflitante com a significância prática Está havendo aqui confusão entre significância estatística e significância biológica Podese perfeitamente ter uma sem ter a outra A significância estatística serve para medir o grau de crença de que a diferença obtida seja espúria Um resultado nãosignificativo estatisticamente indica que é provável que a diferença seja casual determinada por um efeito de amostragem Por outro lado um resultado estatisticamente significativo indica que a diferença é bastante confiável e que é pequena no exemplo menor que 5 a probabilidade de o resultado ser espúrio Neste último exemplo há evidência de que existe uma diferença real de 3 mm entre a estatura dos alunos das duas universidades O que isso pode representar na prática é outra história Assim o pesquisador deve concluir que há uma diferença de 3 mm que não serve para nada na estatura dos jovens de 20 a 22 anos destas universidades Por outro lado como interpretar uma diferença média de 5 cm observada ao se estudarem duas amostras de seis indivíduos de cada universidade com os mesmos valores de desvio padrão Agora esta diferença que poderia ter um sentido prático para um fabricante de roupas por exemplo não é estatisticamente significativa tcalc 133 t00510 2228 A interpretação deve ser a de que as informações obtidas no estudo não são suficientes para justificar uma conclusão de que há diferença ou porque o tamanho das amostras estudadas foi muito pequeno como neste caso ou se as amostras forem grandes porque provavelmente a diferença não é real A significância estatística para um determinado α depende do número de observações e da magnitude da diferença Ela avalia se a diferença pode ser con ² O leitor atento deve ter observado que alguns valores de DP tanto no Exemplo 2 quanto no 3 são bastante altos quando comparados com a média o que pode estar indicando que a distribuição de x não é normal Se assim for nem mesmo a variante t do teste de Student pode ser aplicada e a solução é tentar transformar os dados ou usar um teste nãoparamétrico siderada verdadeira mas de modo algum indica se ela é pequena moderada ou grande Assim em um experimento científico podem resultar a diferenças pequenas muito significativas estatisticamente isto é provavelmente reais mas de pouca importância prática b diferenças grandes nãosignificativas estatisticamente devido ou ao pequeno tamanho amostral ou ao caráter espúrio da diferença c diferenças estatística e biologicamente significativas