·

Química ·

Probabilidade e Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

9 Comparação entre médias de duas amostras pareadas Se as diferenças entre dois grupos experimentais forem pequenas podem não se evidenciar caso as unidades do experimento sejam muito heterogêneas Para diminuir as diferenças naturais existentes entre os indivíduos o pesquisador pode organizar pares em que cada unidade experimental tenha seu próprio controle O controle deve ser um indivíduo o mais semelhante possível ao tratado quanto às características que possam influenciar os valores a serem obtidos Note que enquanto no plano experimental de amostras independentes os grupos podem ser organizados de modo que variáveis intervenientes tenham a mesma frequência nos dois grupos em estudos envolvendo amostras pareadas o controle é feito indivíduo a indivíduo isto é cada um tem um par com as mesmas características Por exemplo um médico que deseja comparar duas dietas alimentares para diabéticos poderá organizar o pareamento por sexo idade e tempo de diagnóstico da doença pois essas variáveis podem interferir no resultado obtido pela dieta Assim um paciente do sexo masculino de 67 anos e diabético há 12 terá como par um outro da mesma faixa etária sexo e tempo de doença Uma mulher de 58 anos diabética há 6 deverá ser pareada com outra da mesma faixa de idade e tempo de diabete Em cada par um dos pacientes receberá a dieta A e o outro a B aleatoriamente Para a atribuição ao acaso das dietas podese usar o lançamento de uma moeda Definese de antemão por exemplo que se o resultado for cara a dieta A será administrada ao paciente e a B ao controle se for coroa os tratamentos serão invertidos Podese também utilizar uma tabela de números aleatórios usando os números ímpares para indicar a administração da dieta A ao paciente e da B ao controle e os pares para a situação inversa Um outro exemplo é o de um experimento sobre duas condições nutricionais em plantas Podese usar duas sementes da mesma vagem ou da mesma espiga para assegurar a identidade genética dos indivíduos dos dois tratamentos Cada semente do par será plantada ao acaso em um de dois potes contendo diferentes características de solo O procedimento é repetido para várias vagens ou espigas obtendose assim as condições de repetição necessárias para mensurar a variabilidade nos resultados A técnica do pareamento ou emparelhamento aumenta a eficiência do teste estatístico tornandoo mais sensível a diferenças pequenas entre os tra tamentos dizse que o emparelhamento torna o teste mais poderoso As amostras organizadas dessa forma denominamse amostras pareadas emparelhadas ou dependentes O emparelhamento máximo é obtido quando cada indivíduo é controle de si próprio Tal procedimento é bastante utilizado em experimentos nas áreas de fisiologia e de farmacologia em que se realiza uma medida antes e outra após a aplicação de determinado tratamento ou procedimento Exemplo 1 Doulot e colaboradores 1992 estudaram o número de trocas ente cromátidesirmãs TCI em floricultores com e sem sintomas de intoxicação por pesticidas parte desse trabalho foi descrito no capítulo anterior Desejando controlar variáveis que poderiam estar mascarando os resultados os autores realizaram um pareamento por sexo e idade já que o número de TCI depende do sexo e aumenta com a idade A Tabela 91 apresenta os indivíduos pareados da melhor forma possível considerando a amostra disponível TABELA 91 Número de trocas entre cromátides irmãs TCI em floricultores com e sem sintomas de intoxicação por pesticidas organizados em nove pares por sexo e idade Par Sexo e idade TCI do indivíduo intoxicado TCI do indiv nãointoxicado x TCIINTOX TCI NÃOINTOX x2 1 F 45 e 48 63 59 04 016 2 M 21 e 22 64 26 38 1444 3 F 53 e 50 69 52 17 289 4 M 17 e 11 64 53 11 121 5 F 63 e 78 70 57 13 169 6 M 62 e 72 56 57 01 001 7 M 52 e 55 54 29 25 625 8 M 30 e 37 88 48 40 1600 9 M 29 e 25 53 71 18 324 Soma 581 452 129 4589 x 645 502 143 Fonte Doulot e colaboradores 1992 Inspecionando os dados verificase que geralmente o indivíduo com sintomas de intoxicação crônica apresenta um número médio de trocas entre cromátidesirmãs superior ao daqueles que não apresentam estes sintomas Mas há exceções nos pares 6 e 9 o TCI foi maior nos indivíduos nãointoxicados A pergunta que fica é será que estudando toda a população de floricultores organizados em pares como foi feito aqui não seriam observados mais casos como os verificados nos pares 6 e 9 contrariando a hipótese de que o TCI é um bom indicador de toxicidade genética A resposta a esta pergunta depende da realização de um teste t semelhante àquele que compara a média de uma amostra com a de uma população A variável a ser testada agora não são os valores medidos de TCI mas a diferença algébrica entre eles isto é a diferença acompanhada de sinal que será denominada x O sentido escolhido para a diferença não importa podendo ser x TCIINTOXICADO TCI NÃOINTOXICADO ou x TCI NÃOINTOXICADO TCIINTOXICADO No entanto uma vez escolhido o sentido este deve ser mantido até o final da análise RACIOCÍNIO DO TESTE A hipótese de partida do teste é a de que a intoxicação por pesticidas não altera o número habitual de TCI nos floricultores Se esta afirmativa for correta os valores de TCI obtidos nos pares de indivíduos deverão ser iguais ou muito parecidos podendo ser algumas vezes um pouco maiores em indivíduos intoxicados outras um pouco maiores nos nãointoxicados ao acaso Esperase então que se não houver efeito do pesticida sobre o TCI os valores de x sejam ou zero ou valores positivos pequenos ou valores negativos pequenos Se os pesquisadores dispusessem da população toda e se a hipótese de partida fosse correta a média das diferenças µx deveria ser zero Portanto se intoxicados e nãointoxicados não diferem quanto ao TCI a média de x na amostra não deve afastarse significativamente de zero Considerando x como a diferença TCIINTOXICADO TCI NÃOINTOXICADO a média das diferenças nos nove pares de floricultores é x 129 9 143 indicando que na amostra os intoxicados apresentaram em média 14 trocas a mais Tal observação no entanto não pode ser transferida para a população de floricultores sem a realização de um teste de significância Para realizar o teste estatístico adequado calculase o desvio entre x 143 e µ 0 em termos de erros padrão e este valor é comparado com um valor tabelado da mesma forma como foi feito em outros testes Se o valor obtido for maior do que o crítico concluise que há diferença entre os dois grupos de floricultores quanto ao TCI ETAPAS DO TESTE DE HIPÓTESES PARA AMOSTRAS PAREADAS 1 Estabelecimento das hipóteses estatísticas H0 µ 0 HA µ 0 2 Escolha do nível de significância α 005 3 Determinação do valor crítico do teste Neste teste gl n 1 onde n é o número de valores de x tαgl t0058 2306 4 Determinação do valor calculado do teste tcalc x µ sn ou simplesmente tcalc x sn já que µ 0 Sendo s x2 x2 n n 1 4589 1292 9 9 1 1851 temse que tcalc 143 1851 9 2318 5 Decisão Como tcalc 2318 t0058 2306 rejeitase H0 É muito pequena a probabilidade de que uma amostra de média 143 seja obtida de uma população onde μ 0 O mais provável é que a amostra seja originária de uma população onde a média das diferenças é maior do que zero Ora se μ 0 floricultores intoxicados têm mais trocas entre cromátidesirmãs do que os nãointoxicados 6 Conclusão Em floricultores com sintomas de intoxicação crônica por pesticidas o número de trocas entre cromátidesirmãs TCI é maior do que entre indivíduos sem esses sintomas OBSERVAÇÕES 1 Note que se a diferença tivesse sido calculada como x TCINÃOINTOXICADO TCIINTOXICADO os valores de x teriam todos seus sinais trocados e a média seria x 143 mas o valor de tcalc seria o mesmo A conclusão também seria a mesma pois sendo x um valor negativo estaria indicando que os valores para os nãointoxicados são em média menores do que os de intoxicados 2 Pode ser interessante calcular a média do TCI para as duas amostras Tais valores seriam 645 para os intoxicados e 502 para os nãointoxicados Note que 645 502 143 Portanto a diferença média pode ser obtida pela diferença entre as duas médias amostrais mas a análise estatística correta deve ser feita sobre as diferenças intrapar usandose um teste t para amostras pareadas e não um teste t para grupos independentes FORMA USADA NAS PUBLICAÇÕES CIENTÍFICAS PARA REPRESENTAR A SIGNIFICÂNCIA ESTATÍSTICA DE UM VALOR CALCULADO Exemplo 2 A médica Magda L Nunes 1994 comunicação pessoal mediu a sincronia entre os hemisférios cerebrais de recémnascidos prematuros na 34ª semana de vida realizando semanalmente esta mensuração até a 42ª semana de vida da criança Os dados relativos à 36ª semana foram reunidos com os da 37ª porque em alguns casos não foi possível obter informação em uma destas oportunidades Os valores observados para o mesmo recémnascido na 34ª e na 3637ª semanas foram comparados por um teste t para amostras pareadas já que se trata de duas medidas para o mesmo indivíduo FIGURA 91 Distribuição t para 5 graus de liberdade com as áreas caudais P indicadas para distintos valores de t A hipótese nula postulou que a sincronia entre hemisférios cerebrais não diferia nesses dois momentos O valor de teste obtido em uma amostra de 6 crianças foi tcalc 1192 que é menor do que o t crítico para α 005 t0055 2571 A área caudal da curva limitada pelo valor t 2571 é 005 Então como se pode ver na Figura 91 a área caudal limitada por tcalc 1192 é maior do que 005 A área caudal associada a um valor calculado de teste é denominada nível descritivo amostral nível crítico amostral ou simplesmente valorP e é indicada por P O valorP é a área que fica além de tcalc e representa a probabilidade de se obter ao acaso um valor igual ou mais extremo que o valor obtido no teste estatístico na condição de que a hipótese nula seja verdadeira O nível α de significância de um teste é um valor particular de P escolhido como critério para estabelecer a significância estatística em um teste de hipóteses Se α for 005 estáse considerando que um valor de tcalc com P 005 é estatisticamente significativo Devese então rejeitar H0 pois se ela for verdadeira a probabilidade de se obter ao acaso este valor t ou um ainda mais extremo é menor do que 005 Do mesmo modo convencionouse que um valorP igual ou maior do que 005 deve conduzir à conclusão de que o resultado do teste não é estatisticamente significativo não se deve portanto rejeitar H0 Considerase que se P 005 a probabilidade de o resultado ser casual é alta sendo portanto também alta a probabilidade de se cometer um erro do tipo I rejeitandose H0 quando não se deveria Com auxílio da tabela da distribuição t é possível determinar aproximadamente o tamanho da área P associada a qualquer valor de tcalc A Tabela 92 mostra o nível de significância bilateral isto é a área caudal bilateral exata referente a vários valores críticos de t quando gl 5 Segundo esta tabela a área caudal valorP associada a t 2571 é 005 e aquela relativa a t 3365 é 002 Então a t 2600 está associado um valorP entre 005 e 002 Um valor de tcalc 7000 fica fora e à direita da amplitude de valores de t apresentada na tabela Portanto o valorP associado a t 7000 deve ser P 0001 Na Figura 91 viuse que o valor tcalc 1192 obtido para os dados do Exemplo 2 está mais no centro da curva do que o valor crítico 2571 portanto P é maior que 005 Realmente olhando a Tabela 92 verificase que quando t 1192 P 020 Assim se a hipótese nula for verdadeira um valor de t igual a 1192 ou ainda maior não é um evento raro a probabilidade é maior do que 020 Então com base no valor de tcalc ou no valorP não se deve rejeitar a hipótese nula Assim não se pode concluir com base na evidência disponível nessa amostra que a sincronia interhemisférica medida na 34ª semana difere da medida na 36ª e 37ª semanas de vida do recémnascido prematuro TABELA 92 Distribuição t quando gl 5 α Bilateral 020 010 005 002 001 0001 t crítico 1476 2015 2571 3365 4032 6859 t calc 1192 2600 7000 ValorP 020 005P002 0001 Uma forma comum de representar o valor de tcalc e o respectivo nível crítico amostral P para os exemplos citados é tcalc 1192 gl 5 P 020 tcalc 2600 gl 5 005 P 002 tcalc 7000 gl 5 P 0001 Com as facilidades computacionais modernas podem ser encontrados vários programas estatísticos que fornecem o valorP exato não havendo necessidade de consultar a tabela t para obtenção de um valor aproximado Os dados do Exemplo 2 foram analisados com o auxílio de um desses programas obtendose P 0287 A notação para o valor de t obtido no Exemplo 2 agora pode ser tcalc 1192 gl 5 P 0287 Assim é de 0287 a probabilidade de se observar ao acaso um valor de tcalc igual ou mais extremo do que 1192 se H0 μ 0 é verdadeira O valorP é uma medida de consistência entre os dados coletados e a hipótese nula e reflete a probabilidade de se observarem os resultados dessa amostra em particular ou de uma amostra com resultados ainda mais extremos se H0 é verdadeira Um valorP alto indica que a informação fornecida pelos dados não é suficiente para rejeitar a hipótese nula ou porque são poucos dados ou porque a diferença é pequena enquanto que um valorP baixo constitui evidência contra a hipótese nula