·

Administração ·

Estatística da Administração

Send your question to AI and receive an answer instantly

Ask Question

Preview text

190 Scientia Medica Porto Alegre PUCRS v 16 n 4 outdez 2006 Medidas de tendência central Duquia RP Bastos JLD NOTAS DE EPIDEMIOLOGIA E ESTATÍSTICA Medidas de tendência central onde a maior parte dos indivíduos se encontra Measures of central tendency where are the bulk of people RODRIGO PEREIRA DUQUIA1 JOÃO LUIZ DORNELLES BASTOS2 1 Dermatologista Mestre em Epidemiologia pela Universidade Federal de Pelotas 2 Odontólogo Mestre em Epidemiologia pela Universidade Federal de Pelotas 1 MEDIDAS DE TENDÊNCIA CENTRAL Conforme mencionado na primeira edição das Notas de Epidemiologia e Estatística desta revista existem várias formas de se classificar as informações coletadas em um estudo Inicialmen te podemos dividir as variáveis em dois gran des grupos o das variáveis quantitativas e o das qualitativas13 Quando trabalhamos com va riáveis quantitativas muitas vezes o número de observações é grande e necessitamos de parâme tros para descrever de forma sucinta o compor tamento desse conjunto de informações Utiliza mos as medidas de tendência central MTC para expressar através de um único número em tor no de que valor tende a se concentrar um con junto de dados numéricos1 Por exemplo um pes quisador interessado em estudar a creatinina substância dosada pelo sangue que avalia a fun ção renal de um indivíduo em um grupo de ido sos de um asilo afere a creatinina de 20 idosos Posteriormente ele registra em uma tabela Ta bela 1 a creatinina de cada indivíduo por ordem de entrevista a fim de estudar o valor desse metabólito nesse grupo de pessoas Da forma como está apresentado na Tabela 1 podemos observar especificamente a creatinina de cada idoso Entretanto qual o valor numérico que po deria representar esses 20 indivíduos Dito de outra forma próximo de que valor encontrase a maioria das medidas de creatinina dos idosos investigados TABELA 1 Descrição da creatinina sérica de 20 in divíduos idosos Número do professor Peso kg 1 06 2 08 3 10 4 08 5 09 6 10 7 07 8 05 9 11 10 05 11 08 12 11 13 08 14 09 15 08 16 09 17 07 18 06 19 08 20 07 Scientia Medica Porto Alegre PUCRS v 16 n 4 outdez 2006 191 Medidas de tendência central Duquia RP Bastos JLD Algumas pessoas responderiam a esta ques tão citando a média da creatinina nesses 20 ido sos No entanto conforme veremos posterior mente nem sempre a média é a medida mais adequada Para responder a este questiona mento freqüentemente utilizamos as MTC que têm como objetivo descrever de forma sucinta um conjunto de dados Existem três principais medidas de tendência central São elas média mediana e moda 11 Média Esta é a MTC mais utilizada e melhor com preendida O cálculo da média X leiase X bar ra é feito pelo somatório representado aqui pela letra grega sigma Σ dos valores de todas as ob servações indivíduos dividido pelo número de observações n conforme a fórmula abaixo14 n X X 08 20 X 06 08 10 08 09 10 07 05 11 05 08 11 08 09 08 09 07 06 08 07 mas de distribuição simétrica também chama da Normal ou Gaussiana ou assimétrica Não Gaussiana Figura 113 Em uma distribuição perfeitamente simétrica a maioria dos dados se encontra próximo de um determinado valor que pode ser expresso pela média ou mediana uma vez que nesse tipo de distribuição ambas as MTC são idênticas13 Os demais dados se distribuem igualmente afastandose dos valores centrais conforme demonstrado no gráfico A da Figura 1 Nesta figura representamos de forma gráfi ca o peso de mil sacos de arroz de um determi nado depósito A média e a mediana de peso des ses sacos é de 3200g Como podemos observar a maioria apresenta um peso igual ou muito pró ximo de 3200g e os sacos mais pesados ou mais leves que 3200g se distribuem igualmente para ambos os lados da média fazendo com que a re presentação gráfica desse conjunto de dados seja simétrica e lembre o formato de um sino No gráfico B da Figura 1 adicionamos 15 sa cos de arroz de 10 kg aos mil sacos já existentes Como resultado a forma gráfica alterase e não mais apresenta uma distribuição perfeitamente simétrica normal como aquela do gráfico A No gráfico B a média de peso dos sacos passa a ser 3550g enquanto que a mediana permanece sen do 3200g Dessa forma verificamos que em dis tribuições assimétricas não podemos utilizar o valor da média Devemos nestas situações utili zar a mediana Utilizando os dados da Tabela 1 para calcu lar a média de creatinina do grupo de 20 idosos verificamos que seu valor equivale a 08 Ao representarmos de forma gráfica histo grama um conjunto de dados quantitativos con tínuos ou numéricos nós podemos ter duas for Figura 1 À esquerda gráfico A temos a representação uma distribuição normal e à direita gráfico B a mesma represen tação após a inclusão de 15 sacos de arroz com 10 kg 0 20e04 40e04 60e04 80e04 001 Density 1000 2000 3000 4000 5000 Peso dos sacos de arroz média e mediana 0 20e04 40e04 60e04 80e04 Density 0 2000 4000 6000 8000 10000 Peso dos sacos de arroz média mediana A B 192 Scientia Medica Porto Alegre PUCRS v 16 n 4 outdez 2006 Medidas de tendência central Duquia RP Bastos JLD Vantagens da média 1 Seu cálculo leva em consideração os valo res de todos indivíduos estudados 2 É utilizada em boa parte dos testes estatís ticos para calcular diferenças em um estu do e 3 É mais facilmente compreendida pelos lei tores e pesquisadores Desvantagens da média 1 É influenciada por valores extremos con forme mencionado anteriormente 2 Só deve ser utilizada quando a distribui ção dos dados for simétrica normal ou Gaussiana 12 Mediana Esta é a segunda MTC mais utilizada Colo cando os dados em ordem crescente ou decres cente a mediana corresponde ao valor que divi de o conjunto de informações em duas partes iguais Para seu cálculo devemos levar em con sideração duas situações se o número de obser vações é ímpar ou par2 Quando o número de observações for ímpar devemos colocar os valores em ordem crescente ou decrescente para obter a mediana Posteriormente identificamos o valor que divide os dados em duas partes iguais13 tal como no Exemplo 1 Exemplo 1 Número ímpar de observações Mediana 08 Quando o número de observações for par para calcular a mediana devemos também colo car os valores em ordem crescente ou decrescen te e após identificar os dois valores centrais Somamos esses dois valores centrais e dividimos por dois obtendo assim o valor da mediana13 conforme o Exemplo 2 abaixo Exemplo 2 Número par de observações Mediana 07 08 0152 075 A mediana neste caso é de 075 10 observações 10 observações 05 05 06 06 07 07 07 08 08 08 08 08 08 08 09 09 09 10 10 11 11 10 observações 10 observações Vantagens da mediana 1 Não sofre influência de valores extremos e 2 A mediana é utilizada especialmente para distribuições assimétricas mas pode ser utilizada para dados com distribuição si métrica também Desvantagens da mediana 1 Suas propriedades não são bem compre endidas por muitas pessoas e 2 Não é levada em consideração na maior parte dos testes estatísticos Quando devemos utilizar média ou mediana A tendência de muitos pesquisadores é de utili zar a média pois o seu cálculo é facilmente reali zado e a sua interpretação compreendida pela maioria dos leitores Mas esses não devem ser os únicos critérios para a escolha da medida de ten dência central Devemos lembrar que o termo média nem sempre corresponde ao número pró ximo do qual se encontra a maioria dos valores de um conjunto de dados Por exemplo quando um pesquisador nos fornece a informação de que a média do número de dias de freqüência à praia de uma determinada cidade foi 12 no último ve rão nós logo interpretamos que a maioria dos indivíduos dessa cidade foi 12 vezes à praia no verão em questão Será que essa interpretação está correta Na Figura 1 representamos de forma gráfica por meio de um histograma o número de dias fre qüentados na praia no verão de 2005 pelos adul tos da cidade de Pelotas5 Nesse estudo foi per guntado a 3136 adultos da cidade de Pelotas o número de dias que os mesmos foram à praia no verão de 20055 Conforme demonstrado na Figu ra 2 gráfico A a maior parte das pessoas não fre qüentou a praia ou o fez por apenas um dia en quanto pouquíssimos indivíduos foram à praia em um grande número de ocasiões Essa hetero geneidade na freqüência à praia nos fornece uma distribuição dos dados denominada assimé trica nãogaussiana Isto significa que a maio ria dos indivíduos foi poucos dias à praia en quanto muito poucos freqüentaramna quase que diariamente no mesmo período Ao contrário do que ocorre em distribuições Gaussianas em distribuições assimétricas a mé dia e a mediana se distanciam fornecendo valo res diferentes13 Nestes casos a média não repre senta o ponto onde se encontra a maioria dos va lores de um conjunto de dados 5 05 06 06 07 07 07 07 07 07 08 09 09 09 09 09 10 10 11 Scientia Medica Porto Alegre PUCRS v 16 n 4 outdez 2006 193 Medidas de tendência central Duquia RP Bastos JLD No gráfico B apresentamos o mesmo gráfico com os respectivos valores da média e da media na do número de dias freqüentados na praia Como podemos observar a distribuição dos da dos é assimétrica e portanto os valores da mé dia e da mediana se distanciam Neste caso a média de dias de freqüência à praia foi 12 mas esse valor não representa o ponto onde se encon tra a maioria dos valores O ponto que represen ta mais adequadamente o número de dias fre qüentados na praia pela maioria dos indivíduos é o valor 1 Este é o valor que divide esse conjun to de dados em duas partes iguais ou seja é a mediana Dessa forma nos casos em que a distribuição dos dados for assimétrica devemos utilizar como medida de tendência central preferencialmente a mediana pois seu valor não será influenciado por valores extremos de distribuições assimé tricas13 Sempre que utilizarmos a média como MTC para distribuições assimétricas seu valor será influenciado pelos valores extremos do con junto de dados ou seja os valores extremos de uma distribuição assimétrica puxarão o valor da média para perto deles 13 Moda Não foi ao acaso que deixamos essa medida por último lugar Sua utilização é pouco freqüen te e serve apenas para demonstrar qual o valor é o mais freqüente que mais se repete em um con junto de dados12 Por exemplo na Tabela 2 de monstramos um conjunto de valores com a ida de em anos de alunos de uma classe de aula Como podemos notar existem mais alunos com 7 anos de idade nessa turma Desta forma dize mos que a moda desse conjunto de dados é 7 pois a maioria das crianças apresenta 7 anos de ida de Devemos lembrar que sempre que uma dis tribuição for perfeitamente simétrica o valor da moda também será igual ao da média e ao da mediana Outra observação a ser feita é que al gumas vezes a distribuição de um conjunto de dados pode não ter moda Isto ocorre caso as ob servações sejam todas diferentes entre si nesse conjunto de dados Figura 2 A Representação do número de dias de exposição solar na praia B Valores da média e mediana do número de dias freqüentados na praia 0 20 40 60 Porcentagem 0 50 100 Quantos dias foi a praia 0 20 40 60 Porcentagem 0 50 100 Quantos dias foi a praia Média 12 dias Mediana 1 dia A B TABELA 2 Lista de alunos com suas respectivas idades Nome dos alunos Idade em anos 1 João 7 2 Samuel 9 3 Rodrigo 7 4 Luciano 7 5 Gustavo 10 6 Luis Artur 11 7 Luiz Henrique 7 8 Gustavo 8 9 Paulo 9 10 Gerson 7 11 Julio 7 12 Lucio 12 13 Lucas 7 14 Marcelo 9 15 Mateus 7 194 Scientia Medica Porto Alegre PUCRS v 16 n 4 outdez 2006 Medidas de tendência central Duquia RP Bastos JLD 2 CONSIDERAÇÕES FINAIS O conhecimento das propriedades das MTC é fundamental para descrição interpretação e análise de dados em pesquisa Frente a um artigo devemos sempre ter o cui dado de avaliar se as MTC foram bem aplicadas pois caso contrário todas as conclusões dos au tores e conseqüentemente as nossas poderão estar distorcidas O mesmo se aplica para o tipo de teste utilizado para realizar análises estatísti cas já que o pressuposto de muitos deles é que a distribuição da variável de interesse desfecho tenha distribuição simétrica normal Dessa for ma muitas vezes observando a forma da distri buição dos dados sabemos se um determinado teste em um artigo foi corretamente utilizado e se seus resultados são válidos REFERÊNCIAS 1 Altman DG Practical statistics for medical research London Chapman Hall 1997 2 Kirkwood BR Sterne JAC Essential medical statistics Oxford Blackwell Science 2003 3 Massad E Menezes RX Silveira PSP Ortega NRS Mé todos quantitativos em medicina São Paulo Manole 2004 4 Pereira MG Epidemiologia teoria e prática Rio de Ja neiro Guanabara Koogan 1995 5 Duquia RP Menezes AMB Reichert FF Almeida HL Prevalence and associated factors with sunscreen use in Southern Brazil A populationbased study J Am Acad Dermatol 2007 in press Endereço para correspondência JOÃO LUIZ DORNELLES BASTOS Avenida do Antão 353 Morro da Cruz CEP 88025150 Florianópolis SC Brasil Telefone 48 30281345 Email joaopilotiscombr