·

Farmácia ·

Outros

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Estatística e Probabilidade Medidas de Assimetria e Curtose Desenvolvimento do material Gregório Dalle Vedove Nosaki 1ª Edição Copyright 2021 Unigranrio Nenhuma parte deste material poderá ser reproduzida transmitida e gravada por qualquer meio eletrônico mecânico por fotocópia e outros sem a prévia autorização por escrito da Unigranrio Sumário Medidas de Assimetria e Curtose Para início de conversa 3 Objetivo 3 1 Assimetria 4 2 Curtose 11 Referências 14 Para início de conversa Ao analisar uma distribuição de frequências de uma determinada variável podemos compreender um pouco mais o seu comportamento por meio das medidas de posição e medidas de dispersão apresentadas anteriormente Neste capítulo iremos trabalhar com outros dois conceitos importantes com relação às distribuições de frequências e os coeficientes que podem nos auxiliar a realizar esse estudo O primeiro conceito que iremos abordar é a assimetria que uma distribuição pode ter quando o valor da moda se distancia do valor da média aritmética Esse comportamento recebe esse nome porque ao traçar uma curva da distribuição de frequência centralizada na média a curva tem seu ponto mais alto desviado ora para direita e ora para esquerda Avaliaremos esses dois casos e como calcular alguns coeficientes de assimetria Outro elemento importante na análise da distribuição de uma frequência é a curtose que aborda o grau de achatamento de uma distribuição Também apresentaremos alguns coeficientes para caracterizar a curtose e como avaliálos para obter informações sobre a amplitude dos valores da nossa variável Objetivo Calcular e interpretar as medidas de assimetria e curtose Estatística e Probabilidade 3 1 Assimetria Uma das distribuições de frequência mais comuns e recorrentes para diversas variáveis e em diferentes exemplos é a distribuição normal também chamada de distribuição gaussiana que tem um formato de sino como apresentada no gráfico a seguir Figura 1 Distribuição normal com média 2 e desvio padrão de 01 Fonte Wikimedia Esse tipo de distribuição tem a característica de ser simétrica com relação à média aritmética mas nem todas as distribuições possuem esse aspecto Iremos tratar justamente de parâmetros que medem esse tipo de comportamento neste capítulo Vamos começar nosso estudo com o conceito de momento definido a seguir Definição seja uma coleção de observáveis com entradas e um inteiro positivo O momento de ordem é definido como sendo Além disso seja definimos o momento de ordem centrado na origem como sendo Antes de apresentarmos alguns exemplos cabe algumas observações sobre as definições acima se o momento de ordem 1 é igual à média aritmética ou seja onde é a média aritmética da coleção se tomarmos então a o momento de ordem 1 centrado em é igual a zero para qualquer que seja a coleção ou seja ainda tomando vale que onde é variação de Estatística e Probabilidade 4 Considere a seguinte coleção de dados X 2 3 5 6 9 O momento de ordem 1 da coleção X é tal que O cálculo anterior é exatamente a definição de média aritmética e portanto Calculando o momento de ordem 2 temos que Tomando podemos calcular os momentos centrado na origem Note que e O cálculo anterior é exatamente o cálculo da variação da coleção e portanto Os momentos também podem ser calculados para dados agrupados Apresentamos a definição formal do cálculo de momentos para este caso a seguir Definição considere uma distribuição de frequência com dados agrupados em classes tais que os intervalos de classe tem pontos médios e a frequência de cada classe é respectivamente O momento de ordem onde é um inteiro positivo é definido como sendo Além disso seja definimos o momento de ordem centrado na origem como sendo A distribuição de frequências acumulada descrita na definição anterior pode ser melhor compreendida se imaginarmos sua distribuição em uma tabela como abaixo Estatística e Probabilidade 5 Intervalo de classe Frequência Frequência acumulada Na tabela cada linha referese a um intervalo de classe cujos extremos são apresentados na primeira coluna Na segunda coluna temos a frequência de cada uma das classes e na terceira a coluna a frequência acumulada Como dito anteriormente uma assimetria é um desvio da distribuição das frequências em relação à média das observáveis Existem diferentes coeficientes que são utilizados para indicar o grau de assimetria de uma distribuição Podemos dividir as assimetrias em dois tipos assimetrias positivas e assimetria negativas Observe a representação abaixo desses dois tipos de assimetria Figura 2 As assimetrias podem ser divididas em positivas e negativas Fonte Wikimedia A assimetria positiva recebe esse nome porque a diferença entre a média e a moda da distribuição é um valor positivo enquanto que a assimetria negativa recebe esse nome porque a diferença entre a média e a moda da distribuição é negativa Perceba que o ponto mais alto da curva que descreve a distribuição nas representações acima é o valor da moda pois é o valor cuja frequência é a maior entre todas as outras Apresentaremos alguns desses coeficientes que nos ajudam a caracterizar e descrever os comportamentos assimétricos de distribuições Iremos considerar uma coleção com entradas sendo Além disso podemos considerar que a coleção está ordenada em ordem crescente tal que Estatística e Probabilidade 6 sem perda de generalidade Denotaremos por a média aritmética da coleção e por e a moda e mediana respectivamente Além disso denota a variação e o desvio padrão Definição o primeiro coeficiente de assimetria de Pearson será denotado como e é definido como sendo O segundo coeficiente de assimetria de Pearson será denotado como e é definido como sendo Quando uma distribuição é moderadamente assimétrica é possível mostrar a seguinte relação entre as medidas de tendência central e portanto o segundo coeficiente de assimetria de Pearson apresentado na definição anterior é obtido a partir do primeiro MATTOS AZAMBUJA KONRATH 2017 Existem diferentes interpretações para os coeficientes de Pearson Segundo Mattos Azambuja e Konrath 2017 o segundo coeficiente de Pearson apresentado aqui pode classificar as assimetrias segundo os seguintes critérios se então a distribuição é praticamente simétrica se então a distribuição é moderadamente assimétrica se então a distribuição é acentuadamente assimétrica Cabe destacar aqui que o segundo coeficiente de assimetria de Pearson varia entre 3 e 3 e que para determinar se a assimetria é negativa ou positiva podemos avaliar o sinal da diferença entre a média e a moda Vejamos agora o cálculo desses coeficientes em um exemplo numérico Exemplo 1 considere a seguinte tabela que apresenta as notas de uma turma de 120 alunos em uma prova Nota Frequência Frequência acumulada 6 10 10 7 50 60 8 30 90 9 20 110 10 10 120 Estatística e Probabilidade 7 Calculando as medidas de posição e de dispersão apresentadas nos capítulos anteriores para essa coleção de dados obtemos os seguintes valores Média aritmética Moda tratase do maior com maior frequência ou seja Mediana como temos 120 observáveis e elas estão organizadas em ordem crescente tomamos a média entre o 60º e 61º valor para determinar a mediana ou seja Variação Desvio padrão A partir dessas informações somos capazes de calcular os coeficientes de assimetria de Pearson Utilizando as fórmulas apresentadas anteriormente e as medidas de posição e de dispersão calculadas obtemos que e Ambos os coeficientes de assimetria de Pearson têm o mesmo valor para os dados apresentados na tabela Além disso podemos considerar que essa é uma distribuição moderadamente assimétrica e que é do tipo positiva isso é o valor da moda é inferior ao valor da média aritmética Existem outros coeficientes de assimetria que podem ser usados para determinar o grau do deslocamento da distribuição de uma determinada variável Apresentaremos outros dois coeficientes que se baseiam nas Estatística e Probabilidade 8 separatrizes de uma coleção de dados Considerando ainda as notações apresentadas anteriormente iremos considerar os quartis que dividem a coleção como sendo e Como usaremos a notação da mediana para o segundo quartil Além disso para a mesma coleção de dados denotaremos os percentis isso é as separatrizes que dividem as observáveis em 100 subconjuntos de mesmo tamanho seguindo uma ordem crescente pela notação onde indicando cada um dos percentis Definição o coeficiente de assimetria de Yule denotado por para a coleção e calculado baseado nas diferenças e Ele é definido como sendo Seguindo a mesma lógica aplicada no coeficiente de assimetria de Yule definimos o coeficiente de assimetria de Kelley que se baseia na divisão da amostra em percentis Definição o coeficiente de assimetria de Kelley denotado por para a coleção como sendo Lembrese de que pela definição de percentis o percentil marca o valor tal que 10 dos valores da coleção são menores que enquanto que marca o valor tal que 10 dos valores da coleção são maiores que Exemplo 2 Considere a coleção de observáveis apresentada a seguir referente a contagem de carros que estavam estacionados em uma rua no centro de uma cidade em diferentes dias da semana MATTOS AZAMBUJA KONRATH 2017 Adaptado 4 4 5 7 7 7 8 8 9 9 9 10 10 11 Figura 3 Coleção de observáveis Fonte Dreamstime Estatística e Probabilidade 9 Os dados já foram ordenados em ordem crescente e não seguem mais a ordem da observação no decorrer do experimento Denominando a coleção apresentada acima como vamos determinar os quartis dela para que possamos calcular o coeficiente de assimetria de Yule Com os em ordem crescente determinamos a mediana encontrando o valor que está exatamente no meio das observáveis acima Como temos 14 observáveis a mediana é igual a média aritmética entre a 7ª e 8ª observáveis Após determinarmos a mediana da coleção podemos determinar a mediana dos dois subconjuntos gerados por essa primeira divisão para encontrarmos os dois quartis restantes Para o subconjunto 4 4 5 7 7 7 8 concluímos que o primeiro quartil é para o subconjunto 8 9 9 9 10 10 11 concluímos que o terceiro quartil é Dessa forma o coeficiente de assimetria de Yule é Observe o histograma da coleção apresentado abaixo Figura 3 Histograma da coleção X Fonte Elaborada pelo autor Estatística e Probabilidade 10 2 Curtose Seguindo na investigação sobre o comportamento de uma distribuição de frequência de uma variável a curtose nos dá informações sobre o grau de achatamento da distribuição Observe as seguintes representações de distribuição de frequências em gráficos de barras Figura 4 Representações de distribuição de frequências em gráficos de barras Fonte Adaptado de Spiegel e Stephens 2009 Com base no achatamento de uma distribuição podemos classificála em três tipos Platicúrtica gráfico a caracterizase por não apresentar grandes discrepâncias entre as frequências dos diferentes valores que a variável assume tem uma distribuição mais achatada de todas Mesocúrtica gráfico b tratase de um grau de achatamento moderado entre os outros dois tipos de distribuições tem um pico de frequência mas não é muito pronunciado Leptocúrtica gráfico c caracterizase por apresentar grandes discrepâncias entre as frequências dos valores que a variável assume tratase da distribuição menos achatada de todas Assim como na seção anterior vamos definir alguns coeficientes que podem auxiliar na interpretação dos dados de uma distribuição de frequência quanto ao seu achatamento O primeiro deles é baseado na definição de momento apresentada no início deste capítulo e o segundo baseado em separatrizes da coleção Definição o coeficiente de curtose calculado a partir de momentos da coleção será denotado por e é definido como sendo Seguindo a interpretação proposta em Mattos Azambuja e Konrath 2017 o coeficiente de curtose pode nos auxiliar a classificar a distribuição de frequências sendo leptocúrtica se Estatística e Probabilidade 11 mesocúrtica se e platicúrtica se Definição o coeficiente de curtose calculado a partir de separatrizes da coleção será denotado por e é definido como sendo Ainda em Mattos Azambuja e Konrath 2017 o coeficiente de curtose baseado nas separatrizes da coleção denotado aqui por classifica a distribuição de frequências sendo leptocúrtica se mesocúrtica se e platicúrtica se Exemplo 3 utilizando os dados apresentados no Exemplo 2 iremos calcular o coeficiente de curtose a partir dos momentos O primeiro passo para calcular os momentos envolvidos no cálculo desse coeficiente é determinar o valor da média aritmética Obtemos que Para facilitar o cálculo dos momentos e organizamos alguns dados em uma tabela apresentada a seguir Valor da variável Frequência 4 2 3714 13794 19027 5 1 2714 7365 54255 7 3 0714 051 026 8 2 0286 0082 0007 9 3 1286 1653 2735 10 2 2286 5225 2731 11 1 3286 10797 116592 A partir dos dados da tabela obtemos que Estatística e Probabilidade 12 e Portanto Como a distribuição de frequência da variável é leptocúrtica O cálculo dos coeficientes de assimetria em coleções de dados pequenos podem conduzir a interpretações que não correspondem exatamente à realidade dos dados O Exemplo 2 apresentado anteriormente é um caso desses pois estamos trabalhando apenas com 14 observáveis e uma variação muito pequena dos valores que a variável assume Em Spiegel e Stephens 2009 você poderá encontrar mais exemplos do cálculo dos coeficientes apresentados aqui utilizando softwares matemáticos Figura 5 Gráfico Minitab para as quatro distribuições normal assimétrica à direita assimétrica à esquerda e uniforme Fonte Adaptado de Spiegel e Stephens 2009 Nesta unidade trabalhamos inicialmente com o conceito de momento dentro de estatística e como ele pode ser calculado Vimos também a relação dos momentos com a média aritmética e a variância de um determinado conjunto de observáveis Tratamos dos tipos de assimetria que podem ser observados em uma distribuição de frequências e como classificálos a partir das medidas de posição Estudamos alguns dos principais coeficientes de assimetria que podem ser calculados Estatística e Probabilidade 13 para determinar o grau de assimetria de uma distribuição Por fim trabalhamos com o conceito de curtose que analisa o grau de achatamento da curva de distribuição de frequências e também está relacionada com o espectro que uma determinada variável tem dentro dos seus possíveis valores Referências FONSECA J S MARTINS G A Curso de estatística 6 ed São Paulo Atlas 2012 MATTOS V L D AZAMBUJA A M V KONRATH AC Introdução à estatística aplicações em ciências exatas Rio de Janeiro LTC 2017 MOORE D NOTZ W FLIGNER M A estatística básica e sua prática 7 ed Rio de Janeiro LTC 2017 MORETTIN P BUSSAB W Estatística básica 9 ed São Paulo Saraiva 2017 SPIEGEL M SCHILLIER J SRINIVASAN A Probabilidade e estatística 3 ed Porto Alegre Bookman 2013 SPIEGEL M STEPHENS L Estatística Porto Alegre Bookman 2009 TRIOLA M Introdução à estatística 12 ed Rio de Janeiro LTC 2017 VIEIRA S Fundamentos de estatística 6 ed São Paulo Atlas 2019 Estatística e Probabilidade 14