·

Engenharia de Computação ·

Probabilidade e Estatística 1

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

UNIVERSIDADE FEDERAL DE ALAGOAS Instituto de Computação ESTATÍSTICA E PROBABILIDADE Medidas de posição medidas de dispersão separatrizes e assimetria PROFESSOR PETRUCIO ANTONIO MEDEIROS BARROS TURMA CIÊNCIA DA COMPUTAÇÃO ENG DA COMPUTAÇÃO 1 MEDIDAS DESCRITIVAS Para sintetizar os dados usamos distribuições de frequências eou gráficos As medidas descritivas mostram um valor representativo em torno do qual os dados tendem a agruparse com maior ou menor frequência São utilizadas para sintetizar em um único número o conjunto de dados observados Principais características analisadas A tendência central dos dados A dispersão ou variação em relação a esse centro Os dados que ocupam certas posições Simetria dos dados A forma na qual os dados se agrupam 2 As principais medidas descritivas ou de tendência central são Média Mediana Moda Separatrizes Quartis Quintis Decis e Percentis As principais medidas de dispersão ou variabilidade são Amplitude Variância Desvio padrão Coeficiente de variação 3 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Média Aritmética Simples Propriedades da média A soma algébrica dos desvios tomados em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética é nula Somandose ou subtraindose uma constante c de todos os valores uma variável a média do conjunto fica aumenta ou diminuída dessa constante Multiplicandose ou dividindose todos os valores uma variável por uma constante c a média do conjunto fica multiplicada ou dividida por essa constante 4 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Média Aritmética Simples Propriedades da média A soma algébrica dos desvios tomados em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética é nula 8 10 12 média 10 8 10 10 10 12 10 2 0 2 0 Somandose ou subtraindose uma constante c de todos os valores uma variável a média do conjunto fica aumenta ou diminuída dessa constante 84 104 124 12 14 16 média 14 10 4 14 Multiplicandose ou dividindose todos os valores uma variável por uma constante c a média do conjunto fica multiplicada ou dividida por essa constante 84 104 124 32 40 48 média 40 10 4 40 5 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Média Aritmética Ponderada Exemplo O exame de seleção pode ser composto de 3 provas onde as duas primeiras tem peso 1 e a terceira tem peso 2 Um candidato com notas 70 75 e 90 terá média final 6 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Média Aritmética Ponderada 7 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Média aritmética para dados tabelados 8 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Média aritmética para dados agrupados ou tabelados 9 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Média Geométrica É utilizada principalmente para calcular médias de razões de taxas de variação e de índices econômicos Média Geométrica Ponderada 10 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Média Harmônica 11 MEDIDAS DESCRITIVAS Relacionada ao cálculo matemático das situações envolvendo as grandezas inversamente proporcionais Medidas Descritivas ou de Tendência Central Média Harmônica Exemplos Um investidor compra 18000 de ações de uma empresa a 45 a ação e em seguida compra 18000 a 36 a ação Qual o preço médio por ação pago pelo investidor xh 2 145 136 2 162081 2 20 40 Calculo matemático de grandezas inversamente proporcionais Por exemplo velocidade e tempo Usar os valores 50 e 60 Km Qual média harmônica da velocidade A média aritmética 55 Km xh 2 150 160 2 30011 54 Km Relação entre as Médias 13 MEDIDAS DESCRITIVAS Relação entre as Médias Exemplo 14 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Mediana Md A mediana de um conjunto de valores dispostos segundo uma ordem crescente ou decrescente é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos Se a série dada tiver número ímpar de termos O valor mediano será o termo de ordem dado pela fórmula Na amostra 32 36 42 42 58 Md 42 Se a série dada tiver número par de termos O valor mediano será o termo de ordem dado pela fórmula Na amostra 30 40 42 45 50 80 Md 42452 435 Medidas Descritivas ou de Tendência Central Mediana Md Se a série dada tiver número ímpar de termos Na amostra 32 36 42 42 58 Md 42 Se a série dada tiver número par de termos Na amostra 30 40 42 45 50 80 Md 42452 435 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Mediana Md para dados agrupados ou tabelados 18 MEDIDAS DESCRITIVAS 𝐌𝐝 𝟏𝟐𝟎 𝟒 𝟐𝟎 𝟏𝟏 𝟏𝟔 𝟐𝟓 𝟔 Md 1348 Medidas Descritivas ou de Tendência Central Moda Mo É o valor que ocorre com mais frequência em uma série de valores Numa amostra a Moda pode não existir ou ser múltipla Exemplos Na amostra 21 24 27 27 28 28 31 31 31 Mo 31 Unimodal Na amostra 45 46 49 52 52 60 60 76 79 Mo 52 e 60 Bimodal Na amostra 3 5 8 10 12 13 Amodal 19 MEDIDAS DESCRITIVAS Medidas Descritivas ou de Tendência Central Moda Mo 20 MEDIDAS DESCRITIVAS MEDIDAS DESCRITIVAS Medidas Separatrizes A principal característica das medidas separatrizes consiste na separação da série ordenada em ordem crescente em partes iguais que apresentam o mesmo número de valores De um modo geral os percentis são números reais que dividem a sequência ordenada de dados em partes que contêm a mesma quantidade de elementos da série É possível ter os seguintes múltiplos Mediana Divide um conjunto em dois grupos com 50 dos dados cada Quartis Divide o conjunto em quatro partes Iguais Q Quintis Cada parte fica com 20 K Decis Divide em 10 partes iguais o conjunto onde cada parte fica com 10 dos dadosD Percentis Divide um conjunto de dados em cem partes onde cada uma ficará com 1 dos elementos Os quartis quintis e decis são múltiplos dos percentis 22 MEDIDAS DESCRITIVAS Medidas Separatrizes 23 MEDIDAS DESCRITIVAS MEDIDAS DESCRITIVAS Medidas Separatrizes 25 MEDIDAS DESCRITIVAS Medidas Separatrizes 26 MEDIDAS DESCRITIVAS Medidas Separatrizes No R 27 MEDIDAS DESCRITIVAS Medidas de Dispersão ou Variabilidade As medidas de dispersão medem a variabilidade dos dados em estudo Permitem verificar se o conjunto de dados é homogêneo ou heterogêneo São medidas estatísticas que medem a dispersão dos dados em torno de um valor central Considere o valor em reais ganho de três grupos de empregados A 70 70 70 70 70 B 50 60 70 80 90 C 5 15 50 120 160 Podemos verificar que apesar de apresentarem a mesma média 70 os três grupos apresentam comportamento diferenciado pois o grupo A é o mais homogêneo e o grupo C é o que apresenta maior variação de ganho Portanto se faz necessário uma medida de posição que avalie esta distribuição ou seja a variabilidade de um conjunto de dados Quanto maior a variabilidade maior será a dispersão das observações 28 MEDIDAS DESCRITIVAS Medidas de Dispersão ou Variabilidade As medidas utilizadas para representar dispersão são Amplitude Variância Desvio Padrão Coeficiente de Variação Amplitude Amplitude total ou máxima é a diferença entre o maior e o menor valor de um conjunto de dados A valor maior valor menor Depende apenas dos valores maior e menor não é tão útil quanto as outras medidas de variação que usam todos os valores Para dados agrupados ou tabelados A limite inferior da classe inferior limite superior da classe superior 29 MEDIDAS DESCRITIVAS Medidas de Dispersão ou Variabilidade As medidas utilizadas para representar dispersão são Amplitude Variância Desvio Padrão Coeficiente de Variação 30 MEDIDAS DESCRITIVAS MEDIDAS DESCRITIVAS Medidas de Dispersão ou Variabilidade Variância É uma medida de dispersão que mede a variabilidade de um conjunto de dados A variância é definida como a média das diferenças quadráticas de n valores em relação à sua média aritmética A variância de uma população representamos variância por δ² A variância amostral representamos por s² sendo s² uma estimativa de δ² Fórmula alternativa σ² 1n xiµ² s² 1n1 xix² Medidas de Dispersão ou Variabilidade Variância Propriedades da Variância Para qualquer distribuição a variância é sempre uma quantidade positiva Se os valores das observações são todos iguais então a variância é zero Variância de uma constante é zero Se somarmos ou subtrairmos uma mesma constante de cada elemento de um conjunto de dados sua variância não se altera Se multiplicarmos ou dividirmos a cada elemento de um conjunto de dados por uma mesma constante sua variância fica multiplicada ou dividida pelo quadrado da constante 32 MEDIDAS DESCRITIVAS MEDIDAS DESCRITIVAS Medidas de Dispersão ou Variabilidade Variância para dados tabelados Para dados tabelados considerar que os dados estão divididos em intervalos Sendo assim cada um contém um número diferente de elementos Portanto devemos considerar a frequência absoluta de cada um A variância é obtida através da expressão Fórmula alternativa s² xi²fin xifi²nn1 Sendo k o número de intervalos de classe xi a média de cada intervalo de classe e x a média do conjunto Medidas de Dispersão ou Variabilidade Desvio padrão A variância não tem a mesma magnitude que as observações pois está elevada ao quadrado Se quisermos que a medida de dispersão seja da mesma dimensão que as das observações basta extrair a raiz quadrada 34 MEDIDAS DESCRITIVAS Medidas de Dispersão ou Variabilidade Coeficiente de Variação O Coeficiente de Variação caracteriza a dispersão ou variabilidade dos dados em termos relativos ao valor médio Dado pela fórmula 𝒅𝒆𝒔𝒗𝒊𝒐 𝒑𝒂𝒅𝒓ã𝒐 𝒎é𝒅𝒊𝒂 100 Quanto maior o coeficiente de variação maior é a variação entre os dados do grupo avaliado A variabilidade de um conjunto de dados depende da área de pesquisa Contudo alguns autores apresentam que CV 20 a amostra é homogênea CV 20 a amostra é heterogênea 35 MEDIDAS DESCRITIVAS Medidas de Dispersão ou Variabilidade Coeficiente de Variação Exemplo Considere as valores de ocupação de dois hotéis A e B Comente as diferenças entre os hotéis 36 MEDIDAS DESCRITIVAS Medidas de Dispersão ou Variabilidade Coeficiente de Variação 37 MEDIDAS DESCRITIVAS Medidas de Dispersão ou Variabilidade Coeficiente de Variação Cálculo das variâncias e dos desvios para os hotéis A e B 38 MEDIDAS DESCRITIVAS Exercício Resolvido Qk li k fi4 fabs ant acfabs c 1 15681868 4 1333 4 1 1718 6872 118061 2 18682168 2 667 6 2000 2018 4036 81446 3 21682468 6 2000 12 4000 2318 13908 322387 4 24682768 9 3000 21 7000 2618 23562 616853 5 27683068 7 2333 28 9333 2918 20426 596031 6 30683368 2 667 30 10000 3218 6436 207110 30 10000 Menor valor 1568 Maior valor 3346 Amplitude 1778 N de classes 548 Amp Classe 30 Desvio padrão 435 Coeficiente de variação 1734 Q3 2832 D5 2568 meanIMC 1 250981 medianIMC 1 250282 varIMC 1 177115 sdIMC 1 420850 quantileIMC 0 156807 25 231674 50 250282 75 285080 100 334622 MEDIDAS DE ASSIMETRIA A medida de assimetria é baseada nas relações entre a média mediana e moda A distância entre a média e a moda pode ser usada para medir a assimetria ou seja quanto maior é a distância seja negativa ou positiva maior é a assimetria da distribuição Estas medidas referemse à forma da curva de uma distribuição de frequência mas especificamente do polígono de frequência ou do histograma Denominase assimetria o grau de afastamento de uma distribuição da unidade de assimetria 40 MEDIDAS DE ASSIMETRIA Simetria Assimetira à direita ou positiva Assimetria à esquerda ou negativa MEDIDAS DE ASSIMETRIA Tipos de Assimetria x Mo 0 assimetria nula ou distribuição simétrica x Mo 0 assimetria negativa ou esquerda x Mo 0 assimetria positiva ou à direita onde Mo Moda Distribuição Simétrica Média Mediana Moda Assimetrias à esquerda ou negativa Mediana Moda Média Assimetrias à direita ou positiva Moda Mediana Média MEDIDAS DE ASSIMETRIA e BOXPLOT 45 A parte maior da caixa do boxplot de maior concentração dos dados direciona a assimetria Cauda direita é mais longa Cauda esquerda é mais longa 46 MEDIDAS DE ASSIMETRIA httpswwwimeuspbrmbrancoMedidasdeAssimetria2014pdf 47 MEDIDAS DE ASSIMETRIA Estimador de Assimetria O coeficiente é baseado na função de momentos Momentos são medidas resumo de uma distribuição sendo 1º momento média valor esperado 2º momento variância 3º momento assimetria e 4º momento curtose Valores próximos de zero sugerem simetria Valores negativos sugerem assimetria a esquerda e valores positivos sugerem assimetria a direita RPubs analisedados02anal04 MEDIDAS DE ASSIMETRIA Coeficiente de assimetria baseado em quartis Para distribuições simétricas temos que Q₃ mₐ mₐ Q₁ Por outro lado a Para distribuições assimétricas positivas Q₃ mₐ mₐ Q₁ b Para distribuições assimétricas negativas Q₃ mₐ mₐ Q₁ Observando esses fatos foi proposto o seguinte coeficiente Aₕ Q₃ mₐ mₐ Q₁ Q₃ Q₁ A função do denominador assim como em Aₚ é fazer com que este coeficiente seja adimensional permitindo a comparação entre conjuntos de dados medidos em diferentes escalas A interpretação é feita da seguinte maneira a Se a distribuição foi simétrica então Aₕ 0 b Se a distribuição foi assimétrica positiva então Aₕ 0 c Se a distribuição foi assimétrica negativa então Aₕ 0 MEDIDAS DE CURTOSE A curtose é o grau de achatamento ou afilamento de uma distribuição em comparação com uma distribuição padrão curva normal De acordo com o grau de curtose podemos ter 49 MEDIDAS DE CURTOSE Para medir o grau de curtose utilizase o coeficiente K Q₃ Q₁ 2P₉₀ P₁₀ Q₁ valor do 1º Quartil Q₃ valor do 3º Quartil P₁₀ valor do percentil 10 P₉₀ valor do percentil 90 Se K 0263 dizse que a curva correspondente à distribuição de frequência é mesocúrtica Se K 0263 dizse que a curva correspondente à distribuição de frequência é platicúrtica Se K 0263 dizse que a curva correspondente à distribuição de frequência é leptocúrtica 51 MEDIDAS DE CURTOSE Estimador de curtose A curtose kurtosis representa o grau de achatamento da distribuição isto é quão espalhados os dados estão em torno da média tendo a curva normal padrão como referência Valores negativos sugerem distribuições platicúrticas valores positivos sugerem distribuições mais Leptocúrticas RPubs analisedados02anal04 Dúvidas Até a próxima aula