·
Administração ·
Probabilidade e Estatística 1
Send your question to AI and receive an answer instantly
Recommended for you
3
Lista de Probabilidade 1 - Estatística
Probabilidade e Estatística 1
IBMR
18
Aula: A Distribuição Normal - 1ª Parte
Probabilidade e Estatística 1
IBMR
43
Probabilidade Condicional e Independência de Eventos
Probabilidade e Estatística 1
IBMR
23
Aula sobre Variáveis Aleatórias Discretas
Probabilidade e Estatística 1
IBMR
35
Aula sobre Distribuições de Variáveis Aleatórias Discretas
Probabilidade e Estatística 1
IBMR
20
Esperança e Variância de Variáveis Aleatórias Discretas
Probabilidade e Estatística 1
IBMR
31
Teorema da Probabilidade Total e Teorema de Bayes
Probabilidade e Estatística 1
IBMR
25
Aula sobre Outras Medidas Estatísticas
Probabilidade e Estatística 1
IBMR
30
Variáveis Aleatórias Contínuas: Funções de Densidade e Distribuição
Probabilidade e Estatística 1
IBMR
Preview text
i i i i i i i i Aula MEDIDAS DE DISPERS AO 4 O b j e t i v o Nesta aula vocˆe estudara as medidas de dispersao de uma distribuicao de dados e aprendera os seguintes conceitos 1 amplitude 2 desvios em torno da media 3 desvio medio absoluto 4 variˆancia 5 desvio padrao i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao AMPLITUDE Considere os conjuntos de dados apresentados por um dia grama de pontos na Figura 41 Nesse grafico as pilhas de pontos representam as frequˆencias de cada valor Podemos ver facilmente que ambos os conjuntos tˆem a mesma media o cen tro de gravidade ou ponto de equilıbrio e o mesmo a mesma mediana e a mesma moda No entanto esses dois conjuntos tˆem caracterısticas diferentes e ao sintetizalos apenas por alguma medida de posicao essa caracterıstica se perdera Tal carac terıstica e a dispersao dos dados no primeiro conjunto os dados estao mais concentrados em torno da media do que no segundo conjunto Figura 41 Conjuntos de dados com medidas de posicao iguais e dispersao diferente Como podemos medir essa dispersao Uma primeira ideia e considerar a amplitude dos dados que e como ja visto a diferenca entre o maior e o menor valor Definicao 41 blablabla A amplitude de um conjunto de dados e a distˆancia entre o maior valor e o menor valor total Vmax Vmin 41 A amplitude tem a mesma unidade dos dados mas ela tem algumas limitacoes conforme ilustrado na Figura 42 Aı os dois conjuntos tˆem a mesma media a mesma mediana e a mesma amplitude mas essas medidas nao conseguem caracterizar o fato de a distribuicao dos valores entre o mınimo e o maximo ser di ferente nos dois conjuntos A limitacao da amplitude tambem 8 C E D E R J i i i i i i i i AULA 4 1 M ODULO 1 fica patente pelo fato de ela se basear em apenas duas observacoes independentemente do numero total de observacoes Figura 42 Conjuntos de dados com medidas de posicao e amplitude iguais DESVIO M EDIO ABSOLUTO Uma maneira de se medir a dispersao dos dados e considerar os tamanhos dos desvios xi x de cada observacao em relacao a media Note nas figuras acima que quanto mais disperso o conjunto de dados maiores esses desvios tendem a ser Para obter uma medidaresumo isto e um unico numero poderıamos somar esses desvios ou seja considerar a seguinte medida D n i1 xi x 42 Vamos desenvolver tal formula usando as propriedades de somatorio e a definicao da media amostral D n i1 xi x n i1 xi n i1 x n i1 xi nx n i1 xi n 1 n n i1 xi n i1 xi n i1 xi 0 Ou seja essa medida que representa a soma dos desvios em relacao a media e sempre nula nao importa o conjunto de da dos Logo ela nao serve para diferenciar quaisquer conjuntos Vamos dar uma explicacao intuitiva para esse fato que nos permitira obter correcoes para tal formula Ao considerarmos as diferencas entre cada valor e o valor medio obtemos valo C E D E R J 9 Probabilidade e Estatistica Medidas de Dispersio res negativos e positivos pois pela definigao de média sempre existem valores menores e maiores que a média esses valores positivos e negativos ao serem somados se anulam Bom se o problema esta no fato de termos valores positi vos e negativos por que nao trabalhar com o valor absoluto das diferengas De fato esse procedimento nos leva a definigao de desvio médio absoluto Definicao 42 O desvio médio absoluto de um conjunto de dados X1X2Xp definido por 1 n DMA x 5 43 M jz onde as barras verticais representam o valor absoluto ou modulo Note que nesta definigao estamos trabalhando com o desvio médio isto é tomamos a média dos desvios absolutos Isso evita interpretagdes equivocadas pois se trabalhassemos apenas com a soma dos desvios absolutos um conjunto com um nimero maior de observagoes tenderia a apresentar um resultado maior para a soma devido apenas ao fato de ter mais observagoes Esta situacao é ilustrada com os seguintes conjuntos de dados Conjunto 1 135 5 13 Conjunto 2 th 37 zr Para os dois conjuntos X 3 mas para o Conjunto 1 temos 3 Y x 3 13 3353 4 il e para o Conjunto 2 temos 2 5 13 20 Yi iaix 135333353 6667 Fa 3 3 3 10 CEDERJ i i i i i i i i AULA 4 1 M ODULO 1 Entao o somatorio para o segundo conjunto e maior mas o desvio absoluto medio e o mesmo para ambos de fato para o primeiro conjunto temos DMA 4 3 e para o segundo conjunto DMA 20 3 5 4 3 Ao dividirmos o somatorio pelo numero de observacoes com pensamos o fato de o segundo conjunto ter mais observacoes que o primeiro O desvio medio absoluto tem a mesma unidade dos dados Exercıcio 41 Para o conjunto de dados 24789658 calcule os des vios em torno da media e verifique que eles somam zero Em seguida calcule o desvio medio absoluto VARI ˆANCIA E DESVIO PADR AO Considerar o valor absoluto das diferencas xi x e uma das maneiras de se contornar o fato de que n i1 xi x 0 No entanto a funcao modulo tem a desvantagem de ser nao dife renciavel no ponto zero Outra possibilidade de correcao com propriedades matematicas e estatısticas mais adequadas e con siderar o quadrado das diferencas Isso nos leva a definicao de variˆancia C E D E R J 11 i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao Definicao 43 blablabla A variˆanciaa de um conjunto de dados x1x2xn e defi nida por σ2 1 n n i1 xi x2 44 a E possıvel definir a variˆancia usando o divisor n 1 no lugar de n essa e a diferenca entre os conceitos de variˆancia populacional e variˆancia amostral que sera mais relevante num segundo curso de inferˆencia es tatıstica Note que esta definicao de variˆancia nos diz que a variˆancia e a media dos desvios quadraticos Suponhamos que os valores xi representem os pesos em qui logramas de um conjunto de pessoas Entao o valor medio x representa o peso medio dessas pessoas e sua unidade tambem e quilogramas o mesmo acontecendo com as diferencas xi x Ao elevarmos essas diferencas ao quadrado passamos a ter a variˆancia medida em quilogramas ao quadrado uma unidade que nao tem interpretacao fısica Uma forma de se obter uma medida de dispersao com a mesma unidade dos dados consiste em tomar a raiz quadrada da variˆancia Definicao 44 blablabla O desvio padrao de um conjunto de dados x1x2xn e definido por σ Variˆancia σ2 45 A tıtulo de ilustracao vamos considerar novamente os dados analisados na aula anterior referentes a idade dos funcionarios do Departamento de Recursos Humanos Essas idades sao 24 25 26 26 29 29 31 35 36 37 38 42 45 51 53 12 C E D E R J e sua média é a 35 13 Assim a variancia em anos é Q a Oo 2 2 2 2 24 35 13 25 35 13 2 x 26 3513 2 29 35 13 31 35 13 35 35 13 ei o is 36 35 13 37 35 13 38 3513 42 35 13 42 35 13 45 35 13 5 51 3513 53 35 13 121373 8092 15 e o desvio padrao em anos é oO 8092 8995 Para 0 conjunto de dados do exercicio anterior 2478965 8 calcule a variancia e o desvio padrao FORMULA ALTERNATIVA PARA O CALCULO DA VARIANCIA Consideremos a Equacao 44 que define a variancia De senvolvendo o quadrado e usando as propriedades de somatério obtemos 2 Is p2 2 Is 1 I4o Oo 7 x 2xiX X nat a ear 1d 1d 1 1d x 2 Es n x7 2 3 Mi M j n Mi 2 I a oO X 46 L x 46 Essa forma de escrever a variancia facilita quando os calculos tém que ser feitos 4 mao ou em calculadoras menos sofisticadas pois o numero de calculos envolvidos é menor Note que ela nos diz que a variancia é a média dos quadrados menos o quadrado Probabilidade e Estatistica Medidas de Dispersao Vamos calcular a variancia das idades dos funcionarios de RH usando essa formula 1 OP Fz 24 25 25 2 x 26 2 x 29 31 35 367 1 2 2 2 2 2 2 2 527 is 37 38 39 42 45 51 53 a3 19729 x 15 527 295935 277729 18206 80916 152 225 22500 Na comparagao dos resultados obtidos pelas duas férmulas pode haver alguma diferenga por causa dos arredondamentos uma vez que a média é uma dizima No Exercicio 42 vocé calculou a variancia do conjunto de dados 24789658 como a média dos desvios quadraticos Calcule a variancia novamente utilizando a formula alternativa dada na Equagao 46 Exemplo 41 Na aula anterior analisamos os dados referentes ao nimero de dependentes dos funcionarios do Departamento de Recursos Humanos apresentados novamente na tabela a seguir Nome Numero de dependentes Joao da Silva 3 Patricia Silva 2 Pedro Fernandes 1 Regina Lima 2 Maria Freitas 0 Alfredo Souza 3 Paula Gongalves 0 Margarete Cunha 0 Ana Freitas 1 Pedro Barbosa 2 Luiz Costa 3 Ricardo Alves 0 André Souza 4 Marcio Rezende 1 14 CEDERJ Ana Carolina Chaves 0 Como o menor valor é 0 e 0 maior valor é 4 temos que a am Q plitude dos dados é de 4 dependentes A média calculada para 2 22 esses dados foi x 5 1467 Vamos calcular a soma dos des g vios em torno da média usando o fato de que temos observagées repetidas 5 22 22 22 Yiaix 5x 03 3x 13 3x 23 22 22 3x 3243 110 21 24 69 38 BT BI 15 15 15 15S 15 SS Caso trabalhdssemos com o valor aproximado 1467 o re sultado aproximado seria 0 005 O desvio médio absoluto é DMA ty x 3 1 22 22 22 2 5 50 t3I 3 22 22 44 bpoa a5 i HO 21 24 69 38 15 15 15 15 15 15 1 131 131 262 x 1 1644 5 3 r a m5 171 A variancia é 1 Oo ili xX 1 22 22 22 1 3 2 i 50 ss 3x a 3 2 1 22 22 2 4 BPC ss 2 iy 2420 147 192 1587 1444 5790 1715556 15 225 225 2250 225 2225 15 x 225 CEDERJ 15 Probabilidade e Estatistica Medidas de Dispersio Entao 5790 1 3098 CY Vi5x225 Vamos agora calcular a variancia usando a férmula alterna tiva oe 1x 5x 03x 13x23x 3744 22 15 15 34122716 484 58 484 58x 15484 15 225 15 225 225 7 386 x 1715556 225 Note que com essa férmula os calculos ficam bem mais sim ples uma vez que temos que fazer menos conta PROPRIEDADES DAS MEDIDAS DE DIS PERSAO Como visto para as medidas de posiga0 vamos ver as prin cipais propriedades das medidas de dispersao Propriedade 1 Todas as medidas de dispersdo sao nao negativas A0 DMA 0 o20 47 o0 Propriedade 2 Somandose uma mesma constante a todas as observac6es as medidas de dispersao nao se alteram Essa propriedade é bastante intuitiva se notarmos que ao somar uma constante aos dados estamos simplesmente fazendo uma translagao dos mes mos sem alterar a dispersao 16 CEDERJ i i i i i i i i AULA 4 1 M ODULO 1 yi xi k y x DMAy DMAx σ2 y σ2 x σy σx 48 Propriedade 3 Ao multiplicarmos todos os dados por uma constante nao nula temos que yi kxi y k x DMAy k DMAx σ2 y k2σ2 x σy k σx 49 Note que e razoavel que apareca o modulo da constante ja que as medidas de dispersao sao nao negativas Exercıcio 44 Se o desvio padrao das temperaturas diarias de uma deter minada localidade e de 52F qual e o desvio padrao em graus Celsius Lembrese de que a relacao entre as duas escalas e C 5 9F 32 MEDIDAS DE DISPERS AO PARA DISTRI BUIC OES DE FREQU ˆENCIAS AGRUPADAS VARI ˆANCIA Na aula passada vimos que em uma tabela de frequˆencias agrupadas perdemos a informacao sobre os valores individuais e isso nos obriga a tomar o ponto medio de cada classe como representante da respectiva classe Vamos ver agora como cal cular a variˆancia para dados agrupados Mais uma vez vamos considerar os dados referentes aos salarios dos funcionarios do Departamento de Recursos Humanos cuja distribuicao e dada na Tabela 41 C E D E R J 17 i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao Tabela 41 Distribuicao da renda dos funcionarios do Departamento de RH Classe Ponto Frequˆencia simples Frequˆencia acumulada de renda medio absoluta relativa absoluta relativa 32004021 36105 4 2667 4 2667 40214842 44315 2 1333 6 4000 48425663 52525 2 1333 8 5333 56636484 60735 3 2000 11 7333 64847305 68945 4 2667 15 10000 Total 15 10000 Como ja dito a interpretacao da tabela de frequˆencias nos diz que ha 4 observacoes iguais a 36105 2 observacoes iguais a 44315 2 iguais a 52525 3 iguais a 60735 e 4 iguais a 68945 Logo para calcular a variˆancia desses dados basta usar uma das formulas 44 ou 46 Usando 44 a variˆancia e calculada como σ2 1 15 436105530723332 244315530723332 252525530723332 360735530723332 468945530723332 σ2 4 15 36105530723332 2 15 44315530723332 2 15 52525530723332 3 15 60735530723332 4 15 68945530723332 1659638729 Note na penultima linha da equacao anterior que os desvios quadraticos de cada classe estao multiplicados pela frequˆencia relativa da classe Dessa forma chegamos a seguinte expressao para a variˆancia de dados agrupados σ2 fixi x2 410 onde xi e o ponto medio da classe e fi e a frequˆencia relativa Usando a Equacao 46 a variˆancia e calculada como 18 C E D E R J 3 5 1 4 x 3610572 x 4431572 x 5252 5 2 A oO 15 43 x 6073524 x 6894 52 9307 2333 S 4 2 2 x 361057 x 443157 x 5252 5 ei 55 3 2b 4 15 5307 23337 x 60735 x 68945 5 F Tg MOTH TS 08M 2 1659638729 Note na pentltima linha da equacao anterior que os quadra dos dos pontos médios de cada classe estaéo multiplicados pela frequéncia relativa da classe Dessa forma chegamos a seguinte expressao alternativa para a variancia de dados agrupados o fix 411 e mais uma vez obtemos que a variancia é a média dos qua drados menos o quadrado da média a diferenga é que aqui a média é uma média ponderada pelas frequéncias das classes DESVIO MEDIO ABSOLUTO Seguindo raciocinio andlogo obtemos que o desvio médio absoluto para dados agrupados é DMAY fixi que é uma média ponderada dos desvios absolutos em torno da média Calcule a variancia e 0 desvio médio absoluto para a distri buicao dada na seguinte tabela analisada no Exercicio 36 Classes Frequéncia 4 6 10 6 8 12 8 10 18 10 12 6 12 14 4 Total 40 CEDERJ 19 i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao Resumo Nesta aula vocˆe estudou as principais medidas de dispersao que medem a variabilidade dos dados Seja x1x2xn o nosso conjunto de dados Amplitude e a distˆancia entre o maior e o menor va lor total VM ax VMın xn x1 Desvio em torno da media di xi x para qualquer conjunto de dados n i1 di 0 Desvio medio absoluto DMA 1 n n i1 xi x Variˆancia desvio quadratico medio σ2 1 n n i1 xi x2 1 n n i1 x2 i x2 Desvio padrao raiz quadrada da variˆancia σ σ2 20 C E D E R J i i i i i i i i AULA 4 1 M ODULO 1 Exercıcio 46 Continuacao do Exercıcio 33 Em uma pesquisa sobre ati vidades de lazer realizada com uma amostra de 20 alunos de um campus universitario perguntouse o numero de horas que os alunos gastaram navegando na Internet na semana anterior Os resultados obtidos foram os seguintes 15 24 18 8 10 12 15 14 12 10 18 12 6 20 18 16 10 12 15 9 Calcule a amplitude o desvio medio absoluto e o desvio padrao desses dados especificando as respectivas unidades Exercıcio 47 Continuacao do Exercıcio 34 No final do ano 2005 o dono de um pequeno escritorio de administracao deu a seus oito fun cionarios uma gratificacao de 250 reais paga junto com o salario de dezembro Se em novembro o desvio padrao dos salarios desses fun cionarios era de 180 reais qual o desvio padrao dos salarios em dezembro Que propriedades vocˆe utilizou para chegar a esse resultado Exercıcio 48 Continuacao do Exercıcio 35 No mˆes de dissıdio de deter minada categoria trabalhista os funcionarios de uma empresa tiveram reajuste salarial de 89 Se no mˆes anterior ao dissıdio o desvio padrao dos salarios desses funcionarios era de 220 reais qual o valor do desvio padrao dos salarios depois do reajuste Que propriedades vocˆe utilizou para chegar a esse resultado C E D E R J 21 Probabilidade e Estatistica Medidas de Dispersao Continuacdo do Exercicio 37 Na tabela a seguir temos o numero de empresas por faixa de pessoal ocupado PO do setor de fabricacgao de bebidas em determinado momento Classe de PO Numero de empresas 10 30 489 30 100 269 100 500 117 500 1000 15 1000 2000 9 2000 4000 7 Calcule 0 desvio médio absoluto e o desvio padrao dessa distribuicdo especificando as respectivas unidades SOLUCAO DOS EXERCICIOS Exercicio 41 A média dos dados 2 6125 8 ViaiX 26125 46 125 5 6 125 66 125 i1 7 6125 2 x 8 6 125 9 6 125 4125 21251125 01250875 2 x 1875 2875 75750 1 DMA ah x X Lf 26125 46 125 5 6 125 6 6 125 7 6 125 8 2 x 8 6 125 9 6 125 a 4 125 2 125 1125 0125 0875 2 x 1875 2875 57575 1875 22 CEDERJ Exercicio 42 Q 5 Q O 5 1 26125 46 125 5 6 125 6 6 125 7 6 125 2 oO 3 2 2 8 2 x 8 6 125 9 6 125 EB 4125 2 1257 1 1257 0 1257 0875 2 x 1875 2875 ae 4 859375 Z o Vo2V4859375 2204399 Exercicio 43 92 42 52 62 7p 92 92 92 e eee ee 6125 339 7 37515625 4 859375 Exercicio 44 Note que podemos escrever 5 160 C F 9 9 Como visto somar uma constante aos dados nao altera o desvio padrao logo o termo 10 nao tem influéncia sobre o resultado Mas quando multiplicamos por uma constante 0 des vio padrao fica multiplicado pelo médulo da constante Logo 5 5 6 5 Oc 5 Or OC 5 X52 F 28889F Exercicio 45 Na aula anterior vocé calculou a média desta distribuicdo a partir da seguinte tabela CEDERJ 23 i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao Classes Ponto Freq simples Freq acumulada medio absoluta relativa absoluta relativa 4 6 5 10 020 10 020 6 8 7 12 024 22 044 8 10 9 18 036 40 080 10 12 11 6 012 46 092 12 14 13 4 008 50 100 Total 50 100 O resultado foi x 828 O desvio medio absoluto e DMA 020582802478280369828 0121182800813828 19264 Usando a formula alternativa temos que σ2 020 52 024 72 036 92 012 112 008 132 8282 7396 685584 54016 Exercıcio 46 O diagrama de ramos e folhas e 0 6 8 9 1 0 0 0 2 2 2 2 4 5 5 5 6 8 8 8 2 0 4 e a media foi calculada como x 137 A amplitude e 24 6 18 horas semanais O desvio medio absoluto tambem em horas semanais e 24 C E D E R J i i i i i i i i AULA 4 1 M ODULO 1 DMA 1 20 6 137 8 137 9 137 3 10 137 4 12 137 14 137 3 15 137 16 137 3 18 137 20 137 24 137 36 A variˆancia pela formula simplificada e σ2 1 20 62 82 92 3 102 4 122 142 3 152 162 1 20 3 182 202 242 1372 4132 20 18769 2066 18769 1891 Exercıcio 47 Os novos salarios sao yi xi 250 Como visto na Proprie dade 2 somar uma constante nao altera as medidas de dispersao logo os novos salarios tˆem o mesmo desvio padrao dos salarios de novembro ou seja 180 reais Exercıcio 48 Como visto os novos salarios sao yi 1089xi Logo pela Propriedade 3 σy 1089σx 1089220 23958 Exercıcio 49 A tabela de frequˆencias completa e C E D E R J 25 Probabilidade e Estatistica Medidas de Dispersio Classe de PO Ponto Freq simples Freq acumulada médio absoluta relativa absoluta relativa 10 30 20 489 539735 489 539735 30 100 65 269 296909 758 836645 100 500 300 117 129139 875 965784 500 1000 750 15 16556 890 982340 1000 2000 1500 9 09934 899 992274 2000 4000 3000 7 07726 906 1000000 Total 906 100000 No Exercicio 37 vocé deve ter calculado a média como x 1193322 empregados O desvio médio absoluto é calcu lado como DMA 0539735 x 20 11933220296909 x 65 119 3322 0129139 x 300 11933220016556 x 750 119 3322 0009934 x 1500 119 33220 007726 x 3000 119 3322 139489691 empregados Oo 0539735 x 207 0296909 x 657 0 129139 x 3007 0016556 x 750 0009934 x 1500 0007726 x 30007 119 3322 1142931843 14240 18102 100053 0033 o 1000530033 31631 empregados 26 CEDERJ
Send your question to AI and receive an answer instantly
Recommended for you
3
Lista de Probabilidade 1 - Estatística
Probabilidade e Estatística 1
IBMR
18
Aula: A Distribuição Normal - 1ª Parte
Probabilidade e Estatística 1
IBMR
43
Probabilidade Condicional e Independência de Eventos
Probabilidade e Estatística 1
IBMR
23
Aula sobre Variáveis Aleatórias Discretas
Probabilidade e Estatística 1
IBMR
35
Aula sobre Distribuições de Variáveis Aleatórias Discretas
Probabilidade e Estatística 1
IBMR
20
Esperança e Variância de Variáveis Aleatórias Discretas
Probabilidade e Estatística 1
IBMR
31
Teorema da Probabilidade Total e Teorema de Bayes
Probabilidade e Estatística 1
IBMR
25
Aula sobre Outras Medidas Estatísticas
Probabilidade e Estatística 1
IBMR
30
Variáveis Aleatórias Contínuas: Funções de Densidade e Distribuição
Probabilidade e Estatística 1
IBMR
Preview text
i i i i i i i i Aula MEDIDAS DE DISPERS AO 4 O b j e t i v o Nesta aula vocˆe estudara as medidas de dispersao de uma distribuicao de dados e aprendera os seguintes conceitos 1 amplitude 2 desvios em torno da media 3 desvio medio absoluto 4 variˆancia 5 desvio padrao i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao AMPLITUDE Considere os conjuntos de dados apresentados por um dia grama de pontos na Figura 41 Nesse grafico as pilhas de pontos representam as frequˆencias de cada valor Podemos ver facilmente que ambos os conjuntos tˆem a mesma media o cen tro de gravidade ou ponto de equilıbrio e o mesmo a mesma mediana e a mesma moda No entanto esses dois conjuntos tˆem caracterısticas diferentes e ao sintetizalos apenas por alguma medida de posicao essa caracterıstica se perdera Tal carac terıstica e a dispersao dos dados no primeiro conjunto os dados estao mais concentrados em torno da media do que no segundo conjunto Figura 41 Conjuntos de dados com medidas de posicao iguais e dispersao diferente Como podemos medir essa dispersao Uma primeira ideia e considerar a amplitude dos dados que e como ja visto a diferenca entre o maior e o menor valor Definicao 41 blablabla A amplitude de um conjunto de dados e a distˆancia entre o maior valor e o menor valor total Vmax Vmin 41 A amplitude tem a mesma unidade dos dados mas ela tem algumas limitacoes conforme ilustrado na Figura 42 Aı os dois conjuntos tˆem a mesma media a mesma mediana e a mesma amplitude mas essas medidas nao conseguem caracterizar o fato de a distribuicao dos valores entre o mınimo e o maximo ser di ferente nos dois conjuntos A limitacao da amplitude tambem 8 C E D E R J i i i i i i i i AULA 4 1 M ODULO 1 fica patente pelo fato de ela se basear em apenas duas observacoes independentemente do numero total de observacoes Figura 42 Conjuntos de dados com medidas de posicao e amplitude iguais DESVIO M EDIO ABSOLUTO Uma maneira de se medir a dispersao dos dados e considerar os tamanhos dos desvios xi x de cada observacao em relacao a media Note nas figuras acima que quanto mais disperso o conjunto de dados maiores esses desvios tendem a ser Para obter uma medidaresumo isto e um unico numero poderıamos somar esses desvios ou seja considerar a seguinte medida D n i1 xi x 42 Vamos desenvolver tal formula usando as propriedades de somatorio e a definicao da media amostral D n i1 xi x n i1 xi n i1 x n i1 xi nx n i1 xi n 1 n n i1 xi n i1 xi n i1 xi 0 Ou seja essa medida que representa a soma dos desvios em relacao a media e sempre nula nao importa o conjunto de da dos Logo ela nao serve para diferenciar quaisquer conjuntos Vamos dar uma explicacao intuitiva para esse fato que nos permitira obter correcoes para tal formula Ao considerarmos as diferencas entre cada valor e o valor medio obtemos valo C E D E R J 9 Probabilidade e Estatistica Medidas de Dispersio res negativos e positivos pois pela definigao de média sempre existem valores menores e maiores que a média esses valores positivos e negativos ao serem somados se anulam Bom se o problema esta no fato de termos valores positi vos e negativos por que nao trabalhar com o valor absoluto das diferengas De fato esse procedimento nos leva a definigao de desvio médio absoluto Definicao 42 O desvio médio absoluto de um conjunto de dados X1X2Xp definido por 1 n DMA x 5 43 M jz onde as barras verticais representam o valor absoluto ou modulo Note que nesta definigao estamos trabalhando com o desvio médio isto é tomamos a média dos desvios absolutos Isso evita interpretagdes equivocadas pois se trabalhassemos apenas com a soma dos desvios absolutos um conjunto com um nimero maior de observagoes tenderia a apresentar um resultado maior para a soma devido apenas ao fato de ter mais observagoes Esta situacao é ilustrada com os seguintes conjuntos de dados Conjunto 1 135 5 13 Conjunto 2 th 37 zr Para os dois conjuntos X 3 mas para o Conjunto 1 temos 3 Y x 3 13 3353 4 il e para o Conjunto 2 temos 2 5 13 20 Yi iaix 135333353 6667 Fa 3 3 3 10 CEDERJ i i i i i i i i AULA 4 1 M ODULO 1 Entao o somatorio para o segundo conjunto e maior mas o desvio absoluto medio e o mesmo para ambos de fato para o primeiro conjunto temos DMA 4 3 e para o segundo conjunto DMA 20 3 5 4 3 Ao dividirmos o somatorio pelo numero de observacoes com pensamos o fato de o segundo conjunto ter mais observacoes que o primeiro O desvio medio absoluto tem a mesma unidade dos dados Exercıcio 41 Para o conjunto de dados 24789658 calcule os des vios em torno da media e verifique que eles somam zero Em seguida calcule o desvio medio absoluto VARI ˆANCIA E DESVIO PADR AO Considerar o valor absoluto das diferencas xi x e uma das maneiras de se contornar o fato de que n i1 xi x 0 No entanto a funcao modulo tem a desvantagem de ser nao dife renciavel no ponto zero Outra possibilidade de correcao com propriedades matematicas e estatısticas mais adequadas e con siderar o quadrado das diferencas Isso nos leva a definicao de variˆancia C E D E R J 11 i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao Definicao 43 blablabla A variˆanciaa de um conjunto de dados x1x2xn e defi nida por σ2 1 n n i1 xi x2 44 a E possıvel definir a variˆancia usando o divisor n 1 no lugar de n essa e a diferenca entre os conceitos de variˆancia populacional e variˆancia amostral que sera mais relevante num segundo curso de inferˆencia es tatıstica Note que esta definicao de variˆancia nos diz que a variˆancia e a media dos desvios quadraticos Suponhamos que os valores xi representem os pesos em qui logramas de um conjunto de pessoas Entao o valor medio x representa o peso medio dessas pessoas e sua unidade tambem e quilogramas o mesmo acontecendo com as diferencas xi x Ao elevarmos essas diferencas ao quadrado passamos a ter a variˆancia medida em quilogramas ao quadrado uma unidade que nao tem interpretacao fısica Uma forma de se obter uma medida de dispersao com a mesma unidade dos dados consiste em tomar a raiz quadrada da variˆancia Definicao 44 blablabla O desvio padrao de um conjunto de dados x1x2xn e definido por σ Variˆancia σ2 45 A tıtulo de ilustracao vamos considerar novamente os dados analisados na aula anterior referentes a idade dos funcionarios do Departamento de Recursos Humanos Essas idades sao 24 25 26 26 29 29 31 35 36 37 38 42 45 51 53 12 C E D E R J e sua média é a 35 13 Assim a variancia em anos é Q a Oo 2 2 2 2 24 35 13 25 35 13 2 x 26 3513 2 29 35 13 31 35 13 35 35 13 ei o is 36 35 13 37 35 13 38 3513 42 35 13 42 35 13 45 35 13 5 51 3513 53 35 13 121373 8092 15 e o desvio padrao em anos é oO 8092 8995 Para 0 conjunto de dados do exercicio anterior 2478965 8 calcule a variancia e o desvio padrao FORMULA ALTERNATIVA PARA O CALCULO DA VARIANCIA Consideremos a Equacao 44 que define a variancia De senvolvendo o quadrado e usando as propriedades de somatério obtemos 2 Is p2 2 Is 1 I4o Oo 7 x 2xiX X nat a ear 1d 1d 1 1d x 2 Es n x7 2 3 Mi M j n Mi 2 I a oO X 46 L x 46 Essa forma de escrever a variancia facilita quando os calculos tém que ser feitos 4 mao ou em calculadoras menos sofisticadas pois o numero de calculos envolvidos é menor Note que ela nos diz que a variancia é a média dos quadrados menos o quadrado Probabilidade e Estatistica Medidas de Dispersao Vamos calcular a variancia das idades dos funcionarios de RH usando essa formula 1 OP Fz 24 25 25 2 x 26 2 x 29 31 35 367 1 2 2 2 2 2 2 2 527 is 37 38 39 42 45 51 53 a3 19729 x 15 527 295935 277729 18206 80916 152 225 22500 Na comparagao dos resultados obtidos pelas duas férmulas pode haver alguma diferenga por causa dos arredondamentos uma vez que a média é uma dizima No Exercicio 42 vocé calculou a variancia do conjunto de dados 24789658 como a média dos desvios quadraticos Calcule a variancia novamente utilizando a formula alternativa dada na Equagao 46 Exemplo 41 Na aula anterior analisamos os dados referentes ao nimero de dependentes dos funcionarios do Departamento de Recursos Humanos apresentados novamente na tabela a seguir Nome Numero de dependentes Joao da Silva 3 Patricia Silva 2 Pedro Fernandes 1 Regina Lima 2 Maria Freitas 0 Alfredo Souza 3 Paula Gongalves 0 Margarete Cunha 0 Ana Freitas 1 Pedro Barbosa 2 Luiz Costa 3 Ricardo Alves 0 André Souza 4 Marcio Rezende 1 14 CEDERJ Ana Carolina Chaves 0 Como o menor valor é 0 e 0 maior valor é 4 temos que a am Q plitude dos dados é de 4 dependentes A média calculada para 2 22 esses dados foi x 5 1467 Vamos calcular a soma dos des g vios em torno da média usando o fato de que temos observagées repetidas 5 22 22 22 Yiaix 5x 03 3x 13 3x 23 22 22 3x 3243 110 21 24 69 38 BT BI 15 15 15 15S 15 SS Caso trabalhdssemos com o valor aproximado 1467 o re sultado aproximado seria 0 005 O desvio médio absoluto é DMA ty x 3 1 22 22 22 2 5 50 t3I 3 22 22 44 bpoa a5 i HO 21 24 69 38 15 15 15 15 15 15 1 131 131 262 x 1 1644 5 3 r a m5 171 A variancia é 1 Oo ili xX 1 22 22 22 1 3 2 i 50 ss 3x a 3 2 1 22 22 2 4 BPC ss 2 iy 2420 147 192 1587 1444 5790 1715556 15 225 225 2250 225 2225 15 x 225 CEDERJ 15 Probabilidade e Estatistica Medidas de Dispersio Entao 5790 1 3098 CY Vi5x225 Vamos agora calcular a variancia usando a férmula alterna tiva oe 1x 5x 03x 13x23x 3744 22 15 15 34122716 484 58 484 58x 15484 15 225 15 225 225 7 386 x 1715556 225 Note que com essa férmula os calculos ficam bem mais sim ples uma vez que temos que fazer menos conta PROPRIEDADES DAS MEDIDAS DE DIS PERSAO Como visto para as medidas de posiga0 vamos ver as prin cipais propriedades das medidas de dispersao Propriedade 1 Todas as medidas de dispersdo sao nao negativas A0 DMA 0 o20 47 o0 Propriedade 2 Somandose uma mesma constante a todas as observac6es as medidas de dispersao nao se alteram Essa propriedade é bastante intuitiva se notarmos que ao somar uma constante aos dados estamos simplesmente fazendo uma translagao dos mes mos sem alterar a dispersao 16 CEDERJ i i i i i i i i AULA 4 1 M ODULO 1 yi xi k y x DMAy DMAx σ2 y σ2 x σy σx 48 Propriedade 3 Ao multiplicarmos todos os dados por uma constante nao nula temos que yi kxi y k x DMAy k DMAx σ2 y k2σ2 x σy k σx 49 Note que e razoavel que apareca o modulo da constante ja que as medidas de dispersao sao nao negativas Exercıcio 44 Se o desvio padrao das temperaturas diarias de uma deter minada localidade e de 52F qual e o desvio padrao em graus Celsius Lembrese de que a relacao entre as duas escalas e C 5 9F 32 MEDIDAS DE DISPERS AO PARA DISTRI BUIC OES DE FREQU ˆENCIAS AGRUPADAS VARI ˆANCIA Na aula passada vimos que em uma tabela de frequˆencias agrupadas perdemos a informacao sobre os valores individuais e isso nos obriga a tomar o ponto medio de cada classe como representante da respectiva classe Vamos ver agora como cal cular a variˆancia para dados agrupados Mais uma vez vamos considerar os dados referentes aos salarios dos funcionarios do Departamento de Recursos Humanos cuja distribuicao e dada na Tabela 41 C E D E R J 17 i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao Tabela 41 Distribuicao da renda dos funcionarios do Departamento de RH Classe Ponto Frequˆencia simples Frequˆencia acumulada de renda medio absoluta relativa absoluta relativa 32004021 36105 4 2667 4 2667 40214842 44315 2 1333 6 4000 48425663 52525 2 1333 8 5333 56636484 60735 3 2000 11 7333 64847305 68945 4 2667 15 10000 Total 15 10000 Como ja dito a interpretacao da tabela de frequˆencias nos diz que ha 4 observacoes iguais a 36105 2 observacoes iguais a 44315 2 iguais a 52525 3 iguais a 60735 e 4 iguais a 68945 Logo para calcular a variˆancia desses dados basta usar uma das formulas 44 ou 46 Usando 44 a variˆancia e calculada como σ2 1 15 436105530723332 244315530723332 252525530723332 360735530723332 468945530723332 σ2 4 15 36105530723332 2 15 44315530723332 2 15 52525530723332 3 15 60735530723332 4 15 68945530723332 1659638729 Note na penultima linha da equacao anterior que os desvios quadraticos de cada classe estao multiplicados pela frequˆencia relativa da classe Dessa forma chegamos a seguinte expressao para a variˆancia de dados agrupados σ2 fixi x2 410 onde xi e o ponto medio da classe e fi e a frequˆencia relativa Usando a Equacao 46 a variˆancia e calculada como 18 C E D E R J 3 5 1 4 x 3610572 x 4431572 x 5252 5 2 A oO 15 43 x 6073524 x 6894 52 9307 2333 S 4 2 2 x 361057 x 443157 x 5252 5 ei 55 3 2b 4 15 5307 23337 x 60735 x 68945 5 F Tg MOTH TS 08M 2 1659638729 Note na pentltima linha da equacao anterior que os quadra dos dos pontos médios de cada classe estaéo multiplicados pela frequéncia relativa da classe Dessa forma chegamos a seguinte expressao alternativa para a variancia de dados agrupados o fix 411 e mais uma vez obtemos que a variancia é a média dos qua drados menos o quadrado da média a diferenga é que aqui a média é uma média ponderada pelas frequéncias das classes DESVIO MEDIO ABSOLUTO Seguindo raciocinio andlogo obtemos que o desvio médio absoluto para dados agrupados é DMAY fixi que é uma média ponderada dos desvios absolutos em torno da média Calcule a variancia e 0 desvio médio absoluto para a distri buicao dada na seguinte tabela analisada no Exercicio 36 Classes Frequéncia 4 6 10 6 8 12 8 10 18 10 12 6 12 14 4 Total 40 CEDERJ 19 i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao Resumo Nesta aula vocˆe estudou as principais medidas de dispersao que medem a variabilidade dos dados Seja x1x2xn o nosso conjunto de dados Amplitude e a distˆancia entre o maior e o menor va lor total VM ax VMın xn x1 Desvio em torno da media di xi x para qualquer conjunto de dados n i1 di 0 Desvio medio absoluto DMA 1 n n i1 xi x Variˆancia desvio quadratico medio σ2 1 n n i1 xi x2 1 n n i1 x2 i x2 Desvio padrao raiz quadrada da variˆancia σ σ2 20 C E D E R J i i i i i i i i AULA 4 1 M ODULO 1 Exercıcio 46 Continuacao do Exercıcio 33 Em uma pesquisa sobre ati vidades de lazer realizada com uma amostra de 20 alunos de um campus universitario perguntouse o numero de horas que os alunos gastaram navegando na Internet na semana anterior Os resultados obtidos foram os seguintes 15 24 18 8 10 12 15 14 12 10 18 12 6 20 18 16 10 12 15 9 Calcule a amplitude o desvio medio absoluto e o desvio padrao desses dados especificando as respectivas unidades Exercıcio 47 Continuacao do Exercıcio 34 No final do ano 2005 o dono de um pequeno escritorio de administracao deu a seus oito fun cionarios uma gratificacao de 250 reais paga junto com o salario de dezembro Se em novembro o desvio padrao dos salarios desses fun cionarios era de 180 reais qual o desvio padrao dos salarios em dezembro Que propriedades vocˆe utilizou para chegar a esse resultado Exercıcio 48 Continuacao do Exercıcio 35 No mˆes de dissıdio de deter minada categoria trabalhista os funcionarios de uma empresa tiveram reajuste salarial de 89 Se no mˆes anterior ao dissıdio o desvio padrao dos salarios desses funcionarios era de 220 reais qual o valor do desvio padrao dos salarios depois do reajuste Que propriedades vocˆe utilizou para chegar a esse resultado C E D E R J 21 Probabilidade e Estatistica Medidas de Dispersao Continuacdo do Exercicio 37 Na tabela a seguir temos o numero de empresas por faixa de pessoal ocupado PO do setor de fabricacgao de bebidas em determinado momento Classe de PO Numero de empresas 10 30 489 30 100 269 100 500 117 500 1000 15 1000 2000 9 2000 4000 7 Calcule 0 desvio médio absoluto e o desvio padrao dessa distribuicdo especificando as respectivas unidades SOLUCAO DOS EXERCICIOS Exercicio 41 A média dos dados 2 6125 8 ViaiX 26125 46 125 5 6 125 66 125 i1 7 6125 2 x 8 6 125 9 6 125 4125 21251125 01250875 2 x 1875 2875 75750 1 DMA ah x X Lf 26125 46 125 5 6 125 6 6 125 7 6 125 8 2 x 8 6 125 9 6 125 a 4 125 2 125 1125 0125 0875 2 x 1875 2875 57575 1875 22 CEDERJ Exercicio 42 Q 5 Q O 5 1 26125 46 125 5 6 125 6 6 125 7 6 125 2 oO 3 2 2 8 2 x 8 6 125 9 6 125 EB 4125 2 1257 1 1257 0 1257 0875 2 x 1875 2875 ae 4 859375 Z o Vo2V4859375 2204399 Exercicio 43 92 42 52 62 7p 92 92 92 e eee ee 6125 339 7 37515625 4 859375 Exercicio 44 Note que podemos escrever 5 160 C F 9 9 Como visto somar uma constante aos dados nao altera o desvio padrao logo o termo 10 nao tem influéncia sobre o resultado Mas quando multiplicamos por uma constante 0 des vio padrao fica multiplicado pelo médulo da constante Logo 5 5 6 5 Oc 5 Or OC 5 X52 F 28889F Exercicio 45 Na aula anterior vocé calculou a média desta distribuicdo a partir da seguinte tabela CEDERJ 23 i i i i i i i i Probabilidade e Estatıstica Medidas de Dispersao Classes Ponto Freq simples Freq acumulada medio absoluta relativa absoluta relativa 4 6 5 10 020 10 020 6 8 7 12 024 22 044 8 10 9 18 036 40 080 10 12 11 6 012 46 092 12 14 13 4 008 50 100 Total 50 100 O resultado foi x 828 O desvio medio absoluto e DMA 020582802478280369828 0121182800813828 19264 Usando a formula alternativa temos que σ2 020 52 024 72 036 92 012 112 008 132 8282 7396 685584 54016 Exercıcio 46 O diagrama de ramos e folhas e 0 6 8 9 1 0 0 0 2 2 2 2 4 5 5 5 6 8 8 8 2 0 4 e a media foi calculada como x 137 A amplitude e 24 6 18 horas semanais O desvio medio absoluto tambem em horas semanais e 24 C E D E R J i i i i i i i i AULA 4 1 M ODULO 1 DMA 1 20 6 137 8 137 9 137 3 10 137 4 12 137 14 137 3 15 137 16 137 3 18 137 20 137 24 137 36 A variˆancia pela formula simplificada e σ2 1 20 62 82 92 3 102 4 122 142 3 152 162 1 20 3 182 202 242 1372 4132 20 18769 2066 18769 1891 Exercıcio 47 Os novos salarios sao yi xi 250 Como visto na Proprie dade 2 somar uma constante nao altera as medidas de dispersao logo os novos salarios tˆem o mesmo desvio padrao dos salarios de novembro ou seja 180 reais Exercıcio 48 Como visto os novos salarios sao yi 1089xi Logo pela Propriedade 3 σy 1089σx 1089220 23958 Exercıcio 49 A tabela de frequˆencias completa e C E D E R J 25 Probabilidade e Estatistica Medidas de Dispersio Classe de PO Ponto Freq simples Freq acumulada médio absoluta relativa absoluta relativa 10 30 20 489 539735 489 539735 30 100 65 269 296909 758 836645 100 500 300 117 129139 875 965784 500 1000 750 15 16556 890 982340 1000 2000 1500 9 09934 899 992274 2000 4000 3000 7 07726 906 1000000 Total 906 100000 No Exercicio 37 vocé deve ter calculado a média como x 1193322 empregados O desvio médio absoluto é calcu lado como DMA 0539735 x 20 11933220296909 x 65 119 3322 0129139 x 300 11933220016556 x 750 119 3322 0009934 x 1500 119 33220 007726 x 3000 119 3322 139489691 empregados Oo 0539735 x 207 0296909 x 657 0 129139 x 3007 0016556 x 750 0009934 x 1500 0007726 x 30007 119 3322 1142931843 14240 18102 100053 0033 o 1000530033 31631 empregados 26 CEDERJ