·

Engenharia da Mobilidade ·

Probabilidade e Estatística 1

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Recomendado para você

Texto de pré-visualização

Estatística e Probabilidade Análise e Desenvolvimento de Sistemas Aula 3 Resumindo dados Medidas de Dispersão Prof Dr Samuel Sanches 1 Os conjuntos de dados muitas vezes possuem certa variabilidade dois pacientes tiveram os pulsos medidos A 72 76 e 74 e o B 72 91 e 59 para os dois a média é 74 porém o B possui uma variação muito grande A amplitude nos ajuda a verificar essa variação sendo definida como diferença entre o maior e o menor valor Paciente A Amplitude 76 72 4 Paciente B Amplitude 91 59 32 MEDIDAS DE DISPERSÃO AMPLITUDE 2 MEDIDAS DE DISPERSÃO AMPLITUDE 3 Veja os dados Todos possuem amplitude de 18 5 13 porém veja a dispersão espaçamento entre valores que é totalmente diferente Amplitude interquartil Q3 Q1 Para abranger aproximadamente 50 dos valores centrais Amplitude semiinterquartil ou desvio quartil Q3 Q12 MEDIDAS DE DISPERSÃO DESVIOPADRÃO E VARIÂNCIA 4 Uma das medidas de dispersão mais úteis Valores concentrados ao redor da média dispersão pequena Valores espalhados ao redor da média dispersão alta Quanto o valor está afastado da média desvio da média Então vamos utilizar o quadrado desse valor para evitar valores negativos somando todos resultados para depois dividir pela quantidade n de dados média e calcular a raiz quadrada para compensar o fato de ter elevado ao quadrado temos o chamado desvio da raiz dos quadrados médios Temos o desviopadrão amostral Elevando ao quadrado s² temos a chamada variância amostral Para populações desviopadrão populacional temos a mesma expressão com modificações nas notações s σ n N média μ E a variância população dada por σ² MEDIDAS DE DISPERSÃO DESVIOPADRÃO E VARIÂNCIA 5 MEDIDAS DE DISPERSÃO DESVIOPADRÃO E VARIÂNCIA 6 Exemplo Um laboratório encontrou 8 11 7 13 10 11 7 e 9 bactérias em oito pessoas saudáveis Calcule s MEDIDAS DE DISPERSÃO DESVIOPADRÃO E VARIÂNCIA 7 Exemplo Um laboratório encontrou 8 11 7 13 10 11 7 e 9 bactérias em oito pessoas saudáveis Calcule s com a outra expressão Planilha Aula 3 httpsdocsgooglecomspreadsheetsd1HoKhlBw2n47HyA9HRg76fRTJrKQ8srW8ST9198OS91Aedituspsharelink APLICAÇÕES 8 Teorema de Tchebichev Para qualquer conjunto de dados população ou amostra e qualquer constante k maior do que 1 a proporção dos dados que devem estar a menos de k desviospadrão de qualquer um dos dois lados da média é pelo menos 1 1k² Isso nos permite afirmar coisas como 75 dos valores de qualquer conjunto de dados devem estar a pelo menos 2 desviospadrão de qualquer um dos dois lados da média 1 12² ¾ 075 96 dos valores estão a 5 desviospadrão 1 15² 2425 096 e 99 a menos de 10 desviospadrão 1 110² 99100 099 APLICAÇÕES 9 Exemplo Um estudo sobre queijos mostrou que em média uma fatia de 30 gramas contém 350 gramas de gordura com um desviopadrão de 004 gramas de gordura a De acordo com o teorema de Tchebichev pelo menos qual percentagem de uma fatia de 30 gramas desse tipo de queijo deve ter um conteúdo de gordura entre 338 e 362 gramas de gordura b De acordo com o teorema entre quais valores deve estar o conteúdo de gordura de pelo menos 9375 das fatias de 30 gramas desse tipo queijo a 362 350 012 então k004 012 para descobrir quantos desviospadrão temos k 3 assim 1 13² 89 0889 ou seja 889 possuem o indicado b 1 1k² 09375 1k² 1 09375 00625 k² 100625 16 k 4 então 9375 possuem entre 350 4004 334 e 350 4004 366 gramas de gordura APLICAÇÕES 10 Possui problemas temos uma regra empírica registrada a partir de dados que caso a distribuição siga o formato de sino distribuição normal podemos afirmar APLICAÇÕES 11 Exemplo Usamos os dados de tempo de espera de erupções onde a média encontrada foi de 7859 e aqueles dados possuem desviopadrão de 1435 Utilizando esses valores determine qual percentagem está a menos de três desviospadrão da média Então 7859 31335 3554 limite inferior 7859 31335 12164 limite superior temos 2 valores menores que 3554 e nenhum acima de 121 então 110 2 108 dos valores estão compreendidos no intervalo ou seja 108110100 982 dos tempos caem a menos de 3 desviospadrão da média próximo do valor de 997 do slide anterior vale lembrar que essa distribuição não tem forma de sino APLICAÇÕES 12 Para compararmos dados aparentemente diferentes usamos unidades padronizadas ou escores z Dois exames vocabulário obteve 66 e gramática 80 aparentemente melhor em gramática média turma 51 com desvio 12 em vocabulário e média 72 com desvio 16 em gramática Vocabulário 66 5112 125 desviospadrão acima da média Gramática 80 7216 050 desviospadrão acima da média Então veja que ele está melhor do que a turma em vocabulário mais longe da média APLICAÇÕES 13 Exemplo Uma faixa etária possui massa média de 56 kg com desviopadrão de 6 kg outra faixa etária possui massa média 82 kg com desviopadrão de 9 kg Se uma pessoa da 1º faixa possui 66 kg e outra da 2º faixa possui 96 kg qual dos dois relativamente a massa média de sua faixa etária está com maior excesso de massa 1º faixa 66 566 166 2º faixa 96 829 155 Então a pessoa da 1º faixa está com excesso relativo a sua faixa etária APLICAÇÕES 14 O desviopadrão depende das unidades de medida por exemplo um objeto possui desviopadrão de 01 grama não temos como saber se isso é muito ou se é pouco assim podemos usar uma medida de dispersão relativa como o coeficiente de dispersão Ele nos informa o desviopadrão como uma porcentagem da medida em média APLICAÇÕES 15 Exemplo Várias medições efetuadas com um micrômetro acusaram média de 249 mm e desviopadrão de 0012 mm com um outro micrômetro e um outro objeto teve 075 cm de média e desviopadrão de 0002 cm Qual dos dois micrômetros é mais preciso Coeficiente de dispersão Observe que o 2º possui menos variação então é mais preciso DADOS AGRUPADOS 16 Como temos uma perda de informação para cada dado os itens dentro de uma mesma classe corresponderão ao ponto médio da classe Então soma de todas medidas Soma de seus quadrados Desviopadrão para dados amostrais agrupados DADOS AGRUPADOS 17 Exemplo Com os dados do tempo de espera entre erupções tabela ao lado calcule o desviopadrão DESCRIÇÕES ESTATÍSTICAS 18 Distribuição perfeitamente simétrica Distribuição em forma de sino Distribuição negativamente assimétrica cauda à esquerda Distribuição positivamente assimétrica cauda à direita MEDIDAS DE ASSIMETRIA 19 Média e mediana coincidem simetria perfeita Assimetria positiva média é maior que a mediana e Assimetria negativa média é menor que a mediana Coeficiente de assimetria de Pearson SK 0 simetria perfeita SK deve cair entre 3 e 3 MEDIDAS DE ASSIMETRIA 20 Exemplo Calcule SK para a distribuição de tempos de espera entre as erupções onde temos média de 7859 mediana de 8053 e desviopadrão de 1435 Simetria negativa fracapequena veja o histograma MEDIDAS DE ASSIMETRIA 21 Conjunto pequeno de dados histograma não é boa escolha gráfico de caixa nos trás mais informações a partir da posição da mediana em relação aos dois quartis Q1 e Q3 Reta da mediana está no centro ou próximo temos uma boa simetria muito à esquerda simetria positiva muito à direita simetria negativa Bem como as retas de menor e maior valor quanto mais diferentes mais assimétrico MEDIDAS DE ASSIMETRIA 22 Exemplo Os dados representam as rendas anuais de quinze contadores em milhares de unidades monetárias 88 77 70 80 74 82 85 96 76 67 80 75 73 93 e 72 Esboce um gráfico de caixa e useo para determinar a simetria ou a falta de simetria dos dados Ordem 67 70 72 73 74 75 76 77 80 80 82 85 88 93 96 menor 67 maior 96 mediana 77 8º valor de qualquer lado Q1 é 73 4º valor a partir da esquerda Q3 é 85 4º valor a partir da direita MEDIDAS DE ASSIMETRIA 23 Exemplo Temos tendência que os dados são negativamente assimétricos a reta mediana está à esquerda e a reta da direita é maior Planilha Aula 3 httpsdocsgooglecomspreadsheetsd1HoKhlBw2n47HyA9HRg76fRTJrKQ8srW8ST9198OS91Aedituspsharelink MEDIDAS DE ASSIMETRIA 24 Distribuição em forma de J invertido Distribuição em forma de U EXERCÍCIOS 25 Lista 1 de Exercícios Parte 2 httpsdrivegooglecomfiled13uquLgC8gQLySR0kgeiSnrOmuiDGOzPxviewuspsharelink