·

Engenharia de Minas ·

Probabilidade e Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Prof Paulo Henrique Barbosa Galdino Disciplina Probabilidade e Estatística Medidas de Variação ou Dispersão para Dados Discretos amplitude variância e desvio padrão Medidas de Variação Embora as medidas de tendência central média mediana e moda sejam extremamente úteis elas não transmitem todas as informações sobre uma amostra de dados A variabilidade ou dispersão nos dados pode ser descrita pela variância da amostra ou pelo desvio padrão da amostra Assim veremos agora diferentes maneiras de medir a variação ou dispersão de um conjunto de dados discretos Vale ressaltar que a variabilidade na amostra desempenha um importante papel na análise de dados A variabilidade do processo e do produto é um fato real na engenharia e nos sistemas científicos O controle ou redução do processo de variabilidade costuma ser fonte de grande dificuldade Cada vez mais e mais engenheiros e gerentes de processos estão aprendendo que a qualidade do produto e como resultado os lucros derivados dos produtos industrializados são muitas vezes função do processo de variabilidade Amplitude Total Assim como há muitas medidas de tendência central ou de localização há também muitas medidas de dispersão ou variabilidade Talvez a mais simples medida de variabilidade seja a amplitude total definida como segue DEFINIÇÃO A amplitude total 𝐴 de um conjunto de dados discretos 𝑥1 𝑥2 𝑥𝑛 é a diferença entre os valores máximo 𝑥𝑚𝑎𝑥 e mínimo 𝑥𝑚𝑖𝑛 sendo esta dada por A 𝑥𝑚𝑎𝑥 𝑥𝑚𝑖𝑛 Vale ressaltar que embora a amplitude seja uma medida simples esta será essencial posteriormente Exemplo 𝟏𝟗 Calcule a amplitude dos dados do Exemplo 15 SOLUÇÃO O Exemplo 15 forneceu um conjunto de dados que lista os preços em dólares de 30 aparelhos 𝐺𝑃𝑆 portáteis os quais de maneira ordenados são dados por Assim como o valor máximo dos preços dos aparelhos de 𝐺𝑃𝑆 é 𝑈𝑆 340 e o valor mínimo é de 𝑈𝑆 65 temos que a amplitude total dos preços dos aparelhos de 𝐺𝑃𝑆 é igual a A 340 65 275 Logo a amplitude total dos dados amostrai é de 𝑼𝑺 𝟐𝟕𝟓 Exemplo 𝟐𝟎 Calcule a amplitude dos dados do Exemplo 14 SOLUÇÃO O Exemplo 14 forneceu um conjunto de dados que lista as resistências à tração em 𝑝𝑠𝑖 de oito anéis de vedação produzidos dadas por 1030 1035 1020 1049 1028 1026 1019 e 1010 Ordenando este conjunto de dados temos que 1010 1019 1020 1026 1028 1030 1035 e 1049 Logo sendo 𝑥𝑚𝑖𝑛 1010 e 𝑥𝑚𝑎𝑥 1049 temos que a amplitude total deste conjunto de dados é dada por A 𝑥𝑚𝑎𝑥 𝑥𝑚𝑖𝑛 1049 1010 𝟑𝟗 𝒑𝒔𝒊 Desvio Como uma medida de variação a amplitude total tem a vantagem de ser fácil de calcular mas possui a desvantagem de usar para o seu cálculo somente dois valores do conjunto de dados observados Duas medidas de variação que usam todos os valores do conjunto de dados observados são a variância e o desvio padrão Porém antes de conceituarmos essas medidas precisamos entender o que chamamos de desvio de um valor observado do conjunto de dados com relação à média deste conjunto podendo ser este conjunto uma amostra ou uma população DEFINIÇÃO Consideremos uma amostra 𝑥1 𝑥2 𝑥𝑛 representada pela variável aleatória discreta 𝑋 O desvio do valor observado 𝑥𝑖 na amostra em estudo é a diferença entre este valor observado e a média amostral 𝑋 isto é desvio de 𝑥𝑖 𝑥𝑖 𝑋 ou 𝑑𝑖 𝑥𝑖 𝑋 com 𝑖 1 2 𝑛 Uma outra notação usada para o desvio acima definido é dada por desvio de 𝑋 𝑋 𝑋 lembrando que a variável aleatória discreta 𝑋 representa todos os elementos da amostra 𝑥1 𝑥2 𝑥𝑛 em estudo A mesma definição vista anteriormente pode ser dada quando estamos fazendo um estudo estatístico considerando uma população dada por 𝑥1 𝑥2 𝑥𝑁 e representada pela variável aleatória discreta 𝑋 Neste caso o desvio do valor observado 𝑥𝑖 na população em estudo é a diferença entre este valor observado e a média populacional 𝜇 isto é desvio de 𝑥𝑖 𝑥𝑖 𝜇 ou 𝑑𝑖 𝑥𝑖 𝜇 com 𝑖 1 2 𝑁 De maneira análoga à definição dada anteriormente uma outra notação usada para o desvio acima definido é dada por desvio de 𝑋 𝑋 𝜇 lembrando que neste caso a variável aleatória discreta 𝑋 representa todos os elementos da população 𝑥1 𝑥2 𝑥𝑁 em estudo Exemplo 𝟐𝟏 Considere agora resistências à tração em 𝑝𝑠𝑖 de uma nova amostra similares às vistas no Exemplo 13 dadas por 1037 1047 1066 1048 1059 1073 1070 e 1040 Calcule os desvios de cada valor observado em relação à média dos dados SOLUÇÃO Observação 𝒊 Resistência à tração 𝒙𝒊 Desvio 𝒙𝒊 𝑋 1 1048 7 2 1059 4 3 1047 8 4 1066 11 5 1040 15 6 1070 15 7 1037 18 8 1073 18 Sabemos pelo Exemplo 13 que a média amostral da resistência à tração é dada por 𝑋 1055 𝑝𝑠𝑖 Assim temos ao lado os desvios pedidos de cada uma das observações com relação a esta média amostral Observe pela terceira coluna da tabela anterior que a soma dos desvios 𝑥𝑖 𝑋 se anula isto é 𝑥𝑖 𝑋 8 𝑖1 0 Em outras palavras a soma dos desvios positivos igualase à soma dos desvios negativos sendo importante dizer que esta soma de todos os desvios se anulando não é uma coincidência mas sim uma propriedade Na figura abaixo temos graficamente o conjunto de dados amostrais plotados bem como os desvios calculados anteriormente 𝑋 1055 Graficamente os desvios calculados anteriormente 3ª coluna da tabela anterior por exemplo representam a diferença entre o valor observado 𝑥𝑖 para 𝑖 1 2 𝑛 e a média amostral 𝑋 Isto é denotando um destes desvios qualquer por 𝑑𝑖 temos que 𝑑𝑖 𝑥𝑖 𝑋 Observe que 1 se 𝑥𝑖 𝑋 então temos que o desvio 𝑑𝑖 é negativo 𝑥𝑖 𝑋 𝑑𝑖 2 se 𝑥𝑖 𝑋 então temos que o desvio 𝑑𝑖 é positivo 𝑥𝑖 𝑋 𝑑𝑖 3 se 𝑥𝑖 𝑋 para algum 𝑖 então temos que o desvio 𝑑𝑖 é exatamente igual a zero Note que se tomarmos 𝑑𝑖 𝑥𝑖 𝑋 temos que este valor representa exatamente a distância entre o valor observado 𝑥𝑖 e a média amostral 𝑋 Exemplo 𝟐𝟐 Calcule os desvios de cada valor observado em relação à média dos dados do Exemplo 15 SOLUÇÃO Na tabela ao lado temos os desvios pedidos para cada elemento observado da amostra donde segue que a soma destes desvios 3ª e 6ª colunas é aproximadamente nula devido aos arredondamentos feitos isto é 𝑋 𝑋 0 Obs 𝒊 Preço 𝒙𝒊 Desvio 𝒙𝒊 𝑋 Obs 𝒊 Preço 𝒙𝒊 Desvio 𝒙𝒊 𝑋 1 65 944 16 150 94 2 80 794 17 150 94 3 85 744 18 150 94 4 90 694 19 170 106 5 90 694 20 170 106 6 100 594 21 180 206 7 105 544 22 190 306 8 110 494 23 200 406 9 112 474 24 200 406 10 120 394 25 200 406 11 126 334 26 230 706 12 128 314 27 230 706 13 130 294 28 270 1106 14 132 274 29 340 1806 15 140 194 30 340 1806 Dessa forma devido à soma dos desvios se anular não faz sentido encontrar a média destes desvios pois esta seria nula Assim para superar esse problema tomamos a média dos quadrados de cada desvio o que nos fornece as seguintes definições Variância Amostral Em uma amostra a média dos quadrados dos desvios é a variância amostral DEFINIÇÃO A variância amostral de um conjunto de dados discretos com 𝑛 elementos denotados por 𝑥1 𝑥2 𝑥𝑛 é dada por 𝑆2 𝑥𝑖 𝑋 2 𝑛 𝑖1 𝑛 1 ou 𝑆2 𝑋 𝑋 2 𝑛 1 Vale observar que como uma medida de variação uma desvantagem da variância é que sua unidade de medida é diferente da unidade de medida do conjunto de dados observados Dessa forma para ir de encontro à unidade de medida dos dados utilizados no problema em estudo extraímos a raiz quadrada da variância obtendo assim o chamado desvio padrão amostral como segue Desvio Padrão Amostral DEFINIÇÃO O desvio padrão amostral de um conjunto de dados discretos com 𝑛 elementos denotados por 𝑥1 𝑥2 𝑥𝑛 é dado por 𝑆 𝑥𝑖 𝑋 2 𝑛 𝑖1 𝑛 1 ou 𝑆 𝑋 𝑋 2 𝑛 1 Observação Algumas observações importantes sobre o desvio padrão 1 o desvio padrão mede a variação dos dados com relação à média e tem a mesma unidade de medida que o conjunto de dados observados 2 o desvio padrão é sempre maior ou igual a zero 3 Quando o desvio padrão é exatamente igual a zero o conjunto de dados não apresenta variação todos os elementos têm o mesmo valor 4 à medida que os valores se afastam da média isto é estão mais dispersos o valor do desviopadrão aumenta Exemplo 𝟐𝟑 Calcule a variância e o desviopadrão dos dados do Exemplo 21 SOLUÇÃO 𝑥𝑖 𝑋 2 8 𝑖1 1148 Observação 𝒊 𝒙𝒊 𝒙𝒊 𝑋 𝒙𝒊 𝑋 𝟐 1 1048 7 49 2 1059 4 16 3 1047 8 64 4 1066 11 121 5 1040 15 225 6 1070 15 225 7 1037 18 324 8 1073 18 324 Pelo Exemplo 21 temos na tabela ao lado 3ª coluna os desvios das resistências à tração em relação à média amostral 𝑋 1055 bem como o quadrado destes desvios 4ª coluna Dessa forma temos conforme a tabela ao lado 4ª coluna que a soma dos quadrados dos desvios é dada por Logo temos que a variância amostral é dada por 𝑆2 𝑥𝑖 𝑋 2 8 𝑖1 𝑛 1 1348 8 1 19257 𝑆2 1926 E o desvio padrão amostral da resistência à tração é dado por 𝑆 19257 𝑆 1388 𝑆 139 Assim é importante concluir que em média o desvio entre cada resistência à tração observada 𝑥𝑖 e a média destas resistências 𝑋 é dado por 139 𝑝𝑠𝑖 Exemplo 𝟐𝟒 Calcule a variância e o desvio padrão amostral dos dados do Exemplo 15 SOLUÇÃO Pelo Exemplo 22 temos na tabela ao lado os preços dos 30 aparelhos de 𝐺𝑃𝑆 bem como os respectivos desvios dos dados em relação à média 𝑋 1594 Calculemos agora o quadrado dos desvios dados na tabela ao lado conforme constam na tabela seguinte Obs 𝒊 Preço 𝒙𝒊 Desvio 𝒙𝒊 𝑋 Obs 𝒊 Preço 𝒙𝒊 Desvio 𝒙𝒊 𝑋 1 65 944 16 150 94 2 80 794 17 150 94 3 85 744 18 150 94 4 90 694 19 170 106 5 90 694 20 170 106 6 100 594 21 180 206 7 105 544 22 190 306 8 110 494 23 200 406 9 112 474 24 200 406 10 120 394 25 200 406 11 126 334 26 230 706 12 128 314 27 230 706 13 130 294 28 270 1106 14 132 274 29 340 1806 15 140 194 30 340 1806 Obs 𝒊 𝒙𝒊 𝑋 𝒙𝒊 𝑋 𝟐 Obs 𝒊 𝒙𝒊 𝑋 𝒙𝒊 𝑋 𝟐 1 944 891765 16 94 8899 2 794 630965 17 94 8899 3 744 554032 18 94 8899 4 694 482099 19 106 11165 5 694 482099 20 106 11165 6 594 353232 21 206 42299 7 544 296299 22 306 93432 8 494 244365 23 406 164565 9 474 224992 24 406 164565 10 394 155499 25 406 164565 11 334 111779 26 706 497965 12 314 98805 27 706 497965 13 294 86632 28 1106 1222499 14 274 75259 29 1806 3260432 15 194 37765 30 1806 3260432 Sabendo que a média amostral é dada por 𝑋 1594 temos conforme tabela ao lado que a soma dos quadrados dos desvios é dada por 𝑋 𝑋 2 14143337 Logo temos que a variância amostral é dada por 𝑆2 𝑋 𝑋 2 𝑛 1 14143337 29 𝑆2 487701 Assim temos que o desvio padrão é dado por 𝑆 487701 𝑆 6984 𝑆 698 Portanto podemos concluir que os valores dos aparelhos de 𝐺𝑃𝑆 tem um desvio médio com relação ao preço médio 𝑈𝑆 1594 de aproximadamente 𝑈𝑆 6980 Exemplo 𝟐𝟓 Abaixo temos as medidas de taxas de pulsação em 𝑏𝑝𝑚 obtidas de uma amostra aleatória simples de 40 mulheres e de outra amostra aleatória simples de 40 homens respectivamente sendo estes resultados dados nas tabelas abaixo Mulheres 76 72 88 60 72 68 80 64 68 68 80 76 68 72 96 72 68 72 64 80 64 80 76 76 76 80 104 88 60 76 72 72 88 80 60 72 88 88 124 64 Homens 68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88 72 56 68 64 60 68 60 60 56 84 72 84 88 56 64 56 56 60 64 72 Calcule a variância e o desvio padrão das taxas de pulsação para as mulheres e para os homens SOLUÇÃO Primeiramente vamos calcular a variância e o desvio padrão das taxas de pulsação para as mulheres Assim denotando as taxas de pulsação das mulheres pela variável 𝑋 temos que a média amostral destas é dada por 𝑋 3052 40 𝑋 763 𝑏𝑝𝑚 Agora de posse da media amostral acima vamos calcular os desvios de cada taxa de pulsação observada 𝑥𝑖 com relação à média amostral calculada 𝑋 763 𝑏𝑝𝑚 conforme segue na tabela dada a seguir Pulsação 𝑿 Desvio 𝑿 𝑋 Pulsação 𝑿 Desvio 𝑿 𝑋 76 03 80 37 72 43 76 03 88 117 68 83 60 163 72 43 72 43 96 197 68 83 72 43 80 37 68 83 64 123 72 43 68 83 64 123 68 83 80 37 Pulsação 𝑿 Desvio 𝑿 𝑋 Pulsação 𝑿 Desvio 𝑿 𝑋 64 123 72 43 80 37 72 43 76 03 88 117 76 03 80 37 76 03 60 163 80 37 72 43 104 277 88 117 88 117 88 117 60 163 124 477 76 03 64 123 Observe que a tabela da direita acima é continuação da tabela da esquerda onde diferentemente das tabelas anteriores omitimos a enumeração 𝑖 das observações afim de melhorar a escrita Agora tendo posse dos desvios acima de cada observação 𝑥𝑖 com relação à média amostral 𝑋 vamos eleválos ao quadrado e somálos para obter a variância desejada conforme tabelas seguintes Pulsação 𝑿 𝑿 𝑋 𝟐 Pulsação 𝑿 𝑿 𝑋 𝟐 76 009 80 1369 72 1849 76 009 88 13689 68 6889 60 26569 72 1849 72 1849 96 38809 68 6889 72 1849 80 1369 68 6889 64 15129 72 1849 68 6889 64 15129 68 6889 80 1369 Pulsação 𝑿 𝑿 𝑋 𝟐 Pulsação 𝑿 𝑿 𝑋 𝟐 64 15129 72 1849 80 1369 72 1849 76 009 88 13689 76 009 80 1369 76 009 60 26569 80 1369 72 1849 104 76729 88 13689 88 13689 88 13689 60 26569 124 22753 76 009 64 15129 Agora de acordo com a tabela acima temos que a soma dos quadrados dos desvios em vermelho é dada por 𝑥𝑖 𝑋 2 40 𝑖1 60924 Logo temos que a variância amostral é dada por 𝑆2 𝑥𝑖 𝑋 2 40 𝑖1 𝑛 1 60924 39 156215 𝑆2 1562 E assim o desvio padrão amostral é dado por 𝑆 1562 𝑆 1249 𝑆 12 Assim podemos concluir que em média o desvio entre cada taxa de pulsação das mulheres 𝑥𝑖 e a média destas taxas 𝑋 é de aproximadamente 12 𝑏𝑝𝑚 Agora vamos calcular a variância e o desvio padrão das taxas de pulsação para os homens sendo estas taxas denotadas por 𝑌 Dessa forma temos que a média amostral das taxas de pulsação para os homens é dada por 𝑌 2776 40 𝑌 694 𝑏𝑝𝑚 Agora de posse da media amostral acima vamos calcular os desvios de cada taxa de pulsação observada 𝑦𝑖 com relação à média amostral calculada 𝑌 694 𝑏𝑝𝑚 conforme segue na tabela dada a seguir Pulsação 𝒀 Desvio 𝒀 𝑌 Pulsação 𝒀 Desvio 𝒀 𝑌 68 17 96 266 64 54 72 26 88 186 56 134 72 26 64 54 64 54 60 94 72 26 64 54 60 94 84 146 88 186 76 66 76 66 84 146 60 94 88 186 Pulsação 𝒀 Desvio 𝒀 𝑌 Pulsação 𝒀 Desvio 𝒀 𝑌 72 26 72 26 56 134 84 146 68 14 88 186 64 54 56 134 60 94 64 54 68 14 56 134 60 94 56 134 60 94 60 94 56 134 64 54 84 146 72 26 Agora tendo posse dos desvios acima de cada observação 𝑦𝑖 com relação à média amostral 𝑌 vamos eleválos ao quadrado e somálos para obter a variância desejada conforme tabelas seguintes Pulsação 𝒀 𝒀 𝒀 𝟐 Pulsação 𝒀 𝒀 𝒀 𝟐 68 196 96 70756 64 2916 72 676 88 34596 56 17956 72 676 64 2916 64 2916 60 8836 72 676 64 2916 60 8836 84 21316 88 34596 76 4356 76 4356 84 21316 60 8836 88 34596 Pulsação 𝒀 𝒀 𝒀 𝟐 Pulsação 𝒀 𝒀 𝒀 𝟐 72 676 72 676 56 17956 84 21316 68 196 88 34596 64 2916 56 17956 60 8836 64 2916 68 196 56 17956 60 8836 56 17956 60 8836 60 8836 56 17956 64 2916 84 21316 72 676 Agora de acordo com a tabela acima temos que a soma dos quadrados dos desvios em vermelho é dada por 𝑦𝑖 𝑌 2 40 𝑖1 49776 Logo temos que a variância amostral é dada por 𝑆2 𝑦𝑖 𝑌 2 40 𝑖1 𝑛 1 49776 39 12763 𝑆2 1276 E assim o desvio padrão amostral é dado por 𝑆 12763 𝑆 1129 𝑆 11 Assim podemos concluir que em média o desvio entre cada taxa de pulsação dos homens observada 𝑦𝑖 e a média destas taxas 𝑌 é de aproximadamente 11 𝑏𝑝𝑚 Resumidamente temos que a média a variância e o desvio padrão amostral das taxas de batimento 𝑏𝑝𝑚 para mulheres e homens são dados por para mulheres 𝑋 763 𝑆2 15622 e 𝑆 12 para homens 𝑌 694 𝑆2 12763 e 𝑆 11 Logo podemos concluir que tanto a média quanto o desvio padrão das taxas de batimentos 𝑏𝑝𝑚 das mulheres são maiores do que as dos homens e que as taxas de pulsação dos homens estão mais próximas da média amostral do que as taxas de pulsação das mulheres que estão levemente mais dispersas devido ao maior valor do seu desvio padrão Variância e Desvio Padrão Populacional DEFINIÇÃO A variância populacional e o desvio padrão populacional de um conjunto de dados populacional discretos de 𝑁 elementos denotado por 𝑥1 𝑥2 𝑥𝑁 são dados respectivamente por variância populacional 𝜎2 𝑥𝑖 𝜇 2 𝑁 𝑖1 𝑁 desvio padrão populacional 𝜎 𝑥𝑖 𝜇 2 𝑁 𝑖1 𝑁 Símbolos nas Fórmulas da Variância e do Desvio Padrão Populacional Amostral Variância 𝜎2 𝑆2 Desvio padrão 𝜎 𝑆 Média 𝜇 𝑋 Número de observações 𝑁 𝑛 Desvio 𝑋 𝜇 𝑋 𝑋 Soma dos quadrados 𝑋 𝜇 2 𝑋 𝑋 2