·

Engenharia de Minas ·

Estatística e Probabilidade

· 2023/2

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta
Equipe Meu Guru

Prefere sua atividade resolvida por um tutor especialista?

  • Receba resolvida até o seu prazo
  • Converse com o tutor pelo chat
  • Garantia de 7 dias contra erros

Texto de pré-visualização

Exercícios de Estatística 5. (a) Ordenando os dados temos: 1, 2, 2, 3, 4, 4, 4, 5, 5, 6. Assim temos: Mediana=4, Q1=2 e Q3=5. Como a quantidade de medidas é 10 que é par, a mediana apresenta a média aritmética dos dois valores centrais nos dados ordenados. Ela indica que 50% das observações estão acima desse valor e 50% abaixo. O primeiro quartil indica que 25% das observações estão abaixo desse valor e o terceiro quartil indica que 25% das observações estão acima desse valor. (b) x̄= \frac{1+2+2+3+4+4+4+5+5+6}{10} =3,6 e a moda é 4. A média é o valor médio de todas as observações e indica a esperança da variável, ou seja ao entrar em um estabelecimento público na região metropolitana de Belo Horizonte esperamos encontrar cerca de 3,6 profissionais da área de recursos humanos. A moda é o valor de maior ocorrência entre os fatos, o que indica que na maioria dos estabelecimentos desse tipo existem 4 profissionais de recursos humanos. (c) Desvio padrão: σ= \sqrt{\frac{\sum_{i=1}^{10}(x_i-x̄)^2}{10}} =4,73. O desvio padrão indica o quão distante da média um conjunto de dados se encontra e neste caso temos um desvio padrão relativamente alto observando que a média é 3,6 e o maior valor é 6 esses dados apresentam uma dispersão alta. Coeficiente de variação: CV= \frac{σ}{x̄} \times 100 = 131\%. O coeficiente de variação indica a variabilidade relativa dos dados com relação à média. Esse valor alto reforça nossa análise com relação à dispersão dos dados ao interpretarmos o desvio padrão. 6. Vamos calcular os coeficientes de variação: CV_H = \frac{1500}{4000} \times 100 = 37,5\% CV_M = \frac{1200}{3000} \times 100= 40\% Como observamos nos cálculos dos coeficientes de variação, a dispersão relativa dos salários é maior para as mulheres. 7. (a) (F) Como a média aritmética soma todos os valores observados e divide pela quantidade de valores, ela sofre influência de valores discrepantes pois ela considera esses valores nos seus cálculos. (b) (V) De fato, como o coeficiente de variação mede a variabilidade relativa de um conjunto de dados, ele transforma essa variabilidade em dados percentuais o que nos permite comparar facilmente a variabilidade de grupos de dados com unidades completamente diferentes. (c) (F) Uma distribuição é dita simétrica quando média, moda e mediana coincidem. (d) (F) Calculando as médias, os desvios padrão e os coeficientes de variâncias para as variáveis Tempo (t) e Temperatura (T): \bar{t}= \frac{20+22+19+23+17}{5} = 20,2, \, \overline{T} = \frac{75+80+75+82+78}{5} =78 \sigma_t= \sqrt{\frac{\sum_{i=1}^{5}(t_{i}- \overline{t})^{2}}{5}} =4,77, \, \sigma_T = \sqrt{\frac{\sum_{i=1}^{5}(T_{i}- \overline{T})^{2}}{5}} =6,16 CV_t= \frac{4,77}{20,22} \times 100= 23,59\%, \, CV_T = \frac{6,16}{78} \times 100 =7,9\% c) Se o limite máximo de contaminação por chumbo aceitável é de 4,80 mmol/L, diga se o nível deste metal entre os funcionários é preocupante. Justifique. 11. Os dados da tabela abaixo se referem à taxa de colesterol (mg/litro) de um grupo de 50 e com idade entre 10 e 19 anos. (a) Complete a tabela. (b) Construa um histograma. (c) Calcule (de forma aproximada): média, Q1, Q2, Q3 e desvio padrão. (d) 60% dos alunos têm colesterol abaixo de __________. (e) Apenas 10% dos alunos têm colesterol acima de __________. Taxa de Colesterol Frequêcia Absoluta Frequência Relativa Simple Acumulada Simple Acumulada 112 132 1 132 152 3 Total 50 12. O teor de nicotina, em miligramas, em 40 cigarros de certa marca foi registrado como segue: 1,09 1,92 2,31 1,79 2,28 1,74 1,47 1,97 0,85 1,24 1,58 2,03 1,70 2,17 2,55 2,11 1,86 1,90 1,68 1,51 1,64 0,72 1,69 1,85 1,82 1,79 2,46 1,88 2,08 1,67 1,37 1,93 1,40 1,64 2,09 1,75 1,63 2,37 1,75 1,69 a) Estabeleça uma tabela de frequências; b) Construa um histograma e discuta a assimetria da distribuição empírica dos dados; c) Calcule a média, a mediana, o desvio padrão, quartis amostrais utilizando sua tabela de frequências; d) Construa um gráfico Box-plot (considerando os valores extremos) para os dados e escreva um pequeno texto explicativo sobre suas conclusões com base neste gráfico; e) Retire os valores extremos da amostra e reconstrua o gráfico Box-plot (considerando somente os valores não extremos) para os dados e escreva um pequeno texto comparativo sobre suas conclusões com base neste gráfico em relação ao anterior. Exercícios de Estatística 3. (a) \begin{array}{|c|c|c|c|} \hline \text{i} & \text{Número de} & \text{Frequência} & \text{Frequência} & \text{Frequência} \\ & \text{Acidentes} (x_i) & \text{Absoluta} (f_i) & \text{Relativa} (f_{irel}) & \text{Acumulada} \\ \hline 1 & 0 & 3 & 0.06 & 3 \\ \hline 2 & 1 & 2 & 0.04 & 5 \\ \hline 3 & 2 & 5 & 0.1 & 10 \\ \hline 4 & 3 & 8 & 0.16 & 18 \\ \hline 5 & 4 & 9 & 0.18 & 27 \\ \hline 6 & 5 & 7 & 0.14 & 34 \\ \hline 7 & 6 & 6 & 0.12 & 40 \\ \hline 8 & 7 & 5 & 0.1 & 45 \\ \hline 9 & 8 & 4 & 0.08 & 49 \\ \hline 10 & 9 & 1 & 0.02 & 50 \\ \hline \text{TOTAL} & & 50 & 1 & \\ \hline \end{array} • Média: \overline{x} = \sum_{i=1}^{10} x_{i}f_{i}rel = 4,38 • Mediana: é a média entre as observações de número 25 e 26 de valores ordenados, olhando a coluna de frequência acumulada fica claro que a Mediana é 4. • Moda: a moda é o valor de maior ocorrência, olhando pela coluna de frequência absoluta fica claro que a moda também é 4. (b) Vamos classificar os dados em 3 faixas: [0, 3] acidentes por dia como uma quantidade baixa, [4, 6] acidentes por dia como uma quantidade média e [7, 9] acidentes por dia como uma quantidade alta. \begin{array}{|c|c|c|c|} \hline \text{Quantidade de} & \text{Frequência} & \text{Frequência} & \text{Frequência} \\ \text{Acidentes} & \text{Absoluta} (f_i) & \text{Relativa} (f_{irel}) & \text{Acumulada} \\ \hline \text{Baixa} & 18 & 0.36 & 18 \\ \hline \text{Média} & 22 & 0.44 & 40 \\ \hline \text{Alta} & 10 & 0.20 & 50 \\ \hline \text{TOTAL} & 50 & 1 & \\ \hline \end{array} Os valores de Média, Moda e Mediana não se alteram quando classificamos os dados, a única diferença é que podemos expressar a moda e a mediana como quantidades Médias de acidentes. A foram ensaiadas ao cisalhamento que forneceu uma média de 32,93 e desvio padrão de 7,34, ao passo que rebite da marca B forneceu, nas mesmas unidades, os seguintes valores: 38,5 39,0 40,7 37,8 41,4 42,0. Analisando os dados e o boxplot das cargas de ruptura das marcas A e B, qual das marcas de rebites é melhor? Justifique. Figura 2: Boxplot da carga de ruptura das marcas A e B 10. Uma empresa química afirma que nenhum de seus funcionários estão contaminados por chumbo. Para verificar isto, a empresa fez um exame de rotina em 36 funcionários escolhidos ao acaso. As concentrações obtidas foram: 3,35 3,67 4,27 5,11 5,55 2,83 3,29 3,63 4,15 3,26 3,58 3,94 4,58 5,42 2,52 3,15 3,55 3,90 3,09 3,49 3,82 4,43 5,25 1,53 3,03 3,45 3,76 3,09 3,49 3,82 4,43 5,25 1,53 3,03 3,45 3,76 4,36 5,20 1,28 a) Construa uma tabela de frequência em classes contendo a frequência absoluta simples, frequência absoluta acumulada, frequência relativa simples percentual, frequência acumulada percentual e ponto médio; b) Para os dados apresentados na tabela construída no item (a), calcule e interprete: b.1) as medidas de tendência central (média, mediana, moda); b.2) o 1º e 3º quartil; b.3) o desvio padrão e o coeficiente de variação. c) Se o limite máximo de contaminação por chumbo aceitável é de 4,80 mmol/L, diga se o nível deste metal entre os funcionários é preocupante. Justifique. 11. Os dados da tabela abaixo se referem à taxa de colesterol (mg/litro) de um grupo de 50 estudantes com idade entre 10 e 19 anos. a) Complete a tabela. b) Construa um histograma. c) Calcule (de forma aproximada): média, Q1, Q2, Q3 e desvio padrão. d) 60% dos alunos têm colesterol abaixo de Exerc´ıcios de Estat´ıstica 1. (a) Como as respostas poss´ıveis s˜ao baixa, m´edia ou alta (e n˜ao o valor do sal´ario), a vari´avel ´e qualitativa ordinal. (b) Como a quantidade de defeitos de soldagem ´e um n´umero inteiro, a vari´avel ´e quantita- tiva discreta. (c) A vari´avel ´e qualitativa nominal. (d) O tempo de esgotamento do flu´ıdo isolante pode assumir valores ”quebrados”, pois minutos s˜ao intervalos de 60 segundos, ent˜ao a vari´avel ´e quantitativa cont´ınua. (e) Como as realizac¸ ˜oes da vari´avel s˜ao n´umeros inteiros de 0 a 5 ela se comporta como quantitativa discreta. 2. (a) Tempo de Frequˆencia Frequˆencia Fundic¸ ˜ao Absoluta Relativa 14 5 0,17 15 7 0,23 16 6 0,2 17 7 0,23 18 5 0,17 TOTAL 30 1 (b) Abaixo de 16 dias temos os metais fundidos em 14 e 15 dias, o que nos d´a uma frequˆencia relativa de 0, 17 + 0, 23 = 0, 4 e em termos de porcentagem nos d´a 40% das observac¸ ˜oes abaixo de 16 dias. (c) Classificando as fundic¸ ˜oes como r´apidas e lentas obtemos a nova tabela de frequˆencias: Tempo de Frequˆencia Frequˆencia Fundic¸ ˜ao Absoluta Relativa R´apida 12 0,4 Lenta 18 0,6 TOTAL 30 1 1 Exerc´ıcios de Estat´ıstica 4. (a) (b) Observando os 3 gr´aficos obtidos, observamos que na empresa A e na B a m´edia e a mediana est˜ao bem pr´oximas e centralizadas o que indica uma distribuic¸ ˜ao sim´etrica dos sal´arios. J´a na empresa C observamos uma distribuic¸ ˜ao assim´etrica inferior. Assim, na empresa A n˜ao temos tantas diferenc¸as salariais e temos uma quantidade similar de empregados em cada faixa salarial. Na empresa B observamos a mesma simetria e tamb´em uma quantidade de empregados similar em cada faixa salarial por´em com uma amplitude maior, ou seja, uma diferenc¸a maior entre o maior e o menor sal´ario da empresa. J´a na empresa C fica clara a desigualdade salarial indicando que metade dos empregados recebem um sal´ario at´e $300 que est´a bem abaixo da m´edia enquanto existem sal´arios bem mais altos para poucos empregados. (c) Nas empresas A e B a m´edia e a mediana est˜ao bem pr´oximas o que indica dados centrais pr´oximos e pouca dispers˜ao. J´a na empresa C notamos divergˆencia nas medidas centrais e valores extremos bem distantes, o que indica alta dispers˜ao dos dados. (d) Na empresa A temos IQ = 400−200 = 200, logo Q1−1, 5IQ = −100 e Q3+1, 5IQ = 700, logo n˜ao temos outliers. Na empresa B temos IQ = 550−250 = 300, logo Q1 −1, 5IQ = −200 e Q3 + 1, 5IQ = 1000, logo tamb´em n˜ao temos outliers. Na empresa C temos IQ = 650 − 230 = 420, logo Q1 − 1, 5IQ = −400 e Q3 + 1, 5IQ = 1280 ent˜ao claramente temos pelo menor um outlier j´a que o sal´ario m´aximo ´e de 10.000. 3 (a) Com a média: \(k + x = \frac{1}{n} \sum_{i=1}^{n} k + x_i = \frac{nk}{n} + \frac{1}{n} \sum_{i=1}^{n} x_i = k + \bar{x},\) então se somamos um mesmo valor a todos elementos de um conjunto de dados a média também é somada desse valor. Com a variância: \(\sigma_{k+x} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} ((x_i + k) - (\bar{x} + k))^2} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2} = \sigma_x,\) então ao somarmos um mesmo valor a todos os elementos de um conjunto de dados a variância não se altera. (b) Com a média: \(k\bar{x} = \frac{1}{n} \sum_{i=1}^{n} kx_i = k\frac{1}{n} \sum_{i=1}^{n} x_i = k\bar{x},\) então ao multiplicarmos cada elemento do conjunto de dados por um valor constante, a média também é multiplicada por esse valor. Com a variância: \(\sigma_{kx} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (kx_i - k\bar{x})^2} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} k^2(x_i - \bar{x})^2} = k\sigma,\) então ao multiplicarmos cada elemento do conjunto de dados por um valor constante, a variância também é multiplicada por esse valor. Observando os box-plot apresentados, verificamos que a melhor marca é a B, pois além de apresentar maior resistência média apresenta menor variabilidade, atendendo os requisitos propostos. (a) \[ \begin{array}{|c|c|c|c|c|c|} \hline \text{Concentração} & \text{Ponto} & \text{Frequência} & \text{Frequência} & \text{Frequência} & \text{Frequência Relativa} \\ \text{de Chumbo} & \text{Médio} & \text{Absoluta} & \text{Relativa} & \text{Acumulada} & \text{Acumulada} \\ \hline [1, 2) & 1,5 & 2 & 0,06 & 2 & 0,06 \\ [2, 3) & 2,5 & 4 & 0,11 & 6 & 0,17 \\ [3, 4) & 3,5 & 16 & 0,45 & 22 & 0,62 \\ [4, 5) & 4,5 & 7 & 0,19 & 29 & 0,81 \\ [5, 6) & 5,5 & 7 & 0,19 & 36 & 1 \\ \hline \end{array} \] (b) i. Média: \(\bar{x} = 1,5 \cdot 0,06 + 2,5 \cdot 0,11 + 3,5 \cdot 0,45 + 4,5 \cdot 0,19 + 5,5 \cdot 0,19 = 3,84\) Moda: \(Mo = 3,5\) Mediana: \(Me = \frac{0,5 - 0,17}{0,62 - 0,17} + 3 = 3,33\) Média é o valor médio das classes de concentração encontradas e também a esperança da variável, ou seja, sorteando uma amostra ao acaso esperamos que tenha uma concentração de aproximadamente 3,84 de chumbo. A moda é o ponto médio do intervalo de maior ocorrência e a mediana é o ponto central aproximado das amostras ordenadas supondo uma distribuição contínua. ii. \(Q_1 = \frac{0,25 - 0,17}{0,62 - 0,17} + 3 = 3,18\) e \(Q_3 = \frac{0,75 - 0,62}{0,81 - 0,62} + 4 = 4,68.\) O primeiro quartil é a medida aproximada abaixo da qual se encontram 25% das observações e o terceiro quartil é a medida aproximada acima da qual se encontram 25% das observações. iii. \(\sigma = \sqrt{\frac{5}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2} = 3,25, CV = \frac{3,25}{3,84} \cdot 100 = 84,64\%.\) A variância é relativamente alta e o coeficiente de variação também, ou seja apesar da média baixa as medições apresentam uma grande variabilidade. (c) Apesar da grande variabilidade dos dados, o nível do metal entre esses funcionários não é preocupante pois menos de 25% dos funcionários apresentam tal concentração de chumbo no sangue. Exerc´ıcios de Estat´ıstica 12. (a) Teor de Frequˆencia Absoluta Frequˆencia Relativa Nicotina Simples Acumulada Relativa Acumulada [0, 7; 1, 1) 3 3 0,075 0,075 [1, 1; 1, 5) 4 7 0,1 0,175 [1, 5; 1, 9) 19 26 0,475 0,65 [1, 9; 2, 3) 10 36 0,25 0,9 [2, 3; 2, 7) 4 30 0,1 1 (b) Observamos no histograma uma quantidade muito grande de observac¸ ˜oes na faixa central, correspondente ao intervalo entre 1, 5 e 1, 9 mg de nicotina, o que possivelmente indica medidas de centralidade pr´oximas e pouca variabilidade. (c) x = 1, 77, Me = 1, 77, σ = 1, 27, Q1 = 1, 56 e Q3 = 2, 06. (d) Distˆancia interquartil IQ = 2, 06 − 1, 56 = 0, 5 ent˜ao temos valores extremos abaixo de 0, 81 e acima de 2, 81. Baseado no gr´afico, observamos uma assimetria positiva no gr´afico, ou seja, uma concentrac¸ ˜ao maior de valores elevados para a concentrac¸ ˜ao de nicotina dos cigarros. 8 Exerc´ıcios de Estat´ıstica (e) Retirando os valores extremos, notamos pouca alterac¸ ˜ao no gr´afico nesse caso, prova- velmente por conta dos intervalos escolhidos que equilibraram a prov´avel diferenc¸a. 9