·
Cursos Gerais ·
Probabilidade e Estatística 1
Send your question to AI and receive an answer instantly
Recommended for you
1
Estatistica-Probabilidade-Conceitos-Testes-e-Modelos-de-Distribuicao
Probabilidade e Estatística 1
PUC
3
Prova de Estatística Geral - Teoria e Aplicações - Análise de Consumo e Receitas
Probabilidade e Estatística 1
PUC
4
Estatística e Probabilidade - Lista de Exercícios Resolvidos
Probabilidade e Estatística 1
PUC
1
Curso de HTML Basico e Estatistica Inferencial: Distribuicoes, Testes e Regressao
Probabilidade e Estatística 1
PUC
1
Teste Qui-Quadrado e Análise de Homicídios por Ocupação - Bioinformática
Probabilidade e Estatística 1
PUC
1
Analise de Arvore de Falhas e Ciclo PDCA Questoes Abertas
Probabilidade e Estatística 1
PUC
1
Exercicios Resolvidos - Probabilidade de Queda de Viaduto e Takt Time na Producao de Biscoitos
Probabilidade e Estatística 1
PUC
1
Lista de Exercicios - Analise de Regressao e Correlacao
Probabilidade e Estatística 1
PUC
1
Probabilidade de Durabilidade de Bomba de Aquecimento - Modelo Exponencial
Probabilidade e Estatística 1
PUC
1
Exercicios Resolvidos Estatistica e Custos da Qualidade para Engenharia de Producao
Probabilidade e Estatística 1
PUC
Preview text
12012024 1 Síntese Numérica e Gráfica de Dados QSND Engenharia e Gestão da Qualidade Professor Alberto A G Grossi 2 3 JURAN J M DEFEO J A Jurans Quality Handbook McGraw Hill Editora 2010 LORENTZ E G et all Certificação em Engenharia da Qualidade Curso completo QG Editora 2019 MONTGOMERY DOUGLAS C Estatística Aplicada e Probabilidades para Engenheiros Editora LTC 7ª edição TRIOLA MÁRIO F Introdução à Estatística Editora LTC 12ª edição STEVENSON W J Estatística Aplicada à Administração Editora Harbra 2001 O que será abordado nesta disciplina 1 Conceitos gerais 2 Medidas estatísticas 3 Síntese numérica e gráfica de dados 4 Conceitos de probabilidades 5 Distribuições de probabilidades discretas 6 Distribuições de probabilidades contínuas 7 Distribuições amostrais das médias e das proporções 8 Séries temporais 9 Exercícios com Software Estatístico 4 CONCEITOS BÁSICOS 5 ESTATÍSTICA Coleta de Dados Estatística Descritiva Estatística Inferencial Organização Apresentação Sintetize Métodos para tomada de decisões Amostragem Planejamento de Experimentos Probabilidades 6 Foco de QTDE Foco de QPEX Foco de QSIN Foco de QSND 12012024 2 Estatística descritiva A parte da estatística que utiliza números para descrever fatos é chamada de forma bem apropriada Estatística Descritiva Compreende a organização o resumo e em geral a simplificação de informações que podem ser muito complexas A finalidade é tornar as coisas mais fáceis de entender de relatar e discutir 7 taxas de acidentes índices de produtos defeituosos custo de vida quilometragem média por litro de combustível A estatística inferencial compreende as técnicas por meio das quais são tomadas decisões sobre uma população decisões estas baseadas unicamente na observação de uma amostra ou na elaboração de um juízo Estatística inferencial 8 Probabilidades A teoria da probabilidade proporciona uma base racional para lidar com situações influenciadas por fatores relacionados ao acaso jogos de dados ou de cartas o lançamento de uma moeda para o ar encontrar produto defeituoso na gôndola do supermercado a chance de ganhar na loteria 9 Amostragem STEVENSON W J Estatística Aplicada à Administração Editora Harbra 2001 10 Amostragem Ideia básica efetuar determinada mensuração sobre uma parcela pequena mas típica de determinada população e utilizar esta informação para fazer inferência sobre a população toda Basta um cálice de vinho para conhecermos a safra Basta uma colher de sopa para saber se precisa de mais sal Nenhum plano de amostragem pode garantir que a amostra seja exatamente semelhante à população da qual foi extraída Uma amostra aleatória permite estimar o erro possível isto é dizer quão próxima está a amostra da população em termos de representatividade 11 População Amostra Parâmetros Média µ Desvio padrão σ Proporção p etc Estatísticas Média Xbarra Desvio padrão s Proporção pchapeu Inferência Amostragem 12 12012024 3 Vantagens da amostragem sobre o censo A população pode ser infinita não seria possível examinar todos elementos da população A amostra pode ser mais atualizada que o censo por ser mais rápida Ensaio de poucos elementos em testes destrutivos Custo reduzido em relação ao censo A exatidão precisão pode ser melhor devido a melhor qualidade da coleta Permite análise de mais itens quando o custo e o tempo são fatores limitantes 13 População X Amostra Custo Alto Baixo Operacionalidade Difícil Fácil Tempo Alto Baixo Precisão Alto Baixo 14 Aleatório é o processo de escolha e não os itens em si Amostragem aleatória Simples ao acaso casual simples randômica são outras designações Amostra Aleatória Simples AAS de tamanho n consiste em n indivíduos escolhidos de maneira que todos os conjuntos de n indivíduos têm a mesma chance de ser a amostra realmente selecionada Uma AAS não apenas concede a cada indivíduo a mesma chance de ser escolhido mas também dá a cada amostra possível a mesma chance de ser escolhida Amostragem 15 Amostragem aleatória As estatísticas média desvio padrão etc tendem a variar de amostra para amostra e também em relação ao verdadeiro valor do parâmetro população População Amostras repetidas Vários fatores aleatórios relacionados com amostragem causam essa variação Variabilidade amostral Erro Amostragem 16 Quão próximo está a estatística amostral do verdadeiro valor do parâmetro populacional Média populacional Média amostral x parâmetro estatística Erro amostral ou erro randômico ou variabilidade amostral Erro amostral E µ 17 Exemplo com o parâmetro média Erro amostral De um baralho com 52 cartas 1ª retirada amostra retiramos 13 cartas e não encontramos os ases Podemos concluir que existem 8 ases 213 x 52 no baralho 2ª retirada amostra retiramos 13 cartas encontramos dois ases Podemos concluir que não existem ases no baralho 18 Sabemos que no baralho existem 4 ases A esse desvio na amostra em relação ao valor real é chamado de erro amostral 12012024 4 Erro amostral Este tipo de erro não pode ser evitado mas pode ser controlado De uma forma ou de outra ele interfere em nossa decisão Esse erro entretanto não ocorre de forma descontrolada desde que a amostra seja retirada aleatoriamente do lote Leis probabilísticas regem os limites de variação desse erro Ao retirar uma amostra com critério de aceitação definido existe o risco de Um lote de má qualidade ser aprovado ou Um lote de boa qualidade ser reprovado 19 População É um conjunto completo de todos os elementos valores pessoas medidas etc a serem estudados Conjunto de elementos com determinada característica em comum cujas propriedades podem ser estudadas a partir de subconjuntos amostras Censo É uma coleção de dados relativos a todos elementos de uma população Amostra É um subconjunto de elementos extraídos de uma população A estimativa feita a partir da amostra será tão melhor quanto mais representativa ela for da população 20 Parâmetro É uma medida numérica que descreve uma característica de uma população Estatística ou Estimativa É uma medida numérica que descreve uma característica de uma amostra Inferência Estatística Se usa uma estatística amostral para o Discutir sobre a população a que esta amostra representa o Fazer uma afirmação sobre uma característica da população o Fazer um julgamento sobre uma característica da população 21 Contínuos Discretos Nominais Ordinais Qualitativos Quantitativos Dados Classificação dos dados 22 Numéricos Não numéricos QUALITATIVOS dados nominais ou categóricos ou atributos Nominais São nomes rótulos ou categorias Não podem estar dispostos num esquema ordenado Ordinais São dados que podem estar dispostos em alguma ordem mas diferenças entre os valores não podem ser determinadas Cor de carros vermelha preta e branca Classificação numa corrida 1º 2º e 3º lugares Classificação dos dados 23 QUANTITATIVOS dados numéricos que representam contagens ou medidas Discretos Resultam de um conjunto finito de valores possíveis sendo dados normalmente inteiros Representam contagens Contínuos Resultam de um conjunto infinito de valores que podem estar associados numa escala contínua Representam mensurações Número de falhas de cada máquina da produção Medidas do peso dos alunos desta sala Dados de uma mesma população podem originar diferentes tipos de dados Natureza dos dados Alunos 2º grau idades pesos nº de alunos menino menina 2º grau Automóveis velocidade Kmh nº defeitos carro cores de carro número da placa do carro grau de limpeza Vendas de imóveis valor Cr Nº ofertas acima do preço de mercado muito dispendioso Populações Contínuo Discreto Nominal Ordinal ou por postos Classificação dos dados 24 12012024 5 MEDIDAS ESTATÍSTICAS 25 Uma boa caracterização de um conjunto de dados necessita de Três informações medidas Dispersão dos dados Distribuição dos dados forma Posição centro dos dados 26 MEDIDAS ESTATÍSTICAS MEDIDAS DOS DADOS Amplitude Variância Desvio padrão Coeficiente de variação Desvio médio absoluto Escore Z DISPERSÃO 27 Quartis Decis Percentis SEPARATRIZES Média Mediana Moda POSIÇÃO tendência central Achatamento curtose Assimetria coeficiente de assimetria FORMA Medidas de posição tendência central Média Mediana Moda Media aritmética Média ponderada 28 É a mais importante das medidas de tendência central Pode ser sempre calculada Para um dado conjunto de números a média é única É sensível a ou afetada todos os valores do conjunto Somandose ou reduzindose uma constante a cada valor do conjunto a média ficará aumentada ou reduzida dessa constante µx k µx k Multiplicandose ou dividindose cada valor do conjunto por uma constante a média ficará multiplicada ou dividida por essa constante µx k µx k µx k µx k µx y µx µy e µx y µx µy só se x e y forem independentes 29 Média aritmética Exercício Um estudante fez quatro provas e obteve as notas 83 94 95 e 86 a sua nota média é 4 895 83 94 95 86 x Fórmula para cálculo ou x i n i 1 n n x x x 30 Média aritmética 12012024 6 A soma dos desvios dos dados de um conjunto a contar da média é zero É conhecida como o centro de gravidade do conjunto de valores Imagine os dados 2 3 e 4 A média é 3 2 4 3 1 1 31 Média aritmética Cada elemento do conjunto pode ter importância diferente peso Neste caso o cálculo da média deve levar em conta os pesos desiguais de cada elemento Exercício O colégio definiu que as provas mensais teriam peso de 30 e a prova final teria peso de 40 no cálculo dos rendimentos dos alunos Veja o quadro abaixo e calcule a média do aluno 80 030 030 Mês 2 90 96 Exame Nota Peso Mês 1 Final 040 MP 03 x 80 03 x 90 04 x 96 03 03 04 894 32 Média ponderada W peso importância de cada elemento X valor de cada elemento i 1 n n W i W i X i i 1 X p 33 Média ponderada Divide um conjunto de dados ordenados em dois grupos iguais É mais usada para as situações nas quais os conjuntos de dados é mais desviado ou assimétrico Dado o conjunto de 11 dados 3 7 5 5 1 9 15 13 11 13 17 Calcule a mediana Exercício 5 dados 5 dados MD 9 11 13 13 15 17 Conjunto dados ordenados 1 3 5 5 7 9 34 X Mediana MD ou Conjunto de valores pares n par MD Valor da posição n2 Posição n 2 1 Valor da 2 Conjunto de valores impares n impar MD Valorposição n 1 2 35 Mediana MD ou X Média aritmética Mediana X Dados fortemente desviados ou com distrib assimétrica A média de 6014 não sintetiza razoavelmente o conjunto de dados Nos dois casos a mediana é 300 Para o segundo caso a mediana representa melhor o conjunto de dados Num conjunto de dados fortemente desviado a mediana é uma medida mais representativa distribuição de rendas folha de pagamentos 36 Salário dos funcionários 7 345 7 200 250 250 300 450 460 510 x 200 250 250 300 450 460 510 ෨𝑋 300 Salário dos funcionários 200 250 250 300 450 460 2300 4 601 7 2300 460 450 300 250 250 200 x ෨𝑋 300 Dados não muito desviados ou com distrib simétrica Média de 3457 representa bem o centro do conj de dados 12012024 7 Exercício Dado o conjunto de dados 10 10 11 14 15 16 17 18 18 Calcule a moda Os valores de maior frequência são 10 e 18 que aparecem duas vezes logo MO 10 e 18 A moda é constituída de dois valores MO 10 e 18 duas vezes cada 37 Moda MO É o valor ou classe de maior freqüência num conjunto de dados pode não existir pode não ser única Exercício Pesquisa entre estudantes revelou que os eletroeletrônicos mais comuns são TV 84 Vídeo cassete 76 CD player 60 Vídeo game 39 DVD 35 Como as TVs são mais frequentes dizemos que a moda é a categoria TV 38 Moda MO 9 Decis divide o conjunto de dados em 10 partes 99 Percentis divide o conjunto de dados em 100 partes Q1 Q2 Q3 D9 D5 D1 P75 P10 P50 P90 Q1 P25 Q2 P50 D5 Q3 P75 D1 P10 D5 P50 D9 P90 3 Quartis divide o conjunto de dados em 4 partes 39 Quartis Decis e Percentis Q3 75 serão inferiores ao terceiro quartil Q3 e 25 serão superiores ao terceiro quartil Os 3 quartis dividem o conjunto de dados ordenados ordem crescente em 4 partes iguais Q1 25 dos valores serão inferiores ao primeiro quartil Q1 Q2 50 serão inferiores ao segundo quartil Q2 mediana 2 3 5 8 9 12 13 15 Q1 40 Q2 85 Q3 125 Q1 Q2 Q3 Fórmula 40 85 1250 Excel 45 85 1225 MINITAB 35 85 1275 Q3 Q1 Distancia interquartil 40 Quartis Quartis Decis e Percentis Há 9 decis denotados por D1 D2 D3 D9 que dividem os dados ordem crescente em 10 grupos com cerca de 10 deles em cada grupo Percentis Há 99 percentis que dividem os dados ordem crescente em 100 grupos com cerca de 1 em cada grupo Exemplo 76 dos valores num grande conjunto de dados serão inferiores ao 76º percentil 41 Decis Quartis Decis e Percentis 42 Quartis Decis e Percentis Início L é um número inteiro Ordene os dados do menor para o maior O valor do Késimo percentil está no meio do caminho entre o Lésimo valor e o valor seguinte do conjunto ordenado de dados Ache Pk somando o Lésimo valor e o valor seguinte e dividindo o total por 2 O valor de P é o L ésimo valor contado a partir do menor dado Mude L arredondandoo para o primeiro inteiro maior que ele Calcule n nº de valores k percentil em questão onde k n L 100 Como calcular quartis decis e percentis Sim Não L posição do percentil desejado Não há concordância universal sobre o procedimento para determinação dos quartis 12012024 8 0 1 1 3 17 32 35 44 48 86 87 103 112 121 123 130 131 149 164 167 173 173 198 208 210 222 227 234 245 250 253 265 266 277 284 289 290 293 477 491 Exercício Considere os 40 dados abaixo relativos aos níveis de Cotinina para fumantes Calcule o percentil 68 P68 L 68 40100 272 Como L não é inteiro devese arredondálo para 28 L 28 corresponde ao valor 234 Logo P68 234 Q1 P25 k 25 e n 40 L 25 40100 10 Como L é um número inteiro devese tomar a metade de L e L1 L 10 valor 86 e L1 11 valor 87 logo 8687 2 865 P25 Q1 865 Calcule o percentil Q1 P25 k n L 100 L posição do percentil desejado L não inteiro arredonda p inteiro superior L é inteiro média de L e L1 K percentil desejado 43 Quartis Decis e Percentis Medidas de dispersão Range amplitude ou intervalo R Desvio médio absoluto DMA Variância σ2 ou s2 e desvio padrão σ ou s Coeficiente de variação CV Escore Z 44 A medida de dispersão mede o quão próximo uns dos outros estão os valores do grupo pequena dispersão grande dispersão Amplitude ou range é expresso pela diferença entre o maior e o menor número num grupo ou pela identificação desses dois números números intervalo diferença 1 5 7 13 14 3 17 4 8 73 36 48 3 2 4 7 5 6 2 1 1 9 10 3 13 1 12 73 3 70 103 19 84 45 Amplitude range ou intervalo R LIMITAÇÃO só leva em conta os dois valores extremos do conjunto de dados nada informando sobre os outros valores Range 1 2 3 distribuição uniforme o intervalo é uma boa medida é uma medida apenas razoável é uma medida ruim da dispersão 46 Amplitude range ou intervalo R DMA xi x n Conquanto o desvio médio absoluto seja fácil de entender não é muito usado como medida de dispersão porque outras medidas apresentam propriedades matemáticas mais interessantes O DMA apresenta algumas aplicações no controle de inventários 47 Desvio Médio Absoluto Exercício Calcule o DMA do conjunto de dados 2 4 6 8 10 X 2 4 6 8 10 5 6 DMA 4 2 0 2 4 5 24 DMA Xi X n Xi X 2 6 4 4 6 2 6 6 0 8 6 2 10 6 4 0 48 Desvio Médio Absoluto 12012024 9 A Variância é uma medida de dispersão muito utilizada σ2 ΣXi μ 2 N s2 ΣXi X 2 n 1 Variância de uma população Variância de uma amostra 49 Variância 50 Exercício Calcule a variância da amostra 2 4 6 8 10 Variância Se esses valores fossem de uma população a variância seria 405 8 σ2 8 xi 2 4 6 8 10 Média 6 xbarra 6 6 6 6 6 xi xbarra 4 2 0 2 4 xi xbarra2 16 4 0 4 16 Soma 0 40 Desvio Desvio2 40 2 x xi 10 5 1 40 1 2 2 n xi x S Propriedades da Variância 1 A variância de uma constante é nula 2k 0 2 Se multiplicarmos todos os valores de uma variável aleatória por uma constante sua variância fica multiplicada pelo quadrado da constante 2kx k2 2x 3 A variância de uma soma ou diferença de variáveis aleatórias independentes é igual à soma das variâncias dessas variáveis 2x y 2x 2y 4 Se somarmos ou subtraímos uma constante aos valores de uma variável aleatória sua variância permanece inalterada 2x k 2x 51 Variância O desvio padrão é mais comumente usado porque se apresenta na mesma unidade da variável em análise Assim se a unidade da variável for kg o desvio padrão também será kg Isso não acontece com a variância É a raiz quadrada positiva da variância Desvio padrão de uma população Desvio padrão de uma amostra σ Σxi μ2 N s Σxi x2 n 1 52 Desvio padrão O desvio padrão é a medida de dispersão mais usada O desviopadrão cresce quando a dispersão dos dados aumenta 1 2 3 4 5 6 7 s 08 1 2 3 4 5 6 7 s 10 1 2 3 4 5 6 7 s 3 4 conjuntos de 7 dados amostrais 1 2 3 4 5 6 7 s 0 7 6 5 4 3 2 1 0 53 Desvio padrão µx 6000 mm σx 25 mm µy 3000 mm σy 15 mm Qual o comprimento médio dos tubos após a junção Qual o desvio padrão dos tubos após a junção União dos dois tubos Devese unir duas peças de cano provenientes de distribuições distintas de médias de 6000 mm e 3000 mm respectivamente e desvios padrão de 25 e 15 mm respectivamente 54 Desvio padrão 12012024 10 ATENÇÃO Desvios padrão nunca se somam somente as variâncias são aditivas Esta propriedade é válida se os dados são independentes σy 15 σx 25 252 152 σx y 292 mm Cálculo do desvio padrão resultante σ2 xy σ2 x σ2 y σ2 x σ2 y σ xy µy 3000 mm µx 6000 mm Cálculo da média resultante 6000 3000 9000 mm μxy 55 Desvio padrão μxy μx μy σx σy σ xy ATENÇÃO É a relação entre o desvio padrão e a média do conjunto de dados Nos dá a ideia do tamanho do desvio padrão em relação à média Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável É uma medida de dispersão relativa É muito útil para comparar a dispersão de dois ou mais conjuntos de dados CV S x 100 σ CV µ 100 ou amostra população 56 Coeficiente de variação Exercício 1 Considere dois conjuntos de dados Calcule coeficiente de variação de cada conjunto 57 μ σ Dados X 100 15 Dados Y 1000 20 CV 1500 200 Coeficiente de variação CVX 15 100 x 100 15 CVY 20 1000 x 100 2 O conj de dados X apesar de ter o menor desvio padrão 15 ele tem maior dispersão relativa à sua média 15 enquanto o conj de dados Y tem apenas 2 apesar de ter maior desvio padrão 20 O escore padrão ou escore Z representa o número de desvios padrão que separa um valor x da média do conjunto de dados Z Valor x Média μ Desvio padrão σ x μ σ 58 Escore padrão Z 29 1 7 161 152 az Solução O valor de x 161 está 129 desvios padrão acima da média O valor de x 148 está 057 desvios padrão abaixo da média O valor de x 152 é a própria média Exercício Em um concurso público as pontuações tiveram uma média de 152 e desvio padrão de 7 Calcule o escore z para um candidato com uma pontuação de a 161 b 148 c 152 0 7 152 152 cz 57 0 7 148 152 bz 59 Escore padrão Z Exercícios 60 12012024 11 1 Escolha quatro números entre os números inteiros de 0 a 10 podendo repetir que tenha o menor desvio padrão possível 2 Escolha quatro números entre os números inteiros de 0 a 10 podendo repetir que tenha o maior desvio padrão possível 0 0 0 0 1 1 1 1 2 2 2 2 10 10 10 10 0 0 10 10 3 Um relatório diz que o débito mediano em cartões de crédito das famílias brasileiras é zero Sabemos que muitas famílias têm grandes quantias de débito em cartões de crédito De fato o débito médio em cartões de crédito por família é 200000 Explique como o débito mediano pode ainda assim ser zero 0 0 0 0 0 0 3000 3500 4500 5500 5500 média 2000 e mediana 0 Isto se explica pelo fato de a maioria da população não ter cartão de crédito débito zero 61 Ex n 11 famílias 4 Qual é a variância de uma população da qual se tira a amostra 16 17 18 20 22 mm 5 A média seja de uma distribuição discreta ou contínua sempre pode ser visualizada como a O ponto onde 50 dos valores estão no lado esquerdo e 50 estão do lado direito b Seu centro de gravidade c O ponto onde a maioria dos valores da distribuição ocorre d É sempre maior que o desvio padrão 62 X Xbarra X Xbarra X Xbarra2 16 186 260 676 17 186 160 256 18 186 060 036 20 186 140 196 22 186 340 1156 média 186 soma 0 2320 Var X 2320 51 Var X 580 mm2 Divide por n1 amostra 6 Qual das seguintes medidas estatísticas de variabilidade não é dependente do valor exato de cada medida a Desvio padrão b Variância c Range ou amplitude d Coeficiente de variação 7 Considere os dados amostrais de dois atletas e calcule os CVs para cada atleta Qual atleta apresentou dados mais homogêneos maior regularidade Atleta de 100 m rasos segundos 9 10 11 8 9 Atleta de salto triplo metros 178 181 184 150 165 63 O atleta do salto triplo foi mais regular mais homogêneo menor dispersão relativa 100 m 9 10 11 8 9 Salto triplo 178 181 184 15 165 Média Desvio p 94 114 1716 141 CV 1210 820 9 Sendo µx 10 σx 2 e µy 17 σy 48 Z X Y Calcule µZ e σZ 10 Sendo µx 10 σx 2 e µy 17 σy 48 Z 4X 2Y Calcule µZ e σz 64 SÍNTESE GRÁFICA DE DADOS 65 O nosso cérebro tem muito mais facilidade de processar as informações apresentadas na forma gráfica Um grande conjunto de dados forma bruta precisa ser sintetizado na forma numérica eou tabular eou gráfica para facilitar a sua visualização entendimento e tomada de decisão com base nos dados 66 12012024 12 25 23 30 29 31 23 24 25 29 23 30 24 26 26 28 24 24 25 25 29 23 25 25 26 26 23 25 26 26 29 27 26 26 27 28 30 30 26 25 23 24 23 28 27 25 25 24 25 29 29 26 26 25 24 30 28 28 29 28 26 Olhando para o conjunto de 60 dados o que podemos concluir sobre ele É muito difícil tirar qualquer conclusão sobre os dados 67 Distribuição de frequência É um agrupamento de dados em classes exibindo o número ou percentagem de observações em cada classe Uma distribuição pode ser apresentada em forma gráfica ou tabular Entendimento do comportamento dos dados Síntese numérica medidas de centro separatrizes dispersão e forma Síntese gráfica ou tabular Tabela de distribuição frequência Histograma 68 Safra anual de 40 pessegueiros Kg árvore 111 125 324 78 210 164 112 223 44 61 275 328 185 164 151 60 107 158 250 182 122 126 47 235 148 226 160 191 74 92 100 262 35 162 145 32 81 129 191 137 O conjunto de dados abaixo embora pequeno não permite uma visão global da safra A distribuição de frequência facilitará a visualização e entendimento Distribuição de frequência 69 Etapas para construção 1 Determinar o intervalo dos dados 2 Determinar o número K de classes 3 Calcular a amplitude da classe 4 Estabelecer limites de classes preliminares Rever os limites que devem tocarse mas não interceptase 5 Relacionar os intervalos e fazer a contagem dos pontos por classe a contagem total dever ser igual a n 6 Construir uma tabela de frequência ou histograma de frequência Distribuição de frequência para dados contínuos 70 1 Determinar o intervalo dos dados 2 Determinar o número K de classes 40 632 No caso dos pessegueiros n 40 logo É aconselhável tomar entre 5 a 20 classes Regra prática K Ajustála se for necessário Maior prod é 328 Menor prod é 32 n 71 900 30 Adotase K 20 Por ex n 900 Distribuição de frequência para dados contínuos Intervalo 328 32 296 328 32 que pode ser arredondado para 6 ou 7 adotado k 6 6 classes 296 3 Calcular a amplitude da classe Amplitude intervalo total nº de classes k Amplitude 296 6 494 5 4 Estabelecer limites de classes preliminares Rever os limites que devem tocarse mas não interceptarse Começando com o primeiro inteiro logo abaixo do menor valor do conjunto de dados Amplitude 5 Certifiquese que k vezes a amplitude é maior que o intervalo pois de outra forma os valores extremos não serão incluídos 5 6 30 30 296 ok 72 Distribuição de frequência para dados contínuos 12012024 13 6ª classe 28 5 33 5ª classe 23 5 28 4ª classe 18 5 23 Considerar os intervalos como 3 a 8 ou 3 8 8 a 13 ou 8 13 28 a 33 ou 28 33 13 a 18 ou 13 1 8 23 a 28 ou 23 28 18 a 23 ou 18 23 1ª classe 3 5 8 2ª classe 8 5 13 3ª classe 13 5 18 73 Distribuição de frequência para dados contínuos limite inferior limite superior Amplitude da classe Classe É importante que não ocorra lacunas na fixação das classes todo valor deve estar enquadrado em uma classe As classes não devem interceptarse um valor deve pertencer a só uma classe A amplitude é igual para todas as classes 74 Distribuição de frequência para dados contínuos 5 Relacionar classes e fazer a contagem dos pontos por classe a contagem total dever ser igual a n 75 Classe Contagem 3 a 8 8 a 13 13 a 18 18 a 23 23 a 28 28 a 33 8 10 9 7 4 2 Total n 40 Frequência Distribuição de frequência para dados contínuos 6 Construir uma tabela de frequência ou histograma de frequência Produção Número de árvores Percentagem de árvores 3 a 8 8 a 13 13 a 18 18 a 23 23 a 28 28 a 33 8 10 9 7 4 2 240 0050 740 0175 940 0225 1040 0250 840 0200 440 0100 totais n 40 100076 Frequência absoluta Frequência relativa Distribuição de frequência para dados contínuos Distribuição de frequência relativa para a safra de pêssego No eixo vertical poderia ser frequência absoluta nº de árvores Histograma frequência Classes de produção 3 8 13 18 23 28 33 000 010 020 030 77 Distribuição de frequência para dados contínuos Distribuição de frequência agrupada Perdas de informação Certa quantidade de informação é perdida porque os valores individuais perdem sua identidade quando são grupados em classes Para dados discretos isto também pode ocorrer dependendo da natureza dos dados e do objetivo do analista Distribuição de frequência para dados discretos 78 12012024 14 Nº de acidentes diários num grande estacionamento 6 9 2 7 0 8 2 5 4 2 5 4 4 4 4 2 5 6 3 7 3 1 8 4 4 4 7 7 6 5 4 7 5 3 7 1 3 1 0 6 5 8 2 3 6 0 5 6 6 3 Considere o exemplo abaixo onde estão 50 dados discretos inteiros de 0 a 9 Construa a distribuição de frequência tabela e gráfico 79 Distribuição de frequência para dados discretos Podemos construir a distribuição de frequência sem perda dos valores originais utilizando os inteiros de 0 a 9 Classe nº acidentes Número de dias Percentagem de dias 0 Sem perda de informação 1 2 3 4 5 6 7 8 9 3 3 5 6 9 7 7 6 3 1 006 006 010 012 018 014 014 012 006 002 Soma 50 dias 80 Freq absoluta Freq relativa Distribuição de frequência para dados discretos Classe nº de acidentes Número de dias Percentagem de dias 0 1 2 3 4 5 6 7 8 9 6 11 16 13 4 012 022 032 026 008 50 100 totais Com perda de informação 81 Podemos construir a distribuição de frequência com perda dos valores originais fazendo agrupamentos Freq absoluta Freq relativa Distribuição de frequência para dados discretos Comparação de duas distribuições de frequência 0 1 2 3 4 5 6 7 8 9 4 acidentes por dia ocorreram 9 vezes 18 a Sem perda de informação 20 15 10 5 01 23 45 67 89 b Com perda de informação 20 15 10 5 82 Distribuição de frequência para dados discretos Nº de acidentes Nº de acidentes Dados discretos A frequência acumulada tem por objetivo indicar o número ou percentagem de itens menores do que ou iguais a determinado valor PX x ou PX x Podemos construir a distribuição de frequência acumulada sem perda dos valores originais do exemplo anterior utilizando os inteiros de 0 a 9 ou com perda fazendo agrupamentos Distribuição de frequência acumulada 83 Classes nº de acidentes 0 1 2 3 4 5 6 7 8 9 Freq absoluta dias 3 3 5 6 9 7 7 6 3 1 Sem perda de informação Dados discretos Distribuição de frequência acumulada Soma 50 6 Freq acumulada dias 3 17 11 33 26 46 40 49 Frequência acumulada 006 006 006 006 012 012 022 034 018 034 052 014 052 066 014 066 080 012 080 092 006 092 098 002 098 100 010 012 022 84 12012024 15 Classe nº de acidentes 0 1 2 3 4 5 6 7 8 9 6 11 16 13 4 012 012 022 012 034 032 034 066 026 066 092 008 092 100 50 totais Com perda de informação Dados discretos Frequência absoluta dias Frequência acumulada Distribuição de frequência acumulada 85 Dados discretos 80 dos acidentes acorreram 6 vezes por dia ou menos 0 1 2 3 4 5 6 7 8 9 Com perda de informação 01 23 45 67 89 000 020 040 060 080 100 Sem perda de informação 000 020 040 060 080 100 Distribuição de frequência acumulada 86 Medidas da distribuição de frequência n número de elementos do conjunto de dados ci centro de cada classe de frequência fi frequência de cada classe ci X fi i 1 n n X fi i 1 n n xi com perda de informação sem perda de informação xi valor individual de cada elemento do conjunto de dados 87 Média Li limite inferior da classe que contém a mediana n número de elementos do conjunto de dados Fa soma das frequências das classes anteriores à que contém a mediana f md frequência da classe que contém a mediana hmd amplitude da classe que contém a mediana MD Li n 2 Fa hmd md f Medidas da distribuição de frequência 88 Mediana MD MO Li d 1 d 2 h d1 Li limite inferior da classe modal d1 diferença entre a frequência da classe modal e da classe imediatamente anterior d2 diferença entre a frequência da classe modal e da classe imediatamente seguinte h amplitude das classes Mo valor ou valores num conjunto de dados Medidas da distribuição de frequência 89 Moda MO Moda MO Determinação da moda num gráfico a sem perda b com perda moda classe modal Medidas da distribuição de frequência 90 12012024 16 Variância Na utilização da classe de frequência com perda de informação xi xc é o centro da classe de frequência O desvio padrão é a raiz positiva da variância mais complicada mais simples xi x 2 fi n 1 s2 s2 fi xi 2 fi xi 2 n n 1 ou Medidas da distribuição de frequência 91 Medidas de forma da distribuição de frequência Assimetria k coeficiente de assimetria skewness K 0 Normal Simétrica K 0 Negativamente desviada Assimétrica à esquerda K 0 Positivamente desviada Assimétrica à direita 92 moda mediana média média mediana moda moda mediana média Assimétrica à esquerda média e mediana estão a esquerda da moda Simétrica média moda e mediana coincidem Assimétrica à direita média e mediana estão à direita da moda Medidas de forma da distribuição de frequência 93 Assimetria Achatamento O coeficiente de achatamento Kurtosis é uma medida de planicidade flatness da distribuição 2 3 planicidade de uma curva normal mesocúrtica 2 45 curva bastante aguda leptocúrtica leptokurtosis 2 1 curva mais achatada platicúrtica platykurtosis Medidas de forma da distribuição de frequência 94 45 30 10 platícúrtica mesocúrtica leptocúrtica normal Medidas de forma da distribuição de frequência 95 Achatamento Os diagramas em caixa são convenientes para revelar tendências centrais dispersão distribuição de dados e presença de outliers valores extremos A mediana revela a tendência central A distância interquartil indica a dispersão dos dados O diagrama em caixa tem a vantagem de não ser tão sensível a valores extremos Não dão informações tão detalhadas quanto o histograma ou gráfico de ramo e folhas 96 Diagrama em caixa Box plot 12012024 17 Ordenase os dados 52 52 60 60 60 60 63 63 66 67 68 69 71 72 73 75 78 80 82 83 88 90 Exercício Construir o diagrama em caixa com os dados abaixo relativos à pulsação de 22 fumantes 60 52 68 69 73 60 80 90 82 52 60 63 83 60 60 66 72 75 67 63 71 78 Q1 P25 25100 x 22 55 arredondado para 6 logo Q1 60 Q2 mediana 685 Q3 78 Solução Valor mínimo 52 e valor máximo 90 685 78 60 90 52 97 Diagrama em caixa Box plot A melhor aplicação do diagrama em caixa é na comparação de dois ou mais conjuntos de dados é necessário usar a mesma escala Fumantes Não fumantes Pulsação 80 90 70 40 60 50 100 Não há diferenças substanciais nos dois conjunto de dados Os não fumantes têm mais valores extremos mas as medianas parecem coincidir A dispersão dos dados são parecidas 98 Diagrama em caixa Box plot No estudo dos valores outliers convém introduzir uma modificação na construção dos diagramas em caixa como segue a Calcular a diferença entre os quartis Q3 e Q1 distância interquartil denotandoa por D assim D Q3 Q1 b Desenhar normalmente a caixa com os quartis e mediana mas ao prolongar as retas que se partem da caixa caminhar apenas até os escores que estão a menos de 15D da mesma c Os outliers suaves são os valores que superam Q3 em 15D a 3D ou estão 15 a 3D abaixo de Q1 Marque os outliers suaves com pontos cheios d Os outliers extremos são escores que excedem Q3 em mais de 3D ou estão abaixo a mais de 3D de Q1 Marque os outliers extremos como pequenos círculos vazios 99 Diagrama em caixa Box plot Exemplo Construa o diagrama em caixa com conjunto de dados 3 15 17 18 21 21 22 25 27 30 38 49 68 Q1 1413 325 4º termo logo Q1 18 Q2 2413 65 7º termo logo Q2 22 Q3 3413 975 10º termo logo Q3 30 D Q3 Q1 12 D 12 15D 18 15D 18 3 38 18 22 30 Q1 Q3 Q2 outliers suaves outliers suaves 48 0 3D 3D 66 18 100 Diagrama em caixa Box plot outliers extremos outliers extremos 49 68 Exemplo Construa o diagrama em caixa com conjunto de dados 3 15 17 18 21 21 22 25 27 30 38 49 68 Q1 1413 325 4º termo logo Q1 18 Q2 2413 65 7º termo logo Q2 22 Q3 3413 975 10º termo logo Q3 30 D Q3 Q1 12 18 16 14 12 10 8 6 4 2 0 2 4 6 8 10 12 1 416 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 D 12 15D 18 15D 18 3 38 18 22 30 Q1 Q3 Q2 outliers suaves outliers suaves 48 0 3D 3D 66 18 101 Diagrama em caixa Box plot outliers extremos outliers extremos 49 68 Diagrama em caixa dos resultados das avaliações de Estatística nos campus de Ipatinga e BH 102 Diagrama em caixa Box plot 12012024 18 Salários de homens e mulheres de um grande banco americano Funcioná rios Qde Pessoas Mínimo Q1 Mediana Q3 Máximo 1 Mulheres negras 315 126410 171455 183540 203630 337030 2 Mulheres brancas 697 126410 184920 214920 255830 375130 3 Homens negros 81 147310 171550 184000 209720 326780 4 Homens brancos 162 126050 183433 220295 253020 366080 A tabela apresenta os dados de salários de homens e mulheres em um grande banco americano Faça um diagrama em caixa e tire conclusões 103 Diagrama em caixa Box plot 15000 20000 25000 30000 35000 Mulheres negras Mulheres brancas 40000 Homens brancos Homens negros 104 Diagrama em caixa Box plot Concentrese na parte da caixa que contem os quartis porque os extremos em um grande conjunto de dados muitas vezes são discrepantes Vemos ao mesmo tempo que os brancos tanto homens como mulheres tendem a ganhar mais do que os negros A renda mediana dos trabalhadores horistas brancos é maior que o terceiro quartil da renda dos negros Há apenas pequenas diferenças entre mulheres e homens dentro de cada raça Em termos legais os dados demonstram que políticas de remuneração têm impactos adversos sobre os negros O banco deve agora investigar se existe uma razão legítima para a diferença de ganhos entre brancos e negros tais como horas trabalhadas antiguidade ou classificação profissional 105 Diagrama em caixa Box plot Embora de menor interesse neste caso os boxplots também sugerem a simetria ou assimetria de distribuição Em uma distribuição simétrica o primeiro e terceiro quartis estão igualmente distantes a partir da mediana Na maioria das distribuições que são desviadas para a direita o terceiro quartil será mais acima da mediana do que o primeiro quartil é abaixo dela Os extremos se comportam da mesma maneira mas lembre se que eles são constituídos apenas de duas observações e pode dizer pouco sobre a distribuição como um todo especialmente se qualquer um deles é um valor extremo A figura sugere que as distribuições de salários são um pouco desviadas para direita para cima 106 Diagrama em caixa Box plot Reúne cinco informações importantes de um conjunto de dados Não dão informações detalhadas como os histogramas e diagramas de ramos e folhas São poderosos para comparar dois ou mais conjuntos de dados Aplicase em pequenos e grandes conjunto de dados 107 Diagrama em caixa Box plot Outlier ou valor discrepante é um valor que se localiza muito distante de quase todos os outros valores É um valor extremo Um valor outlier pode ser um erro ou um valor raro mas correto Um outlier pode afetar fortemente a média o desvio padrão e distorcer seriamente um histograma Outlier 108 Diagrama em caixa Box plot 12012024 19 Este diagrama é muito útil para apresentar um pequeno conjunto de dados até aproximadamente 20 dados Este gráfico nos permite rapidamente e facilmente ver a localização ou a tendência central e a variabilidade nos dados O conjunto de dados relativos à resistência de uma argamassa modificada em uma indústria de cimento 1685 164 1721 1635 1652 1704 1696 1715 1659 e 1657 argamassa modificada 160 165 170 175 180 resistência kgfcm2 Diagrama de pontos 109 É utilizado frequentemente para comparar dois ou mais conjuntos de dados Considere os dados de resistência de argamassa 1750 1763 1825 1800 1786 1775 1822 1790 1796 e 1815 argamassa modificada argamassa não modificada 160 165 170 175 180 185 resistência kgfcm2 Imediatamente verificase que a argamassa modificada apresenta resultados com valores menores de resistência A variabilidade dentro dos grupos é praticamente a mesma Também é possível ver a frequência dos dados Diagrama de pontos 110 Turma A Turma B 20 10 18 12 17 11 12 15 9 13 11 14 13 8 15 7 16 7 15 8 16 8 17 9 18 7 16 8 14 9 16 4 15 4 15 5 15 6 15 5 12 6 10 3 12 7 14 8 16 8 Minitab Diagrama de pontos 111 Turma A Turma B 20 10 18 12 17 11 12 15 9 13 11 14 13 8 15 7 16 7 15 8 16 8 17 9 18 7 16 8 14 9 16 4 15 4 15 5 15 6 15 5 12 6 10 3 12 7 14 8 16 8 Minitab Diagrama de pontos 112 A tabela de frequência e o histograma mostram a natureza da distribuição dos dados mas pode ocorrer perda de informação O diagrama de ramos e folhas mostra a natureza da distribuição do conjunto de dados sem perda de informação Os dados devem conter pelo menos dois dígitos Exemplo O dado 257 é dividido em duas partes a primeira parte 25 chamada de ramo é constituída pelo primeiro ou primeiro e segundo dígitos e a segunda parte 7 chamada de folha é constituído pelo dígito restante É usual escolher o número de ramos entre 5 a 20 Limitação não considera a temporalidade dos dados O tempo pode ser uma fator importante na variabilidade dos dados Diagrama de ramos e folhas 113 Resistência a compressão de uma liga de alumínio 54 dados 105 221 183 186 121 181 180 143 245 228 174 199 181 158 176 110 207 180 190 193 194 133 156 123 97 154 154 174 120 168 167 141 163 131 153 115 160 208 158 133 134 178 76 167 184 135 220 146 218 157 101 171 165 172 Diagrama de ramos e folhas 114 Ramos Folhas Frequência 7 6 1 9 7 1 10 1 5 2 11 0 5 2 12 0 1 3 3 13 1 3 3 4 5 5 14 1 3 6 3 15 3 4 4 6 7 8 8 7 16 0 3 5 7 7 7 8 7 17 1 2 4 4 8 5 18 0 0 1 1 3 4 6 7 19 0 3 4 9 4 20 7 8 2 21 8 1 22 1 8 9 3 24 5 1 12012024 20 Resistência a compressão de uma liga de alumínio 54 dados 105 221 183 186 121 181 180 143 245 228 174 199 181 158 176 110 207 180 190 193 194 133 156 123 97 154 154 174 120 168 167 141 163 131 153 115 160 208 158 133 134 178 76 167 184 135 220 146 218 157 101 171 165 172 Diagrama de ramos e folhas 115 Ramos Folhas Frequência 7 6 1 9 7 1 10 1 5 2 11 0 5 2 12 0 1 3 3 13 1 3 3 4 5 5 14 1 3 6 3 15 3 4 4 6 7 8 8 7 16 0 3 5 7 7 7 8 7 17 1 2 4 4 8 5 18 0 0 1 1 3 4 6 7 19 0 3 4 9 4 20 7 8 2 21 8 1 22 1 8 9 3 24 5 1 StemandLeaf Display F ruptura Stemandleaf of F ruptura N 100 Leaf Unit 10 1 17 6 2 18 7 3 19 7 6 20 058 9 21 045 13 22 0138 19 23 114555 26 24 2235688 37 25 00013447888 21 26 000012334455555577899 42 27 01124444566788 28 28 0000113367 18 29 0346899 11 30 0178 7 31 78 5 32 18 3 33 47 1 34 6 Força de ruptura de garrafas descartáveis de 1 litro de refrigerantes 100 dados 265 197 346 280 265 200 221 265 261 278 205 286 317 242 254 235 176 262 248 250 263 274 242 260 281 246 248 271 260 265 307 243 258 321 294 328 263 245 274 270 220 231 276 228 223 296 231 301 337 298 268 267 300 250 260 276 334 280 250 257 260 281 208 299 308 264 280 274 278 210 234 265 187 258 235 269 265 253 254 280 299 214 264 267 283 235 272 287 274 269 215 318 271 293 277 290 283 258 275 251 Minitab Diagrama de ramos e folhas 116 Diagrama de sequência ou temporal 117 Diagrama de sequência ou temporal 118 CONCEITOS BÁSICOS DE PROBABILIDADE 119 Qual é a probabilidade do GALO conquistar um TRI brasileiro ainda neste século Qual é a probabilidade dessa turma ser aprovada em QSND dado que os alunos fazem todos os exercícios Qual é a probabilidade dos políticos serem julgados e punidos aqui no Brasil Próxima de zero Mais de 90 Só Deus sabe 120 12012024 21 É a chance que alguma coisa um evento tem para ocorrer Exprime a chance de ocorrência de determinado evento NOTAÇÃO P denota probabilidade A B C denotam eventos específicos PA denota a probabilidade do evento A ocorrer A probabilidade pode ser expressa em fração decimal 0 a 1 ou percentagem 0 a 100 sendo 0 ou 0 a probabilidade de um evento impossível e 1 ou 100 a probabilidade de ocorrência um evento certo Conceitos de probabilidade 121 Exemplo Seja o evento A tirar um ás num baralho de 52 cartas logo a probabilidade de ocorrer o evento A é Conceitos de probabilidade Nº de possibilidades de interesse Nº total de possibilidades PA 4 ases existentes 52 cartas possíveis 4 00769 769 PA 52 122 Clássico Aplicase à situações que têm resultados igualmente prováveis Moeda equilibrada Pcara 1 2 Pcoroa 1 2 Dado perfeito Pqualquer face 1 6 Baralho sem vício P1dama 4 52 PA Número de resultados associados ao evento A Número total de resultados possíveis Conceitos de probabilidade 123 Empírica ou frequência relativa Aplicase à situações onde os resultados não são igualmente prováveis Moeda não equilibrada é claro que cara e coroa não são igualmente prováveis Fazse experimentos e obtémse os dados para estimar as probabilidades Exemplo Lançase uma moeda 100 vezes e obtémse 60 caras PA Número total de provas ou observações Número de ocorrências de A É razoável estimar a probabilidade de cara em jogada futura como sendo 60 100 060 Pcara Conceitos de probabilidade 124 S A Considere a experiência Lançar um dado São 6 resultados possíveis faces 1 2 3 4 5 e 6 Considere que você deseja apenas os resultados pares faces 2 4 e 6 Considere que você deseja apenas os resultados maiores que 4 faces 5 e 6 B Conceitos de probabilidade 125 Experimento Ação por meio do qual se obtém contagens medições ou respostas É uma experiência Exemplo Lançar um dado Extrair uma carta de um baralho de 52 cartas Contar carros brancos em frente à faculdade Empacotar caixas de leite de 1000 ml S Espaço amostral Conjunto de todos os resultados possíveis de um experimento e é designado pela letra S Conceitos de probabilidade 126 12012024 22 Evento É um subconjunto do espaço amostral Evento A Faces pares do dado Evento B Faces maiores que 4 Conceitos de probabilidade 127 A B S S Exercício Dois dados são lançados e os resultados são anotados 36 possibilidades 11 12 13 14 15 16 21 22 23 24 25 26 31 32 33 34 35 36 41 42 43 44 45 46 51 52 53 54 55 56 61 62 63 64 65 66 S Evento A a soma dê 4 Evento B a soma dê 11 Evento C a soma dê 4 ou 11 Conceitos de probabilidade A 132231 PA 336 B 5665 PB 236 C 1322315665 PC 536 128 Conceitos de probabilidade Aleatoriedade e probabilidade Acaso o comportamento ao acaso é imprevisível no curto prazo mas tem um padrão regular e previsível no longo prazo Exemplo uma moeda jogada uma vez pode dar cara ou coroa Não se sabe previamente o que pode ocorrer Mas uma moeda jogada um número muito grande de vezes sabese que 50 das vezes teremos cara e nos outros 50 teremos coroa Chamase um fenômeno de aleatório se os resultados individuais são incertos embora haja uma distribuição regular de resultados em um grande número de repetições A probabilidade de qualquer fenômeno aleatório é a proporção de vezes que o resultado ocorreria em uma série muito longa de repetições 129 Evento complementar A ou A ou Ac É todo evento do espaço amostral não pertencente ao evento A O complemento do evento A é o evento A que consiste em todos os resultados do espaço amostral que não estejam incluídos no evento A S A A PA 1 PA A A Conceitos de probabilidade 130 Espaço amostral área total 1 PA PB Evento B Evento A Diagrama de Venn Conceitos de probabilidade PA PA Espaço amostral área total 1 PA PA 1 A 131 Exercício A produção diária de carros é de 12 carros 5 dos quais são defeituosos Se um carro for selecionado ao acaso determine a probabilidade de que ele não seja defeituoso que seja bom Conceitos de probabilidade PB 1 512 712 0583 PD 512 PB 1 PD PB PD 1 D DEFEITUOSO B BOM Solução B B D B B B D D B B D D 1 2 3 4 5 6 7 8 9 10 11 12 12 carros 132 PB Nº carros bons Nº total carros ou PB 712 0583 12012024 23 Dois eventos A e B são mutuamente exclusivos se a ocorrência de um evento exclui a ocorrência do outro evento numa mesma tentativa Não existem elementos comuns entre eles A B PA e B 0 A Ter menos de 21 anos B Estar concorrendo ao senado da república do Brasil A B A Ter nascido em Ipaba B Ter nascido em Murici Eventos mutuamente exclusivos disjuntos Conceitos de probabilidade Exemplo 133 Se dois eventos podem ocorrer na mesma tentativa eles não são mutuamente exclusivos Existem elementos comuns entre eles A B PA e B 0 A B A Ter menos de 25 anos B Ser um advogado A Ter nascido em Cuba B Assistir o programa de Tom e Jerry na TV PA e B Exemplo Eventos não excludentes Conceitos de probabilidade 134 Dois eventos que não são independentes são dependentes Eventos dependentes um evento influencia a ocorrência do outro Uma planta crescer e regar planta frequentemente Estudar a matéria e tirar boas notas nas provas Conceitos de probabilidade 135 Eventos independentes a ocorrência de um evento não influencia a ocorrência do outro Num lance de dois dados o conhecimento do resultado de um deles em nada nos ajuda a predizer o resultado do outro Colocar um livro de matemática debaixo da cama e obter uma boa nota na prova não estão correlacionados Dois eventos são independentes se a probabilidade de ocorrência do evento B não for afetada pela ocorrência ou não ocorrência do evento A Conceitos de probabilidade 136 Exercício Dois dados são lançados Determine a probabilidade de sair 2 no segundo lançamento dado que no primeiro já saiu 2 Espaço amostral do 1º dado S 1 2 3 4 5 6 Espaço amostral do 2º dado S 1 2 3 4 5 6 Evento A Evento B Observe que a ocorrência do evento A em nada afeta a ocorrência do evento B e portanto os eventos são independentes Logo a probabilidade de tirar um 2 no 2º dado é 16 independentemente do resultado obtido no primeiro lançamento Conceitos de probabilidade PA 16 PA 16 2 2 137 Probabilidade da ocorrência de eventos simultâneos PA e B Regra da multiplicação A e B são independentes PA e B PA PBA não Probabilidade condicionada Probabilidade de ocorrer o evento B quando o evento A já ocorreu ATENÇÃO A B A e B A B Regra da multiplicação PA e B PA PB sim 138 PA e B PB PAB 12012024 24 Exercício Jogamse duas moedas equilibradas Qual é a probabilidade de ambas darem cara PA e PB obter ambas moedas com cara Logo PA e B PA PB x Regra da multiplicação Solução É razoável admitir que os resultados das duas moedas sejam independentes um do outro PA cara na 1ª jogada 1ª moeda PB cara na 2ª jogada 2ª moeda Pcara 1 2 1 2 1 2 1 2 1 2 1 4 Pcara e cara 139 Em 25 das vezes Manoel chega em casa tarde para jantar Por outro lado o jantar atrasa 10 das vezes Se não há qualquer relação entre os atrasos de Manoel e os atrasos do jantar qual é a probabilidade de ocorrerem ambos os atrasos Os eventos de atrasos são independentes Solução PA 025 atrasos do Manoel PB 010 atrasos do jantar PA e B PA PB 025 010 0025 25 PA e B Pambos atrasos Regra da multiplicação Regra da multiplicação 141 Simbolicamente se escreve PAB o que significa probabilidade de ocorrer o evento A tendo ocorrido o evento B ou supondo o evento B ou dado o evento B Exemplos Dentre três urnas com fichas brancas e vermelhas qual é Pficha vermelhaurna Z probabilidade de tirar uma ficha vermelha tendo sido definida a urna Z Numa bancada com máq elétricas e mecânicas novas e usadas qual é Pmaquina elétricanova probabilidade de tirar uma máquina elétrica sabendo que ela é nova Quando dois eventos são independentes o fato de sabermos que um deles ocorreu nada nos diz sobre a ocorrência do outro logo PAB PA e Um evento não afeta o outro evento PBA PB 142 Probabilidade condicionada ou condicional Exercício Dois carros são selecionados em uma linha de produção com 12 carros 5 deles defeituosos Qual é a probabilidade de o segundo carro ser defeituoso dado que o primeiro carro era defeituoso Probabilidade condicionada ou condicional 12 carros 7 carros bons 5 carros defeituosos 143 Solução Dado que um carro já foi selecionado defeituoso o espaço amostral condicional possui 4 defeituosos entre 11 carros existentes Logo PBA 411 Evento B 2º carro defeituoso dado que o evento A já ocorreu é Evento A primeiro carro defeituoso Probabilidade condicionada ou condicional PD 512 411 A probabilidade do 2º carro ser ou não ser defeituoso depende do 1º ser ou não defeituoso Os eventos são dependentes 144 Suponhamos duas urnas com fichas A urna Y contém 8 fichas vermelhas e 2 brancas A urna Z contém 5 vermelhas e 5 brancas Qual a probabilidade de escolher uma ficha vermelha e a urna Z que seja vermelha e seja a urna Z Vermelha Branca Total Urna Y 8 2 10 Urna Z 5 5 10 Exercício Probabilidade condicionada ou condicional Urna Y 10 fichas Urna Z 10 fichas V ficha vermelha B ficha branca Y urna Y Z urna Z Desejase PV e Z 145 12012024 25 Solução Desejase PV e Z A probabilidade de ocorrer uma ficha vermelha ou branca depende da urna escolhida portanto o evento cor da ficha depende do evento urna escolhida Eventos dependentes PV e Z PZ PVZ Probabilidade condicionada ou condicional Urna Z 10 fichas PV 510 Urna Y 10 fichas PV 810 PVZ 510 12 Qual é a probabilidade de tirar uma ficha vermelha na urna Z Qual é a probabilidade de tirar uma ficha vermelha na urna Y 146 PV e Z PZ PV Z 12 x 12 14 PY 12 escolher a urna Y PZ 12 escolher a urna Z PV escolher ficha vermelha PV Z 510 12 Desejase PV e Z PZ PV Z Regra da multiplicação 147 Probabilidade condicionada ou condicional Urna Z 10 fichas Desejase PV e Z PZ PVZ Probabilidade condicionada ou condicional Dado que a urna Z foi escolhida temos então 10 fichas para serem escolhidas Nesta urna temos 5 fichas vermelhas A probabilidade de escolhermos uma ficha vermelha é então PVZ 510 12 como pode ser visto na figura abaixo vermelha branca total Urna Y 8 2 10 Urna Z 5 5 10 Outra maneira de ver a probabilidade condicionada PVZ é usar a própria tabela para equacionar o problema 148 Exercício Perguntouse a uma amostra de pessoas adultas em três cidades se elas gostavam de um novo suco Ipatinga Iapu Dionísio Total Sim 100 150 150 400 Não 125 130 95 350 Não sabe 75 170 5 250 Total 300 450 250 1000 Uma das respostas é selecionada ao acaso Determine a PSim d PNão dado Dionísio b PIapu e PDionísio e não c PDionísio Probabilidade condicionada ou condicional 149 O evento Não depende de qual cidade é escolhida IPA PN 125300 IAPU PN 130450 Dionísio PN 95250 portanto são eventos dependentes Ipatinga Iapu Dionísio Total Sim 100 150 150 400 Não 125 130 95 350 Não sabe 75 170 5 250 Total 300 450 250 1000 e PDionísio e Não Solução Probabilidade condicionada ou condicional a Psim b PIapu c PDionísio d Pnão dado Dionísio Observe a linha pontilhada 400 1000 04 450 1000 045 250 1000 025 95 250 038 PDionísioPNãoDionísio 250100095250 0095 150 Dois carros são selecionados em uma linha de produção com 12 unidades sendo 5 deles defeituosos Determine a probabilidade de ambos serem defeituosos Evento B selecionar o 2º carro defeituoso dado que um carro já foi selecionado PBA 411 Solução Pedese PA e B PAB PA e B PA PBA 512 411 01515 PBA 411 Eventos dependentes Probabilidade condicionada ou condicional Evento A selecionar o 1º carro defeituoso PA 512 151 12012024 26 Regra da adição A e B são mutuamente excludentes PA ou B PA PB PA e B PA B PA PB A B Parcela subtraída pelo fato dos eventos A e B terem ocorrido ao mesmo tempo ATENÇÃO sim A B A ou B AB PA ou B PAB Pevento A ocorrer ou evento B ocorrer ou ambos ocorrem PA B Regra da adição não 152 P6 16 Paparecer o seis Qual a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado Solução Numa jogada de um dado ou aparece o cinco ou aparece o seis portanto são eventos mutuamente exclusivos P5 16 Paparecer o cinco Desejase P5 ou 6 P5 P6 P5 6 P5 P6 16 16 26 13 Regra da adição Regra da adição 153 Qual a probabilidade de extração de uma carta de copas ou uma carta de paus de um baralho de 52 cartas Solução Tirar uma carta de copas exclui a possibilidade de tirar uma carta de paus logo os eventos são mutuamente exclusivos PA 1352 tirar carta de copas Num baralho com 52 cartas temos 13 de copas 13 de paus 13 de ouros e 13 de espadas PB 1352 tirar carta de paus Desejase PA ou B PA PB PA B PA PB 1352 1352 2652 05 50 Regra da adição Regra da adição 154 Regra da adição Exercício Uma carta é tirada de um baralho Determine a probabilidade de ser um rei ou ser um naipe vermelho Evento B a carta é vermelha PB 2652 Tirar um rei e tirar uma carta vermelha são eventos independentes logo PA e B PA PB 452 2652 252 PA ou B PA PB PA e B PA ou B 452 2652 252 2852 0538 Eventos não mutuamente excludentes p p v v v v v v v v v v v v v v A 4 cartas B 26 cartas v Regra da adição Evento A a carta é um rei PA 452 Pedese PA ou B 155 Exercício Perguntouse a uma amostra de adultos em três cidades se eles gostavam de um novo suco Os resultados são apresentados na tabela de contingência a seguir Ipatinga Iapu Dionísio Total Sim 100 150 150 400 Não 125 130 95 350 Não sabe 75 170 5 250 Total 300 450 250 1000 Uma das respostas é selecionada ao acaso Determine a PDionísio e Sim b PDionísio e Iapu c PDionísio ou Sim d PDionísio ou Iapu Regra da adição 156 Solução d PDionísio ou Iapu Ipatinga Iapu Dionísio Total Sim 100 150 150 400 Não 125 130 95 350 Não sabe 75 170 5 250 Total 300 450 250 1000 Regra da adição a PDionísio e Sim 2501000 150250 015 eventos dependentes Psim depende de qual cidade é escolhida b PDionísio e Iapu eventos mutuamente excludentes 0 c PDionísio ou sim 2501000 4001000 1501000 05 eventos não mutuamente excludentes podem ocorrer simultaneamente eventos mutuamente excludentes 4501000 2501000 01000 07 PDPSD PD PIAPU PD PS PD e S PD e S PD PSD 2501000150250são dependentes 157 12012024 27 Se um evento pode ocorrer de m maneiras e um segundo evento pode ocorrer de n maneiras o número de maneiras pelas quais os dois eventos podem ocorrer em sequência é mn Essa regra pode ser estendida para qualquer número de eventos que ocorram em sequência Se uma refeição consiste de duas opções de sopa três pratos principais e duas de sobremesas quantas refeições diferentes podem ser compostas Início 2 3 Principal 2 Sopa Sobremesa 12 refeições Técnicas de contagem 158 Uma prova cuja resposta da questão seja V verdadeira ou F falsa quantos gabaritos podem ter se a prova tiver 1 questão 2 questões 3 questões 4 questões ou 5 questões FFV Qde gabaritos FFF FVF VVV VFV FVV VFF V F V F V F Diagrama de árvore VVF Técnicas de contagem Questão Nº1 Questão Nº2 Questão Nº3 2 8 possibilidades 2 2 V F V F V F V F 159 Técnicas de contagem Observe que o número de resultados possíveis cresce rapidamente e a dificuldade para enumerar os resultados também aumenta 4 Nº de questões Gabaritos possíveis Nº de gabaritos possíveis 3 1 V F 21 2 23 24 2 VV VF FV FF 22 4 8 16 VVV VVF VFF VFV FFF FVV FFV FFF VVVV VVVF VVFF VFFF 5 25 32 VVVVV VVVVF VVVFF VVFFF VFFFF 160 Exercício Qual a probabilidade de acertar o gabarito correto respondendo ao acaso quando a prova tiver 5 questões e 20 questões P5 125 1 32 00312 312 Como só precisamos do número de resultados possíveis usamos uma maneira simples de conhecer este número de resultados do experimento aplicando as técnicas de contagem PERMUTAÇÃO ARRANJO COMBINAÇÃO 5 questões 32 gabaritos possíveis 25 20 questões 1048576 gabaritos possíveis 220 Técnicas de contagem P20 1220 1 1048576 0000000954 00000954 161 Entre os tantos de gabaritos possíveis apenas um é certo De quantas maneiras você pode colocar n objetos em ordem Com base no princípio fundamental da contagem o número de maneiras em que n objetos podem ser arranjados é nn1n2n3 1 Essa expressão é chamada de FATORIAL e escrevese n Saiba que 0 1 e 1 1 Fatorial Técnicas de contagem Exemplo Seja n 5 logo fatorial de n é 5 5 x 4 x 3 x 2 x 1 120 n n1 n2 n3 1 162 Quando temos n elementos dispostos de n formas diferentes e a ordem dos elementos é importante utilizamos a permutação É um caso particular de arranjo Pn n Quando os n elementos podem ser de tipos diferentes temos número de permutações disposições diferentes que será dada por P n 1 n 2 n 3 n k n n1 n2 n3 n4 nk n Técnicas de contagem 163 Permutação 12012024 28 Temos 6 lápis de cores diferentes De quantas formas diferentes podemos ordenar os lápis Exercício Temos 6 lápis sendo 2 vermelhos 3 azuis e 1 branco De quantas formas diferentes podemos ordenálos n 6 n1 2 n2 3 e n3 1 P 6 2 x 3 x 1 60 formas diferentes Técnicas de contagem 720 maneiras V1 V2 A1 A2 A3 B1 V2 V1 A1 A2 A3 B1 Os lápis V1 e V2 foram trocados de posição e a disposição das cores não alterou n 6 P 6 6x5x4x3x2x1 720 maneiras diferentes 164 Permutação Considere três livros de cores diferentes Faça todos agrupamentos dos três livros dois a dois Verifique que o agrupamento verdelaranja é diferente do agrupamento laranjaverde A ordem diferente dos livros é importante pois propicia maneiras diferentes de dispor os livros Todas disposições precisam ser consideradas Isto configura um ARRANJO Logo temse 6 arranjos 1 2 3 4 5 6 165 Técnicas de contagem Arranjo Combinação Verifique que a reta AB reta BA que a reta AC reta CA e que a reta BC reta CB A ordem dos pontos não é importante pois de um jeito ou do outro propicia retas iguais portanto nem todas as retas devem ser consideradas Isto configura uma COMBINAÇÃO Logo temse 3 combinações possíveis Considere três pontos Trace todas retas possíveis A B C B C A C A B A C B C B A 166 Técnicas de contagem Arranjo Combinação Quando os n elementos estão agrupados em x formas diferentes e a ordem da disposição dos elementos é importante temos os arranjos É uma permutação na qual n número de elementos do experimento x tamanho do agrupamento n nx Anx Técnicas de contagem 167 O arranjo é uma permutação de subconjuntos de x elementos agrupamentos de x a x que podem ser selecionados a partir um conjunto de n elementos Arranjo Se há 7 cavalos em um páreo quantas disposições diferentes de cavalos há considerando 1º 2º e 3º lugares Imagine os cavalos A B C D E F G Os agrupamentos ABC ACB são agrupamentos diferentes pois o cavalo B no primeiro caso está em 2º lugar e no 2º caso está em 3º lugar logo a ordem é importante e está configurando um arranjo A73 7 73 7x6x5x4x3x2x1 4x3x2x1 210 Técnicas de contagem 168 Arranjo Você precisa ler cinco livros de uma lista de oito De quantas maneiras diferentes você pode fazêla Solução Imagine os livros A B C D E F G H 8 livros Podemos ler os livros das seguintes maneiras ABCDE ABCDF ABCDG As maneiras ACBED CABED DBCEA etc são diferentes da primeira à esquerda pois apesar de serem os mesmos livros a leitura é feita em ordem diferente A ordem dos livros é importante e portanto configurase um arranjo A85 8 85 8x7x6x5x4x3x2x1 3x2x1 6720 Há 6720 maneiras diferentes de ler cinco livros de uma lista de oito HGFAD Técnicas de contagem 169 Arranjo 12012024 29 Quando os n elementos estão agrupados em x formas diferentes e a ordem da disposição dos elementos NÃO é importante temos combinações de elementos Cn x n xnx n x nCx Técnicas de contagem 170 Combinação Imagine 3 pontos A B e C Quantas retas podemos fazer unindo dois pontos quaisquer Retas AB BA AC CA BC e CB como as retas BA e AB constituem uma única reta da mesma forma que AC e CA e BC e CB logo a ordem não é importante e as unidades repetidas não devem ser consideradas na contagem Esta situação configura uma combinação n 3 e x 2 C3 2 3 232 3 Técnicas de contagem 171 Combinação De quantas maneiras podemos formar um comitê de uma mulher e dois homens de um total de 4 mulheres e 6 homens Técnicas de contagem Desejase comitês de MHH 1 mulher e 2 homens Disponibilidade M1M2M3M4 H1H2H3H4H5H6 Do grupo de 4 mulheres podemos formar 4 comitês de 1 mulher C 141 4 1 4 4 M1 M2 M3 M4 H H H H H H H H 172 Combinação Do grupo de 6 homens podemos formar 15 comitês de 2 homens 62 2 C 6 2 6 15 Formando os comitês de 1 mulher e 2 homens temse 4 x 15 60 Técnicas de contagem H1H2 H1H3 H5H6 15 possibilidades M1 H1H2 H1H3 H5H6 15 vezes M2 H1H2 H1H3 H5H6 15 vezes M3 H1H2 H1H3 H5H6 15 vezes M4 H1H2 H1H3 H5H6 15 vezes 60 vezes C41 x C 6 2 173 Combinação Você precisa ler cinco livros de uma lista de oito De quantas maneiras você pode escolher os livros se a ordem não importa Se a ordem não importa a sequência ABCDE ABCED ABDCE ABDEC e todas suas variações constituem uma única maneira pois o texto disse que a ordem não importa logo configurase uma combinação Há 56 maneiras diferentes de ler cinco livros de uma lista de oito considerando que a ordem de leitura não é importante Técnicas de contagem 5x3x2x1 585 C 8 5 8 56 8x7x6x5 174 Combinação Técnicas de contagem 1 O projeto de um site na internet consiste em quatro cores três fontes e três posições para uma imagem Quantos projetos diferentes podem ser realizados Faça o diagrama de árvore 175 36 Da regra da multiplicação 4 3 3 36 projetos diferentes são possíveis 4 Cores 3 x Fontes 3 x Posições 12012024 30 Técnicas de contagem 2 Uma placa de circuito impresso tem oito localizações diferentes em que um componente pode ser colocado Se quatro componentes diferentes forem colocados na placa quantos projetos diferentes são possíveis A 8 4 8 84 1680 projetos possíveis 3 Um centro cirúrgico de um hospital necessita programar três cirurgias de joelho e duas cirurgias de quadris em um dia O número de sequências possíveis das três cirurgias de joelho e das duas cirurgias de quadris é Pn n 1 n 2 n n1 n2 5 3 X 2 10 jjjqq jjqjq jjqqj jqqjj jqjqj jqjjqqqjjj qjqjj qjjqj qjjjq 176 1 2 3 4 5 6 7 8 Observase que a ordem é importante Técnicas de contagem Amostragem sem Reposição Um silo com 50 itens fabricados contém três itens defeituosos e 47 itens não defeituosos Uma amostra de seis itens é selecionada Os itens selecionados não são repostos Quantas amostras diferentes existem de tamanho seis que contêm exatamente dois itens defeituosos B1B2B3B4 D1D2 Temse 47 itens bons para se escolher 4 itens sem repetir Assim temos uma C47 4 Temse 3 itens defeituosos para se escolher 2 itens sem repetir Assim temos uma C3 2 47 4 3 2 X 178365 x 3 535095 Amostras diferentes de tamanho 6 com exatamente 2 itens defeituosos B1B2B3B4B5 B47 47 itens bons 3 itens defeituosos D1D2D3 177 DISTRIBUIÇÕES DE PROBABILIDADES DISCRETAS 178 Variável aleatória Uma variável aleatória X é o resultado numérico de um experimento probabilístico X O número de pessoas num carro X Quantidade de metros cúbicos de gás comprados numa semana X O tempo que se gasta para ir da casa até a escola X O número de vezes que vai à escola por semana Exemplos 179 Variável aleatória contínua Variável aleatória contínua Variável aleatória discreta Variável aleatória discreta Variável aleatória Discreta Os possíveis resultados estão contidos em um conjunto finito ou enumerável Contínua Os possíveis resultados abrangem todo um intervalo de números reais 0 1 2 3 4 0 número de defeitos na pintura número de carros fabricados Ex Ex tempo de resposta do corredor pressão atmosférica ao nível do mar Variável aleatória 180 Identifique cada variável aleatória como discreta D ou contínua C Exercício Variável aleatória Número de pessoas em num carro Quantidade de metros cúbicos de gás comprados na semana O número de vezes que vai à escola por semana O tempo que se gasta para ir da casa até a escola Número de pessoas você conta 0 1 2 3 Você mede a quantidade de metros cúbicos de gás Você conta o número de vezes que vai à escola Você mede a quantidade de tempo D C D C 181 12012024 31 Distribuição discreta de probabilidades Em um levantamento realizado com várias famílias avaliouse a quantidade de veículos que elas possuíam X Px 0 0004 1 0435 2 0355 3 0206 Px 1000 X Número de veículos por família Distribuição de probabilidade é um gráfico uma tabela ou fórmula que dá a probabilidade para cada valor que a variável aleatória assume PROPRIEDADES DE UMA DISTRIBUIÇÃO Uma distribuição de probabilidade deve sempre atender aos dois requisitos abaixo Px 1 x assume todos valores possíveis 0 Px 1 para qualquer valor individual de x 182 Observe que 1 P0 P1 P2 P3 1 0004 0435 0355 0206 1 2 P0 P1 P2 e P3 estão todos entre 0 e 1 0004 0435 0355 0206 Os dois requisitos estão satisfeitos Número de veículos por família Px 0 1 2 3 0435 040 030 020 010 0004 0355 0206 Distribuição discreta de probabilidades 183 Distribuição discreta de probabilidades 184 Se o experimento for repetido muitas vezes Uma variável aleatória va pode assumir diversos valores e cada valor tem a sua probabilidade de ocorrer Então existe um valor médio destes valores um valor central que representa bem a distribuição Este valor chamase esperança da distribuição Ex Como os valores assumidos variam em torno do valor médio podese calcular a variabilidade da distribuição em torno da média variância σ2x e desvio padrão σx O valor médio valor esperado da distribuição deve ser entendido como o valor médio que a distribuição terá se o experimento for repetido um número infinito de vezes O valor médio ou valor esperado de uma variável aleatória discreta é designado por μ x ou Ex Distribuição discreta de probabilidades 185 Distribuição discreta Média μx Ex Σx Px Pi xi Variância σ2 x E2 Px Desvio padrão σ x E2 Px ou σ2 x2 PX µ2 Exercício Calcule a média valor esperado a variância e desvio padrão da distribuição de probabilidade do exercício anterior X nº de carros por família Quantidade de veículos por família Se o experimento avaliação da qte de veículos por famílias for repetido uma grande quantidade de vezes verifica se que o valor esperado média é de 1763 veículo por família Algumas famílias terão um pouco mais e outras terão um pouco menos mas a média será 1763 se este evento se repetir infinitas vezes Interpretação do resultado Distribuição discreta de probabilidades 186 Variância e Desvio padrão Desvio padrão σ x E2 Px 0601 0775 veículo Distribuição discreta de probabilidades 187 12012024 32 Exercício Você tem uma loja de eletrodomésticos e tem os seguintes registros históricos de vendas de refrigeradores Quantos refrigeradores se espera vender por dia em média a longo prazo Qual o valor esperado xi Número vendidodia Px frequência relativa 0 020 1 030 2 030 3 015 4 005 Calcule a média valor esperado a variância e o desvio padrão dessa distribuição Distribuição discreta de probabilidades Com base nos dados podese concluir que se trata de uma distribuição discreta 188 Distribuição discreta de probabilidades Xi Px xi Px x Ex x E2 x E2 Px Número vendidodia frequência relativa 0 02 0 155 240 048 1 03 03 055 030 009 2 03 06 045 020 006 3 015 045 145 210 032 4 005 02 245 600 030 Ex soma 155 Var xE2Px 125 Desvio padrão raiz q125 11 189 0 005 01 015 02 025 03 035 0 1 2 3 4 probabilidade de venda nº de refrigeradores vendidos Distribuição de probabilidades Uma distribuição de probabilidades é uma distribuição de frequências para os resultados de uma variável aleatória Uma distribuição de probabilidades dá a probabilidade de cada valor de uma variável aleatória Exemplo A probabilidade de vender refrigeradores de uma loja x Número vendidodia Px frequência relativa 0 020 1 030 2 030 3 015 4 005 Distribuição discreta de probabilidades 190 Propriedades do valor esperado e variância quando x e y forem variáveis independentes Item Valor esperado Ex Variância Vx 1 Ek k Vk 0 2 EX k EX k VX k VX 3 EkX kEX VkX k2VX 4 EXY EX EY DPkX kDPX 5 EXY EX EY VX Y VX VY Distribuição discreta de probabilidades 191 Propriedades do valor esperado e variância x px Distribuição de X Ex e Vx Distribuição de Z kX z pz Ex k e k2Vx Distribuição de Y X k Ex k e Vx px x Distribuição de X Ex e Vx Distribuição discreta de probabilidades Média ficou acrescida de k Variância não se alterou Média ficou multiplicada por k Variância ficou multiplicada por k2 y py k k Exemplo Y X k Exemplo Z kX 192 Para se ter uma distribuição de probabilidades é necessário PX 1 onde X toma todos valores possíveis 0 PX 1 para todo o X Envolvem distribuições de probabilidades de variáveis aleatórias relativas a dados que podem ser contados Número de ocorrências por amostras Número de ocorrências num intervalo de tempo Exemplo DSTRIBUIÇÕES DESCONTÍNUAS OU DISCRETAS Número nascimentos em um hospital Distribuição discreta de probabilidades 193 12012024 33 UNIFORME OU RETANGULAR BINOMIAL BINOMIAL NEGATIVA OU DE PASCAL GEOMÉTRICA POISSON MULTINOMIAL OU POLINOMIAL HIPERGEOMÉTRICA OUTRAS DESCONTÍNUAS OU DISCRETAS alguns exemplos Distribuição discreta de probabilidades 194 Processo de Bernoulli O experimento tem n provas Cada prova tem duas possibilidades sucesso e falha Cada prova é independente da outra A probabilidade de sucesso ou falha é constante para todas as provas A distribuição binomial é um processo de Bernoulli A distribuição hipergeométrica não é um processo de Bernoulli Distribuição discreta de probabilidades 195 Observe as variáveis Respostas de um teste do tipo V ou F Classificação de produtos Defeituoso e não defeituoso Notas fiscais com erro e sem erro Características observadas Todas variáveis tem apenas duas respostas Todos os dados gerados são nominais categorias não numéricos As categorias duas são mutuamente excludentes ou pertence a uma ou à outra categoria As categorias são coletivamente exaustivas só existem os dois resultados possíveis cuja soma da 100 BINOMIAL Distribuição de probabilidades Binomial 196 É comum referirse às duas categorias de uma distribuição binomial como SUCESSO E FRACASSO As observações de um experimento binomial são designadas por ensaios tentativas provas observações e pela letra n A probabilidade de sucesso é designada pela letra PS e obviamente a probabilidade de fracasso PF por 1 PS A quantidade de sucessos desejados em um experimento é designado por x e o de fracasso por n x Distribuição de probabilidades Binomial 197 n PS PF x n PS PF x Um teste de múltipla escolha tem oito questões cada qual com três alternativas uma delas correta Você quer saber qual a probabilidade de chutar certo exatamente cinco questões Determine os elementos do experimento binomial Um médico lhe diz que certa cirurgia é bem sucedida em 80 das vezes Se a cirurgia for realizada sete vezes você quer saber qual a probabilidade de ser bemsucedido em exatamente seis cirurgias Determine os elementos do experimento binomial Distribuição de probabilidades Binomial 8 13 23 5 7 080 020 6 198 Requisitos para se ter uma distribuição binomial 1 Há n tentativas ou provas idênticas 2 Cada tentativa deve ter todos os resultados classificados em duas categorias sucesso e fracasso 3 As probabilidades PS de sucesso e 1 PS de fracasso devem permanecer constantes em todas tentativas 4 Os resultados das tentativas são independentes um do outro o resultado de qualquer tentativa individual não afeta as probabilidades nas outras tentativas Distribuição de probabilidades Binomial 199 12012024 34 PSSSFF 025025025075075 02530752 000879 Determine a probabilidade de acertar exatamente 3 questões em cinco questões de uma prova que tem quatro opções sendo apenas uma certa n 5 x 3 PS ¼ 025 PF 1 025 075 Px 3 Uma vez que a ordem não importa qualquer combinação de três questões corretas entre cinco servirá SSSFF SSFSF SSFFS SFFSS SFSFS FFSSS FSFSS FSSFS SFSSF FSSSF 10 3 5 3 5 3 5 C PSFSFS 025075025075025 02530752 000879 Distribuição de probabilidades Binomial 200 Temos 10 possibilidades que interessam Cada uma dessas dez maneiras tem uma probabilidade de 000879 Px 3 10 0253 0752 10 000879 00879 Px Cn x PSx PFnx 0 001 5 0 015 4 0 088 3 0 264 0 75 2 0 25 5 2 5 0 75 0 25 2 0 396 0 75 5 1 0 25 1 5 0 75 0 25 1 0 237 0 75 0 0 25 5 0 5 0 75 0 25 0 3 2 5 2 2 2 5 4 1 5 1 1 1 5 5 0 5 0 0 0 5 P x P x x P C x P C x P C x P Distribuição de probabilidades Binomial 201 0237 0396 0264 0088 0015 0001 0 01 02 03 04 05 0 1 2 3 4 5 Probabilidades Valores da variável x Histograma binomial x Px 0 0237 1 0396 2 0264 3 0088 4 0015 5 0001 Distribuição de probabilidades Binomial 202 X Px 0 0237 1 0396 2 0264 3 0088 4 0015 5 0001 Qual é a probabilidade de se responder corretamente a duas ou quatro questões Distribuição de probabilidades Binomial Px2 ou Px4 Px2 Px4 Px3 Px3Px4Px5 Px 1 1 Px 0 Qual a probabilidade de se responder corretamente a pelo menos três questões Qual a probabilidade de responder corretamente a pelo menos uma questão Px2 Px4 0264 0015 0279 008800150001 0104 1 0237 0763 203 Px1 Px1Px2 Px3Px4Px5 Média Ex μ np Variância σ2 npq Desvio padrão σ npq Para o exercício anterior de respostas corretas no teste distribuição de probabilidade binomial temse Média Ex μ np 5 025 125 Variância σ2 npq 5 025 075 09375 Desvio padrão σ npq 09375 0968 Px Cn x PSx PFnx Distribuição de probabilidades Binomial Notação X Bn p 204 Exercício Distribuição de probabilidades Binomial 205 Em uma manufatura de interruptores elétricos que tem histórico de qualidade estabelecido em 2 2 defeituosos foram coletados 250 interruptores para inspeção Qual é a probabilidade de se encontrar na amostra a 100 de interruptores bons b Pelo menos dois interruptores defeituosos Distribuição binomial P100 bons Px 0 defeituoso Px 0 C250 0 0020 098250 00064 PPelo menos dois defeituosos Px 2 1 Px 0 Px 1 Px 0 00064 Px 1 C250 1 0021 098249 00327 PPelo menos dois defeituosos Px 2 1 0006400327 09609 PS PD 002 n 250 12012024 35 Exercício Distribuição de probabilidades Binomial 206 c Qual é a esperança da distribuição de interruptores defeituosos d Qual é o desvio padrão da distribuição de produtos defeituosos Ex np 250 x 002 5 Var x npq 250 x 002 x 098 49 Desvio padrão raiz quadrada da variância raiz q49 22 0 1 2 3 4 p 030 0 1 2 3 4 p 050 0 1 2 3 4 p 060 0 1 2 3 4 p 080 Distribuição binomial simétrica para p 050 desviada à direita para p 050 e desviada à esquerda para p 050 0 1 2 3 4 p 010 Exemplos de distribuições binomiais para n 4 e P variável μ np 4 x 05 2 σ npq 4 x 05 x 05 1 Distribuição de probabilidades Binomial 207 Defeitos por centímetro quadrado Acidentes por dia Clientes por hora que chegam a uma fila Chamadas telefônicas por minuto Erros tipográficos por página em um material impresso Ocorrências típicas do modelo de distribuição de Poisson O intervalo de medida é contínuo tempo área etc mas o número de ocorrências variável aleatória é discreta OBSERVAÇÃO A distribuição de Poisson é útil para descrever a probabilidade do número de ocorrências num campo ou intervalo contínuo tempo distância área volume etc Distribuição de probabilidades de Poisson 208 Defeitos num rolo de papel Chamadas telefônicas no período de tempo x x x x x amostra x defeito Porção de um rolo de papel chamada telefônica amostra tempo Distribuição de probabilidades de Poisson 209 Requisitos para se ter uma distribuição Poisson Distribuição de probabilidades de Poisson 1 A variável aleatória X é o número de ocorrências de um evento ao longo de algum intervalo contínuo 2 As ocorrências devem ser aleatórias 3 As ocorrências devem ser independentes umas das outras 4 As ocorrências devem ser uniformemente distribuídas sobre o intervalo em uso O número médio de ocorrências por unidade tempo intervalo λ é constante durante todo tempo intervalo considerado 210 Px x t tx e µ t logo A média é o parâmetro que caracteriza a distribuição de Poisson Px µx eµ x µ é a média de ocorrências no intervalo t taxa média por unidade t é o número de unidades ou intervalo x número de ocorrências ao longo de um intervalo Px probabilidade de ocorrer x ocorrências Média t Desvio padrão Variância média µ Distribuição de probabilidades de Poisson 211 Notação X Poisson ou X Po 12012024 36 Exercício Um processo produz tecido para tapetes com uma média de dois defeitos por jarda quadrada Determine a probabilidade de uma jarda quadrada ter exatamente um defeito admitindo que o processo possa ser bem aproximado por uma distribuição de Poisson µ 2 x 1 Px 1 e221 1 0135 x 2 1 0270 λ 2 defeitos por jarda quadrada t 1 jarda quadrada Distribuição de probabilidades de Poisson e2 0135 Px µx eµ x Px 1 212 μ λt x 1J2 2D 2D J2 λ t Exercício Navios chegam ao porto à razão de 2 navios por hora e essa razão é bem aproximada por um processo de Poisson Num período de meia hora determine a probabilidade de a Não chegar nenhum navio b Chegarem 3 navios Px 3 2 navios por hora t ½ hora µ λt 2 12 1 Px 0 e1 10 0 03679 Px 3 e1 13 3 00613 Distribuição de probabilidades de Poisson Px 0 e1 03679 Px 3 213 105e10 5 00378 Px 5 μX Ex 10 e VarX 10 Distribuição de probabilidades de Poisson Exercício Suponha que o número médio de carros que chegam no período de 15 minutos é10 Qual é a probabilidade de 5 chegadas em15 minutos Solução A probabilidade de um carro chegar é a mesma para quaisquer dois períodos de tempo de igual cumprimento A chegada ou não chegada de um carro em qualquer período de tempo é independente da chegada ou não chegada de um outro carro em qualquer outro período de tempo x número de carros que chegam em qualquer período de 15 minutos μ média de carros no período 10 A probabilidade de 5 chegadas em 15 minutos é dada por 214 Distribuição Binomial aproximada por Poisson Quando se deve fazer a aproximação da Binomial por Poisson Número n de observações é grande n 100 e np 10 regra prática Probabilidade de sucesso p está próxima de 0 ou 1 Porque fazer a aproximação por Poisson A distribuição binomial descreve adequadamente muitas situações de interesse A maioria das tabelas está limitada a n 20 A fórmula binomial pode exigir esforço substancial para obtenção de uma solução exata Distribuição de probabilidades de Poisson 215 Exercício Qual a probabilidade de haver 4 peças defeituosas numa amostra de 300 extraída de um grande lote onde há 2 de defeituosos P 002 próximo de zero n 300 muito grande Px 4 0024098296 P x 4 01338 4 300 µ np 300002 6 Px 4 e6 64 4 01339 Binomial Poisson Distribuição de probabilidades de Poisson 216 μ 1 μ 4 μ 10 Distribuição de probabilidades de Poisson 217 12012024 37 Utilizase a distribuição hipergeométrica em situações com dois ou mais resultados em que a probabilidade de sucessos varia de uma prova para outra extração sem reposição de uma população finita Px N r n N r n x r x N n Observações dependentes Quando a amostra é menor ou igual a 5 da pop fazse boa aproximação com a distribuição binomial n N 005 binomial Média Ex µ np p r N Variância Vx np 1p N n N 1 Distribuição de probabilidades Hipergeométrica População Amostra Tamanho N n Nº sucessos r x A probabilidade de se obter x sucessos em uma amostra de tamanho n retirada de uma população de tamanho N com r sucessos é 218 Notação X Hgeo r N n Exercício Numa caixa com 10 fusíveis 2 são defeituosos Extraída uma amostra de tamanho 4 qual a probabilidade de sair A nenhum defeituoso B 1 defeituoso C 1 ou menos defeituoso Temos N 10 r 2 e n 4 Distribuição de probabilidades Hipergeométrica A x 0 defeituoso todos bons na amostra BBBB PBBBB 8 10 7 9 6 8 5 7 1 3 03333 B B B B B B B D B D n 4 População N 10 Amostra BBBB 219 Exercício Usando a fórmula temos N 10 r 2 e n 4 10 2 4 1 2 1 B x 1 Px 1 0533 8 3 10 4 10 4 2 1 C x 1 Px 1 P0 P1 0333 0533 0866 Distribuição de probabilidades Hipergeométrica A x 0 Px 0 10 2 4 0 2 0 10 4 10 4 2 0 8 4 0333 220 Exercício Um grupo de 200 pedidos de empréstimos para automóveis contem 5 pedidos preenchidos incorretamente Uma amostra aleatória de 10 pedidos é retirada qual é a probabilidade de não encontrar pedidos preenchidos incorretamente Temos N 200 r 5 e n 10 e x 0 Distribuição de probabilidades Hipergeométrica Px 0 200 5 10 0 5 0 200 10 200 10 5 0 195 10 07717 Observe que a relação nN 10200 005 é igual a 005 assim uma distribuição hipergeométrica pode ser bem aproximada pela distribuição binomial Px 0 00250 097510 07763 10 0 221 PS rN 5200 0025 PF 10025 0975 Distribuições discretas resumo Item Distribui ção Fórmula Média Variância 1 Binomial 2 Poisson 3 Hipergeo métrica P S P F C n x x x n x P np E x npq V x x x P x e E x t x V Px N r n N r n x r x N n N nr E x 1 N n npq N x V 222 DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 223 12012024 38 UNIFORME OU RETANGULAR NORMAL BIVARIADA NORMAL EXPONENCIAL LOGNORMAL WEIBULL QUIQUADRADO 2 QTDE Alguns exemplos t DE STUDENT QTDE F DE SNEDECOR QTDE GAMA BETA ERLANG Distribuição de probabilidades contínuas 224 Variável aleatória Discreta Os possíveis resultados estão contidos em um conjunto finito ou enumerável Contínua Os possíveis resultados abrangem todo um intervalo de números reais 0 1 2 3 4 0 Número de defeitos em Tempo de resposta de Distribuição de probabilidades 225 Quando se usa as distribuições contínuas A variável aleatória em questão é contínua A variável aleatória discreta apresenta um grande número de resultados Os ponteiros de um relógio podem parar em qualquer dos infinitos pontos do círculo Distribuição de probabilidades n 2 n 4 n 8 n 100 12 14 18 1100 110000 n quase 1quase 050 025 0125 001 0000000 A probabilidade de parar em um ponto definido é zero n 10000 00001 226 Nas distribuições contínuas utilizamse a probabilidade da ocorrência em um intervalo Pa x b Em uma distribuição contínua a probabilidade é dada pela área contida no intervalo considerado Distribuição de probabilidades Variáveis aleatórias contínuas tempo de resposta de um sistema computacional resistência de um material Variáveis aleatórias discretas número de defeitos numa amostra de 5000 itens número de transações por segundo de uma CPU com grande número de possíveis resultados podem ser aproximadas para contínuas 227 As probabilidades de eventos associados a uma variável aleatória contínua X podem ser calculadas através da função densidade de probabilidade f que deve satisfazer e x f x 0 x fx a b 1 x d x f Se A a b então b a f x d x P A Distribuição de probabilidades Variáveis aleatórias contínuas 228 Importância da distribuição Normal Retrata com boa aproximação as distribuições de frequência de muitos fenômenos naturais e físicos Serve como aproximação das probabilidades binomiais quando n é grande Representa a distribuição das médias e proporções em grandes amostras o que tem relevante implicação na amostragem a mais importante Distribuição de probabilidades Normal 229 12012024 39 Um pouco de história No século XVIII astrônomos e outros cientistas observaram que medidas repetidas de mensurações como a distância à lua variavam como na figura quando coletadas em grande número Esta forma gráfica era associada aos erros de mensuração daí o nome de Distribuição normal dos erros e depois Distribuição normal É conhecida por Distribuição Gaussiana em função do modelo matemático desenvolvido por Karl F Gauss Distribuição de probabilidades Normal 230 133 137 141 145 149 153 157 161 165 169 Altura de universitárias n 3000 µ 152 cm σ 5 cm 25 40 55 70 85 100 115 020 015 010 005 000 Peso da população adulta n 5000 µ 75 kg σ 12 kg Distribuição de probabilidades Normal 000 005 020 010 015 231 Uma indústria de metalurgia realizou um levantamento da espessura de 10000 arruelas de bronze e apresentou a tabela de frequência e o histograma correspondente conforme mostrado abaixo A medida da espessura está em polegadas 1 polegada 254 cm Distribuição de probabilidades Normal 00203 00048 4810000 00048 00202 a 00204 00201 00122 12210000 00122 00200 a 00202 00199 00325 32510000 00325 00198 a 00200 00197 00695 69510000 00695 00196 a 00198 00195 01198 119810000 01198 00194 a 00196 00193 01664 166410000 01664 00192 a 00194 00191 01896 189610000 01896 00190 a 00192 00189 01664 166410000 01664 00188 a 00190 00187 01198 119810000 01198 00186 a 00188 00185 00695 69510000 00695 00184 a 00186 00183 00325 32510000 00325 00182 a 00184 00181 00122 12210000 00122 00180 a 00182 00179 00048 4810000 00048 00178 a 00180 ponto médio da classe Frequência relativa Espessura 1 2 11 3 4 10 9 8 7 6 5 12 13 232 Distribuição de probabilidades Normal 233 Histograma das espessuras de 10000 arruelas de branze 0 005 01 015 02 1 2 3 4 5 6 7 8 9 10 11 12 13 espessuras classes freqüência relativa bronze Curva normal típica média Forma de uma boca de sino Área sob a curva 1 05 05 Média µ Desvio padrão 50 50 Distribuição de probabilidades Normal 234 Características 1 A curva normal tem a forma de sino 2 É simétrica em relação a média 3 Prolongase de a apenas em teoria assintótica 4 Fica completamente especificada por sua média e seu desvio padrão há uma distribuição normal para cada par média e desvio padrão 5 A área total sob a curva é considerada 100 ou igual a 1 6 A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar um valor entre esses pontos 7 Possui dois parâmetros que caracteriza cada distribuição normal µ e σ Distribuição de probabilidades Normal 235 12012024 40 A probabilidade de uma variável aleatória tomar um valor entre dois pontos quaisquer é igual à área sob a curva normal entre aqueles pontos P a x b área hachurada sob a curva é a probabilidade de X assumir qualquer valor entre a e b Distribuição de probabilidades Normal 236 Variável X µ a b Observação x µ distância do ponto considerado à média x µ z número de desvios padrões a contar da média Ex Z 25 desvios padrões x ponto considerado da distrib µ média da distribuição desvio padrão da distribuição Distribuição de probabilidades Normal e 271828 e fx 2 1 x µ 2 2 1 237 70 80 90 100 110 120 130 escala padroni zada escala efetiva Distribuição de probabilidades Normal kmh m 07 08 09 10 11 12 13 kg 175 20 225 25 275 30 325 Kgcm2 49 56 63 70 77 84 91 velocidade comprimento massa pressão 3 2 1 0 1 2 3 z Quantidade de desvios padrão µ 100 kmh 100 kmh x 110 kmh velocidade µ 10 m 01 m x 11 m comprimento µ 25 kg 025 kg x 275 kg massa µ 70 kgcm2 070 kgcm2 x 77 kgcm2 pressão X 238 Seja X uma variável com distribuição normal X Nµ σ A distância entre a média e um ponto qualquer x é dado em número de desvios padrão z z x µ Distribuição de probabilidades Normal Normal não padronizada µ x P X Nµ σ Normal padronizada 239 Qualquer distribuição normal com os parâmetros µ e σ Transformação matemática 0 z P Normal padronizada Z N0 1 Uma única distribuição normal normal padronizada X Z Como calcular Z µ x x µ x µ z média desvio padrão valor considerado diferença diferença relativa 40 1 42 2 2 30 25 375 75 3 25 2 23 2 1 18 3 135 45 15 37 38 39 40 41 42 43 escala efetiva 3 2 1 0 1 2 3 42 401 2 Distribuição de probabilidades Normal 240 Distribuição de probabilidades Normal 3 2 1 0 1 2 3 6826 9546 9973 241 12012024 41 Segunda casa decimal de z z 000 001 002 009 00 01 02 03 05832 Usando a tabela de distribuição Normal Distribuição de probabilidades Normal 242 Área sob a curva de z até z 021 pela tabela 021 05832 0 Z Distribuição de probabilidades Normal 243 Exercício 01359 Distribuição de probabilidades Normal 244 Determine a área probabilidade sob a curva entre 1σ em torno da média Determine probabilidade área da variável assumir valores entre 1σ e 2σ distantes da média 08413 01587 06826 08413 09772 1 0 1 Z 0 1 2 Z Distribuição de probabilidades Normal Dado os valores de Z ache a probabilidade de se encontrar valores de Z nas áreas hachuradas 0025 0025 02266 02266 O8113 O1469 00465 04484 245 A B C E F G Distribuição de probabilidades Normal Dado os valores de probabilidades de se encontrar valores de Z nas áreas em hachuradas ache os valores de Z Z1 2326 Z1 111 Z1 165 Z2 165 Z1 128 Z1 067 Z1 173 Z2 173 246 A B C E F G Exercício Após 28 dias de curagem o cimento de uma certa marca tem uma resistência compressiva média de 4000 psi Suponha que a resistência tem uma distribuição normal com desviopadrão de 120 psi Qual a probabilidade de se comprar um pacote de cimento com resistência compressiva de 28 dias menor que 3850 psi N N4000 120 psi 3850 4000 1 25 120 3850 4000 X z Distribuição de probabilidades Normal 247 Desejase PX 3850 Z 125 Pz 125 Variável de interesse resistência compressiva do cimento 01056 Pz 125 01056 1056 12012024 42 Uma indústria siderúrgica produz tubos de aço cujo comprimento pode ser considerado uma variável normalmente distribuída com média 1000 metros e desvio padrão igual a 009 metros Quanto refugo a indústria espera produzir se o comprimento dos tubos de aço tiver que ser no máximo igual a 1020 m N N10 009 metros 2 22 09 0 102010 σ μ X z 0 Z 222 Z X 10 μ 1020 Distribuição de probabilidades Normal 248 Variável de interesse comprimento de tubos Prefugo Pcomprimento tubo 1020 09868 1 09868 00132 PZ 222 09868 Prefugo PZ 222 1 09868 00132 O tempo médio que demora para uma viatura de uma determinada Cia da PMMG da capital atender a uma chamada de emergência é de 8 minutos com desviopadrão de 3 minutos Considere o tempo médio como uma variável normalmente distribuída para calcular a probabilidade de uma chamada esperar menos de 4 minutos 133 3 48 X z N N8 3 minutos Desejase PX 4 minutos X 8 4 0 Z Z 133 Distribuição de probabilidades Normal 249 Variável de interesse tempo médio de demora no atendimento PX 4 minutos Pz 133 009176 009176 Um máquina produz peças com o diâmetro médio de 200 polegadas e o desviopadrão de 001 polegada O diâmetro tem distribuição normal As peças que se afastam da média por mais de 003 polegada são consideradas defeituosas Qual é a percentagem de peças defeituosa 3 01 0 2 03 2 203 X z 0 3 Z 3 N N200 001 polegadas 3 01 0 197 2 1 97 X z Distribuição de probabilidades Normal 250 2 X 2 203 197 Variável de interesse diâmetro de peças Desejase Ppeças defeituosas Ppd P pd PX 203 PX 197 P X 203 PZ 3 000135 PX 197 PZ 3 000135 P pd 000135 000135 00027 P pd PZ 3 PZ 3 0 1 2 3 4 5 n 5 p 025 q 075 np 125 nq 375 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 n 20 p 025 np 5 nq 15 n 50 p 025 np 125 nq 375 0 10 20 30 40 50 Binomial aproximada pela Normal A distribuição binomial quando np 5 e nq 5 se aproxima bem da distr normal 251 Se n 50 e p 025 determine P14 x 16 0111 0089 0065 0265 P14 x 16 0265 Binomial aproximada pela Normal Quando np 5 e nq 5 a distribuição binomial se aproxima da distribuição normal Neste caso np 125 e nq 375 252 0 002 004 006 008 01 012 014 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Correção pela continuidade Sendo n 50 e p 025 np 125 e nq 375 Ambos são maiores que 5 Para garantir que as fronteiras de cada retângulo estejam incluídas no intervalo subtraise 05 das fronteiras à esquerda e some 05 à fronteira que está a direita O intervalo de valores sob a curva normal é 135 X 165 Binomial aproximada pela Normal 125 135 165 14 15 16 253 12012024 43 Com as fórmulas de distribuição Binomial determine a média e o desvio padrão 3 062 50 0 25 0 75 12 5 0 25 50 npq x np Converta cada ponto no escore Z P033 Z 131 09049 06293 02756 Z135 135 1253062 033 Z165 165 1253062 131 PZ135 P Z 033 06293 PZ165 P Z 131 09049 Binomial aproximada pela Normal 254 125 135 165 14 15 16 Exercício Segundo um levantamento entre os usuários da internet 75 são a favor de que o governo regulamente o lixo eletrônico Se 200 internautas forem escolhidos aleatoriamente determine a probabilidade de que menos de 140 sejam a favor da regulamentação governamental Solução Tratase de uma distribuição binomial na qual n 200 p 075 X 140 Binomial aproximada pela Normal 255 PX 140 PX 0 PX 1 PX 139 004539 Solução da usando a distribuição normal Uma vez que np 150 5 e nq 50 5 podese usar a distribuição Normal para aproximar a probabilidade Binomial 612 0 75 0 25 200 150 0 75 200 npq x np Use a correção pela continuidade para traduzir isso para variável contínua no intervalo 1395 Determine a Px 1395 Binomial aproximada pela Normal 256 1 71 12 6 150 5 139 139 5 Z A probabilidade de que menos de 140 sejam a favor da regulamentação governamental é de aproximadamente 00436 Pz 171 00436 1395 150 Aproximação válida quando for grande 0 1 2 3 4 5 00 01 02 03 04 px x 0 2 4 6 8 10 12 000 005 010 015 px x 10 20 30 000 004 008 px x 1 5 20 Parâmetros da Normal t t Poisson aproximada pela Normal Para valores de λ 5 já se consegue boa aproximação da distr de Poisson pela distr Normal 257 Exemplo Uma variável aleatória é o número de falhas ao longo do comprimento de um fio de cobre Número de falhas é uma variável discreta com distribuição de Poisson Distribuição de probabilidades Exponencial 258 Exemplo Uma variável aleatória contínua é o comprimento de qualquer ponto inicial no fio até o ponto em que uma falha é detectada Distribuição de Exponencial A variável aleatória X que é igual à distancia entre contagens sucessivas de um processo de Poisson com média λ 0 é uma variável contínua aleatória exponencial com parâmetro λ A função densidade de probabilidade de X é fx λeλx para 0 x Falhas variável discreta Intervalo entre falhas variável contínua A distribuição exponencial envolve probabilidades ao longo do tempo ou da distância entre ocorrências num intervalo contínuo A exponencial é usada para modelo do tempo entre falhas de equipamento elétrico tempo de chegada de clientes a um supermercado tempo entre chamadas telefônicas duração de vida de componentes que não se desgastam com o tempo etc A distribuição exponencial é útil quando a taxa de ocorrência tem distribuição de Poisson Possui a propriedade de não ter memória Se o componente já durou t0 horas a probabilidade de durar mais t horas continua a mesma A probabilidade não se altera pelo fato de já ter transcorrido t0 horas O fato de um chip já ter durado 5 anos não afeta sua probabilidade de durar mais 5 anos Distribuição de probabilidades Exponencial 259 12012024 44 Distribuição de probabilidades Exponencial 260 O que significa falta de memória memoryless Uma importante propriedade da distribuição exponencial é que ela é memoryless A chance de um evento ocorrer não depende de ensaios passados Portanto a taxa de ocorrência permanece constante A propriedade memoryless indica que a vida útil restante de um componente é independente da sua idade atual Por exemplo os ensaios aleatórios de jogar uma moeda demonstram a propriedade memoryless Um sistema que sofre desgaste e portanto tornase mais propenso a falhar posteriormente em sua vida útil não é memoryless Distribuição de probabilidades Exponencial 261 Propriedade da falta de memória Seja T o tempo entre detecções de uma partícula rara em um contador Geiger e considere que T tenha uma distribuição exponencial com ET 14 minuto A probabilidade de detectarmos uma partícula dentro de 30 segundos do começo da contagem é PT 05 1 e0514 030 ET µ 1 λ 14 minuto λ 114 minuto t 30 segundos 05 minuto Tempo T 0 05 min ft PT t 1 e t Distribuição de probabilidades Exponencial 262 Propriedade da falta de memória Qual prob detectar uma partícula em 30 segundos Passaramse 3 minutos e nenhuma partícula foi detectada 05 T minuto 0 30 35 Qual a prob detectar uma partícula nos próximos 30 segundos dado que 3 minutos já se passaram PT 35 T 3 05 ft PT 05 1 e t 030 T 0 05 ft PT 05 1 e t 030 0 Provase que PT 35 T 3 é igual à probabilidade anterior 030 30 35 Uma variável aleatória tem distribuição exponencial se sua função de densidade de probabilidade é da forma 2 1 ft 12 t e t t f t 0 e 0 Distribuição de probabilidades Exponencial A variável aleatória exponencial esquece ou ignora o que aconteceu antes O futuro é independente do passado 263 0 PT t et é a probabilidade da ocorrência de um evento após transcorrido o tempo t PT t 1 et é a probabilidade da ocorrência de um evento em t ou antes de t Média Et µ 1 0 t ft PT t 1 e t PT t e t Distribuição de probabilidades Exponencial T É o modelo probabilístico mais usual para situações que envolvem tempo e questões de confiabilidade de produtos e processo de produção σ µ 1 264 σ2 VX 1 2 Exercício A vida de uma certa marca de lâmpada tem distribuição aproximadamente exponencial com média de 1000 horas Determine a percentagem das lâmpadas que queimarão antes de 1000 horas λ μ 1 λ 1000 1 0 001 λ e t t P T 1 0 632 1 0 368 1 1 1000 1 00011000 e e T P Utilizando a expressão 6320 queimarão antes das 1000 horas PT t 1 e t 0 1000 Distribuição de probabilidades Exponencial horas t 1000 h 265 Média Et µ 1 12012024 45 Após quantas horas terão queimadas 50 das lâmpadas λ μ 1 1000 1 0 001 λ PT t 05 a área sob a curva é igual 050 horas t 693 001 0 0 693147 PTt 050 t Distribuição de probabilidades Exponencial PT t eλt 05 e0001t ln05 lne0001t ln05 0693147 então 0693147 0001t horas ln05 0001t 266 Após t horas Suponha que o tempo médio entre o pedido e o atendimento num grande restaurante seja de 10 minutos e que esse tempo tenha uma distribuição exponencial Determine a probabilidade µ 1 10 110 01 PT 10 et e0110 e1 b Do tempo de espera não ser superior a 10 min PT10 1 et 1 e0110 1 0368 a Do tempo de espera ser superior a 10 minutos Distribuição de probabilidades Exponencial PT 10 0368 PT10 0632 t 10 min 267 t 10 ft PT t e t 0 t 10 ft PT t 1 e t 0 µ 1 10 110 01 PT 10 et e0110 e1 d De que o tempo de espera fique entre 10 e 15 minutos PT t e t Distribuição de probabilidades Exponencial PT 10 03678 t 10 min PT 15 et e0115 e15 PT 15 02231 01447 PT 10 PT 15 c Do tempo de espera não ser superior a 3 minutos PT 3 1 et 1 e013 PT 3 1 0741 PT 3 0259 268 t 3 ft PT t 1 e t 0 10 15 T ft P10 T 15 0 02231 03678 Distribuição de probabilidades t de student Distribuição de probabilidades Quiquadrado Distribuição de probabilidades F de Snedecor Essas distribuições serão estudadas na disciplina de QTDE 269 DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS E PROPORÇÕES 270 Parâmetros Estatísticas Inferência Média Proporção Média Proporção Distribuição amostral das médias População É a distribuição das médias amostrais com todas as amostras de tamanho n extraídas da mesma população 271 12012024 46 2 3 4 5 População Amostra Retirar todas amostras de n 2 elementos 2 2 3 2 4 4 4 3 5 5 Média 35 Desvio padrão 1118 Total 16 amostras Amostra 2 2 2 3 2 4 2 5 3 2 3 3 3 4 3 5 Amostra 4 2 4 3 4 4 4 5 5 2 5 3 5 4 5 5 Média 20 25 30 35 25 30 35 40 Média 30 35 40 45 35 40 45 50 Média das médias 2 25 30 5 16 35 Desvio padrão das médias 0791 Distribuição amostral das médias 272 População Amostra Todas amostras de 2 elementos OBSERVE 791 0 2 1118 n sx x 2 3 4 5 2 2 3 2 4 4 4 3 5 5 Erro padrão POPULAÇÃO DISTRIBUIÇÃO AMOSTRAL Média 35 35 Desvio padrão 1118 0791 Distribuição amostral das médias 273 Histograma das médias amostrais frequência Médias Histograma da população n x Conhecido como erro padrão das médias frequência 1 Distribuição amostral das médias 274 x x x x Distribuição das medidas individuais X x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x dp σ Distribuição das médias n x x xx xx x x xx xx x xx xx xx x xx x x x x x x Distribuição amostral das médias 275 A média amostral da distribuição é igual à média da população O aumento do tamanho da amostra reduz a variabilidade da distribuição amostral média populacional a As médias amostrais tendem a gruparse em torno da média da população n 100 n 80 n 60 n 40 média populacional b As distribuições amostrais de grandes amostras têm menor variabilidade que as de pequeno tamanho amostral Distribuição amostral das médias 276 Conclusões importantes sobre distribuições das médias A média da distribuição das médias é sempre igual à média da população O desvio padrão da distribuição variabilidade das médias diminui quando aumenta o tamanho da amostra Quando a população é grande ou infinita o desvio padrão da distribuição amostral das médias é dado por do desvio padrão da população x da raiz quadrada do tamanho da amostra n O desvio padrão da distribuição amostral x ou erro padrão da média depende x x n 277 12012024 47 Teorema central do limite Média 1 1 2 2 4 225 2 5 3 3 6 425 3 2 4 4 3 325 4 9 8 5 9 775 5 4 0 1 0 125 6 2 3 4 2 275 7 4 5 6 7 55 8 5 6 8 9 7 9 8 6 6 5 625 10 9 6 7 8 75 11 0 2 8 0 25 12 8 8 4 8 7 13 9 9 7 8 825 14 8 7 4 5 6 15 9 6 4 2 525 16 3 7 9 4 575 17 3 1 2 2 2 18 2 4 4 6 4 19 8 9 3 4 6 20 2 7 9 7 625 21 3 3 4 5 375 22 3 6 7 8 6 23 9 8 9 6 8 24 3 0 1 2 15 25 7 9 6 8 75 Amostras aleatórias 0 1 2 3 4 5 6 7 frequência 8 9 Distribuição dos 100 dados fx 1 Distribuição amostral das 25 médias x 278 P2 Teorema central do limite 279 P1 P3 P4 280 Que tamanho de amostra é grande o suficiente de modo que o teorema central do limite pode ser aplicado A resposta depende de quão próxima distribuição original esteja da normal Se a distribuição for simétrica e unimodal não muito longe da normal o TLC se aplica para valores pequenos de n digamos 4 ou 5 Se a população amostrada for muito não normal amostras maiores serão requeridas Como regra geral se n 30 o TLC quase sempre se aplicará As exceções a esta regra geral são relativamente raras Para a maioria dos casos práticos o TLC se aplicará para valores de n muito menores que 30 Teorema central do limite TLCválido para médias amostrais Teorema central do limite TLCválido para médias amostrais Concluise que não é necessário conhecer a forma da distribuição da população bastando que o tamanho da amostra seja grande pois assim a distribuição amostral será aproximadamente normal Uma regra prática muito usada é que a amostra deve consistir de 30 ou mais observações O TLC se refere exatamente à forma da distribuições amostrais 1 Se a população tem distribuição normal a distribuição das médias amostrais também será normal para todos tamanhos de amostras 2 Se a população é nãonormal a distribuição de médias amostrais será aproximadamente normal para grandes amostras 281 Teorema central do limite TLCválido para médias amostrais 282 Se X1 X2 X3 Xn é uma amostra aleatória simples AAS de tamanho n grande retirada de uma população X com média µ finita e variância σ2 finita então a variável Xbarra tem distribuição aproximadamente normal ҧ𝑥 ℕ 𝜇 𝜎 𝑛 X 1 X 3 X 2 X n 𝑋 𝐷𝑖𝑠𝑡𝑟𝑖𝑏 𝑞𝑢𝑎𝑙𝑞𝑢𝑒𝑟 𝜇 𝜎 População Médias ҧ𝑥1 ҧ𝑥2 ҧ𝑥3 ҧ𝑥4 ҧ𝑥n n grande Exercício Uma população muito grande tem média de 20 e desvio padrão 14 Extraise uma amostra de 49 observações a Qual a média da distribuição amostral médias b Qual o desvio padrão da distribuição amostral erro padrão das médias c Qual a percentagem das possíveis médias amostrais que diferirão por mais de 02 da média da população Solução Como n 30 podemos supor normal a distribuição amostral das médias b O desvio padrão da distribuição é a A média da distribuição amostral é sempre igual à média da população Logo µx x 20 14 49 02 x x n 283 12012024 48 c A percentagem de médias amostrais que diferem por mais de 02 da média populacional é Z202 202 20 02 Z 1x proporção 01587 Z198 198 200 02 Z 1x proporção 01587 total 03174 z 1x µx Z 1x 01587 01587 284 198 20 202 02 02 Em projetos de elevadores é fundamental considerar o peso das pessoas para que não haja sobrecarga e futuras falhas Dado que a população brasileira tem peso distribuído normalmente com média de 72 kg e dp 12 kg determine a probabilidade de que a uma pessoa escolhida aleatoriamente pese mais de 78 kg 0 6915 0 50 50 0 12 72 78 78 z P X z Logo a probabilidade de uma pessoa pesar mais de 78 kg é de 3085 1 06915 Z78 05 72 PX 78 78 03085 285 b Levando em consideração que uma empresa desenvolveu um elevador de grande porte 25 pessoas e a capacidade máxima de carga é de 1950 Kg Qual a probabilidade de que 25 pessoas que entrem aleatoriamente no elevador ao mesmo tempo propiciem um peso médio maior que 78 kg Agora estamos lidando com a média para um grupo de 25 valores e não mais com um valor individual kg X 72 42 25 12 n X 2 50 42 72 78 x X x Z 0 99379 2 50 z P Logo a probabilidade será de 062 1 099379 78 00062 Z78 25 72 286 O ciclo de vida de aparelhos de CD Player de uma determinada marca têm média de 71 anos e desviopadrão de 14 ano Determine a probabilidade de 45 aparelhos selecionados aleatoriamente terem um ciclo de vida maior do que 7 anos 17 X 21 0 45 41 n X 0 48 21 0 17 7 7 x X x Z 0 3156 0 48 Z P Logo a probabilidade será de 6844 1 03156 71 06844 Z7 048 7 287 As distribuições amostrais de proporções e número de ocorrências são essencialmente as mesmas Ambas dizem respeito à contagem de dados e não às mensurações Distribuição amostral Média Desvio padrão Proporções p p p1 p n np np1 p Número de ocorrências np Distribuições amostrais das proporções e do número de ocorrências 288 Tamanho da população e das amostras Grande ou infinita Não há necessidade de reposição Probabilidades de cada prova é constante Finita ou amostra muito grande nN 5 Deveria se fazer a reposição mas não se faz A probabilidade de cada prova varia Os desvios padrão das distribuições amostrais devem ser multiplicados pelo fator de correção finita Tamanho da população 289 N população n amostra N n N 1 Fator de correção finita 12012024 49 Distribuição Desvio padrão Médias Proporção Número de ocorrências Populações finitas o desvio padrão deve ser corrigido x n x N n N 1 p p1 p n N n N 1 np np1 p N n N 1 290 LEITURA COMPLEMENTAR 291 Uma outra maneira de classificar os dados é pelo NÍVEL DE MENSURAÇÃO Classificação dos dados 1º nível 2º nível 3º nível 4º nível Nominal Ordinal Intervalar Razão 292 1º nível Nível de mensuração mais baixo Mais rudimentar possível É a escala de medida NOMINAL A atribuição dos números é de natureza QUALITATIVA DISTINTIVA Os algarismos representam uma categoria Ex 1 mulher e 2 homem 2º nível Nível de mensuração um pouco mais elaborado que o anterior É a escala de medida ORDINAL As grandezas podem ser avaliadas em termos de mais que ou menos que Quantificação imprecisa Não é possível fazer operação aritmética neste nível Classificação dos dados 293 3º nível É uma escala de medida propriamente dita É a escala INTERVALAR c unidade de medida arbitrária porém fixa e zero relativo convencional não natural Faz operações de subtração algumas vezes adição e não faz multiplicação ou divisão Exemplo Um corpo a 40ºC não é 4 vezes mais quente que um corpo que está a 10ºC A razão é 4 vezes em ºC e apenas 208 em ºF 4º nível É o nível de mensuração mais elaborado de todos É designado pela escala de RAZÃO ou RACIONAL É muito parecido com a escala do 3º nível exceto quanto a ORIGEM o zero absoluto isto é é zero natural Todas operações aritméticas podem ser feitas Exemplo peso de porcos distância entre dois carros etc Classificação dos dados 294 Coleta de dados Manual Usa folhas de verificação tally sheets check list Folha de verificação é ferramenta útil para coletar os dados no campo de forma organizada e estruturada O seu projeto ou desenho pode ser muito variado Automática Utiliza computadores máquinas automáticas de diversos processos leitores óticos etc Reduz o tempo de coleta erros custos e evita perda de precisãoexatidão Exige investimentos iniciais mais elevados 295 12012024 50 Coleta de dados Arredondamento Deixar os arredondamentos para a fase final dos cálculos Devese evitar os arredondamentos intermediários Codificação de dados Algumas vezes há limitação para processar ou armazenar números ou grupo de letras Para reduzir o tamanho fazse então a necessidade de codificação para processálos sem perda da precisão e exatidão Melhora a eficiência e análise dos dados de entrada 296 Folha de Verificação Classificação de produto defeituoso Produto Lente Estágio de fabricação inspeção final Tipo de defeitos arranhão trinca revestimento inadequado muito grossa muito fina não acabada Total inspecionado 1200 Data 030195 Seção INSPROD Inspetor Augusto Bicalho Defeito Contagem Subtotal Arranhão 12 Trinca 41 Revestimento inadequado 55 Muito grossa ou muito fina 11 Não acabada 5 Outros 3 Total 127 Total rejeitado 90 297 Causa de erros na coleta ou processamento dos dados Incorreta definição das unidades de medidas m s etc Digitação ou manuscrito incorreto erros naturais ou confusão devido similaridade de caracteres ou dígitos Sistema de medição com erros imprecisos e inexatos Arredondamentos inadequados forma incorreta ou em estágios intermediários Utilização de softwares com validação inadequada Múltiplas entradas de dados Pessoas mal preparadas e instruções de coleta deficientes Amostragem incorreta tamanho inadequado não aleatória não representativa plano de amostragem mau elaborado etc 298 Estratégias para evitar erros Fazer um plano de coleta de dados criterioso e detalhado amostragem folhas de verificação plano 5W1H etc Usar equipamentos calibrados Efetuar análise do sistema de medição Treinar as pessoas Avaliar a presença de outliers usando técnicas estatísticas Utilizar softwares validados corretamente reconhecidos etc Utilizar sistemas adequados de verificação da correção da transmissão e recepção Automatizar usar códigos de barras leitoras óticas etc 299 Estudos enumerativos são os estudos de inferência estatística baseados em amostras retiradas de populações para estimarem parâmetros de populações existentes Estudos analíticos são estudos de inferência estatística baseados em amostras para estimarem parâmetros de populações futuras amostra População x1 x2 xn Estudo enumerativo amostra População futura x1 x2 xn Estudo analítico tempo 300 Utilizada nas situações onde há mais de dois resultados mutuamente excludentes Exigese Que as n provas sejam independentes Tenham probabilidade de ocorrência constante PE1 E2 EK n n1n2n3 nk P1 n1 P2 n2 Pk nk A probabilidade de que em n observações o resultado E1 ocorra n1 vezes E2 ocorra n2 vezes e Ek ocorra nk vezes é dado pela fórmula Distribuição de probabilidades Polinomial ou multinomial 301 12012024 51 Em um processo 80 da produção de uma máquina é aceitável 15 necessita de algum reparo e 5 é imprestável Numa amostra de n 10 itens qual a probabilidade de obter 8 itens aceitáveis 2 que necessitem de reparos e nenhum imprestável P820 10 8 2 0 088 0152 0050 017 Exercício Distribuição de probabilidades Polinomial ou multinomial Reparo Imprestável Aceitável n1 8 n2 2 n3 0 n 10 itens P1 080 P2 015 P3 005 302 Uma inspeção de peças ao longo do tempo revela quatro classificações A B C e G peça boa qualidade Historicamente pA 003 pB 005 pC 006 e pG 086 Se uma amostra de 170 unidades for retirada de uma população qual seria a probabilidade de nA 9 nB 7 nC 16 e nG 138 0 00011 0 03 0 05 0 06 0 86 16138 79 170 138 16 7 9 138 16 7 9 G C B A P Exercício Distribuição de probabilidades Polinomial ou multinomial nA 9 nB 7 nC 16 nG 138 pA 003 pB 005 pC 006 pG 086 n 170 303 Quando se usa as distribuições uniformes Quando a variável aleatória pode tomar qualquer valor numa escala contínua entre dois pontos intervalo e que estes valores sejam igualmente prováveis Distribuição de probabilidades Uniforme ou Retangular Um vendedor sempre comparece à sua empresa no horário de 300 às 400 h Neste intervalo cada instante é igualmente provável Qual a probabilidade dele comparecer entre 300 e 315 h Exemplo 304 P 100 fx 0 a b Px fx 0 a c d b d c b a Média a b 2 Variância b a2 12 Pc x d 1ba Distribuição de probabilidades Uniforme ou Retangular Distribuição uniforme fx a x b 0 qualquer outro intervalo 1 b a X X 305 fx 0 300 400 Um vendedor sempre comparece à sua empresa no horário de 300 às 400 h Neste intervalo cada instante é igualmente provável Qual a probabilidade dele comparecer entre 300 e 315 h Px 400 300 315 300 15 60 P300 x 315 025 Distribuição de probabilidades Uniforme ou Retangular 306 315 25 a b c d d c b a Pc x d Uma variável aleatória X tem distribuição Lognormal quando seu logaritmo LnX tem densidade normal de probabilidade Se X é lognormal lnx é Nμσ x1 x2 x3 x4 x5 xn ln xn ln x1 ln x2 ln x3 ln x4 ln x5 distribuição normal Distribuição de probabilidades Lognormal distribuição lognormal 307 12012024 52 Exemplos estimativas de um processo de quebra da distribuição de rendimentos patrimônios e depósitos bancários vida de alguns tipos de transistores etc A distribuição Lognormal é um modelo muito utilizado em situações em que a variável de interesse apresenta uma assimetria à direita 2 1 ln 2 1 2 2 x α β π e x β x f Distribuição de probabilidades Lognormal 308 Distribuição de probabilidades Lognormal 309 Histograma dos logaritmos dos dados Distribuição Normal Histograma dos dados Distribuição Lognormal Distribuição de probabilidades Lognormal 310 Uma variável aleatória exponencial descreve o comprimento espaço até que a primeira contagem ocorrência seja obtida em um processo de Possion Exemplo Qual é a probabilidade de que o tempo exceda 100 h até que ocorra a primeira falha no sistema r 1 sabendo que a média é de 80 0 100 ft PT t e t Quando generalizamos de r 1 primeira ocorrência para r um valor qualquer inteiro temos a distribuição Erlang Quando generalizamos de um valor inteiro qualquer de r para valor qualquer não negativo de r temos a distribuição de probabilidade Gama Distribuição de probabilidades Erlang e Gama 311 Distribuição de probabilidades Erlang e Gama A distribuição Erlang é um caso especial da distribuição Gama r qualquer valor positivo inteiro A distribuição exponencial é um caso especial da distribuição Erlang quando r 1 A distribuição Gama é usada para representar fenômenos limitados de um lado 0 X tais como distribuição dos intervalos de tempos entre recalibrações de instrumentos intervalos de tempos entre compras de um item estocado etc 312 É usada frequentemente para determinar o tempo até a falha de diferentes sistemas físicos Devido a grande diversidade de curvas de taxa de risco é muito utilizada no estudo de confiabilidade Os parâmetros da distribuição permitem grande flexibilidade para lidar com sistemas onde o número de falhas crescem com o tempo desgastes de rolamentos decresce com o tempo alguns semicondutores ou permanece constante com o tempo falhas causadas por choques ao sistema Exemplos distribuições de vida para alguns capacitores reles etc Distribuição de probabilidades Weibull 313 12012024 53 Com 1 a distribuição de Weibull é idêntica à distribuição exponencial Na maioria dos casos a distribuição é desviada para a direita Com 35 1 e 0 a distribuição de Weibull se aproxima da normal fX X 1 eX parâmetro de escala Está relacionado com planicidade da curva Quando varia a curva pode se tornar mais achatada flated ou pontiaguda peaked parâmetro de forma shape é o mais importante parâmetro e reflete o padrão da curva Na prática varia de 13 a 5 gama é o menor valor possível de X quase sempre é assumido como zero Distribuição de probabilidades Weibull 314 Efeito do parâmetro de forma β com α 100 e δ 0 Distribuição de probabilidades Weibull 315 TEOREMA DE CHEBYSHEV OU INEQUAÇÃO DE CHEBYSHEV 316 Teorema de Chebyshev Qual é a proporção ou fração de dados que esta contido em um intervalo em torno da média de qualquer distribuição 317 Teorema de Chebyshev A proporção ou fração de dados que está fora ou que está contido em um intervalo em torno da média de uma distribuição conhecida utilizamse as técnicas verificadas nos tópicos anteriores ex curva normal E quando não se conhece a distribuição Qual é esta proporção Em 1867 o matemático russo Chebyshev definiu uma inequação que é válida para variáveis aleatórias discretas e contínuas 318 Teorema de Chebyshev INEQUAÇÃO DE CHEBYSHEV P x µ k 1 k2 A teoria de Chebyshev permite definir a proporção ou fração de um conjunto de dados fora ou dentro do intervalo µ k entorno da média para qualquer variável aleatória X com média e desvio padrão conhecidos A desigualdade de Chebyshev garante que em qualquer distribuição com média µ e desvio padrão Pelo menos 1 1 k2 dos dados estão dentro intervalo µ k Menos1 k2 dos dados estão fora do intervalo µ k sendo k maior que 1 A probabilidade que a sua variável assuma um valor distante da média maior que k desvios padrão é menor que 1k2 319 12012024 54 Para qualquer distribuição com média µ e desvio padrão Dentro do intervalo P x µ k 1 1 k2 Teorema de Chebyshev fator k K 2 dentro do intervalo fora intervalo K 15 k 2 1 1 K 3 056 1 1 51 2 0 75 1 1 02 2 0 89 1 1 03 2 k 2 1 044 1 51 2 0 25 1 02 2 011 1 03 2 X Fora do intervalo P x µ k 1 k2 K quantidade de desvios padrão Esta relação só é valida para k 1 µ µ k µ k 320 Em qualquer distribuição independentemente de sua forma a proporção ou fração de qualquer conjunto de dados que se situa a k desvios padrão da média é sempre no mínimo 1 1k2 no qual k é um número positivo maior que 1 Se k 2 no mínimo 1122 114 ¾ 75 de todos os dados se localizam a 2 desvios padrão da média Se k 3 no mínimo 1132 119 89 889 de todos os dados se localizam a 3 desvios padrão da média Uma distribuição qualquer com Teorema de Chebyshev µ 6 σ 384 321 Quando a distribuição for unimodal e simétrica CampMeidell definiu a seguinte desigualdade Podese observar que pelo fato de conhecermos alguma característica da distribuição o percentual de dados contidos dentro do intervalo ficou aumentado e consequentemente o percentual de dados fora do intervalo ficou reduzido pelo fator 49 Teorema de CampMeidell 4 9 P x µ k k2 1 Probab fora do intervalo 322 A média feminina nos 400 metros rasos é de 524 segundos com um desvio padrão de 22 segundos Aplique o teorema de Chebyshev e ache o percentual de tempos e os limites de tempo entre a média 2 desvios padrão Pelo menos 75 dos tempos femininos nos 400 m rasos estão entre 48 e 568 segundos 524 44 48 524 44 568 Solução Exercício Teorema de Chebyshev K 2 desvios padrão 2 x 22 44 s μ 2σ 1 122 114 075 524 546 568 59 502 48 458 μ 323 FIM 324
Send your question to AI and receive an answer instantly
Recommended for you
1
Estatistica-Probabilidade-Conceitos-Testes-e-Modelos-de-Distribuicao
Probabilidade e Estatística 1
PUC
3
Prova de Estatística Geral - Teoria e Aplicações - Análise de Consumo e Receitas
Probabilidade e Estatística 1
PUC
4
Estatística e Probabilidade - Lista de Exercícios Resolvidos
Probabilidade e Estatística 1
PUC
1
Curso de HTML Basico e Estatistica Inferencial: Distribuicoes, Testes e Regressao
Probabilidade e Estatística 1
PUC
1
Teste Qui-Quadrado e Análise de Homicídios por Ocupação - Bioinformática
Probabilidade e Estatística 1
PUC
1
Analise de Arvore de Falhas e Ciclo PDCA Questoes Abertas
Probabilidade e Estatística 1
PUC
1
Exercicios Resolvidos - Probabilidade de Queda de Viaduto e Takt Time na Producao de Biscoitos
Probabilidade e Estatística 1
PUC
1
Lista de Exercicios - Analise de Regressao e Correlacao
Probabilidade e Estatística 1
PUC
1
Probabilidade de Durabilidade de Bomba de Aquecimento - Modelo Exponencial
Probabilidade e Estatística 1
PUC
1
Exercicios Resolvidos Estatistica e Custos da Qualidade para Engenharia de Producao
Probabilidade e Estatística 1
PUC
Preview text
12012024 1 Síntese Numérica e Gráfica de Dados QSND Engenharia e Gestão da Qualidade Professor Alberto A G Grossi 2 3 JURAN J M DEFEO J A Jurans Quality Handbook McGraw Hill Editora 2010 LORENTZ E G et all Certificação em Engenharia da Qualidade Curso completo QG Editora 2019 MONTGOMERY DOUGLAS C Estatística Aplicada e Probabilidades para Engenheiros Editora LTC 7ª edição TRIOLA MÁRIO F Introdução à Estatística Editora LTC 12ª edição STEVENSON W J Estatística Aplicada à Administração Editora Harbra 2001 O que será abordado nesta disciplina 1 Conceitos gerais 2 Medidas estatísticas 3 Síntese numérica e gráfica de dados 4 Conceitos de probabilidades 5 Distribuições de probabilidades discretas 6 Distribuições de probabilidades contínuas 7 Distribuições amostrais das médias e das proporções 8 Séries temporais 9 Exercícios com Software Estatístico 4 CONCEITOS BÁSICOS 5 ESTATÍSTICA Coleta de Dados Estatística Descritiva Estatística Inferencial Organização Apresentação Sintetize Métodos para tomada de decisões Amostragem Planejamento de Experimentos Probabilidades 6 Foco de QTDE Foco de QPEX Foco de QSIN Foco de QSND 12012024 2 Estatística descritiva A parte da estatística que utiliza números para descrever fatos é chamada de forma bem apropriada Estatística Descritiva Compreende a organização o resumo e em geral a simplificação de informações que podem ser muito complexas A finalidade é tornar as coisas mais fáceis de entender de relatar e discutir 7 taxas de acidentes índices de produtos defeituosos custo de vida quilometragem média por litro de combustível A estatística inferencial compreende as técnicas por meio das quais são tomadas decisões sobre uma população decisões estas baseadas unicamente na observação de uma amostra ou na elaboração de um juízo Estatística inferencial 8 Probabilidades A teoria da probabilidade proporciona uma base racional para lidar com situações influenciadas por fatores relacionados ao acaso jogos de dados ou de cartas o lançamento de uma moeda para o ar encontrar produto defeituoso na gôndola do supermercado a chance de ganhar na loteria 9 Amostragem STEVENSON W J Estatística Aplicada à Administração Editora Harbra 2001 10 Amostragem Ideia básica efetuar determinada mensuração sobre uma parcela pequena mas típica de determinada população e utilizar esta informação para fazer inferência sobre a população toda Basta um cálice de vinho para conhecermos a safra Basta uma colher de sopa para saber se precisa de mais sal Nenhum plano de amostragem pode garantir que a amostra seja exatamente semelhante à população da qual foi extraída Uma amostra aleatória permite estimar o erro possível isto é dizer quão próxima está a amostra da população em termos de representatividade 11 População Amostra Parâmetros Média µ Desvio padrão σ Proporção p etc Estatísticas Média Xbarra Desvio padrão s Proporção pchapeu Inferência Amostragem 12 12012024 3 Vantagens da amostragem sobre o censo A população pode ser infinita não seria possível examinar todos elementos da população A amostra pode ser mais atualizada que o censo por ser mais rápida Ensaio de poucos elementos em testes destrutivos Custo reduzido em relação ao censo A exatidão precisão pode ser melhor devido a melhor qualidade da coleta Permite análise de mais itens quando o custo e o tempo são fatores limitantes 13 População X Amostra Custo Alto Baixo Operacionalidade Difícil Fácil Tempo Alto Baixo Precisão Alto Baixo 14 Aleatório é o processo de escolha e não os itens em si Amostragem aleatória Simples ao acaso casual simples randômica são outras designações Amostra Aleatória Simples AAS de tamanho n consiste em n indivíduos escolhidos de maneira que todos os conjuntos de n indivíduos têm a mesma chance de ser a amostra realmente selecionada Uma AAS não apenas concede a cada indivíduo a mesma chance de ser escolhido mas também dá a cada amostra possível a mesma chance de ser escolhida Amostragem 15 Amostragem aleatória As estatísticas média desvio padrão etc tendem a variar de amostra para amostra e também em relação ao verdadeiro valor do parâmetro população População Amostras repetidas Vários fatores aleatórios relacionados com amostragem causam essa variação Variabilidade amostral Erro Amostragem 16 Quão próximo está a estatística amostral do verdadeiro valor do parâmetro populacional Média populacional Média amostral x parâmetro estatística Erro amostral ou erro randômico ou variabilidade amostral Erro amostral E µ 17 Exemplo com o parâmetro média Erro amostral De um baralho com 52 cartas 1ª retirada amostra retiramos 13 cartas e não encontramos os ases Podemos concluir que existem 8 ases 213 x 52 no baralho 2ª retirada amostra retiramos 13 cartas encontramos dois ases Podemos concluir que não existem ases no baralho 18 Sabemos que no baralho existem 4 ases A esse desvio na amostra em relação ao valor real é chamado de erro amostral 12012024 4 Erro amostral Este tipo de erro não pode ser evitado mas pode ser controlado De uma forma ou de outra ele interfere em nossa decisão Esse erro entretanto não ocorre de forma descontrolada desde que a amostra seja retirada aleatoriamente do lote Leis probabilísticas regem os limites de variação desse erro Ao retirar uma amostra com critério de aceitação definido existe o risco de Um lote de má qualidade ser aprovado ou Um lote de boa qualidade ser reprovado 19 População É um conjunto completo de todos os elementos valores pessoas medidas etc a serem estudados Conjunto de elementos com determinada característica em comum cujas propriedades podem ser estudadas a partir de subconjuntos amostras Censo É uma coleção de dados relativos a todos elementos de uma população Amostra É um subconjunto de elementos extraídos de uma população A estimativa feita a partir da amostra será tão melhor quanto mais representativa ela for da população 20 Parâmetro É uma medida numérica que descreve uma característica de uma população Estatística ou Estimativa É uma medida numérica que descreve uma característica de uma amostra Inferência Estatística Se usa uma estatística amostral para o Discutir sobre a população a que esta amostra representa o Fazer uma afirmação sobre uma característica da população o Fazer um julgamento sobre uma característica da população 21 Contínuos Discretos Nominais Ordinais Qualitativos Quantitativos Dados Classificação dos dados 22 Numéricos Não numéricos QUALITATIVOS dados nominais ou categóricos ou atributos Nominais São nomes rótulos ou categorias Não podem estar dispostos num esquema ordenado Ordinais São dados que podem estar dispostos em alguma ordem mas diferenças entre os valores não podem ser determinadas Cor de carros vermelha preta e branca Classificação numa corrida 1º 2º e 3º lugares Classificação dos dados 23 QUANTITATIVOS dados numéricos que representam contagens ou medidas Discretos Resultam de um conjunto finito de valores possíveis sendo dados normalmente inteiros Representam contagens Contínuos Resultam de um conjunto infinito de valores que podem estar associados numa escala contínua Representam mensurações Número de falhas de cada máquina da produção Medidas do peso dos alunos desta sala Dados de uma mesma população podem originar diferentes tipos de dados Natureza dos dados Alunos 2º grau idades pesos nº de alunos menino menina 2º grau Automóveis velocidade Kmh nº defeitos carro cores de carro número da placa do carro grau de limpeza Vendas de imóveis valor Cr Nº ofertas acima do preço de mercado muito dispendioso Populações Contínuo Discreto Nominal Ordinal ou por postos Classificação dos dados 24 12012024 5 MEDIDAS ESTATÍSTICAS 25 Uma boa caracterização de um conjunto de dados necessita de Três informações medidas Dispersão dos dados Distribuição dos dados forma Posição centro dos dados 26 MEDIDAS ESTATÍSTICAS MEDIDAS DOS DADOS Amplitude Variância Desvio padrão Coeficiente de variação Desvio médio absoluto Escore Z DISPERSÃO 27 Quartis Decis Percentis SEPARATRIZES Média Mediana Moda POSIÇÃO tendência central Achatamento curtose Assimetria coeficiente de assimetria FORMA Medidas de posição tendência central Média Mediana Moda Media aritmética Média ponderada 28 É a mais importante das medidas de tendência central Pode ser sempre calculada Para um dado conjunto de números a média é única É sensível a ou afetada todos os valores do conjunto Somandose ou reduzindose uma constante a cada valor do conjunto a média ficará aumentada ou reduzida dessa constante µx k µx k Multiplicandose ou dividindose cada valor do conjunto por uma constante a média ficará multiplicada ou dividida por essa constante µx k µx k µx k µx k µx y µx µy e µx y µx µy só se x e y forem independentes 29 Média aritmética Exercício Um estudante fez quatro provas e obteve as notas 83 94 95 e 86 a sua nota média é 4 895 83 94 95 86 x Fórmula para cálculo ou x i n i 1 n n x x x 30 Média aritmética 12012024 6 A soma dos desvios dos dados de um conjunto a contar da média é zero É conhecida como o centro de gravidade do conjunto de valores Imagine os dados 2 3 e 4 A média é 3 2 4 3 1 1 31 Média aritmética Cada elemento do conjunto pode ter importância diferente peso Neste caso o cálculo da média deve levar em conta os pesos desiguais de cada elemento Exercício O colégio definiu que as provas mensais teriam peso de 30 e a prova final teria peso de 40 no cálculo dos rendimentos dos alunos Veja o quadro abaixo e calcule a média do aluno 80 030 030 Mês 2 90 96 Exame Nota Peso Mês 1 Final 040 MP 03 x 80 03 x 90 04 x 96 03 03 04 894 32 Média ponderada W peso importância de cada elemento X valor de cada elemento i 1 n n W i W i X i i 1 X p 33 Média ponderada Divide um conjunto de dados ordenados em dois grupos iguais É mais usada para as situações nas quais os conjuntos de dados é mais desviado ou assimétrico Dado o conjunto de 11 dados 3 7 5 5 1 9 15 13 11 13 17 Calcule a mediana Exercício 5 dados 5 dados MD 9 11 13 13 15 17 Conjunto dados ordenados 1 3 5 5 7 9 34 X Mediana MD ou Conjunto de valores pares n par MD Valor da posição n2 Posição n 2 1 Valor da 2 Conjunto de valores impares n impar MD Valorposição n 1 2 35 Mediana MD ou X Média aritmética Mediana X Dados fortemente desviados ou com distrib assimétrica A média de 6014 não sintetiza razoavelmente o conjunto de dados Nos dois casos a mediana é 300 Para o segundo caso a mediana representa melhor o conjunto de dados Num conjunto de dados fortemente desviado a mediana é uma medida mais representativa distribuição de rendas folha de pagamentos 36 Salário dos funcionários 7 345 7 200 250 250 300 450 460 510 x 200 250 250 300 450 460 510 ෨𝑋 300 Salário dos funcionários 200 250 250 300 450 460 2300 4 601 7 2300 460 450 300 250 250 200 x ෨𝑋 300 Dados não muito desviados ou com distrib simétrica Média de 3457 representa bem o centro do conj de dados 12012024 7 Exercício Dado o conjunto de dados 10 10 11 14 15 16 17 18 18 Calcule a moda Os valores de maior frequência são 10 e 18 que aparecem duas vezes logo MO 10 e 18 A moda é constituída de dois valores MO 10 e 18 duas vezes cada 37 Moda MO É o valor ou classe de maior freqüência num conjunto de dados pode não existir pode não ser única Exercício Pesquisa entre estudantes revelou que os eletroeletrônicos mais comuns são TV 84 Vídeo cassete 76 CD player 60 Vídeo game 39 DVD 35 Como as TVs são mais frequentes dizemos que a moda é a categoria TV 38 Moda MO 9 Decis divide o conjunto de dados em 10 partes 99 Percentis divide o conjunto de dados em 100 partes Q1 Q2 Q3 D9 D5 D1 P75 P10 P50 P90 Q1 P25 Q2 P50 D5 Q3 P75 D1 P10 D5 P50 D9 P90 3 Quartis divide o conjunto de dados em 4 partes 39 Quartis Decis e Percentis Q3 75 serão inferiores ao terceiro quartil Q3 e 25 serão superiores ao terceiro quartil Os 3 quartis dividem o conjunto de dados ordenados ordem crescente em 4 partes iguais Q1 25 dos valores serão inferiores ao primeiro quartil Q1 Q2 50 serão inferiores ao segundo quartil Q2 mediana 2 3 5 8 9 12 13 15 Q1 40 Q2 85 Q3 125 Q1 Q2 Q3 Fórmula 40 85 1250 Excel 45 85 1225 MINITAB 35 85 1275 Q3 Q1 Distancia interquartil 40 Quartis Quartis Decis e Percentis Há 9 decis denotados por D1 D2 D3 D9 que dividem os dados ordem crescente em 10 grupos com cerca de 10 deles em cada grupo Percentis Há 99 percentis que dividem os dados ordem crescente em 100 grupos com cerca de 1 em cada grupo Exemplo 76 dos valores num grande conjunto de dados serão inferiores ao 76º percentil 41 Decis Quartis Decis e Percentis 42 Quartis Decis e Percentis Início L é um número inteiro Ordene os dados do menor para o maior O valor do Késimo percentil está no meio do caminho entre o Lésimo valor e o valor seguinte do conjunto ordenado de dados Ache Pk somando o Lésimo valor e o valor seguinte e dividindo o total por 2 O valor de P é o L ésimo valor contado a partir do menor dado Mude L arredondandoo para o primeiro inteiro maior que ele Calcule n nº de valores k percentil em questão onde k n L 100 Como calcular quartis decis e percentis Sim Não L posição do percentil desejado Não há concordância universal sobre o procedimento para determinação dos quartis 12012024 8 0 1 1 3 17 32 35 44 48 86 87 103 112 121 123 130 131 149 164 167 173 173 198 208 210 222 227 234 245 250 253 265 266 277 284 289 290 293 477 491 Exercício Considere os 40 dados abaixo relativos aos níveis de Cotinina para fumantes Calcule o percentil 68 P68 L 68 40100 272 Como L não é inteiro devese arredondálo para 28 L 28 corresponde ao valor 234 Logo P68 234 Q1 P25 k 25 e n 40 L 25 40100 10 Como L é um número inteiro devese tomar a metade de L e L1 L 10 valor 86 e L1 11 valor 87 logo 8687 2 865 P25 Q1 865 Calcule o percentil Q1 P25 k n L 100 L posição do percentil desejado L não inteiro arredonda p inteiro superior L é inteiro média de L e L1 K percentil desejado 43 Quartis Decis e Percentis Medidas de dispersão Range amplitude ou intervalo R Desvio médio absoluto DMA Variância σ2 ou s2 e desvio padrão σ ou s Coeficiente de variação CV Escore Z 44 A medida de dispersão mede o quão próximo uns dos outros estão os valores do grupo pequena dispersão grande dispersão Amplitude ou range é expresso pela diferença entre o maior e o menor número num grupo ou pela identificação desses dois números números intervalo diferença 1 5 7 13 14 3 17 4 8 73 36 48 3 2 4 7 5 6 2 1 1 9 10 3 13 1 12 73 3 70 103 19 84 45 Amplitude range ou intervalo R LIMITAÇÃO só leva em conta os dois valores extremos do conjunto de dados nada informando sobre os outros valores Range 1 2 3 distribuição uniforme o intervalo é uma boa medida é uma medida apenas razoável é uma medida ruim da dispersão 46 Amplitude range ou intervalo R DMA xi x n Conquanto o desvio médio absoluto seja fácil de entender não é muito usado como medida de dispersão porque outras medidas apresentam propriedades matemáticas mais interessantes O DMA apresenta algumas aplicações no controle de inventários 47 Desvio Médio Absoluto Exercício Calcule o DMA do conjunto de dados 2 4 6 8 10 X 2 4 6 8 10 5 6 DMA 4 2 0 2 4 5 24 DMA Xi X n Xi X 2 6 4 4 6 2 6 6 0 8 6 2 10 6 4 0 48 Desvio Médio Absoluto 12012024 9 A Variância é uma medida de dispersão muito utilizada σ2 ΣXi μ 2 N s2 ΣXi X 2 n 1 Variância de uma população Variância de uma amostra 49 Variância 50 Exercício Calcule a variância da amostra 2 4 6 8 10 Variância Se esses valores fossem de uma população a variância seria 405 8 σ2 8 xi 2 4 6 8 10 Média 6 xbarra 6 6 6 6 6 xi xbarra 4 2 0 2 4 xi xbarra2 16 4 0 4 16 Soma 0 40 Desvio Desvio2 40 2 x xi 10 5 1 40 1 2 2 n xi x S Propriedades da Variância 1 A variância de uma constante é nula 2k 0 2 Se multiplicarmos todos os valores de uma variável aleatória por uma constante sua variância fica multiplicada pelo quadrado da constante 2kx k2 2x 3 A variância de uma soma ou diferença de variáveis aleatórias independentes é igual à soma das variâncias dessas variáveis 2x y 2x 2y 4 Se somarmos ou subtraímos uma constante aos valores de uma variável aleatória sua variância permanece inalterada 2x k 2x 51 Variância O desvio padrão é mais comumente usado porque se apresenta na mesma unidade da variável em análise Assim se a unidade da variável for kg o desvio padrão também será kg Isso não acontece com a variância É a raiz quadrada positiva da variância Desvio padrão de uma população Desvio padrão de uma amostra σ Σxi μ2 N s Σxi x2 n 1 52 Desvio padrão O desvio padrão é a medida de dispersão mais usada O desviopadrão cresce quando a dispersão dos dados aumenta 1 2 3 4 5 6 7 s 08 1 2 3 4 5 6 7 s 10 1 2 3 4 5 6 7 s 3 4 conjuntos de 7 dados amostrais 1 2 3 4 5 6 7 s 0 7 6 5 4 3 2 1 0 53 Desvio padrão µx 6000 mm σx 25 mm µy 3000 mm σy 15 mm Qual o comprimento médio dos tubos após a junção Qual o desvio padrão dos tubos após a junção União dos dois tubos Devese unir duas peças de cano provenientes de distribuições distintas de médias de 6000 mm e 3000 mm respectivamente e desvios padrão de 25 e 15 mm respectivamente 54 Desvio padrão 12012024 10 ATENÇÃO Desvios padrão nunca se somam somente as variâncias são aditivas Esta propriedade é válida se os dados são independentes σy 15 σx 25 252 152 σx y 292 mm Cálculo do desvio padrão resultante σ2 xy σ2 x σ2 y σ2 x σ2 y σ xy µy 3000 mm µx 6000 mm Cálculo da média resultante 6000 3000 9000 mm μxy 55 Desvio padrão μxy μx μy σx σy σ xy ATENÇÃO É a relação entre o desvio padrão e a média do conjunto de dados Nos dá a ideia do tamanho do desvio padrão em relação à média Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável É uma medida de dispersão relativa É muito útil para comparar a dispersão de dois ou mais conjuntos de dados CV S x 100 σ CV µ 100 ou amostra população 56 Coeficiente de variação Exercício 1 Considere dois conjuntos de dados Calcule coeficiente de variação de cada conjunto 57 μ σ Dados X 100 15 Dados Y 1000 20 CV 1500 200 Coeficiente de variação CVX 15 100 x 100 15 CVY 20 1000 x 100 2 O conj de dados X apesar de ter o menor desvio padrão 15 ele tem maior dispersão relativa à sua média 15 enquanto o conj de dados Y tem apenas 2 apesar de ter maior desvio padrão 20 O escore padrão ou escore Z representa o número de desvios padrão que separa um valor x da média do conjunto de dados Z Valor x Média μ Desvio padrão σ x μ σ 58 Escore padrão Z 29 1 7 161 152 az Solução O valor de x 161 está 129 desvios padrão acima da média O valor de x 148 está 057 desvios padrão abaixo da média O valor de x 152 é a própria média Exercício Em um concurso público as pontuações tiveram uma média de 152 e desvio padrão de 7 Calcule o escore z para um candidato com uma pontuação de a 161 b 148 c 152 0 7 152 152 cz 57 0 7 148 152 bz 59 Escore padrão Z Exercícios 60 12012024 11 1 Escolha quatro números entre os números inteiros de 0 a 10 podendo repetir que tenha o menor desvio padrão possível 2 Escolha quatro números entre os números inteiros de 0 a 10 podendo repetir que tenha o maior desvio padrão possível 0 0 0 0 1 1 1 1 2 2 2 2 10 10 10 10 0 0 10 10 3 Um relatório diz que o débito mediano em cartões de crédito das famílias brasileiras é zero Sabemos que muitas famílias têm grandes quantias de débito em cartões de crédito De fato o débito médio em cartões de crédito por família é 200000 Explique como o débito mediano pode ainda assim ser zero 0 0 0 0 0 0 3000 3500 4500 5500 5500 média 2000 e mediana 0 Isto se explica pelo fato de a maioria da população não ter cartão de crédito débito zero 61 Ex n 11 famílias 4 Qual é a variância de uma população da qual se tira a amostra 16 17 18 20 22 mm 5 A média seja de uma distribuição discreta ou contínua sempre pode ser visualizada como a O ponto onde 50 dos valores estão no lado esquerdo e 50 estão do lado direito b Seu centro de gravidade c O ponto onde a maioria dos valores da distribuição ocorre d É sempre maior que o desvio padrão 62 X Xbarra X Xbarra X Xbarra2 16 186 260 676 17 186 160 256 18 186 060 036 20 186 140 196 22 186 340 1156 média 186 soma 0 2320 Var X 2320 51 Var X 580 mm2 Divide por n1 amostra 6 Qual das seguintes medidas estatísticas de variabilidade não é dependente do valor exato de cada medida a Desvio padrão b Variância c Range ou amplitude d Coeficiente de variação 7 Considere os dados amostrais de dois atletas e calcule os CVs para cada atleta Qual atleta apresentou dados mais homogêneos maior regularidade Atleta de 100 m rasos segundos 9 10 11 8 9 Atleta de salto triplo metros 178 181 184 150 165 63 O atleta do salto triplo foi mais regular mais homogêneo menor dispersão relativa 100 m 9 10 11 8 9 Salto triplo 178 181 184 15 165 Média Desvio p 94 114 1716 141 CV 1210 820 9 Sendo µx 10 σx 2 e µy 17 σy 48 Z X Y Calcule µZ e σZ 10 Sendo µx 10 σx 2 e µy 17 σy 48 Z 4X 2Y Calcule µZ e σz 64 SÍNTESE GRÁFICA DE DADOS 65 O nosso cérebro tem muito mais facilidade de processar as informações apresentadas na forma gráfica Um grande conjunto de dados forma bruta precisa ser sintetizado na forma numérica eou tabular eou gráfica para facilitar a sua visualização entendimento e tomada de decisão com base nos dados 66 12012024 12 25 23 30 29 31 23 24 25 29 23 30 24 26 26 28 24 24 25 25 29 23 25 25 26 26 23 25 26 26 29 27 26 26 27 28 30 30 26 25 23 24 23 28 27 25 25 24 25 29 29 26 26 25 24 30 28 28 29 28 26 Olhando para o conjunto de 60 dados o que podemos concluir sobre ele É muito difícil tirar qualquer conclusão sobre os dados 67 Distribuição de frequência É um agrupamento de dados em classes exibindo o número ou percentagem de observações em cada classe Uma distribuição pode ser apresentada em forma gráfica ou tabular Entendimento do comportamento dos dados Síntese numérica medidas de centro separatrizes dispersão e forma Síntese gráfica ou tabular Tabela de distribuição frequência Histograma 68 Safra anual de 40 pessegueiros Kg árvore 111 125 324 78 210 164 112 223 44 61 275 328 185 164 151 60 107 158 250 182 122 126 47 235 148 226 160 191 74 92 100 262 35 162 145 32 81 129 191 137 O conjunto de dados abaixo embora pequeno não permite uma visão global da safra A distribuição de frequência facilitará a visualização e entendimento Distribuição de frequência 69 Etapas para construção 1 Determinar o intervalo dos dados 2 Determinar o número K de classes 3 Calcular a amplitude da classe 4 Estabelecer limites de classes preliminares Rever os limites que devem tocarse mas não interceptase 5 Relacionar os intervalos e fazer a contagem dos pontos por classe a contagem total dever ser igual a n 6 Construir uma tabela de frequência ou histograma de frequência Distribuição de frequência para dados contínuos 70 1 Determinar o intervalo dos dados 2 Determinar o número K de classes 40 632 No caso dos pessegueiros n 40 logo É aconselhável tomar entre 5 a 20 classes Regra prática K Ajustála se for necessário Maior prod é 328 Menor prod é 32 n 71 900 30 Adotase K 20 Por ex n 900 Distribuição de frequência para dados contínuos Intervalo 328 32 296 328 32 que pode ser arredondado para 6 ou 7 adotado k 6 6 classes 296 3 Calcular a amplitude da classe Amplitude intervalo total nº de classes k Amplitude 296 6 494 5 4 Estabelecer limites de classes preliminares Rever os limites que devem tocarse mas não interceptarse Começando com o primeiro inteiro logo abaixo do menor valor do conjunto de dados Amplitude 5 Certifiquese que k vezes a amplitude é maior que o intervalo pois de outra forma os valores extremos não serão incluídos 5 6 30 30 296 ok 72 Distribuição de frequência para dados contínuos 12012024 13 6ª classe 28 5 33 5ª classe 23 5 28 4ª classe 18 5 23 Considerar os intervalos como 3 a 8 ou 3 8 8 a 13 ou 8 13 28 a 33 ou 28 33 13 a 18 ou 13 1 8 23 a 28 ou 23 28 18 a 23 ou 18 23 1ª classe 3 5 8 2ª classe 8 5 13 3ª classe 13 5 18 73 Distribuição de frequência para dados contínuos limite inferior limite superior Amplitude da classe Classe É importante que não ocorra lacunas na fixação das classes todo valor deve estar enquadrado em uma classe As classes não devem interceptarse um valor deve pertencer a só uma classe A amplitude é igual para todas as classes 74 Distribuição de frequência para dados contínuos 5 Relacionar classes e fazer a contagem dos pontos por classe a contagem total dever ser igual a n 75 Classe Contagem 3 a 8 8 a 13 13 a 18 18 a 23 23 a 28 28 a 33 8 10 9 7 4 2 Total n 40 Frequência Distribuição de frequência para dados contínuos 6 Construir uma tabela de frequência ou histograma de frequência Produção Número de árvores Percentagem de árvores 3 a 8 8 a 13 13 a 18 18 a 23 23 a 28 28 a 33 8 10 9 7 4 2 240 0050 740 0175 940 0225 1040 0250 840 0200 440 0100 totais n 40 100076 Frequência absoluta Frequência relativa Distribuição de frequência para dados contínuos Distribuição de frequência relativa para a safra de pêssego No eixo vertical poderia ser frequência absoluta nº de árvores Histograma frequência Classes de produção 3 8 13 18 23 28 33 000 010 020 030 77 Distribuição de frequência para dados contínuos Distribuição de frequência agrupada Perdas de informação Certa quantidade de informação é perdida porque os valores individuais perdem sua identidade quando são grupados em classes Para dados discretos isto também pode ocorrer dependendo da natureza dos dados e do objetivo do analista Distribuição de frequência para dados discretos 78 12012024 14 Nº de acidentes diários num grande estacionamento 6 9 2 7 0 8 2 5 4 2 5 4 4 4 4 2 5 6 3 7 3 1 8 4 4 4 7 7 6 5 4 7 5 3 7 1 3 1 0 6 5 8 2 3 6 0 5 6 6 3 Considere o exemplo abaixo onde estão 50 dados discretos inteiros de 0 a 9 Construa a distribuição de frequência tabela e gráfico 79 Distribuição de frequência para dados discretos Podemos construir a distribuição de frequência sem perda dos valores originais utilizando os inteiros de 0 a 9 Classe nº acidentes Número de dias Percentagem de dias 0 Sem perda de informação 1 2 3 4 5 6 7 8 9 3 3 5 6 9 7 7 6 3 1 006 006 010 012 018 014 014 012 006 002 Soma 50 dias 80 Freq absoluta Freq relativa Distribuição de frequência para dados discretos Classe nº de acidentes Número de dias Percentagem de dias 0 1 2 3 4 5 6 7 8 9 6 11 16 13 4 012 022 032 026 008 50 100 totais Com perda de informação 81 Podemos construir a distribuição de frequência com perda dos valores originais fazendo agrupamentos Freq absoluta Freq relativa Distribuição de frequência para dados discretos Comparação de duas distribuições de frequência 0 1 2 3 4 5 6 7 8 9 4 acidentes por dia ocorreram 9 vezes 18 a Sem perda de informação 20 15 10 5 01 23 45 67 89 b Com perda de informação 20 15 10 5 82 Distribuição de frequência para dados discretos Nº de acidentes Nº de acidentes Dados discretos A frequência acumulada tem por objetivo indicar o número ou percentagem de itens menores do que ou iguais a determinado valor PX x ou PX x Podemos construir a distribuição de frequência acumulada sem perda dos valores originais do exemplo anterior utilizando os inteiros de 0 a 9 ou com perda fazendo agrupamentos Distribuição de frequência acumulada 83 Classes nº de acidentes 0 1 2 3 4 5 6 7 8 9 Freq absoluta dias 3 3 5 6 9 7 7 6 3 1 Sem perda de informação Dados discretos Distribuição de frequência acumulada Soma 50 6 Freq acumulada dias 3 17 11 33 26 46 40 49 Frequência acumulada 006 006 006 006 012 012 022 034 018 034 052 014 052 066 014 066 080 012 080 092 006 092 098 002 098 100 010 012 022 84 12012024 15 Classe nº de acidentes 0 1 2 3 4 5 6 7 8 9 6 11 16 13 4 012 012 022 012 034 032 034 066 026 066 092 008 092 100 50 totais Com perda de informação Dados discretos Frequência absoluta dias Frequência acumulada Distribuição de frequência acumulada 85 Dados discretos 80 dos acidentes acorreram 6 vezes por dia ou menos 0 1 2 3 4 5 6 7 8 9 Com perda de informação 01 23 45 67 89 000 020 040 060 080 100 Sem perda de informação 000 020 040 060 080 100 Distribuição de frequência acumulada 86 Medidas da distribuição de frequência n número de elementos do conjunto de dados ci centro de cada classe de frequência fi frequência de cada classe ci X fi i 1 n n X fi i 1 n n xi com perda de informação sem perda de informação xi valor individual de cada elemento do conjunto de dados 87 Média Li limite inferior da classe que contém a mediana n número de elementos do conjunto de dados Fa soma das frequências das classes anteriores à que contém a mediana f md frequência da classe que contém a mediana hmd amplitude da classe que contém a mediana MD Li n 2 Fa hmd md f Medidas da distribuição de frequência 88 Mediana MD MO Li d 1 d 2 h d1 Li limite inferior da classe modal d1 diferença entre a frequência da classe modal e da classe imediatamente anterior d2 diferença entre a frequência da classe modal e da classe imediatamente seguinte h amplitude das classes Mo valor ou valores num conjunto de dados Medidas da distribuição de frequência 89 Moda MO Moda MO Determinação da moda num gráfico a sem perda b com perda moda classe modal Medidas da distribuição de frequência 90 12012024 16 Variância Na utilização da classe de frequência com perda de informação xi xc é o centro da classe de frequência O desvio padrão é a raiz positiva da variância mais complicada mais simples xi x 2 fi n 1 s2 s2 fi xi 2 fi xi 2 n n 1 ou Medidas da distribuição de frequência 91 Medidas de forma da distribuição de frequência Assimetria k coeficiente de assimetria skewness K 0 Normal Simétrica K 0 Negativamente desviada Assimétrica à esquerda K 0 Positivamente desviada Assimétrica à direita 92 moda mediana média média mediana moda moda mediana média Assimétrica à esquerda média e mediana estão a esquerda da moda Simétrica média moda e mediana coincidem Assimétrica à direita média e mediana estão à direita da moda Medidas de forma da distribuição de frequência 93 Assimetria Achatamento O coeficiente de achatamento Kurtosis é uma medida de planicidade flatness da distribuição 2 3 planicidade de uma curva normal mesocúrtica 2 45 curva bastante aguda leptocúrtica leptokurtosis 2 1 curva mais achatada platicúrtica platykurtosis Medidas de forma da distribuição de frequência 94 45 30 10 platícúrtica mesocúrtica leptocúrtica normal Medidas de forma da distribuição de frequência 95 Achatamento Os diagramas em caixa são convenientes para revelar tendências centrais dispersão distribuição de dados e presença de outliers valores extremos A mediana revela a tendência central A distância interquartil indica a dispersão dos dados O diagrama em caixa tem a vantagem de não ser tão sensível a valores extremos Não dão informações tão detalhadas quanto o histograma ou gráfico de ramo e folhas 96 Diagrama em caixa Box plot 12012024 17 Ordenase os dados 52 52 60 60 60 60 63 63 66 67 68 69 71 72 73 75 78 80 82 83 88 90 Exercício Construir o diagrama em caixa com os dados abaixo relativos à pulsação de 22 fumantes 60 52 68 69 73 60 80 90 82 52 60 63 83 60 60 66 72 75 67 63 71 78 Q1 P25 25100 x 22 55 arredondado para 6 logo Q1 60 Q2 mediana 685 Q3 78 Solução Valor mínimo 52 e valor máximo 90 685 78 60 90 52 97 Diagrama em caixa Box plot A melhor aplicação do diagrama em caixa é na comparação de dois ou mais conjuntos de dados é necessário usar a mesma escala Fumantes Não fumantes Pulsação 80 90 70 40 60 50 100 Não há diferenças substanciais nos dois conjunto de dados Os não fumantes têm mais valores extremos mas as medianas parecem coincidir A dispersão dos dados são parecidas 98 Diagrama em caixa Box plot No estudo dos valores outliers convém introduzir uma modificação na construção dos diagramas em caixa como segue a Calcular a diferença entre os quartis Q3 e Q1 distância interquartil denotandoa por D assim D Q3 Q1 b Desenhar normalmente a caixa com os quartis e mediana mas ao prolongar as retas que se partem da caixa caminhar apenas até os escores que estão a menos de 15D da mesma c Os outliers suaves são os valores que superam Q3 em 15D a 3D ou estão 15 a 3D abaixo de Q1 Marque os outliers suaves com pontos cheios d Os outliers extremos são escores que excedem Q3 em mais de 3D ou estão abaixo a mais de 3D de Q1 Marque os outliers extremos como pequenos círculos vazios 99 Diagrama em caixa Box plot Exemplo Construa o diagrama em caixa com conjunto de dados 3 15 17 18 21 21 22 25 27 30 38 49 68 Q1 1413 325 4º termo logo Q1 18 Q2 2413 65 7º termo logo Q2 22 Q3 3413 975 10º termo logo Q3 30 D Q3 Q1 12 D 12 15D 18 15D 18 3 38 18 22 30 Q1 Q3 Q2 outliers suaves outliers suaves 48 0 3D 3D 66 18 100 Diagrama em caixa Box plot outliers extremos outliers extremos 49 68 Exemplo Construa o diagrama em caixa com conjunto de dados 3 15 17 18 21 21 22 25 27 30 38 49 68 Q1 1413 325 4º termo logo Q1 18 Q2 2413 65 7º termo logo Q2 22 Q3 3413 975 10º termo logo Q3 30 D Q3 Q1 12 18 16 14 12 10 8 6 4 2 0 2 4 6 8 10 12 1 416 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 D 12 15D 18 15D 18 3 38 18 22 30 Q1 Q3 Q2 outliers suaves outliers suaves 48 0 3D 3D 66 18 101 Diagrama em caixa Box plot outliers extremos outliers extremos 49 68 Diagrama em caixa dos resultados das avaliações de Estatística nos campus de Ipatinga e BH 102 Diagrama em caixa Box plot 12012024 18 Salários de homens e mulheres de um grande banco americano Funcioná rios Qde Pessoas Mínimo Q1 Mediana Q3 Máximo 1 Mulheres negras 315 126410 171455 183540 203630 337030 2 Mulheres brancas 697 126410 184920 214920 255830 375130 3 Homens negros 81 147310 171550 184000 209720 326780 4 Homens brancos 162 126050 183433 220295 253020 366080 A tabela apresenta os dados de salários de homens e mulheres em um grande banco americano Faça um diagrama em caixa e tire conclusões 103 Diagrama em caixa Box plot 15000 20000 25000 30000 35000 Mulheres negras Mulheres brancas 40000 Homens brancos Homens negros 104 Diagrama em caixa Box plot Concentrese na parte da caixa que contem os quartis porque os extremos em um grande conjunto de dados muitas vezes são discrepantes Vemos ao mesmo tempo que os brancos tanto homens como mulheres tendem a ganhar mais do que os negros A renda mediana dos trabalhadores horistas brancos é maior que o terceiro quartil da renda dos negros Há apenas pequenas diferenças entre mulheres e homens dentro de cada raça Em termos legais os dados demonstram que políticas de remuneração têm impactos adversos sobre os negros O banco deve agora investigar se existe uma razão legítima para a diferença de ganhos entre brancos e negros tais como horas trabalhadas antiguidade ou classificação profissional 105 Diagrama em caixa Box plot Embora de menor interesse neste caso os boxplots também sugerem a simetria ou assimetria de distribuição Em uma distribuição simétrica o primeiro e terceiro quartis estão igualmente distantes a partir da mediana Na maioria das distribuições que são desviadas para a direita o terceiro quartil será mais acima da mediana do que o primeiro quartil é abaixo dela Os extremos se comportam da mesma maneira mas lembre se que eles são constituídos apenas de duas observações e pode dizer pouco sobre a distribuição como um todo especialmente se qualquer um deles é um valor extremo A figura sugere que as distribuições de salários são um pouco desviadas para direita para cima 106 Diagrama em caixa Box plot Reúne cinco informações importantes de um conjunto de dados Não dão informações detalhadas como os histogramas e diagramas de ramos e folhas São poderosos para comparar dois ou mais conjuntos de dados Aplicase em pequenos e grandes conjunto de dados 107 Diagrama em caixa Box plot Outlier ou valor discrepante é um valor que se localiza muito distante de quase todos os outros valores É um valor extremo Um valor outlier pode ser um erro ou um valor raro mas correto Um outlier pode afetar fortemente a média o desvio padrão e distorcer seriamente um histograma Outlier 108 Diagrama em caixa Box plot 12012024 19 Este diagrama é muito útil para apresentar um pequeno conjunto de dados até aproximadamente 20 dados Este gráfico nos permite rapidamente e facilmente ver a localização ou a tendência central e a variabilidade nos dados O conjunto de dados relativos à resistência de uma argamassa modificada em uma indústria de cimento 1685 164 1721 1635 1652 1704 1696 1715 1659 e 1657 argamassa modificada 160 165 170 175 180 resistência kgfcm2 Diagrama de pontos 109 É utilizado frequentemente para comparar dois ou mais conjuntos de dados Considere os dados de resistência de argamassa 1750 1763 1825 1800 1786 1775 1822 1790 1796 e 1815 argamassa modificada argamassa não modificada 160 165 170 175 180 185 resistência kgfcm2 Imediatamente verificase que a argamassa modificada apresenta resultados com valores menores de resistência A variabilidade dentro dos grupos é praticamente a mesma Também é possível ver a frequência dos dados Diagrama de pontos 110 Turma A Turma B 20 10 18 12 17 11 12 15 9 13 11 14 13 8 15 7 16 7 15 8 16 8 17 9 18 7 16 8 14 9 16 4 15 4 15 5 15 6 15 5 12 6 10 3 12 7 14 8 16 8 Minitab Diagrama de pontos 111 Turma A Turma B 20 10 18 12 17 11 12 15 9 13 11 14 13 8 15 7 16 7 15 8 16 8 17 9 18 7 16 8 14 9 16 4 15 4 15 5 15 6 15 5 12 6 10 3 12 7 14 8 16 8 Minitab Diagrama de pontos 112 A tabela de frequência e o histograma mostram a natureza da distribuição dos dados mas pode ocorrer perda de informação O diagrama de ramos e folhas mostra a natureza da distribuição do conjunto de dados sem perda de informação Os dados devem conter pelo menos dois dígitos Exemplo O dado 257 é dividido em duas partes a primeira parte 25 chamada de ramo é constituída pelo primeiro ou primeiro e segundo dígitos e a segunda parte 7 chamada de folha é constituído pelo dígito restante É usual escolher o número de ramos entre 5 a 20 Limitação não considera a temporalidade dos dados O tempo pode ser uma fator importante na variabilidade dos dados Diagrama de ramos e folhas 113 Resistência a compressão de uma liga de alumínio 54 dados 105 221 183 186 121 181 180 143 245 228 174 199 181 158 176 110 207 180 190 193 194 133 156 123 97 154 154 174 120 168 167 141 163 131 153 115 160 208 158 133 134 178 76 167 184 135 220 146 218 157 101 171 165 172 Diagrama de ramos e folhas 114 Ramos Folhas Frequência 7 6 1 9 7 1 10 1 5 2 11 0 5 2 12 0 1 3 3 13 1 3 3 4 5 5 14 1 3 6 3 15 3 4 4 6 7 8 8 7 16 0 3 5 7 7 7 8 7 17 1 2 4 4 8 5 18 0 0 1 1 3 4 6 7 19 0 3 4 9 4 20 7 8 2 21 8 1 22 1 8 9 3 24 5 1 12012024 20 Resistência a compressão de uma liga de alumínio 54 dados 105 221 183 186 121 181 180 143 245 228 174 199 181 158 176 110 207 180 190 193 194 133 156 123 97 154 154 174 120 168 167 141 163 131 153 115 160 208 158 133 134 178 76 167 184 135 220 146 218 157 101 171 165 172 Diagrama de ramos e folhas 115 Ramos Folhas Frequência 7 6 1 9 7 1 10 1 5 2 11 0 5 2 12 0 1 3 3 13 1 3 3 4 5 5 14 1 3 6 3 15 3 4 4 6 7 8 8 7 16 0 3 5 7 7 7 8 7 17 1 2 4 4 8 5 18 0 0 1 1 3 4 6 7 19 0 3 4 9 4 20 7 8 2 21 8 1 22 1 8 9 3 24 5 1 StemandLeaf Display F ruptura Stemandleaf of F ruptura N 100 Leaf Unit 10 1 17 6 2 18 7 3 19 7 6 20 058 9 21 045 13 22 0138 19 23 114555 26 24 2235688 37 25 00013447888 21 26 000012334455555577899 42 27 01124444566788 28 28 0000113367 18 29 0346899 11 30 0178 7 31 78 5 32 18 3 33 47 1 34 6 Força de ruptura de garrafas descartáveis de 1 litro de refrigerantes 100 dados 265 197 346 280 265 200 221 265 261 278 205 286 317 242 254 235 176 262 248 250 263 274 242 260 281 246 248 271 260 265 307 243 258 321 294 328 263 245 274 270 220 231 276 228 223 296 231 301 337 298 268 267 300 250 260 276 334 280 250 257 260 281 208 299 308 264 280 274 278 210 234 265 187 258 235 269 265 253 254 280 299 214 264 267 283 235 272 287 274 269 215 318 271 293 277 290 283 258 275 251 Minitab Diagrama de ramos e folhas 116 Diagrama de sequência ou temporal 117 Diagrama de sequência ou temporal 118 CONCEITOS BÁSICOS DE PROBABILIDADE 119 Qual é a probabilidade do GALO conquistar um TRI brasileiro ainda neste século Qual é a probabilidade dessa turma ser aprovada em QSND dado que os alunos fazem todos os exercícios Qual é a probabilidade dos políticos serem julgados e punidos aqui no Brasil Próxima de zero Mais de 90 Só Deus sabe 120 12012024 21 É a chance que alguma coisa um evento tem para ocorrer Exprime a chance de ocorrência de determinado evento NOTAÇÃO P denota probabilidade A B C denotam eventos específicos PA denota a probabilidade do evento A ocorrer A probabilidade pode ser expressa em fração decimal 0 a 1 ou percentagem 0 a 100 sendo 0 ou 0 a probabilidade de um evento impossível e 1 ou 100 a probabilidade de ocorrência um evento certo Conceitos de probabilidade 121 Exemplo Seja o evento A tirar um ás num baralho de 52 cartas logo a probabilidade de ocorrer o evento A é Conceitos de probabilidade Nº de possibilidades de interesse Nº total de possibilidades PA 4 ases existentes 52 cartas possíveis 4 00769 769 PA 52 122 Clássico Aplicase à situações que têm resultados igualmente prováveis Moeda equilibrada Pcara 1 2 Pcoroa 1 2 Dado perfeito Pqualquer face 1 6 Baralho sem vício P1dama 4 52 PA Número de resultados associados ao evento A Número total de resultados possíveis Conceitos de probabilidade 123 Empírica ou frequência relativa Aplicase à situações onde os resultados não são igualmente prováveis Moeda não equilibrada é claro que cara e coroa não são igualmente prováveis Fazse experimentos e obtémse os dados para estimar as probabilidades Exemplo Lançase uma moeda 100 vezes e obtémse 60 caras PA Número total de provas ou observações Número de ocorrências de A É razoável estimar a probabilidade de cara em jogada futura como sendo 60 100 060 Pcara Conceitos de probabilidade 124 S A Considere a experiência Lançar um dado São 6 resultados possíveis faces 1 2 3 4 5 e 6 Considere que você deseja apenas os resultados pares faces 2 4 e 6 Considere que você deseja apenas os resultados maiores que 4 faces 5 e 6 B Conceitos de probabilidade 125 Experimento Ação por meio do qual se obtém contagens medições ou respostas É uma experiência Exemplo Lançar um dado Extrair uma carta de um baralho de 52 cartas Contar carros brancos em frente à faculdade Empacotar caixas de leite de 1000 ml S Espaço amostral Conjunto de todos os resultados possíveis de um experimento e é designado pela letra S Conceitos de probabilidade 126 12012024 22 Evento É um subconjunto do espaço amostral Evento A Faces pares do dado Evento B Faces maiores que 4 Conceitos de probabilidade 127 A B S S Exercício Dois dados são lançados e os resultados são anotados 36 possibilidades 11 12 13 14 15 16 21 22 23 24 25 26 31 32 33 34 35 36 41 42 43 44 45 46 51 52 53 54 55 56 61 62 63 64 65 66 S Evento A a soma dê 4 Evento B a soma dê 11 Evento C a soma dê 4 ou 11 Conceitos de probabilidade A 132231 PA 336 B 5665 PB 236 C 1322315665 PC 536 128 Conceitos de probabilidade Aleatoriedade e probabilidade Acaso o comportamento ao acaso é imprevisível no curto prazo mas tem um padrão regular e previsível no longo prazo Exemplo uma moeda jogada uma vez pode dar cara ou coroa Não se sabe previamente o que pode ocorrer Mas uma moeda jogada um número muito grande de vezes sabese que 50 das vezes teremos cara e nos outros 50 teremos coroa Chamase um fenômeno de aleatório se os resultados individuais são incertos embora haja uma distribuição regular de resultados em um grande número de repetições A probabilidade de qualquer fenômeno aleatório é a proporção de vezes que o resultado ocorreria em uma série muito longa de repetições 129 Evento complementar A ou A ou Ac É todo evento do espaço amostral não pertencente ao evento A O complemento do evento A é o evento A que consiste em todos os resultados do espaço amostral que não estejam incluídos no evento A S A A PA 1 PA A A Conceitos de probabilidade 130 Espaço amostral área total 1 PA PB Evento B Evento A Diagrama de Venn Conceitos de probabilidade PA PA Espaço amostral área total 1 PA PA 1 A 131 Exercício A produção diária de carros é de 12 carros 5 dos quais são defeituosos Se um carro for selecionado ao acaso determine a probabilidade de que ele não seja defeituoso que seja bom Conceitos de probabilidade PB 1 512 712 0583 PD 512 PB 1 PD PB PD 1 D DEFEITUOSO B BOM Solução B B D B B B D D B B D D 1 2 3 4 5 6 7 8 9 10 11 12 12 carros 132 PB Nº carros bons Nº total carros ou PB 712 0583 12012024 23 Dois eventos A e B são mutuamente exclusivos se a ocorrência de um evento exclui a ocorrência do outro evento numa mesma tentativa Não existem elementos comuns entre eles A B PA e B 0 A Ter menos de 21 anos B Estar concorrendo ao senado da república do Brasil A B A Ter nascido em Ipaba B Ter nascido em Murici Eventos mutuamente exclusivos disjuntos Conceitos de probabilidade Exemplo 133 Se dois eventos podem ocorrer na mesma tentativa eles não são mutuamente exclusivos Existem elementos comuns entre eles A B PA e B 0 A B A Ter menos de 25 anos B Ser um advogado A Ter nascido em Cuba B Assistir o programa de Tom e Jerry na TV PA e B Exemplo Eventos não excludentes Conceitos de probabilidade 134 Dois eventos que não são independentes são dependentes Eventos dependentes um evento influencia a ocorrência do outro Uma planta crescer e regar planta frequentemente Estudar a matéria e tirar boas notas nas provas Conceitos de probabilidade 135 Eventos independentes a ocorrência de um evento não influencia a ocorrência do outro Num lance de dois dados o conhecimento do resultado de um deles em nada nos ajuda a predizer o resultado do outro Colocar um livro de matemática debaixo da cama e obter uma boa nota na prova não estão correlacionados Dois eventos são independentes se a probabilidade de ocorrência do evento B não for afetada pela ocorrência ou não ocorrência do evento A Conceitos de probabilidade 136 Exercício Dois dados são lançados Determine a probabilidade de sair 2 no segundo lançamento dado que no primeiro já saiu 2 Espaço amostral do 1º dado S 1 2 3 4 5 6 Espaço amostral do 2º dado S 1 2 3 4 5 6 Evento A Evento B Observe que a ocorrência do evento A em nada afeta a ocorrência do evento B e portanto os eventos são independentes Logo a probabilidade de tirar um 2 no 2º dado é 16 independentemente do resultado obtido no primeiro lançamento Conceitos de probabilidade PA 16 PA 16 2 2 137 Probabilidade da ocorrência de eventos simultâneos PA e B Regra da multiplicação A e B são independentes PA e B PA PBA não Probabilidade condicionada Probabilidade de ocorrer o evento B quando o evento A já ocorreu ATENÇÃO A B A e B A B Regra da multiplicação PA e B PA PB sim 138 PA e B PB PAB 12012024 24 Exercício Jogamse duas moedas equilibradas Qual é a probabilidade de ambas darem cara PA e PB obter ambas moedas com cara Logo PA e B PA PB x Regra da multiplicação Solução É razoável admitir que os resultados das duas moedas sejam independentes um do outro PA cara na 1ª jogada 1ª moeda PB cara na 2ª jogada 2ª moeda Pcara 1 2 1 2 1 2 1 2 1 2 1 4 Pcara e cara 139 Em 25 das vezes Manoel chega em casa tarde para jantar Por outro lado o jantar atrasa 10 das vezes Se não há qualquer relação entre os atrasos de Manoel e os atrasos do jantar qual é a probabilidade de ocorrerem ambos os atrasos Os eventos de atrasos são independentes Solução PA 025 atrasos do Manoel PB 010 atrasos do jantar PA e B PA PB 025 010 0025 25 PA e B Pambos atrasos Regra da multiplicação Regra da multiplicação 141 Simbolicamente se escreve PAB o que significa probabilidade de ocorrer o evento A tendo ocorrido o evento B ou supondo o evento B ou dado o evento B Exemplos Dentre três urnas com fichas brancas e vermelhas qual é Pficha vermelhaurna Z probabilidade de tirar uma ficha vermelha tendo sido definida a urna Z Numa bancada com máq elétricas e mecânicas novas e usadas qual é Pmaquina elétricanova probabilidade de tirar uma máquina elétrica sabendo que ela é nova Quando dois eventos são independentes o fato de sabermos que um deles ocorreu nada nos diz sobre a ocorrência do outro logo PAB PA e Um evento não afeta o outro evento PBA PB 142 Probabilidade condicionada ou condicional Exercício Dois carros são selecionados em uma linha de produção com 12 carros 5 deles defeituosos Qual é a probabilidade de o segundo carro ser defeituoso dado que o primeiro carro era defeituoso Probabilidade condicionada ou condicional 12 carros 7 carros bons 5 carros defeituosos 143 Solução Dado que um carro já foi selecionado defeituoso o espaço amostral condicional possui 4 defeituosos entre 11 carros existentes Logo PBA 411 Evento B 2º carro defeituoso dado que o evento A já ocorreu é Evento A primeiro carro defeituoso Probabilidade condicionada ou condicional PD 512 411 A probabilidade do 2º carro ser ou não ser defeituoso depende do 1º ser ou não defeituoso Os eventos são dependentes 144 Suponhamos duas urnas com fichas A urna Y contém 8 fichas vermelhas e 2 brancas A urna Z contém 5 vermelhas e 5 brancas Qual a probabilidade de escolher uma ficha vermelha e a urna Z que seja vermelha e seja a urna Z Vermelha Branca Total Urna Y 8 2 10 Urna Z 5 5 10 Exercício Probabilidade condicionada ou condicional Urna Y 10 fichas Urna Z 10 fichas V ficha vermelha B ficha branca Y urna Y Z urna Z Desejase PV e Z 145 12012024 25 Solução Desejase PV e Z A probabilidade de ocorrer uma ficha vermelha ou branca depende da urna escolhida portanto o evento cor da ficha depende do evento urna escolhida Eventos dependentes PV e Z PZ PVZ Probabilidade condicionada ou condicional Urna Z 10 fichas PV 510 Urna Y 10 fichas PV 810 PVZ 510 12 Qual é a probabilidade de tirar uma ficha vermelha na urna Z Qual é a probabilidade de tirar uma ficha vermelha na urna Y 146 PV e Z PZ PV Z 12 x 12 14 PY 12 escolher a urna Y PZ 12 escolher a urna Z PV escolher ficha vermelha PV Z 510 12 Desejase PV e Z PZ PV Z Regra da multiplicação 147 Probabilidade condicionada ou condicional Urna Z 10 fichas Desejase PV e Z PZ PVZ Probabilidade condicionada ou condicional Dado que a urna Z foi escolhida temos então 10 fichas para serem escolhidas Nesta urna temos 5 fichas vermelhas A probabilidade de escolhermos uma ficha vermelha é então PVZ 510 12 como pode ser visto na figura abaixo vermelha branca total Urna Y 8 2 10 Urna Z 5 5 10 Outra maneira de ver a probabilidade condicionada PVZ é usar a própria tabela para equacionar o problema 148 Exercício Perguntouse a uma amostra de pessoas adultas em três cidades se elas gostavam de um novo suco Ipatinga Iapu Dionísio Total Sim 100 150 150 400 Não 125 130 95 350 Não sabe 75 170 5 250 Total 300 450 250 1000 Uma das respostas é selecionada ao acaso Determine a PSim d PNão dado Dionísio b PIapu e PDionísio e não c PDionísio Probabilidade condicionada ou condicional 149 O evento Não depende de qual cidade é escolhida IPA PN 125300 IAPU PN 130450 Dionísio PN 95250 portanto são eventos dependentes Ipatinga Iapu Dionísio Total Sim 100 150 150 400 Não 125 130 95 350 Não sabe 75 170 5 250 Total 300 450 250 1000 e PDionísio e Não Solução Probabilidade condicionada ou condicional a Psim b PIapu c PDionísio d Pnão dado Dionísio Observe a linha pontilhada 400 1000 04 450 1000 045 250 1000 025 95 250 038 PDionísioPNãoDionísio 250100095250 0095 150 Dois carros são selecionados em uma linha de produção com 12 unidades sendo 5 deles defeituosos Determine a probabilidade de ambos serem defeituosos Evento B selecionar o 2º carro defeituoso dado que um carro já foi selecionado PBA 411 Solução Pedese PA e B PAB PA e B PA PBA 512 411 01515 PBA 411 Eventos dependentes Probabilidade condicionada ou condicional Evento A selecionar o 1º carro defeituoso PA 512 151 12012024 26 Regra da adição A e B são mutuamente excludentes PA ou B PA PB PA e B PA B PA PB A B Parcela subtraída pelo fato dos eventos A e B terem ocorrido ao mesmo tempo ATENÇÃO sim A B A ou B AB PA ou B PAB Pevento A ocorrer ou evento B ocorrer ou ambos ocorrem PA B Regra da adição não 152 P6 16 Paparecer o seis Qual a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado Solução Numa jogada de um dado ou aparece o cinco ou aparece o seis portanto são eventos mutuamente exclusivos P5 16 Paparecer o cinco Desejase P5 ou 6 P5 P6 P5 6 P5 P6 16 16 26 13 Regra da adição Regra da adição 153 Qual a probabilidade de extração de uma carta de copas ou uma carta de paus de um baralho de 52 cartas Solução Tirar uma carta de copas exclui a possibilidade de tirar uma carta de paus logo os eventos são mutuamente exclusivos PA 1352 tirar carta de copas Num baralho com 52 cartas temos 13 de copas 13 de paus 13 de ouros e 13 de espadas PB 1352 tirar carta de paus Desejase PA ou B PA PB PA B PA PB 1352 1352 2652 05 50 Regra da adição Regra da adição 154 Regra da adição Exercício Uma carta é tirada de um baralho Determine a probabilidade de ser um rei ou ser um naipe vermelho Evento B a carta é vermelha PB 2652 Tirar um rei e tirar uma carta vermelha são eventos independentes logo PA e B PA PB 452 2652 252 PA ou B PA PB PA e B PA ou B 452 2652 252 2852 0538 Eventos não mutuamente excludentes p p v v v v v v v v v v v v v v A 4 cartas B 26 cartas v Regra da adição Evento A a carta é um rei PA 452 Pedese PA ou B 155 Exercício Perguntouse a uma amostra de adultos em três cidades se eles gostavam de um novo suco Os resultados são apresentados na tabela de contingência a seguir Ipatinga Iapu Dionísio Total Sim 100 150 150 400 Não 125 130 95 350 Não sabe 75 170 5 250 Total 300 450 250 1000 Uma das respostas é selecionada ao acaso Determine a PDionísio e Sim b PDionísio e Iapu c PDionísio ou Sim d PDionísio ou Iapu Regra da adição 156 Solução d PDionísio ou Iapu Ipatinga Iapu Dionísio Total Sim 100 150 150 400 Não 125 130 95 350 Não sabe 75 170 5 250 Total 300 450 250 1000 Regra da adição a PDionísio e Sim 2501000 150250 015 eventos dependentes Psim depende de qual cidade é escolhida b PDionísio e Iapu eventos mutuamente excludentes 0 c PDionísio ou sim 2501000 4001000 1501000 05 eventos não mutuamente excludentes podem ocorrer simultaneamente eventos mutuamente excludentes 4501000 2501000 01000 07 PDPSD PD PIAPU PD PS PD e S PD e S PD PSD 2501000150250são dependentes 157 12012024 27 Se um evento pode ocorrer de m maneiras e um segundo evento pode ocorrer de n maneiras o número de maneiras pelas quais os dois eventos podem ocorrer em sequência é mn Essa regra pode ser estendida para qualquer número de eventos que ocorram em sequência Se uma refeição consiste de duas opções de sopa três pratos principais e duas de sobremesas quantas refeições diferentes podem ser compostas Início 2 3 Principal 2 Sopa Sobremesa 12 refeições Técnicas de contagem 158 Uma prova cuja resposta da questão seja V verdadeira ou F falsa quantos gabaritos podem ter se a prova tiver 1 questão 2 questões 3 questões 4 questões ou 5 questões FFV Qde gabaritos FFF FVF VVV VFV FVV VFF V F V F V F Diagrama de árvore VVF Técnicas de contagem Questão Nº1 Questão Nº2 Questão Nº3 2 8 possibilidades 2 2 V F V F V F V F 159 Técnicas de contagem Observe que o número de resultados possíveis cresce rapidamente e a dificuldade para enumerar os resultados também aumenta 4 Nº de questões Gabaritos possíveis Nº de gabaritos possíveis 3 1 V F 21 2 23 24 2 VV VF FV FF 22 4 8 16 VVV VVF VFF VFV FFF FVV FFV FFF VVVV VVVF VVFF VFFF 5 25 32 VVVVV VVVVF VVVFF VVFFF VFFFF 160 Exercício Qual a probabilidade de acertar o gabarito correto respondendo ao acaso quando a prova tiver 5 questões e 20 questões P5 125 1 32 00312 312 Como só precisamos do número de resultados possíveis usamos uma maneira simples de conhecer este número de resultados do experimento aplicando as técnicas de contagem PERMUTAÇÃO ARRANJO COMBINAÇÃO 5 questões 32 gabaritos possíveis 25 20 questões 1048576 gabaritos possíveis 220 Técnicas de contagem P20 1220 1 1048576 0000000954 00000954 161 Entre os tantos de gabaritos possíveis apenas um é certo De quantas maneiras você pode colocar n objetos em ordem Com base no princípio fundamental da contagem o número de maneiras em que n objetos podem ser arranjados é nn1n2n3 1 Essa expressão é chamada de FATORIAL e escrevese n Saiba que 0 1 e 1 1 Fatorial Técnicas de contagem Exemplo Seja n 5 logo fatorial de n é 5 5 x 4 x 3 x 2 x 1 120 n n1 n2 n3 1 162 Quando temos n elementos dispostos de n formas diferentes e a ordem dos elementos é importante utilizamos a permutação É um caso particular de arranjo Pn n Quando os n elementos podem ser de tipos diferentes temos número de permutações disposições diferentes que será dada por P n 1 n 2 n 3 n k n n1 n2 n3 n4 nk n Técnicas de contagem 163 Permutação 12012024 28 Temos 6 lápis de cores diferentes De quantas formas diferentes podemos ordenar os lápis Exercício Temos 6 lápis sendo 2 vermelhos 3 azuis e 1 branco De quantas formas diferentes podemos ordenálos n 6 n1 2 n2 3 e n3 1 P 6 2 x 3 x 1 60 formas diferentes Técnicas de contagem 720 maneiras V1 V2 A1 A2 A3 B1 V2 V1 A1 A2 A3 B1 Os lápis V1 e V2 foram trocados de posição e a disposição das cores não alterou n 6 P 6 6x5x4x3x2x1 720 maneiras diferentes 164 Permutação Considere três livros de cores diferentes Faça todos agrupamentos dos três livros dois a dois Verifique que o agrupamento verdelaranja é diferente do agrupamento laranjaverde A ordem diferente dos livros é importante pois propicia maneiras diferentes de dispor os livros Todas disposições precisam ser consideradas Isto configura um ARRANJO Logo temse 6 arranjos 1 2 3 4 5 6 165 Técnicas de contagem Arranjo Combinação Verifique que a reta AB reta BA que a reta AC reta CA e que a reta BC reta CB A ordem dos pontos não é importante pois de um jeito ou do outro propicia retas iguais portanto nem todas as retas devem ser consideradas Isto configura uma COMBINAÇÃO Logo temse 3 combinações possíveis Considere três pontos Trace todas retas possíveis A B C B C A C A B A C B C B A 166 Técnicas de contagem Arranjo Combinação Quando os n elementos estão agrupados em x formas diferentes e a ordem da disposição dos elementos é importante temos os arranjos É uma permutação na qual n número de elementos do experimento x tamanho do agrupamento n nx Anx Técnicas de contagem 167 O arranjo é uma permutação de subconjuntos de x elementos agrupamentos de x a x que podem ser selecionados a partir um conjunto de n elementos Arranjo Se há 7 cavalos em um páreo quantas disposições diferentes de cavalos há considerando 1º 2º e 3º lugares Imagine os cavalos A B C D E F G Os agrupamentos ABC ACB são agrupamentos diferentes pois o cavalo B no primeiro caso está em 2º lugar e no 2º caso está em 3º lugar logo a ordem é importante e está configurando um arranjo A73 7 73 7x6x5x4x3x2x1 4x3x2x1 210 Técnicas de contagem 168 Arranjo Você precisa ler cinco livros de uma lista de oito De quantas maneiras diferentes você pode fazêla Solução Imagine os livros A B C D E F G H 8 livros Podemos ler os livros das seguintes maneiras ABCDE ABCDF ABCDG As maneiras ACBED CABED DBCEA etc são diferentes da primeira à esquerda pois apesar de serem os mesmos livros a leitura é feita em ordem diferente A ordem dos livros é importante e portanto configurase um arranjo A85 8 85 8x7x6x5x4x3x2x1 3x2x1 6720 Há 6720 maneiras diferentes de ler cinco livros de uma lista de oito HGFAD Técnicas de contagem 169 Arranjo 12012024 29 Quando os n elementos estão agrupados em x formas diferentes e a ordem da disposição dos elementos NÃO é importante temos combinações de elementos Cn x n xnx n x nCx Técnicas de contagem 170 Combinação Imagine 3 pontos A B e C Quantas retas podemos fazer unindo dois pontos quaisquer Retas AB BA AC CA BC e CB como as retas BA e AB constituem uma única reta da mesma forma que AC e CA e BC e CB logo a ordem não é importante e as unidades repetidas não devem ser consideradas na contagem Esta situação configura uma combinação n 3 e x 2 C3 2 3 232 3 Técnicas de contagem 171 Combinação De quantas maneiras podemos formar um comitê de uma mulher e dois homens de um total de 4 mulheres e 6 homens Técnicas de contagem Desejase comitês de MHH 1 mulher e 2 homens Disponibilidade M1M2M3M4 H1H2H3H4H5H6 Do grupo de 4 mulheres podemos formar 4 comitês de 1 mulher C 141 4 1 4 4 M1 M2 M3 M4 H H H H H H H H 172 Combinação Do grupo de 6 homens podemos formar 15 comitês de 2 homens 62 2 C 6 2 6 15 Formando os comitês de 1 mulher e 2 homens temse 4 x 15 60 Técnicas de contagem H1H2 H1H3 H5H6 15 possibilidades M1 H1H2 H1H3 H5H6 15 vezes M2 H1H2 H1H3 H5H6 15 vezes M3 H1H2 H1H3 H5H6 15 vezes M4 H1H2 H1H3 H5H6 15 vezes 60 vezes C41 x C 6 2 173 Combinação Você precisa ler cinco livros de uma lista de oito De quantas maneiras você pode escolher os livros se a ordem não importa Se a ordem não importa a sequência ABCDE ABCED ABDCE ABDEC e todas suas variações constituem uma única maneira pois o texto disse que a ordem não importa logo configurase uma combinação Há 56 maneiras diferentes de ler cinco livros de uma lista de oito considerando que a ordem de leitura não é importante Técnicas de contagem 5x3x2x1 585 C 8 5 8 56 8x7x6x5 174 Combinação Técnicas de contagem 1 O projeto de um site na internet consiste em quatro cores três fontes e três posições para uma imagem Quantos projetos diferentes podem ser realizados Faça o diagrama de árvore 175 36 Da regra da multiplicação 4 3 3 36 projetos diferentes são possíveis 4 Cores 3 x Fontes 3 x Posições 12012024 30 Técnicas de contagem 2 Uma placa de circuito impresso tem oito localizações diferentes em que um componente pode ser colocado Se quatro componentes diferentes forem colocados na placa quantos projetos diferentes são possíveis A 8 4 8 84 1680 projetos possíveis 3 Um centro cirúrgico de um hospital necessita programar três cirurgias de joelho e duas cirurgias de quadris em um dia O número de sequências possíveis das três cirurgias de joelho e das duas cirurgias de quadris é Pn n 1 n 2 n n1 n2 5 3 X 2 10 jjjqq jjqjq jjqqj jqqjj jqjqj jqjjqqqjjj qjqjj qjjqj qjjjq 176 1 2 3 4 5 6 7 8 Observase que a ordem é importante Técnicas de contagem Amostragem sem Reposição Um silo com 50 itens fabricados contém três itens defeituosos e 47 itens não defeituosos Uma amostra de seis itens é selecionada Os itens selecionados não são repostos Quantas amostras diferentes existem de tamanho seis que contêm exatamente dois itens defeituosos B1B2B3B4 D1D2 Temse 47 itens bons para se escolher 4 itens sem repetir Assim temos uma C47 4 Temse 3 itens defeituosos para se escolher 2 itens sem repetir Assim temos uma C3 2 47 4 3 2 X 178365 x 3 535095 Amostras diferentes de tamanho 6 com exatamente 2 itens defeituosos B1B2B3B4B5 B47 47 itens bons 3 itens defeituosos D1D2D3 177 DISTRIBUIÇÕES DE PROBABILIDADES DISCRETAS 178 Variável aleatória Uma variável aleatória X é o resultado numérico de um experimento probabilístico X O número de pessoas num carro X Quantidade de metros cúbicos de gás comprados numa semana X O tempo que se gasta para ir da casa até a escola X O número de vezes que vai à escola por semana Exemplos 179 Variável aleatória contínua Variável aleatória contínua Variável aleatória discreta Variável aleatória discreta Variável aleatória Discreta Os possíveis resultados estão contidos em um conjunto finito ou enumerável Contínua Os possíveis resultados abrangem todo um intervalo de números reais 0 1 2 3 4 0 número de defeitos na pintura número de carros fabricados Ex Ex tempo de resposta do corredor pressão atmosférica ao nível do mar Variável aleatória 180 Identifique cada variável aleatória como discreta D ou contínua C Exercício Variável aleatória Número de pessoas em num carro Quantidade de metros cúbicos de gás comprados na semana O número de vezes que vai à escola por semana O tempo que se gasta para ir da casa até a escola Número de pessoas você conta 0 1 2 3 Você mede a quantidade de metros cúbicos de gás Você conta o número de vezes que vai à escola Você mede a quantidade de tempo D C D C 181 12012024 31 Distribuição discreta de probabilidades Em um levantamento realizado com várias famílias avaliouse a quantidade de veículos que elas possuíam X Px 0 0004 1 0435 2 0355 3 0206 Px 1000 X Número de veículos por família Distribuição de probabilidade é um gráfico uma tabela ou fórmula que dá a probabilidade para cada valor que a variável aleatória assume PROPRIEDADES DE UMA DISTRIBUIÇÃO Uma distribuição de probabilidade deve sempre atender aos dois requisitos abaixo Px 1 x assume todos valores possíveis 0 Px 1 para qualquer valor individual de x 182 Observe que 1 P0 P1 P2 P3 1 0004 0435 0355 0206 1 2 P0 P1 P2 e P3 estão todos entre 0 e 1 0004 0435 0355 0206 Os dois requisitos estão satisfeitos Número de veículos por família Px 0 1 2 3 0435 040 030 020 010 0004 0355 0206 Distribuição discreta de probabilidades 183 Distribuição discreta de probabilidades 184 Se o experimento for repetido muitas vezes Uma variável aleatória va pode assumir diversos valores e cada valor tem a sua probabilidade de ocorrer Então existe um valor médio destes valores um valor central que representa bem a distribuição Este valor chamase esperança da distribuição Ex Como os valores assumidos variam em torno do valor médio podese calcular a variabilidade da distribuição em torno da média variância σ2x e desvio padrão σx O valor médio valor esperado da distribuição deve ser entendido como o valor médio que a distribuição terá se o experimento for repetido um número infinito de vezes O valor médio ou valor esperado de uma variável aleatória discreta é designado por μ x ou Ex Distribuição discreta de probabilidades 185 Distribuição discreta Média μx Ex Σx Px Pi xi Variância σ2 x E2 Px Desvio padrão σ x E2 Px ou σ2 x2 PX µ2 Exercício Calcule a média valor esperado a variância e desvio padrão da distribuição de probabilidade do exercício anterior X nº de carros por família Quantidade de veículos por família Se o experimento avaliação da qte de veículos por famílias for repetido uma grande quantidade de vezes verifica se que o valor esperado média é de 1763 veículo por família Algumas famílias terão um pouco mais e outras terão um pouco menos mas a média será 1763 se este evento se repetir infinitas vezes Interpretação do resultado Distribuição discreta de probabilidades 186 Variância e Desvio padrão Desvio padrão σ x E2 Px 0601 0775 veículo Distribuição discreta de probabilidades 187 12012024 32 Exercício Você tem uma loja de eletrodomésticos e tem os seguintes registros históricos de vendas de refrigeradores Quantos refrigeradores se espera vender por dia em média a longo prazo Qual o valor esperado xi Número vendidodia Px frequência relativa 0 020 1 030 2 030 3 015 4 005 Calcule a média valor esperado a variância e o desvio padrão dessa distribuição Distribuição discreta de probabilidades Com base nos dados podese concluir que se trata de uma distribuição discreta 188 Distribuição discreta de probabilidades Xi Px xi Px x Ex x E2 x E2 Px Número vendidodia frequência relativa 0 02 0 155 240 048 1 03 03 055 030 009 2 03 06 045 020 006 3 015 045 145 210 032 4 005 02 245 600 030 Ex soma 155 Var xE2Px 125 Desvio padrão raiz q125 11 189 0 005 01 015 02 025 03 035 0 1 2 3 4 probabilidade de venda nº de refrigeradores vendidos Distribuição de probabilidades Uma distribuição de probabilidades é uma distribuição de frequências para os resultados de uma variável aleatória Uma distribuição de probabilidades dá a probabilidade de cada valor de uma variável aleatória Exemplo A probabilidade de vender refrigeradores de uma loja x Número vendidodia Px frequência relativa 0 020 1 030 2 030 3 015 4 005 Distribuição discreta de probabilidades 190 Propriedades do valor esperado e variância quando x e y forem variáveis independentes Item Valor esperado Ex Variância Vx 1 Ek k Vk 0 2 EX k EX k VX k VX 3 EkX kEX VkX k2VX 4 EXY EX EY DPkX kDPX 5 EXY EX EY VX Y VX VY Distribuição discreta de probabilidades 191 Propriedades do valor esperado e variância x px Distribuição de X Ex e Vx Distribuição de Z kX z pz Ex k e k2Vx Distribuição de Y X k Ex k e Vx px x Distribuição de X Ex e Vx Distribuição discreta de probabilidades Média ficou acrescida de k Variância não se alterou Média ficou multiplicada por k Variância ficou multiplicada por k2 y py k k Exemplo Y X k Exemplo Z kX 192 Para se ter uma distribuição de probabilidades é necessário PX 1 onde X toma todos valores possíveis 0 PX 1 para todo o X Envolvem distribuições de probabilidades de variáveis aleatórias relativas a dados que podem ser contados Número de ocorrências por amostras Número de ocorrências num intervalo de tempo Exemplo DSTRIBUIÇÕES DESCONTÍNUAS OU DISCRETAS Número nascimentos em um hospital Distribuição discreta de probabilidades 193 12012024 33 UNIFORME OU RETANGULAR BINOMIAL BINOMIAL NEGATIVA OU DE PASCAL GEOMÉTRICA POISSON MULTINOMIAL OU POLINOMIAL HIPERGEOMÉTRICA OUTRAS DESCONTÍNUAS OU DISCRETAS alguns exemplos Distribuição discreta de probabilidades 194 Processo de Bernoulli O experimento tem n provas Cada prova tem duas possibilidades sucesso e falha Cada prova é independente da outra A probabilidade de sucesso ou falha é constante para todas as provas A distribuição binomial é um processo de Bernoulli A distribuição hipergeométrica não é um processo de Bernoulli Distribuição discreta de probabilidades 195 Observe as variáveis Respostas de um teste do tipo V ou F Classificação de produtos Defeituoso e não defeituoso Notas fiscais com erro e sem erro Características observadas Todas variáveis tem apenas duas respostas Todos os dados gerados são nominais categorias não numéricos As categorias duas são mutuamente excludentes ou pertence a uma ou à outra categoria As categorias são coletivamente exaustivas só existem os dois resultados possíveis cuja soma da 100 BINOMIAL Distribuição de probabilidades Binomial 196 É comum referirse às duas categorias de uma distribuição binomial como SUCESSO E FRACASSO As observações de um experimento binomial são designadas por ensaios tentativas provas observações e pela letra n A probabilidade de sucesso é designada pela letra PS e obviamente a probabilidade de fracasso PF por 1 PS A quantidade de sucessos desejados em um experimento é designado por x e o de fracasso por n x Distribuição de probabilidades Binomial 197 n PS PF x n PS PF x Um teste de múltipla escolha tem oito questões cada qual com três alternativas uma delas correta Você quer saber qual a probabilidade de chutar certo exatamente cinco questões Determine os elementos do experimento binomial Um médico lhe diz que certa cirurgia é bem sucedida em 80 das vezes Se a cirurgia for realizada sete vezes você quer saber qual a probabilidade de ser bemsucedido em exatamente seis cirurgias Determine os elementos do experimento binomial Distribuição de probabilidades Binomial 8 13 23 5 7 080 020 6 198 Requisitos para se ter uma distribuição binomial 1 Há n tentativas ou provas idênticas 2 Cada tentativa deve ter todos os resultados classificados em duas categorias sucesso e fracasso 3 As probabilidades PS de sucesso e 1 PS de fracasso devem permanecer constantes em todas tentativas 4 Os resultados das tentativas são independentes um do outro o resultado de qualquer tentativa individual não afeta as probabilidades nas outras tentativas Distribuição de probabilidades Binomial 199 12012024 34 PSSSFF 025025025075075 02530752 000879 Determine a probabilidade de acertar exatamente 3 questões em cinco questões de uma prova que tem quatro opções sendo apenas uma certa n 5 x 3 PS ¼ 025 PF 1 025 075 Px 3 Uma vez que a ordem não importa qualquer combinação de três questões corretas entre cinco servirá SSSFF SSFSF SSFFS SFFSS SFSFS FFSSS FSFSS FSSFS SFSSF FSSSF 10 3 5 3 5 3 5 C PSFSFS 025075025075025 02530752 000879 Distribuição de probabilidades Binomial 200 Temos 10 possibilidades que interessam Cada uma dessas dez maneiras tem uma probabilidade de 000879 Px 3 10 0253 0752 10 000879 00879 Px Cn x PSx PFnx 0 001 5 0 015 4 0 088 3 0 264 0 75 2 0 25 5 2 5 0 75 0 25 2 0 396 0 75 5 1 0 25 1 5 0 75 0 25 1 0 237 0 75 0 0 25 5 0 5 0 75 0 25 0 3 2 5 2 2 2 5 4 1 5 1 1 1 5 5 0 5 0 0 0 5 P x P x x P C x P C x P C x P Distribuição de probabilidades Binomial 201 0237 0396 0264 0088 0015 0001 0 01 02 03 04 05 0 1 2 3 4 5 Probabilidades Valores da variável x Histograma binomial x Px 0 0237 1 0396 2 0264 3 0088 4 0015 5 0001 Distribuição de probabilidades Binomial 202 X Px 0 0237 1 0396 2 0264 3 0088 4 0015 5 0001 Qual é a probabilidade de se responder corretamente a duas ou quatro questões Distribuição de probabilidades Binomial Px2 ou Px4 Px2 Px4 Px3 Px3Px4Px5 Px 1 1 Px 0 Qual a probabilidade de se responder corretamente a pelo menos três questões Qual a probabilidade de responder corretamente a pelo menos uma questão Px2 Px4 0264 0015 0279 008800150001 0104 1 0237 0763 203 Px1 Px1Px2 Px3Px4Px5 Média Ex μ np Variância σ2 npq Desvio padrão σ npq Para o exercício anterior de respostas corretas no teste distribuição de probabilidade binomial temse Média Ex μ np 5 025 125 Variância σ2 npq 5 025 075 09375 Desvio padrão σ npq 09375 0968 Px Cn x PSx PFnx Distribuição de probabilidades Binomial Notação X Bn p 204 Exercício Distribuição de probabilidades Binomial 205 Em uma manufatura de interruptores elétricos que tem histórico de qualidade estabelecido em 2 2 defeituosos foram coletados 250 interruptores para inspeção Qual é a probabilidade de se encontrar na amostra a 100 de interruptores bons b Pelo menos dois interruptores defeituosos Distribuição binomial P100 bons Px 0 defeituoso Px 0 C250 0 0020 098250 00064 PPelo menos dois defeituosos Px 2 1 Px 0 Px 1 Px 0 00064 Px 1 C250 1 0021 098249 00327 PPelo menos dois defeituosos Px 2 1 0006400327 09609 PS PD 002 n 250 12012024 35 Exercício Distribuição de probabilidades Binomial 206 c Qual é a esperança da distribuição de interruptores defeituosos d Qual é o desvio padrão da distribuição de produtos defeituosos Ex np 250 x 002 5 Var x npq 250 x 002 x 098 49 Desvio padrão raiz quadrada da variância raiz q49 22 0 1 2 3 4 p 030 0 1 2 3 4 p 050 0 1 2 3 4 p 060 0 1 2 3 4 p 080 Distribuição binomial simétrica para p 050 desviada à direita para p 050 e desviada à esquerda para p 050 0 1 2 3 4 p 010 Exemplos de distribuições binomiais para n 4 e P variável μ np 4 x 05 2 σ npq 4 x 05 x 05 1 Distribuição de probabilidades Binomial 207 Defeitos por centímetro quadrado Acidentes por dia Clientes por hora que chegam a uma fila Chamadas telefônicas por minuto Erros tipográficos por página em um material impresso Ocorrências típicas do modelo de distribuição de Poisson O intervalo de medida é contínuo tempo área etc mas o número de ocorrências variável aleatória é discreta OBSERVAÇÃO A distribuição de Poisson é útil para descrever a probabilidade do número de ocorrências num campo ou intervalo contínuo tempo distância área volume etc Distribuição de probabilidades de Poisson 208 Defeitos num rolo de papel Chamadas telefônicas no período de tempo x x x x x amostra x defeito Porção de um rolo de papel chamada telefônica amostra tempo Distribuição de probabilidades de Poisson 209 Requisitos para se ter uma distribuição Poisson Distribuição de probabilidades de Poisson 1 A variável aleatória X é o número de ocorrências de um evento ao longo de algum intervalo contínuo 2 As ocorrências devem ser aleatórias 3 As ocorrências devem ser independentes umas das outras 4 As ocorrências devem ser uniformemente distribuídas sobre o intervalo em uso O número médio de ocorrências por unidade tempo intervalo λ é constante durante todo tempo intervalo considerado 210 Px x t tx e µ t logo A média é o parâmetro que caracteriza a distribuição de Poisson Px µx eµ x µ é a média de ocorrências no intervalo t taxa média por unidade t é o número de unidades ou intervalo x número de ocorrências ao longo de um intervalo Px probabilidade de ocorrer x ocorrências Média t Desvio padrão Variância média µ Distribuição de probabilidades de Poisson 211 Notação X Poisson ou X Po 12012024 36 Exercício Um processo produz tecido para tapetes com uma média de dois defeitos por jarda quadrada Determine a probabilidade de uma jarda quadrada ter exatamente um defeito admitindo que o processo possa ser bem aproximado por uma distribuição de Poisson µ 2 x 1 Px 1 e221 1 0135 x 2 1 0270 λ 2 defeitos por jarda quadrada t 1 jarda quadrada Distribuição de probabilidades de Poisson e2 0135 Px µx eµ x Px 1 212 μ λt x 1J2 2D 2D J2 λ t Exercício Navios chegam ao porto à razão de 2 navios por hora e essa razão é bem aproximada por um processo de Poisson Num período de meia hora determine a probabilidade de a Não chegar nenhum navio b Chegarem 3 navios Px 3 2 navios por hora t ½ hora µ λt 2 12 1 Px 0 e1 10 0 03679 Px 3 e1 13 3 00613 Distribuição de probabilidades de Poisson Px 0 e1 03679 Px 3 213 105e10 5 00378 Px 5 μX Ex 10 e VarX 10 Distribuição de probabilidades de Poisson Exercício Suponha que o número médio de carros que chegam no período de 15 minutos é10 Qual é a probabilidade de 5 chegadas em15 minutos Solução A probabilidade de um carro chegar é a mesma para quaisquer dois períodos de tempo de igual cumprimento A chegada ou não chegada de um carro em qualquer período de tempo é independente da chegada ou não chegada de um outro carro em qualquer outro período de tempo x número de carros que chegam em qualquer período de 15 minutos μ média de carros no período 10 A probabilidade de 5 chegadas em 15 minutos é dada por 214 Distribuição Binomial aproximada por Poisson Quando se deve fazer a aproximação da Binomial por Poisson Número n de observações é grande n 100 e np 10 regra prática Probabilidade de sucesso p está próxima de 0 ou 1 Porque fazer a aproximação por Poisson A distribuição binomial descreve adequadamente muitas situações de interesse A maioria das tabelas está limitada a n 20 A fórmula binomial pode exigir esforço substancial para obtenção de uma solução exata Distribuição de probabilidades de Poisson 215 Exercício Qual a probabilidade de haver 4 peças defeituosas numa amostra de 300 extraída de um grande lote onde há 2 de defeituosos P 002 próximo de zero n 300 muito grande Px 4 0024098296 P x 4 01338 4 300 µ np 300002 6 Px 4 e6 64 4 01339 Binomial Poisson Distribuição de probabilidades de Poisson 216 μ 1 μ 4 μ 10 Distribuição de probabilidades de Poisson 217 12012024 37 Utilizase a distribuição hipergeométrica em situações com dois ou mais resultados em que a probabilidade de sucessos varia de uma prova para outra extração sem reposição de uma população finita Px N r n N r n x r x N n Observações dependentes Quando a amostra é menor ou igual a 5 da pop fazse boa aproximação com a distribuição binomial n N 005 binomial Média Ex µ np p r N Variância Vx np 1p N n N 1 Distribuição de probabilidades Hipergeométrica População Amostra Tamanho N n Nº sucessos r x A probabilidade de se obter x sucessos em uma amostra de tamanho n retirada de uma população de tamanho N com r sucessos é 218 Notação X Hgeo r N n Exercício Numa caixa com 10 fusíveis 2 são defeituosos Extraída uma amostra de tamanho 4 qual a probabilidade de sair A nenhum defeituoso B 1 defeituoso C 1 ou menos defeituoso Temos N 10 r 2 e n 4 Distribuição de probabilidades Hipergeométrica A x 0 defeituoso todos bons na amostra BBBB PBBBB 8 10 7 9 6 8 5 7 1 3 03333 B B B B B B B D B D n 4 População N 10 Amostra BBBB 219 Exercício Usando a fórmula temos N 10 r 2 e n 4 10 2 4 1 2 1 B x 1 Px 1 0533 8 3 10 4 10 4 2 1 C x 1 Px 1 P0 P1 0333 0533 0866 Distribuição de probabilidades Hipergeométrica A x 0 Px 0 10 2 4 0 2 0 10 4 10 4 2 0 8 4 0333 220 Exercício Um grupo de 200 pedidos de empréstimos para automóveis contem 5 pedidos preenchidos incorretamente Uma amostra aleatória de 10 pedidos é retirada qual é a probabilidade de não encontrar pedidos preenchidos incorretamente Temos N 200 r 5 e n 10 e x 0 Distribuição de probabilidades Hipergeométrica Px 0 200 5 10 0 5 0 200 10 200 10 5 0 195 10 07717 Observe que a relação nN 10200 005 é igual a 005 assim uma distribuição hipergeométrica pode ser bem aproximada pela distribuição binomial Px 0 00250 097510 07763 10 0 221 PS rN 5200 0025 PF 10025 0975 Distribuições discretas resumo Item Distribui ção Fórmula Média Variância 1 Binomial 2 Poisson 3 Hipergeo métrica P S P F C n x x x n x P np E x npq V x x x P x e E x t x V Px N r n N r n x r x N n N nr E x 1 N n npq N x V 222 DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 223 12012024 38 UNIFORME OU RETANGULAR NORMAL BIVARIADA NORMAL EXPONENCIAL LOGNORMAL WEIBULL QUIQUADRADO 2 QTDE Alguns exemplos t DE STUDENT QTDE F DE SNEDECOR QTDE GAMA BETA ERLANG Distribuição de probabilidades contínuas 224 Variável aleatória Discreta Os possíveis resultados estão contidos em um conjunto finito ou enumerável Contínua Os possíveis resultados abrangem todo um intervalo de números reais 0 1 2 3 4 0 Número de defeitos em Tempo de resposta de Distribuição de probabilidades 225 Quando se usa as distribuições contínuas A variável aleatória em questão é contínua A variável aleatória discreta apresenta um grande número de resultados Os ponteiros de um relógio podem parar em qualquer dos infinitos pontos do círculo Distribuição de probabilidades n 2 n 4 n 8 n 100 12 14 18 1100 110000 n quase 1quase 050 025 0125 001 0000000 A probabilidade de parar em um ponto definido é zero n 10000 00001 226 Nas distribuições contínuas utilizamse a probabilidade da ocorrência em um intervalo Pa x b Em uma distribuição contínua a probabilidade é dada pela área contida no intervalo considerado Distribuição de probabilidades Variáveis aleatórias contínuas tempo de resposta de um sistema computacional resistência de um material Variáveis aleatórias discretas número de defeitos numa amostra de 5000 itens número de transações por segundo de uma CPU com grande número de possíveis resultados podem ser aproximadas para contínuas 227 As probabilidades de eventos associados a uma variável aleatória contínua X podem ser calculadas através da função densidade de probabilidade f que deve satisfazer e x f x 0 x fx a b 1 x d x f Se A a b então b a f x d x P A Distribuição de probabilidades Variáveis aleatórias contínuas 228 Importância da distribuição Normal Retrata com boa aproximação as distribuições de frequência de muitos fenômenos naturais e físicos Serve como aproximação das probabilidades binomiais quando n é grande Representa a distribuição das médias e proporções em grandes amostras o que tem relevante implicação na amostragem a mais importante Distribuição de probabilidades Normal 229 12012024 39 Um pouco de história No século XVIII astrônomos e outros cientistas observaram que medidas repetidas de mensurações como a distância à lua variavam como na figura quando coletadas em grande número Esta forma gráfica era associada aos erros de mensuração daí o nome de Distribuição normal dos erros e depois Distribuição normal É conhecida por Distribuição Gaussiana em função do modelo matemático desenvolvido por Karl F Gauss Distribuição de probabilidades Normal 230 133 137 141 145 149 153 157 161 165 169 Altura de universitárias n 3000 µ 152 cm σ 5 cm 25 40 55 70 85 100 115 020 015 010 005 000 Peso da população adulta n 5000 µ 75 kg σ 12 kg Distribuição de probabilidades Normal 000 005 020 010 015 231 Uma indústria de metalurgia realizou um levantamento da espessura de 10000 arruelas de bronze e apresentou a tabela de frequência e o histograma correspondente conforme mostrado abaixo A medida da espessura está em polegadas 1 polegada 254 cm Distribuição de probabilidades Normal 00203 00048 4810000 00048 00202 a 00204 00201 00122 12210000 00122 00200 a 00202 00199 00325 32510000 00325 00198 a 00200 00197 00695 69510000 00695 00196 a 00198 00195 01198 119810000 01198 00194 a 00196 00193 01664 166410000 01664 00192 a 00194 00191 01896 189610000 01896 00190 a 00192 00189 01664 166410000 01664 00188 a 00190 00187 01198 119810000 01198 00186 a 00188 00185 00695 69510000 00695 00184 a 00186 00183 00325 32510000 00325 00182 a 00184 00181 00122 12210000 00122 00180 a 00182 00179 00048 4810000 00048 00178 a 00180 ponto médio da classe Frequência relativa Espessura 1 2 11 3 4 10 9 8 7 6 5 12 13 232 Distribuição de probabilidades Normal 233 Histograma das espessuras de 10000 arruelas de branze 0 005 01 015 02 1 2 3 4 5 6 7 8 9 10 11 12 13 espessuras classes freqüência relativa bronze Curva normal típica média Forma de uma boca de sino Área sob a curva 1 05 05 Média µ Desvio padrão 50 50 Distribuição de probabilidades Normal 234 Características 1 A curva normal tem a forma de sino 2 É simétrica em relação a média 3 Prolongase de a apenas em teoria assintótica 4 Fica completamente especificada por sua média e seu desvio padrão há uma distribuição normal para cada par média e desvio padrão 5 A área total sob a curva é considerada 100 ou igual a 1 6 A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar um valor entre esses pontos 7 Possui dois parâmetros que caracteriza cada distribuição normal µ e σ Distribuição de probabilidades Normal 235 12012024 40 A probabilidade de uma variável aleatória tomar um valor entre dois pontos quaisquer é igual à área sob a curva normal entre aqueles pontos P a x b área hachurada sob a curva é a probabilidade de X assumir qualquer valor entre a e b Distribuição de probabilidades Normal 236 Variável X µ a b Observação x µ distância do ponto considerado à média x µ z número de desvios padrões a contar da média Ex Z 25 desvios padrões x ponto considerado da distrib µ média da distribuição desvio padrão da distribuição Distribuição de probabilidades Normal e 271828 e fx 2 1 x µ 2 2 1 237 70 80 90 100 110 120 130 escala padroni zada escala efetiva Distribuição de probabilidades Normal kmh m 07 08 09 10 11 12 13 kg 175 20 225 25 275 30 325 Kgcm2 49 56 63 70 77 84 91 velocidade comprimento massa pressão 3 2 1 0 1 2 3 z Quantidade de desvios padrão µ 100 kmh 100 kmh x 110 kmh velocidade µ 10 m 01 m x 11 m comprimento µ 25 kg 025 kg x 275 kg massa µ 70 kgcm2 070 kgcm2 x 77 kgcm2 pressão X 238 Seja X uma variável com distribuição normal X Nµ σ A distância entre a média e um ponto qualquer x é dado em número de desvios padrão z z x µ Distribuição de probabilidades Normal Normal não padronizada µ x P X Nµ σ Normal padronizada 239 Qualquer distribuição normal com os parâmetros µ e σ Transformação matemática 0 z P Normal padronizada Z N0 1 Uma única distribuição normal normal padronizada X Z Como calcular Z µ x x µ x µ z média desvio padrão valor considerado diferença diferença relativa 40 1 42 2 2 30 25 375 75 3 25 2 23 2 1 18 3 135 45 15 37 38 39 40 41 42 43 escala efetiva 3 2 1 0 1 2 3 42 401 2 Distribuição de probabilidades Normal 240 Distribuição de probabilidades Normal 3 2 1 0 1 2 3 6826 9546 9973 241 12012024 41 Segunda casa decimal de z z 000 001 002 009 00 01 02 03 05832 Usando a tabela de distribuição Normal Distribuição de probabilidades Normal 242 Área sob a curva de z até z 021 pela tabela 021 05832 0 Z Distribuição de probabilidades Normal 243 Exercício 01359 Distribuição de probabilidades Normal 244 Determine a área probabilidade sob a curva entre 1σ em torno da média Determine probabilidade área da variável assumir valores entre 1σ e 2σ distantes da média 08413 01587 06826 08413 09772 1 0 1 Z 0 1 2 Z Distribuição de probabilidades Normal Dado os valores de Z ache a probabilidade de se encontrar valores de Z nas áreas hachuradas 0025 0025 02266 02266 O8113 O1469 00465 04484 245 A B C E F G Distribuição de probabilidades Normal Dado os valores de probabilidades de se encontrar valores de Z nas áreas em hachuradas ache os valores de Z Z1 2326 Z1 111 Z1 165 Z2 165 Z1 128 Z1 067 Z1 173 Z2 173 246 A B C E F G Exercício Após 28 dias de curagem o cimento de uma certa marca tem uma resistência compressiva média de 4000 psi Suponha que a resistência tem uma distribuição normal com desviopadrão de 120 psi Qual a probabilidade de se comprar um pacote de cimento com resistência compressiva de 28 dias menor que 3850 psi N N4000 120 psi 3850 4000 1 25 120 3850 4000 X z Distribuição de probabilidades Normal 247 Desejase PX 3850 Z 125 Pz 125 Variável de interesse resistência compressiva do cimento 01056 Pz 125 01056 1056 12012024 42 Uma indústria siderúrgica produz tubos de aço cujo comprimento pode ser considerado uma variável normalmente distribuída com média 1000 metros e desvio padrão igual a 009 metros Quanto refugo a indústria espera produzir se o comprimento dos tubos de aço tiver que ser no máximo igual a 1020 m N N10 009 metros 2 22 09 0 102010 σ μ X z 0 Z 222 Z X 10 μ 1020 Distribuição de probabilidades Normal 248 Variável de interesse comprimento de tubos Prefugo Pcomprimento tubo 1020 09868 1 09868 00132 PZ 222 09868 Prefugo PZ 222 1 09868 00132 O tempo médio que demora para uma viatura de uma determinada Cia da PMMG da capital atender a uma chamada de emergência é de 8 minutos com desviopadrão de 3 minutos Considere o tempo médio como uma variável normalmente distribuída para calcular a probabilidade de uma chamada esperar menos de 4 minutos 133 3 48 X z N N8 3 minutos Desejase PX 4 minutos X 8 4 0 Z Z 133 Distribuição de probabilidades Normal 249 Variável de interesse tempo médio de demora no atendimento PX 4 minutos Pz 133 009176 009176 Um máquina produz peças com o diâmetro médio de 200 polegadas e o desviopadrão de 001 polegada O diâmetro tem distribuição normal As peças que se afastam da média por mais de 003 polegada são consideradas defeituosas Qual é a percentagem de peças defeituosa 3 01 0 2 03 2 203 X z 0 3 Z 3 N N200 001 polegadas 3 01 0 197 2 1 97 X z Distribuição de probabilidades Normal 250 2 X 2 203 197 Variável de interesse diâmetro de peças Desejase Ppeças defeituosas Ppd P pd PX 203 PX 197 P X 203 PZ 3 000135 PX 197 PZ 3 000135 P pd 000135 000135 00027 P pd PZ 3 PZ 3 0 1 2 3 4 5 n 5 p 025 q 075 np 125 nq 375 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 n 20 p 025 np 5 nq 15 n 50 p 025 np 125 nq 375 0 10 20 30 40 50 Binomial aproximada pela Normal A distribuição binomial quando np 5 e nq 5 se aproxima bem da distr normal 251 Se n 50 e p 025 determine P14 x 16 0111 0089 0065 0265 P14 x 16 0265 Binomial aproximada pela Normal Quando np 5 e nq 5 a distribuição binomial se aproxima da distribuição normal Neste caso np 125 e nq 375 252 0 002 004 006 008 01 012 014 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Correção pela continuidade Sendo n 50 e p 025 np 125 e nq 375 Ambos são maiores que 5 Para garantir que as fronteiras de cada retângulo estejam incluídas no intervalo subtraise 05 das fronteiras à esquerda e some 05 à fronteira que está a direita O intervalo de valores sob a curva normal é 135 X 165 Binomial aproximada pela Normal 125 135 165 14 15 16 253 12012024 43 Com as fórmulas de distribuição Binomial determine a média e o desvio padrão 3 062 50 0 25 0 75 12 5 0 25 50 npq x np Converta cada ponto no escore Z P033 Z 131 09049 06293 02756 Z135 135 1253062 033 Z165 165 1253062 131 PZ135 P Z 033 06293 PZ165 P Z 131 09049 Binomial aproximada pela Normal 254 125 135 165 14 15 16 Exercício Segundo um levantamento entre os usuários da internet 75 são a favor de que o governo regulamente o lixo eletrônico Se 200 internautas forem escolhidos aleatoriamente determine a probabilidade de que menos de 140 sejam a favor da regulamentação governamental Solução Tratase de uma distribuição binomial na qual n 200 p 075 X 140 Binomial aproximada pela Normal 255 PX 140 PX 0 PX 1 PX 139 004539 Solução da usando a distribuição normal Uma vez que np 150 5 e nq 50 5 podese usar a distribuição Normal para aproximar a probabilidade Binomial 612 0 75 0 25 200 150 0 75 200 npq x np Use a correção pela continuidade para traduzir isso para variável contínua no intervalo 1395 Determine a Px 1395 Binomial aproximada pela Normal 256 1 71 12 6 150 5 139 139 5 Z A probabilidade de que menos de 140 sejam a favor da regulamentação governamental é de aproximadamente 00436 Pz 171 00436 1395 150 Aproximação válida quando for grande 0 1 2 3 4 5 00 01 02 03 04 px x 0 2 4 6 8 10 12 000 005 010 015 px x 10 20 30 000 004 008 px x 1 5 20 Parâmetros da Normal t t Poisson aproximada pela Normal Para valores de λ 5 já se consegue boa aproximação da distr de Poisson pela distr Normal 257 Exemplo Uma variável aleatória é o número de falhas ao longo do comprimento de um fio de cobre Número de falhas é uma variável discreta com distribuição de Poisson Distribuição de probabilidades Exponencial 258 Exemplo Uma variável aleatória contínua é o comprimento de qualquer ponto inicial no fio até o ponto em que uma falha é detectada Distribuição de Exponencial A variável aleatória X que é igual à distancia entre contagens sucessivas de um processo de Poisson com média λ 0 é uma variável contínua aleatória exponencial com parâmetro λ A função densidade de probabilidade de X é fx λeλx para 0 x Falhas variável discreta Intervalo entre falhas variável contínua A distribuição exponencial envolve probabilidades ao longo do tempo ou da distância entre ocorrências num intervalo contínuo A exponencial é usada para modelo do tempo entre falhas de equipamento elétrico tempo de chegada de clientes a um supermercado tempo entre chamadas telefônicas duração de vida de componentes que não se desgastam com o tempo etc A distribuição exponencial é útil quando a taxa de ocorrência tem distribuição de Poisson Possui a propriedade de não ter memória Se o componente já durou t0 horas a probabilidade de durar mais t horas continua a mesma A probabilidade não se altera pelo fato de já ter transcorrido t0 horas O fato de um chip já ter durado 5 anos não afeta sua probabilidade de durar mais 5 anos Distribuição de probabilidades Exponencial 259 12012024 44 Distribuição de probabilidades Exponencial 260 O que significa falta de memória memoryless Uma importante propriedade da distribuição exponencial é que ela é memoryless A chance de um evento ocorrer não depende de ensaios passados Portanto a taxa de ocorrência permanece constante A propriedade memoryless indica que a vida útil restante de um componente é independente da sua idade atual Por exemplo os ensaios aleatórios de jogar uma moeda demonstram a propriedade memoryless Um sistema que sofre desgaste e portanto tornase mais propenso a falhar posteriormente em sua vida útil não é memoryless Distribuição de probabilidades Exponencial 261 Propriedade da falta de memória Seja T o tempo entre detecções de uma partícula rara em um contador Geiger e considere que T tenha uma distribuição exponencial com ET 14 minuto A probabilidade de detectarmos uma partícula dentro de 30 segundos do começo da contagem é PT 05 1 e0514 030 ET µ 1 λ 14 minuto λ 114 minuto t 30 segundos 05 minuto Tempo T 0 05 min ft PT t 1 e t Distribuição de probabilidades Exponencial 262 Propriedade da falta de memória Qual prob detectar uma partícula em 30 segundos Passaramse 3 minutos e nenhuma partícula foi detectada 05 T minuto 0 30 35 Qual a prob detectar uma partícula nos próximos 30 segundos dado que 3 minutos já se passaram PT 35 T 3 05 ft PT 05 1 e t 030 T 0 05 ft PT 05 1 e t 030 0 Provase que PT 35 T 3 é igual à probabilidade anterior 030 30 35 Uma variável aleatória tem distribuição exponencial se sua função de densidade de probabilidade é da forma 2 1 ft 12 t e t t f t 0 e 0 Distribuição de probabilidades Exponencial A variável aleatória exponencial esquece ou ignora o que aconteceu antes O futuro é independente do passado 263 0 PT t et é a probabilidade da ocorrência de um evento após transcorrido o tempo t PT t 1 et é a probabilidade da ocorrência de um evento em t ou antes de t Média Et µ 1 0 t ft PT t 1 e t PT t e t Distribuição de probabilidades Exponencial T É o modelo probabilístico mais usual para situações que envolvem tempo e questões de confiabilidade de produtos e processo de produção σ µ 1 264 σ2 VX 1 2 Exercício A vida de uma certa marca de lâmpada tem distribuição aproximadamente exponencial com média de 1000 horas Determine a percentagem das lâmpadas que queimarão antes de 1000 horas λ μ 1 λ 1000 1 0 001 λ e t t P T 1 0 632 1 0 368 1 1 1000 1 00011000 e e T P Utilizando a expressão 6320 queimarão antes das 1000 horas PT t 1 e t 0 1000 Distribuição de probabilidades Exponencial horas t 1000 h 265 Média Et µ 1 12012024 45 Após quantas horas terão queimadas 50 das lâmpadas λ μ 1 1000 1 0 001 λ PT t 05 a área sob a curva é igual 050 horas t 693 001 0 0 693147 PTt 050 t Distribuição de probabilidades Exponencial PT t eλt 05 e0001t ln05 lne0001t ln05 0693147 então 0693147 0001t horas ln05 0001t 266 Após t horas Suponha que o tempo médio entre o pedido e o atendimento num grande restaurante seja de 10 minutos e que esse tempo tenha uma distribuição exponencial Determine a probabilidade µ 1 10 110 01 PT 10 et e0110 e1 b Do tempo de espera não ser superior a 10 min PT10 1 et 1 e0110 1 0368 a Do tempo de espera ser superior a 10 minutos Distribuição de probabilidades Exponencial PT 10 0368 PT10 0632 t 10 min 267 t 10 ft PT t e t 0 t 10 ft PT t 1 e t 0 µ 1 10 110 01 PT 10 et e0110 e1 d De que o tempo de espera fique entre 10 e 15 minutos PT t e t Distribuição de probabilidades Exponencial PT 10 03678 t 10 min PT 15 et e0115 e15 PT 15 02231 01447 PT 10 PT 15 c Do tempo de espera não ser superior a 3 minutos PT 3 1 et 1 e013 PT 3 1 0741 PT 3 0259 268 t 3 ft PT t 1 e t 0 10 15 T ft P10 T 15 0 02231 03678 Distribuição de probabilidades t de student Distribuição de probabilidades Quiquadrado Distribuição de probabilidades F de Snedecor Essas distribuições serão estudadas na disciplina de QTDE 269 DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS E PROPORÇÕES 270 Parâmetros Estatísticas Inferência Média Proporção Média Proporção Distribuição amostral das médias População É a distribuição das médias amostrais com todas as amostras de tamanho n extraídas da mesma população 271 12012024 46 2 3 4 5 População Amostra Retirar todas amostras de n 2 elementos 2 2 3 2 4 4 4 3 5 5 Média 35 Desvio padrão 1118 Total 16 amostras Amostra 2 2 2 3 2 4 2 5 3 2 3 3 3 4 3 5 Amostra 4 2 4 3 4 4 4 5 5 2 5 3 5 4 5 5 Média 20 25 30 35 25 30 35 40 Média 30 35 40 45 35 40 45 50 Média das médias 2 25 30 5 16 35 Desvio padrão das médias 0791 Distribuição amostral das médias 272 População Amostra Todas amostras de 2 elementos OBSERVE 791 0 2 1118 n sx x 2 3 4 5 2 2 3 2 4 4 4 3 5 5 Erro padrão POPULAÇÃO DISTRIBUIÇÃO AMOSTRAL Média 35 35 Desvio padrão 1118 0791 Distribuição amostral das médias 273 Histograma das médias amostrais frequência Médias Histograma da população n x Conhecido como erro padrão das médias frequência 1 Distribuição amostral das médias 274 x x x x Distribuição das medidas individuais X x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x dp σ Distribuição das médias n x x xx xx x x xx xx x xx xx xx x xx x x x x x x Distribuição amostral das médias 275 A média amostral da distribuição é igual à média da população O aumento do tamanho da amostra reduz a variabilidade da distribuição amostral média populacional a As médias amostrais tendem a gruparse em torno da média da população n 100 n 80 n 60 n 40 média populacional b As distribuições amostrais de grandes amostras têm menor variabilidade que as de pequeno tamanho amostral Distribuição amostral das médias 276 Conclusões importantes sobre distribuições das médias A média da distribuição das médias é sempre igual à média da população O desvio padrão da distribuição variabilidade das médias diminui quando aumenta o tamanho da amostra Quando a população é grande ou infinita o desvio padrão da distribuição amostral das médias é dado por do desvio padrão da população x da raiz quadrada do tamanho da amostra n O desvio padrão da distribuição amostral x ou erro padrão da média depende x x n 277 12012024 47 Teorema central do limite Média 1 1 2 2 4 225 2 5 3 3 6 425 3 2 4 4 3 325 4 9 8 5 9 775 5 4 0 1 0 125 6 2 3 4 2 275 7 4 5 6 7 55 8 5 6 8 9 7 9 8 6 6 5 625 10 9 6 7 8 75 11 0 2 8 0 25 12 8 8 4 8 7 13 9 9 7 8 825 14 8 7 4 5 6 15 9 6 4 2 525 16 3 7 9 4 575 17 3 1 2 2 2 18 2 4 4 6 4 19 8 9 3 4 6 20 2 7 9 7 625 21 3 3 4 5 375 22 3 6 7 8 6 23 9 8 9 6 8 24 3 0 1 2 15 25 7 9 6 8 75 Amostras aleatórias 0 1 2 3 4 5 6 7 frequência 8 9 Distribuição dos 100 dados fx 1 Distribuição amostral das 25 médias x 278 P2 Teorema central do limite 279 P1 P3 P4 280 Que tamanho de amostra é grande o suficiente de modo que o teorema central do limite pode ser aplicado A resposta depende de quão próxima distribuição original esteja da normal Se a distribuição for simétrica e unimodal não muito longe da normal o TLC se aplica para valores pequenos de n digamos 4 ou 5 Se a população amostrada for muito não normal amostras maiores serão requeridas Como regra geral se n 30 o TLC quase sempre se aplicará As exceções a esta regra geral são relativamente raras Para a maioria dos casos práticos o TLC se aplicará para valores de n muito menores que 30 Teorema central do limite TLCválido para médias amostrais Teorema central do limite TLCválido para médias amostrais Concluise que não é necessário conhecer a forma da distribuição da população bastando que o tamanho da amostra seja grande pois assim a distribuição amostral será aproximadamente normal Uma regra prática muito usada é que a amostra deve consistir de 30 ou mais observações O TLC se refere exatamente à forma da distribuições amostrais 1 Se a população tem distribuição normal a distribuição das médias amostrais também será normal para todos tamanhos de amostras 2 Se a população é nãonormal a distribuição de médias amostrais será aproximadamente normal para grandes amostras 281 Teorema central do limite TLCválido para médias amostrais 282 Se X1 X2 X3 Xn é uma amostra aleatória simples AAS de tamanho n grande retirada de uma população X com média µ finita e variância σ2 finita então a variável Xbarra tem distribuição aproximadamente normal ҧ𝑥 ℕ 𝜇 𝜎 𝑛 X 1 X 3 X 2 X n 𝑋 𝐷𝑖𝑠𝑡𝑟𝑖𝑏 𝑞𝑢𝑎𝑙𝑞𝑢𝑒𝑟 𝜇 𝜎 População Médias ҧ𝑥1 ҧ𝑥2 ҧ𝑥3 ҧ𝑥4 ҧ𝑥n n grande Exercício Uma população muito grande tem média de 20 e desvio padrão 14 Extraise uma amostra de 49 observações a Qual a média da distribuição amostral médias b Qual o desvio padrão da distribuição amostral erro padrão das médias c Qual a percentagem das possíveis médias amostrais que diferirão por mais de 02 da média da população Solução Como n 30 podemos supor normal a distribuição amostral das médias b O desvio padrão da distribuição é a A média da distribuição amostral é sempre igual à média da população Logo µx x 20 14 49 02 x x n 283 12012024 48 c A percentagem de médias amostrais que diferem por mais de 02 da média populacional é Z202 202 20 02 Z 1x proporção 01587 Z198 198 200 02 Z 1x proporção 01587 total 03174 z 1x µx Z 1x 01587 01587 284 198 20 202 02 02 Em projetos de elevadores é fundamental considerar o peso das pessoas para que não haja sobrecarga e futuras falhas Dado que a população brasileira tem peso distribuído normalmente com média de 72 kg e dp 12 kg determine a probabilidade de que a uma pessoa escolhida aleatoriamente pese mais de 78 kg 0 6915 0 50 50 0 12 72 78 78 z P X z Logo a probabilidade de uma pessoa pesar mais de 78 kg é de 3085 1 06915 Z78 05 72 PX 78 78 03085 285 b Levando em consideração que uma empresa desenvolveu um elevador de grande porte 25 pessoas e a capacidade máxima de carga é de 1950 Kg Qual a probabilidade de que 25 pessoas que entrem aleatoriamente no elevador ao mesmo tempo propiciem um peso médio maior que 78 kg Agora estamos lidando com a média para um grupo de 25 valores e não mais com um valor individual kg X 72 42 25 12 n X 2 50 42 72 78 x X x Z 0 99379 2 50 z P Logo a probabilidade será de 062 1 099379 78 00062 Z78 25 72 286 O ciclo de vida de aparelhos de CD Player de uma determinada marca têm média de 71 anos e desviopadrão de 14 ano Determine a probabilidade de 45 aparelhos selecionados aleatoriamente terem um ciclo de vida maior do que 7 anos 17 X 21 0 45 41 n X 0 48 21 0 17 7 7 x X x Z 0 3156 0 48 Z P Logo a probabilidade será de 6844 1 03156 71 06844 Z7 048 7 287 As distribuições amostrais de proporções e número de ocorrências são essencialmente as mesmas Ambas dizem respeito à contagem de dados e não às mensurações Distribuição amostral Média Desvio padrão Proporções p p p1 p n np np1 p Número de ocorrências np Distribuições amostrais das proporções e do número de ocorrências 288 Tamanho da população e das amostras Grande ou infinita Não há necessidade de reposição Probabilidades de cada prova é constante Finita ou amostra muito grande nN 5 Deveria se fazer a reposição mas não se faz A probabilidade de cada prova varia Os desvios padrão das distribuições amostrais devem ser multiplicados pelo fator de correção finita Tamanho da população 289 N população n amostra N n N 1 Fator de correção finita 12012024 49 Distribuição Desvio padrão Médias Proporção Número de ocorrências Populações finitas o desvio padrão deve ser corrigido x n x N n N 1 p p1 p n N n N 1 np np1 p N n N 1 290 LEITURA COMPLEMENTAR 291 Uma outra maneira de classificar os dados é pelo NÍVEL DE MENSURAÇÃO Classificação dos dados 1º nível 2º nível 3º nível 4º nível Nominal Ordinal Intervalar Razão 292 1º nível Nível de mensuração mais baixo Mais rudimentar possível É a escala de medida NOMINAL A atribuição dos números é de natureza QUALITATIVA DISTINTIVA Os algarismos representam uma categoria Ex 1 mulher e 2 homem 2º nível Nível de mensuração um pouco mais elaborado que o anterior É a escala de medida ORDINAL As grandezas podem ser avaliadas em termos de mais que ou menos que Quantificação imprecisa Não é possível fazer operação aritmética neste nível Classificação dos dados 293 3º nível É uma escala de medida propriamente dita É a escala INTERVALAR c unidade de medida arbitrária porém fixa e zero relativo convencional não natural Faz operações de subtração algumas vezes adição e não faz multiplicação ou divisão Exemplo Um corpo a 40ºC não é 4 vezes mais quente que um corpo que está a 10ºC A razão é 4 vezes em ºC e apenas 208 em ºF 4º nível É o nível de mensuração mais elaborado de todos É designado pela escala de RAZÃO ou RACIONAL É muito parecido com a escala do 3º nível exceto quanto a ORIGEM o zero absoluto isto é é zero natural Todas operações aritméticas podem ser feitas Exemplo peso de porcos distância entre dois carros etc Classificação dos dados 294 Coleta de dados Manual Usa folhas de verificação tally sheets check list Folha de verificação é ferramenta útil para coletar os dados no campo de forma organizada e estruturada O seu projeto ou desenho pode ser muito variado Automática Utiliza computadores máquinas automáticas de diversos processos leitores óticos etc Reduz o tempo de coleta erros custos e evita perda de precisãoexatidão Exige investimentos iniciais mais elevados 295 12012024 50 Coleta de dados Arredondamento Deixar os arredondamentos para a fase final dos cálculos Devese evitar os arredondamentos intermediários Codificação de dados Algumas vezes há limitação para processar ou armazenar números ou grupo de letras Para reduzir o tamanho fazse então a necessidade de codificação para processálos sem perda da precisão e exatidão Melhora a eficiência e análise dos dados de entrada 296 Folha de Verificação Classificação de produto defeituoso Produto Lente Estágio de fabricação inspeção final Tipo de defeitos arranhão trinca revestimento inadequado muito grossa muito fina não acabada Total inspecionado 1200 Data 030195 Seção INSPROD Inspetor Augusto Bicalho Defeito Contagem Subtotal Arranhão 12 Trinca 41 Revestimento inadequado 55 Muito grossa ou muito fina 11 Não acabada 5 Outros 3 Total 127 Total rejeitado 90 297 Causa de erros na coleta ou processamento dos dados Incorreta definição das unidades de medidas m s etc Digitação ou manuscrito incorreto erros naturais ou confusão devido similaridade de caracteres ou dígitos Sistema de medição com erros imprecisos e inexatos Arredondamentos inadequados forma incorreta ou em estágios intermediários Utilização de softwares com validação inadequada Múltiplas entradas de dados Pessoas mal preparadas e instruções de coleta deficientes Amostragem incorreta tamanho inadequado não aleatória não representativa plano de amostragem mau elaborado etc 298 Estratégias para evitar erros Fazer um plano de coleta de dados criterioso e detalhado amostragem folhas de verificação plano 5W1H etc Usar equipamentos calibrados Efetuar análise do sistema de medição Treinar as pessoas Avaliar a presença de outliers usando técnicas estatísticas Utilizar softwares validados corretamente reconhecidos etc Utilizar sistemas adequados de verificação da correção da transmissão e recepção Automatizar usar códigos de barras leitoras óticas etc 299 Estudos enumerativos são os estudos de inferência estatística baseados em amostras retiradas de populações para estimarem parâmetros de populações existentes Estudos analíticos são estudos de inferência estatística baseados em amostras para estimarem parâmetros de populações futuras amostra População x1 x2 xn Estudo enumerativo amostra População futura x1 x2 xn Estudo analítico tempo 300 Utilizada nas situações onde há mais de dois resultados mutuamente excludentes Exigese Que as n provas sejam independentes Tenham probabilidade de ocorrência constante PE1 E2 EK n n1n2n3 nk P1 n1 P2 n2 Pk nk A probabilidade de que em n observações o resultado E1 ocorra n1 vezes E2 ocorra n2 vezes e Ek ocorra nk vezes é dado pela fórmula Distribuição de probabilidades Polinomial ou multinomial 301 12012024 51 Em um processo 80 da produção de uma máquina é aceitável 15 necessita de algum reparo e 5 é imprestável Numa amostra de n 10 itens qual a probabilidade de obter 8 itens aceitáveis 2 que necessitem de reparos e nenhum imprestável P820 10 8 2 0 088 0152 0050 017 Exercício Distribuição de probabilidades Polinomial ou multinomial Reparo Imprestável Aceitável n1 8 n2 2 n3 0 n 10 itens P1 080 P2 015 P3 005 302 Uma inspeção de peças ao longo do tempo revela quatro classificações A B C e G peça boa qualidade Historicamente pA 003 pB 005 pC 006 e pG 086 Se uma amostra de 170 unidades for retirada de uma população qual seria a probabilidade de nA 9 nB 7 nC 16 e nG 138 0 00011 0 03 0 05 0 06 0 86 16138 79 170 138 16 7 9 138 16 7 9 G C B A P Exercício Distribuição de probabilidades Polinomial ou multinomial nA 9 nB 7 nC 16 nG 138 pA 003 pB 005 pC 006 pG 086 n 170 303 Quando se usa as distribuições uniformes Quando a variável aleatória pode tomar qualquer valor numa escala contínua entre dois pontos intervalo e que estes valores sejam igualmente prováveis Distribuição de probabilidades Uniforme ou Retangular Um vendedor sempre comparece à sua empresa no horário de 300 às 400 h Neste intervalo cada instante é igualmente provável Qual a probabilidade dele comparecer entre 300 e 315 h Exemplo 304 P 100 fx 0 a b Px fx 0 a c d b d c b a Média a b 2 Variância b a2 12 Pc x d 1ba Distribuição de probabilidades Uniforme ou Retangular Distribuição uniforme fx a x b 0 qualquer outro intervalo 1 b a X X 305 fx 0 300 400 Um vendedor sempre comparece à sua empresa no horário de 300 às 400 h Neste intervalo cada instante é igualmente provável Qual a probabilidade dele comparecer entre 300 e 315 h Px 400 300 315 300 15 60 P300 x 315 025 Distribuição de probabilidades Uniforme ou Retangular 306 315 25 a b c d d c b a Pc x d Uma variável aleatória X tem distribuição Lognormal quando seu logaritmo LnX tem densidade normal de probabilidade Se X é lognormal lnx é Nμσ x1 x2 x3 x4 x5 xn ln xn ln x1 ln x2 ln x3 ln x4 ln x5 distribuição normal Distribuição de probabilidades Lognormal distribuição lognormal 307 12012024 52 Exemplos estimativas de um processo de quebra da distribuição de rendimentos patrimônios e depósitos bancários vida de alguns tipos de transistores etc A distribuição Lognormal é um modelo muito utilizado em situações em que a variável de interesse apresenta uma assimetria à direita 2 1 ln 2 1 2 2 x α β π e x β x f Distribuição de probabilidades Lognormal 308 Distribuição de probabilidades Lognormal 309 Histograma dos logaritmos dos dados Distribuição Normal Histograma dos dados Distribuição Lognormal Distribuição de probabilidades Lognormal 310 Uma variável aleatória exponencial descreve o comprimento espaço até que a primeira contagem ocorrência seja obtida em um processo de Possion Exemplo Qual é a probabilidade de que o tempo exceda 100 h até que ocorra a primeira falha no sistema r 1 sabendo que a média é de 80 0 100 ft PT t e t Quando generalizamos de r 1 primeira ocorrência para r um valor qualquer inteiro temos a distribuição Erlang Quando generalizamos de um valor inteiro qualquer de r para valor qualquer não negativo de r temos a distribuição de probabilidade Gama Distribuição de probabilidades Erlang e Gama 311 Distribuição de probabilidades Erlang e Gama A distribuição Erlang é um caso especial da distribuição Gama r qualquer valor positivo inteiro A distribuição exponencial é um caso especial da distribuição Erlang quando r 1 A distribuição Gama é usada para representar fenômenos limitados de um lado 0 X tais como distribuição dos intervalos de tempos entre recalibrações de instrumentos intervalos de tempos entre compras de um item estocado etc 312 É usada frequentemente para determinar o tempo até a falha de diferentes sistemas físicos Devido a grande diversidade de curvas de taxa de risco é muito utilizada no estudo de confiabilidade Os parâmetros da distribuição permitem grande flexibilidade para lidar com sistemas onde o número de falhas crescem com o tempo desgastes de rolamentos decresce com o tempo alguns semicondutores ou permanece constante com o tempo falhas causadas por choques ao sistema Exemplos distribuições de vida para alguns capacitores reles etc Distribuição de probabilidades Weibull 313 12012024 53 Com 1 a distribuição de Weibull é idêntica à distribuição exponencial Na maioria dos casos a distribuição é desviada para a direita Com 35 1 e 0 a distribuição de Weibull se aproxima da normal fX X 1 eX parâmetro de escala Está relacionado com planicidade da curva Quando varia a curva pode se tornar mais achatada flated ou pontiaguda peaked parâmetro de forma shape é o mais importante parâmetro e reflete o padrão da curva Na prática varia de 13 a 5 gama é o menor valor possível de X quase sempre é assumido como zero Distribuição de probabilidades Weibull 314 Efeito do parâmetro de forma β com α 100 e δ 0 Distribuição de probabilidades Weibull 315 TEOREMA DE CHEBYSHEV OU INEQUAÇÃO DE CHEBYSHEV 316 Teorema de Chebyshev Qual é a proporção ou fração de dados que esta contido em um intervalo em torno da média de qualquer distribuição 317 Teorema de Chebyshev A proporção ou fração de dados que está fora ou que está contido em um intervalo em torno da média de uma distribuição conhecida utilizamse as técnicas verificadas nos tópicos anteriores ex curva normal E quando não se conhece a distribuição Qual é esta proporção Em 1867 o matemático russo Chebyshev definiu uma inequação que é válida para variáveis aleatórias discretas e contínuas 318 Teorema de Chebyshev INEQUAÇÃO DE CHEBYSHEV P x µ k 1 k2 A teoria de Chebyshev permite definir a proporção ou fração de um conjunto de dados fora ou dentro do intervalo µ k entorno da média para qualquer variável aleatória X com média e desvio padrão conhecidos A desigualdade de Chebyshev garante que em qualquer distribuição com média µ e desvio padrão Pelo menos 1 1 k2 dos dados estão dentro intervalo µ k Menos1 k2 dos dados estão fora do intervalo µ k sendo k maior que 1 A probabilidade que a sua variável assuma um valor distante da média maior que k desvios padrão é menor que 1k2 319 12012024 54 Para qualquer distribuição com média µ e desvio padrão Dentro do intervalo P x µ k 1 1 k2 Teorema de Chebyshev fator k K 2 dentro do intervalo fora intervalo K 15 k 2 1 1 K 3 056 1 1 51 2 0 75 1 1 02 2 0 89 1 1 03 2 k 2 1 044 1 51 2 0 25 1 02 2 011 1 03 2 X Fora do intervalo P x µ k 1 k2 K quantidade de desvios padrão Esta relação só é valida para k 1 µ µ k µ k 320 Em qualquer distribuição independentemente de sua forma a proporção ou fração de qualquer conjunto de dados que se situa a k desvios padrão da média é sempre no mínimo 1 1k2 no qual k é um número positivo maior que 1 Se k 2 no mínimo 1122 114 ¾ 75 de todos os dados se localizam a 2 desvios padrão da média Se k 3 no mínimo 1132 119 89 889 de todos os dados se localizam a 3 desvios padrão da média Uma distribuição qualquer com Teorema de Chebyshev µ 6 σ 384 321 Quando a distribuição for unimodal e simétrica CampMeidell definiu a seguinte desigualdade Podese observar que pelo fato de conhecermos alguma característica da distribuição o percentual de dados contidos dentro do intervalo ficou aumentado e consequentemente o percentual de dados fora do intervalo ficou reduzido pelo fator 49 Teorema de CampMeidell 4 9 P x µ k k2 1 Probab fora do intervalo 322 A média feminina nos 400 metros rasos é de 524 segundos com um desvio padrão de 22 segundos Aplique o teorema de Chebyshev e ache o percentual de tempos e os limites de tempo entre a média 2 desvios padrão Pelo menos 75 dos tempos femininos nos 400 m rasos estão entre 48 e 568 segundos 524 44 48 524 44 568 Solução Exercício Teorema de Chebyshev K 2 desvios padrão 2 x 22 44 s μ 2σ 1 122 114 075 524 546 568 59 502 48 458 μ 323 FIM 324