·

Sistemas de Informação ·

Probabilidade e Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

PUC MINAS PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS ESTATÍSTICA E PROBABILIDADE Sistemas de Informação 1º semestre de 2023 Profa Mayra Alves Stradioto stradiotopucminasbr Notas de aula de uso exclusivo dos alunos da disciplina de Estatística e Probabilidade da PUC Minas Unidade São Gabriel 1º2023 Unidade São Gabriel 2 I INTRODUÇÃO ESTATÍSTICA É A CIÊNCIA QUE NOS AJUDA A TOMAR DECISÕES E TIRAR CONCLUSÕES NA PRESENÇA DE VARIABILIDADE Montgomery 2018 11 Aplicações da Estatística Conceitos População ou Universo Estatístico N é o conjunto constituído por todos os indivíduos valores pessoas medidas etc que apresentam pelo menos uma característica comum cujo comportamento interessa analisar Amostra n é um subconjunto uma parte selecionada da população através da qual se faz inferência sobre as características da população Levantamento das hipóteses Planejamento Estatístico Coleta de dados Análise das informações Conclusões e decisões 3 12 Classificação de variáveis Qualitativas ou categóricas São variáveis obtidas por classificação Ordinais Os valores da variável têm uma ordenação Ex Mês de observação janeiro fevereiro março Nominais Não é possível estabelecer uma ordem Ex Curso Engenharia Sistemas Nutrição Enfermagem Quantitativas São variáveis obtidas sob forma de dados que medem numericamente determinadas características Discretas Os valores diferem entre si por quantidades fixas em geral são resultantes de contagens Ex Número de alunos aprovados Contínuas Assumem valores em intervalos dos números reais mensuração Ex Peso 4 II ESTATÍSTICA DESCRITIVA Exemplo Adaptado de Werkema 1995 Uma fábrica de azulejos recentemente começou a receber reclamações de seus clientes A maioria das reclamações era relativa aos seguintes problemas Os azulejos ao serem manuseados quebravamse facilmente O assentamento dos azulejos não produzia um resultado uniforme em relação ao nível da parede Sabese que os limites de especificação para a espessura dos azulejos são 50 15 mm ou seja a espessura dos azulejos pode variar entre 35 a 65 mm sendo o valor nominal de especificação igual a 50 mm Para avaliar se estavam ocorrendo problemas com a espessura dos azulejos produzidos o grupo decidiu retirar uma amostra aleatória dos azulejos fabricados pela empresa medir a espessura destes e comparar os resultados obtidos com as especificações Como a indústria emprega duas turmas de trabalho turmas A e B e pode haver diferença na qualidade dos azulejos produzidos por cada turma foi utilizada uma estratificação sendo então retirada uma amostra de 56 azulejos produzidos pela turma A e 56 fabricados pela turma B Os resultados da turma A são apresentados no Quadro 1 Quadro 1 Resultado das espessuras dos azulejos da turma A 45 31 23 28 35 23 28 34 31 31 34 35 33 37 38 46 41 40 35 23 43 45 55 52 29 35 33 42 43 31 54 45 33 34 45 46 39 35 43 27 40 47 40 38 31 34 54 56 43 35 54 49 38 57 56 35 5 21 Tabelas de frequências para variáveis quantitativas Se a variável é contínua ou se é discreta mas assume um grande número de valores distintos considerar cada valor como uma classe na tabela e no gráfico de frequências fica inviável A solução é agrupar os valores em classes ou seja categorizar a variável Construção da tabela de frequências para variáveis quantitativas 1 Determinar o número de classes1 Uma regra prática para determinar o número de classes é a seguinte número de classes k 𝑛 2 Identifique o maior valor máx e o menor valor mín da amostra 3 Calcule a amplitude total dos dados a a máx mín 4 Calcule o comprimento de cada intervalo ou seja a amplitude das classes ℎ 5 Arredonde o valor de ℎ conforme as regras de arredondamento Este número deve ter a mesma quantidade de casas decimais dos dados da amostra 6 Calcule os limites de cada intervalo A primeira classe vai de mín até mín h A segunda classe vai de mín h até mín 2h 1 É recomendado que o número de classes esteja entre 4 e 10 Também pode ser calculado através da fórmula de Sturges 𝑘 1 𝑙𝑜𝑔2𝑛 ℎ 𝑎 𝑘 6 7 Construa uma tabela de frequências com as seguintes colunas Limites de cada intervalo os intervalos são fechados à esquerda e abertos à direita NOTAÇÃO Frequência absoluta de cada intervalo 𝑛𝑖 Frequência relativa de cada intervalo 𝑓𝑖 Frequência absoluta acumulada de cada intervalo 𝑁𝑖 Frequência relativa acumulada de cada intervalo 𝐹𝑖 Tabela 1 Distribuição de frequências das espessuras dos azulejos da turma A TOTAL 7 22 Representação gráfica de variáveis quantitativas I Histograma O histograma é muito parecido com o gráfico de barras com uma diferença essencial os dados apresentados no eixo das abscissas são numéricos e têm uma ordem que deve ser obedecida rigorosamente Por ser um gráfico resultante da tabela de frequências essa ordem é a mesma apresentada na tabela Os números devem portanto aparecer em sequência quer existam ou não dados com determinados valores A altura das barras pode representar tanto a frequência absoluta quanto a frequência relativa Gráfico 1 Histograma da distribuição de frequências das espessuras dos azulejos da turma A 8 II Diagrama de pontos Permite a visualização dos aspectos gerais da distribuição da variável em estudo tais como valores máximo e mínimo valores mais frequentes forma da distribuição simétrica ou assimétrica etc A construção do diagrama de pontos para um conjunto de dados consiste em 1 Determinar os valores mínimo e máximo do conjunto de dados 2 Com base nestes valores estabelecer um eixo em escala conveniente 3 Utilizando o eixo estabelecido em 2 para cada valor observado nos dados marcar com pontos dispostos verticalmente sua correspondente frequência Gráfico 2 Diagrama de pontos das espessuras dos azulejos da turma A 9 III Diagrama de Ramoefolhas O diagrama de ramoefolhas fornece praticamente as mesmas informações que o histograma mas com duas vantagens É mais fácil de construir à mão Apresenta mais informações porque mostra os dados reais A construção do ramoefolhas para um conjunto de dados consiste em 1 Dividir cada número do conjunto de dados em duas partes uma composta por um ou mais dígitos iniciais ramo e outra composta pelo dígito restante folha 2 Traçar uma linha vertical e escrever o ramo com a escala adotada à esquerda1 3 Colocar à direita da linha vertical o último algarismo de cada número observado Estes números formarão as folhas do gráfico 4 Escrever a unidade do ramoefolhas2 Gráfico 3 Diagrama de ramoefolhas das espessuras dos azulejos da turma A 2 333 2 7889 3 111113334444 3 555555578889 4 000123333 4 55556679 5 2444 5 5667 Unidade de Folha 01 Chave 23 23 1 Essa linha é opcional Pode ser apenas uma divisão invisível entre o ramo e as folhas 2 Também chamada de chave do gráfico 10 23 Medidas de Tendência Central Os dados apresentados em tabelas ou gráficos fornecem informação sobre o assunto em estudo Mas pode existir interesse em apresentar essa informação de maneira condensada Embora você possa ver os dados em tabelas e gráficos é difícil falar sobre eles I Média Aritmética A média aritmética de n observações 𝑥1 𝑥2 𝑥𝑛 é denotada por 𝑥 e é dada por 𝑥 𝑥1 𝑥2 𝑥𝑛 𝑛 𝑥𝑖 𝑛 𝑖1 𝑛 Exemplo Considere os seguintes valores que representam o tempo em segundos para atualização de um mesmo aplicativo mobile em diferentes momentos do dia Calcule e interprete a média 52 64 57 48 67 54 48 63 55 62 49 83 11 II Mediana A mediana 𝑀𝑑 é o valor que ocupa a posição central de um conjunto de dados ordenados ou seja a mediana divide a distribuição ao meio 50 das observações estão acima da mediana e 50 abaixo Exemplo Considere os seguintes valores que representam o tempo em segundos para atualização de um mesmo aplicativo mobile em diferentes momentos do dia Calcule e interprete a mediana Compare com a média calculada anteriormente 52 64 57 48 67 54 48 63 55 62 49 83 Observe que a mediana é dada pelo elemento que ocupa a posição 𝑛1 2 se n for ímpar e pela média dos elementos que ocupam as posições 𝑛 2 e 𝑛2 2 se n for par 12 III Moda A moda 𝑀𝑜 é o valor que ocorre com mais frequência em um conjunto de dados Exemplo Considere os seguintes valores que representam o tempo em segundos para atualização de um mesmo aplicativo mobile em diferentes momentos do dia Determine a moda 52 64 57 48 67 54 48 63 55 62 49 83 Um conjunto de dados pode ser Amodal não tem moda Unimodal tem apenas uma moda Bimodal tem duas modas Multimodal tem mais de duas modas Exemplo Para as séries a seguir encontre a moda e classifique o conjunto de dados quanto ao número de modas a 7 8 9 10 10 10 11 12 13 15 b 3 5 8 10 12 13 c 2 3 4 4 4 5 6 7 7 7 8 9 d 4 4 5 7 7 8 10 10 11 13 13 e 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 13 24 Medidas Separatrizes I Quartis Os quartis são pontos que dividem o conjunto de dados ordenados em quatro partes iguais originando o 1º quartil Q1 o 2º quartil Q2 3º quartil Q3 Assim Exemplo Considere os seguintes valores que representam o tempo em segundos para atualização de um mesmo aplicativo mobile em diferentes momentos do dia Calcular o Q1 o Q2 e o Q3 48 48 49 52 54 55 57 62 63 64 67 83 Exemplo Adaptado de Farias et al 2003 Considere os dados a seguir já ordenados do maior para o menor de 35 observações em decibéis do nível de ruído de tráfego em certo cruzamento Determine os valores dos quartis 520 540 557 558 559 562 564 567 572 576 594 594 598 600 603 605 608 610 617 618 621 626 631 633 640 646 649 657 662 668 671 679 682 694 771 Mín Q1 Q2 Q3 Máx 25 25 25 25 14 25 Medidas de Variabilidade Dispersão Através das medidas de tendência central estabelecemos um valor em torno do qual os dados se distribuem Além de calcular este ponto devemos calcular um valor de mostre a variabilidade dos dados ou seja uma medida de dispersão Exemplo Quatro alunos fizeram quatro atividades com valor de 10 pontos cada uma Suas notas foram 5 5 5 5 4 6 4 6 0 4 6 10 0 0 10 10 I Amplitude da amostra A amplitude é a medida de dispersão mais fácil de ser calculada e a mais utilizada A amplitude é simplesmente a diferença entre o maior e o menor valor ou seja 𝑎 𝑚𝑎𝑥 𝑚𝑖𝑛 Exemplo Considere um grupo de pessoas com idades 4 3 4 3 4 3 e 21 Calcule 𝑥 𝑥 𝑀𝑜 e 𝑎 Exemplo Considere os seguintes valores que representam o tempo em segundos para atualização de um mesmo aplicativo mobile em diferentes momentos do dia Calcule a amplitude 52 64 57 48 67 54 48 63 55 62 49 83 15 II Variância Mede a variabilidade dos dados através dos desvios em relação à média Desvio em relação à média é a diferença entre cada valor observado e a média do conjunto de dados A notação é 𝑠2 e é calculada como a soma dos desvios ao quadrado dividida por 𝑛 1 ou seja 𝑠2 𝑥𝑖 𝑥2 𝑛 1 O denominador 𝑛 1 é chamado graus de liberdade da amostra Para calcular a variância da população chamada 𝜎2 a soma dos desvios ao quadrado é dividida por N Utilizaremos essa medida nos próximos capítulos Exemplo Considere os seguintes valores que representam o tempo em segundos para atualização de um mesmo aplicativo mobile em diferentes momentos do dia Calcule a variância 52 64 57 48 67 54 48 63 55 62 49 83 16 III Desviopadrão O desviopadrão é um valor que possui a mesma unidade de medida dos dados originais Por definição o é a raiz quadrada com sinal positivo da variância O desviopadrão da amostra é denotado por 𝑠 e pode ser calculado através da fórmula 𝑠 𝑥𝑖 𝑥2 𝑛 1 Exemplo Considere os seguintes valores que representam o tempo em segundos para atualização de um mesmo aplicativo mobile em diferentes momentos do dia Calcule o desviopadrão 52 64 57 48 67 54 48 63 55 62 49 83 IV Coeficiente de variação O coeficiente de variação é um índice relativo de dispersão que compara o desviopadrão 𝑠 com a média 𝑥 e fornece uma medida de homogeneidade dos dados É geralmente expresso em e é calculado pela fórmula 𝐶𝑉 𝑠 𝑥 100 O coeficiente de variação é utilizado com maior frequência na comparação de conjuntos de dados 17 Exemplo Considere os seguintes valores que representam o tempo em segundos para atualização de um mesmo aplicativo mobile em diferentes momentos do dia Calcule o coeficiente de variação 52 64 57 48 67 54 48 63 55 62 49 83 V Amplitude interqualtílica1 É calculada como a distância entre o Q3 e o Q1 AIQ 𝑄3 𝑄1 Como existem 50 dos valores entre o Q1 e o Q3 quanto maior o valor do IQ maior a dispersão do conjunto de dados A melhor forma de interpretar o IQ é através do diagrama de caixa Boxplot 1 Também chamada de Distância Interquartílica Amplitude Interquartil Faixa Interquartil Desvio Interquartílico 18 26 Diagrama de caixa Boxplot O boxplot é um gráfico que apresenta a dispersão do conjunto de dados através dos valores mínimo máximo primeiro quartil Q1 mediana Q2 e terceiro quartil Q3 Além disso através deste gráfico é possível verificar se o conjunto de dados possui valores atípicos outliers que podem afetar fortemente algumas medidas como média e desviopadrão A construção do boxplot para um conjunto de dados consiste em 1 Determinar o valores mínimo Q1 Q2 Q3 máximo e AIQ do conjunto de dados 2 Com base nestes valores estabelecer um eixo em escala conveniente 3 Construir um retângulo iniciando no Q1 e terminando no Q3 4 Trace uma linha dentro do retângulo no valor do Q2 5 A partir do valor do Q1 em direção ao mínimo trace uma linha perpendicular à linha do Q1 Essa linha irá terminar no valor mínimo ou no valor de 𝑄1 15 𝐴𝐼𝑄 o que ocorrer primeiro 6 A partir do valor do Q3 em direção ao máximo trace uma linha perpendicular à linha do Q3 Essa linha irá terminar no valor máximo ou no valor de 𝑄3 15 𝐴𝐼𝑄 o que ocorrer primeiro 7 Marque os outliers se houver1 Um valor do conjunto de dados é um outlier2 se ele está i Abaixo de 𝑄1 15 𝐴𝐼𝑄 ii Acima de 𝑄3 15 𝐴𝐼𝑄 1 Para representar um outlier normalmente é utilizado um asterisco um círculo ou um x 2 Um valor que esteja a uma distância de mais de 3 vezes a amplitude interquartílica do Q1 ou do Q3 é chamado de outlier extremo Na construção do boxplot símbolos diferentes podem ser usados para representar os dois tipos de outliers 19 Exemplo Adaptado de Farias et al 2003 Considere os dados a seguir já ordenados do maior para o menor de 35 observações em decibéis do nível de ruído de tráfego em certo cruzamento Construir e interpretar o boxplot do conjunto de dados 520 540 557 558 559 562 564 567 572 576 594 594 598 600 603 605 608 610 617 618 621 626 631 633 640 646 649 657 662 668 671 679 682 694 771 Exemplo Adaptado de Werkema 1995 Fábrica de azulejos Lembrando os limites de especificação para a espessura dos azulejos são 50 15 mm ou seja a espessura dos azulejos pode variar entre 35 a 65 mm sendo o valor nominal de especificação igual a 50 mm Gráfico 4 Boxplot das espessuras dos azulejos das turmas A e B Turma B Turma A 7 6 5 4 3 2 Espessura 20 III PROBABILIDADE Em todos os fenômenos estudados pela Estatística os resultados mesmo nas mesmas condições de experimentação variam de uma observação para outra dificultando a previsão de um resultado futuro Para a explicação destes fenômenos chamados experimentos aleatórios utilizamos o cálculo das probabilidades 31 Conceitos Experimento aleatório Situação em que os resultados possíveis são conhecidos mas não sabemos a priori qual deles ocorrerá Além disso os experimentos aleatórios podem ser repetidos indefinidamente sob as mesmas condições Exemplo Lançar um dado Espaço amostral E Conjunto de todos os resultados possíveis de um experimento aleatório Exemplo E 1 2 3 4 5 6 Evento sempre em letras maiúsculas Subconjunto do espaço amostral que contém apenas os elementos de interesse Um evento deve ser representado sempre por letras maiúsculas 21 Exemplo 1 Considere o lançamento de dois dados onde devemos observar as faces superiores Escreva o espaço amostral quando a ordem dos dados importa e determine a Os elementos do evento A onde A a soma das faces superiores é seis b Os elementos do evento B onde B o valor de uma das faces é exatamente a metade do outro c Os elementos do evento C onde C o valor de uma face multiplicado pelo valor da outra é igual a 1 d Os elementos do evento D onde D a soma das faces superiores é maior que 13 32 Cálculo de Probabilidades Definição Clássica de Probabilidade Se os eventos são equiprováveis têm a mesma probabilidade de ocorrer podemos calcular PA onde A é um evento qualquer como 𝑃𝐴 n de resultados favora veis a ocorre ncia do evento A n de resultados possí veis Exemplo 1 continuação Considere o lançamento de dois dados onde devemos observar as faces superiores Determine e Calcule 𝑃𝐸 f Calcule 𝑃𝐴 𝑃𝐵 𝑃𝐶 e 𝑃𝐷 22 Definição Frequentista de Probabilidade Se os eventos simples não são equiprováveis não têm a mesma probabilidade de ocorrer podemos calcular 𝑃𝐴 onde 𝐴 é um evento qualquer como 𝑃𝐴 n de vezes que o evento A ocorreu n total de repetições do experimento Exemplos Especificar o tempo de garantia de lâmpadas através do cálculo de 𝑃𝐴𝑡 onde 𝐴𝑡 é o evento a lâmpada funcionar até o tempo t Avaliar a viabilidade da construção de uma usina hidrelétrica utilizando dados históricos de vazões de um rio para calcular a probabilidade de ocorrência de determinados eventos climáticos 33 Tipos especiais de eventos Evento interseção É a ocorrência simultânea dos eventos A e B 𝐴 𝐵 Exemplo 1 continuação g Determine os elementos do evento 𝐴 𝐵 h Calcule 𝑃𝐴 𝐵 23 Evento união É a ocorrência de A ou de B ou de ambos 𝐴 𝐵 Exemplo 1 continuação i Determine os elementos do evento 𝐴 𝐵 j Calcule 𝑃𝐴 𝐵 Evento complementar O complementar do evento A contém todos os elementos do espaço amostral que não pertencem ao evento A 𝐴 ou 𝐴𝐶 Exemplo 1 continuação k Determine os elementos do evento 𝐴 l Calcule 𝑃𝐴 24 Eventos mutuamente excludentes ou disjuntos Quando a ocorrência de um impossibilita a ocorrência do outro ou seja 𝐴 𝐵 Exemplo 1 continuação m Determine os elementos do evento 𝐴 𝐶 n Calcule 𝑃𝐴 𝐶 o Calcule 𝑃𝐴 𝐶 34 Propriedades da Probabilidade Dado um experimento aleatório com espaço amostral E a probabilidade de um evento A dada por 𝑃𝐴 é uma função definida em E que associa a cada evento um número real satisfazendo as seguintes probabilidades i 0 𝑃𝐴 1 para qualquer evento 𝐴 ii 𝑃𝐸 1 onde E é o espaço amostral iii Se A e B são eventos mutuamente excludentes então 𝑃𝐴 𝐵 𝑃𝐴 𝑃𝐵 Consequentemente Se A e B são dois eventos quaisquer então 𝑃𝐴 𝐵 𝑃𝐴 𝑃𝐵 𝑃𝐴 𝐵 𝑃𝐴 1 𝑃𝐴 25 35 Probabilidade Condicional A probabilidade de um evento A ocorrer dado que se sabe que um evento B ocorreu é chamada probabilidade condicional do evento A dado B e é denotada por PAB É calculada como 𝑃𝐴𝐵 𝑃𝐴 𝐵 𝑃𝐵 se 𝑃𝐵 0 Regra da multiplicação 𝑃𝐴 𝐵 𝑃𝐴𝐵𝑃𝐵 𝑃𝐴𝐵 1 𝑃𝐴𝐵 Exemplo 1 continuação Considere o lançamento de dois dados onde devemos observar as faces superiores Determine p Determine 𝑃𝐴𝐵 q Determine 𝑃𝐴𝐵 36 Independência Estatística Os eventos A e B são independentes se o fato de um deles ter ocorrido não altera a probabilidade de ocorrência de outro isto é 𝑃𝐴𝐵 𝑃𝐴 e 𝑃𝐵𝐴 𝑃𝐵 Pela regra da multiplicação 𝑃𝐴 𝐵 𝑃𝐴𝑃𝐵 26 Exemplo 1 continuação Considere o lançamento de dois dados onde devemos observar as faces superiores Determine r Os eventos A e B são independentes Justifique Exemplo 2 Um casal possui 2 filhosas Qual a probabilidade de ambos serem do sexo masculino Exemplo 3 O depósito da loja de confecções Savanah Ltda possui 180 calças jeans da marca A das quais seis são defeituosas e 200 da marca B das quais nove são defeituosas Um funcionário da loja vai ao depósito e retira uma calça jeans Qual a probabilidade de que a calça jeans seja a Da marca A 04737 b Defeituosa 00395 c Da marca A e defeituosa 00158 d Da marca A e da marca B 0 e Da marca B ou não defeituosa 09842 f Defeituosa sabendose que é da marca B 0045 g O fato da calça ser defeituosa independe da marca da mesma Justifique com os cálculos Não 27 37 O Teorema de Bayes Sejam A1 A2 A3 An eventos mutuamente excludentes cuja união é o espaço amostral E ou seja um dos eventos necessariamente deve ocorrer Sejam 𝑃𝐴𝑖 as probabilidades conhecidas dos vários eventos e B um evento qualquer de E tal que são conhecidas todas as probabilidades condicionais 𝑃𝐵𝐴𝑖 A probabilidade do evento B ocorrer pode ser calculada como a soma das probabilidades das interseções do evento B com cada um dos eventos 𝐴𝑖 ou seja 𝑃𝐵 𝑃𝐵 𝐴𝑖 𝐴1 𝐴2 𝐴4 𝐴3 𝐸 𝐴1 𝐴2 𝐴4 𝐴3 𝐸 𝐵 28 Essa equação é conhecida como regra da probabilidade total Pela regra da multiplicação a regra da probabilidade total pode ser escrita como 𝑃𝐵 𝑃𝐴𝑖𝑃𝐵𝐴𝑖 Aplicando a regra da probabilidade total para a probabilidade condicional a probabilidade de cada evento 𝐴𝑖 condicional ao evento B pode ser calculada como 𝑃𝐴𝑖𝐵 𝑃𝐴𝑖𝑃𝐵𝐴𝑖 𝑃𝐴1𝑃𝐵𝐴1 𝑃𝐴2𝑃𝐵𝐴2 𝑃𝐴𝑛𝑃𝐵𝐴𝑛 O resultado acima conhecido como Teorema de Bayes é bastante importante pois relaciona probabilidades a priori 𝑃𝐴𝑖 com probabilidades a posteriori 𝑃𝐴𝑖𝐵 29 Exemplo Três candidatos disputam as eleições para a Presidência da República O candidato do partido de direita tem 40 da preferência eleitoral o de centro tem 32 e o da esquerda 28 Em sendo eleito a probabilidade de dar efetivamente prioridade para Educação e Saúde é de 03 05 e 06 para os candidatos de direita centro e esquerda respectivamente a Qual é a probabilidade de ser dada prioridade a essas áreas no próximo governo b Se a área teve prioridade qual a probabilidade do candidato de direita ter ganho a eleição 30 IV DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE 41 Conceitos Variável aleatória Uma variável aleatória va é uma variável quantitativa que produz valores diferentes quando observada em repetições feitas mesmo sob condições idênticas As variáveis aleatórias são denotadas por letras maiúsculas 𝑋 𝑌 𝑊 etc e seus respectivos valores por letras minúsculas 𝑥 3 𝑦 54 𝑤 035 Variável aleatória Discreta Se a va assume valores num intervalo de números inteiros é chamada de variável aleatória discreta Função de Distribuição de Probabilidade A função de probabilidade de uma variável aleatória descreve como as probabilidades estão distribuídas para cada valor desta variável Para variáveis aleatórias discretas essa é chamada função de distribuição de probabilidade e é denotada por 𝑃𝑋 𝑥 ou 𝑝𝑥 31 Exemplo No lançamento de dois dados onde a ordem importa a variável aleatória X denota a soma dos pontos das faces superiores a Determine os valores de X e a distribuição de probabilidade associada b Construa um gráfico de barras que represente essa distribuição Uma função 𝑝𝑥 é uma função distribuição de probabilidade se e somente se 1 0 𝑝𝑥 1 𝑥 2 𝑝𝑥 1 Função de Distribuição Acumulada A função de distribuição acumulada ou função de probabilidade acumulada denotada por 𝐹𝑥 fornece a probabilidade de a va 𝑋 apresentar valores menores ou iguais a 𝑥 ou seja 𝐹𝑥 𝑃𝑋 𝑥 𝑝𝑡 𝑡𝑥 0 0 0 0 0 0 0 0 2 3 4 5 6 7 8 9 10 11 12 3 36 𝑥 𝑃𝑋 𝑥 1 36 4 36 5 36 6 36 2 36 32 Esperança de X 𝐸𝑋 Se 𝑋 é uma variável aleatória discreta cuja distribuição de probabilidade é dada por 𝑥 𝑥1 𝑥2 𝑥𝑛 𝑃𝑋 𝑥 𝑝𝑥1 𝑝𝑥2 𝑝𝑥𝑛 Então a média desta va também chamada valor esperado ou esperança matemática ou simplesmente esperança de 𝑋 é representada por 𝐸𝑋 ou 𝜇 é calculada como 𝜇 𝐸𝑋 𝑥𝑖 𝑝𝑥𝑖 𝑛 𝑖1 Variância de X 𝑉𝑎𝑟𝑋 Analogamente à fórmula do valor esperado a variância da va X denotada por 𝜎2 ou 𝑉𝑎𝑟𝑋 é dada por 𝜎2 𝑉𝑎𝑟𝑋 𝑥𝑖 𝜇2 𝑝𝑥𝑖 𝑛 𝑖1 Desenvolvendo essa expressão podemos escrever a variância de X como 𝜎2 𝑉𝑎𝑟𝑋 𝐸𝑋2 𝜇2 33 42 Distribuição Binomial Considere um experimento aleatório realizado 𝑛 vezes sob as mesmas condições com as seguintes características Cada repetição do experimento produz apenas um de dois resultados possíveis denominados por sucesso ou fracasso A probabilidade de sucesso 𝑃𝑆 𝑝 é constante em cada repetição do experimento As provas são independentes isto é o resultado de um ensaio não interfere no resultado do outro Se 𝑋 número de sucessos em 𝑛 realizações do experimento então 𝑋 𝐵𝑖𝑛𝑛 𝑝 A probabilidade é dada por 𝑃𝑋 𝑥 𝑛 𝑥 𝑝𝑥1 𝑝𝑛𝑥 𝑥 0 1 2 𝑛 onde 𝑛 número de realizações do experimento 𝑝 probabilidade de um sucesso em qualquer dos ensaios 1 𝑝 probabilidade de um fracasso em qualquer dos ensaios e 𝑛 𝑥 𝑛 𝑥𝑛𝑥 A esperança e a variância de uma va 𝑋 𝐵𝑖𝑛 são dadas por 𝐸𝑋 𝑛𝑝 e 𝑉𝑎𝑟𝑋 𝑛𝑝1 𝑝 34 Exemplo Seja 𝑋 uma va seguindo o modelo Binomial com parâmetros 𝑛 15 e 𝑝 04 Calcule a A esperança e a variância de 𝑋 b 𝑃𝑋 7 c 𝑃𝑋 3 d 𝑃𝑋 3 e 𝑃5 𝑋 12 f 𝑃𝑋 13 e 𝑋 6 g 𝑃𝑋 13𝑋 11 Exemplo Uma universidade descobriu que 20 de seus estudantes abandonam a disciplina de Estatística a cada semestre Considere que 20 estudantes tenham se matriculado para essa disciplina neste semestre a Qual a probabilidade de que exatamente quatro alunos abandonem a disciplina 02182 b Qual a probabilidade de que dois alunos ou menos abandonem a disciplina 02061 c Qual a probabilidade de que mais de três alunos não abandonem a disciplina 09999999992 35 43 Distribuição de Poisson Dizemos que um experimento apresenta uma distribuição de Poisson se for possível observar eventos discretos em um intervalo de meio contínuo de tempo área volume etc e se o experimento possui as seguintes características a probabilidade de observar exatamente um sucesso no intervalo é estável a ocorrência de um sucesso em qualquer intervalo é estatisticamente independente da ocorrência em qualquer outro intervalo Na distribuição de Poisson 𝑋 número de ocorrências do evento de interesse no intervalo A notação é 𝑋 𝑃𝑜𝜆 e a probabilidade é dada por 𝑃𝑋 𝑥 𝑒𝜆𝜆𝑥 𝑥 𝑥 0 1 2 onde 𝜆 é o parâmetro da distribuição ou seja a taxa média de ocorrência do evento de interesse A esperança e a variância de uma va 𝑋 𝑃𝑜 são dadas por 𝐸𝑋 𝜆 e 𝑉𝑎𝑟𝑋 𝜆 36 Exemplo Seja 𝑋 uma va seguindo o modelo de Poisson com 𝜆 3 Calcule a 𝑃𝑋 7 b 𝑃𝑋 2 c 𝑃𝑋 25 Exemplo Seja 𝑝 001 a probabilidade de certo tipo de lâmpada queimar no período de 24 horas Qual a probabilidade de um luminoso com 10 destas lâmpadas permanecer totalmente aceso durante esse período E durante 3 dias 37 44 Distribuição Hipergeométrica Dizemos que um experimento apresenta uma distribuição Hipergeométrica se desejamos contar o número elementos com determinada característica em uma amostra de tamanho 𝑛 retirada de uma população de tamanho 𝑁 onde 𝑟 destes 𝑁 indivíduos possuem tal característica sucesso e se o experimento satisfaz as seguintes condições Cada repetição do experimento produz apenas um de dois resultados possíveis A amostra é retirada sem reposição ou seja os resultados não são independentes Na distribuição Hipergeométrica 𝑋 número elementos na amostra que possuem a característica de interesse A notação é 𝑋 𝐻𝑖𝑝𝑁 𝑟 𝑛 e a probabilidade é dada por 𝑃𝑋 𝑥 𝑟 𝑥 𝑁 𝑟 𝑛 𝑥 𝑁 𝑛 𝑥 0 1 2 𝑚𝑖𝑛𝑟 𝑛 onde 𝑁 tamanho da população 𝑛 tamanho da amostra 𝑟 número de elementos da população com a característica de interesse A esperança e a variância de uma va 𝑋 𝐻𝑖𝑝 são dadas por 𝐸𝑋 𝑛𝑝 e 𝑉𝑎𝑟𝑋 𝑛𝑝1 𝑝 𝑁𝑛 𝑁1 onde 𝑝 𝑟 𝑁 é a probabilidade de se obter um sucesso em uma única retirada 38 Exemplo Adaptado de Morettin 2010 Pequenos motores são guardados em caixas de 50 unidades Um inspetor de qualidade examina cada caixa antes da posterior remessa testando 5 motores Se nenhum for defeituoso a caixa é aceita Caso contrário todos os 50 são testados Há 6 motores defeituosos numa caixa Qual a probabilidade de que seja necessário examinar todos os motores desta caixa 39 V DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE 51 Conceitos Variável aleatória contínua Uma va que assume valores no intervalo dos números reais é chamada de variável aleatória contínua Função Densidade de Probabilidade Uma função 𝑓𝑥 é chamada função densidade de probabilidade fdp da va 𝑋 se e somente se 1 𝑓𝑥 0 𝑥 2 𝑓𝑥𝑑𝑥 1 Para variáveis aleatórias contínuas a probabilidade de ocorrerem valores no intervalo 𝑎 𝑏 é calculada através da integral da função densidade de probabilidade 𝑓𝑥 entre 𝑎 e 𝑏 ou seja 𝑃𝑎 𝑋 𝑏 𝑓𝑥 𝑑𝑥 𝑏 𝑎 40 Densidade de Probabilidade Acumulada A função densidade de probabilidade acumulada denotada por 𝐹𝑥 fornece a probabilidade da va 𝑋 tomar valores menores ou iguais a 𝑥 ou seja 𝐹𝑥 𝑃𝑋 𝑥 𝑓𝑥 𝑑𝑥 𝑥 Exemplo O gráfico a seguir representa a densidade de uma variável aleatória X a Determine o valor de a b Mostre que esta é uma função densidade de probabilidade c Determine a função de densidade acumulada de X 2 0 𝑓𝑥 2a a 2 4 𝑥 41 Esperança de X 𝐸𝑋 Se 𝑋 é uma variável aleatória contínua cuja função densidade de probabilidade é dada por 𝑓𝑥 então a média desta va representada por 𝐸𝑋 ou 𝜇 é calculada como 𝜇 𝐸𝑋 𝑥𝑓𝑥 𝑑𝑥 Variância de X 𝑉𝑎𝑟𝑋 Se 𝑋 é uma variável aleatória contínua cuja função densidade de probabilidade é dada por 𝑓𝑥 então a variância desta va representada por 𝑉𝑎𝑟𝑋 ou 𝜎2 é calculada como 𝜎2 𝑉𝑎𝑟𝑋 𝐸𝑋2 𝐸𝑋2 Exemplo Dada a função densidade de probabilidade da va X 𝑓𝑥 1 8 2 𝑥 2 2 8 2𝑥4 0 𝑐 𝑐 a Determine o valor esperado de X b Determine a variância e o desviopadrão da va X 42 52 Distribuição Uniforme O modelo uniforme é o modelo mais simples para va contínuas Dizemos que uma va X tem distribuição uniforme no intervalo ou seja 𝑋𝑈𝛼 𝛽 se sua função de densidade de probabilidade é dada por 𝑓𝑥 1 𝛽 𝛼 𝛼 𝑥 𝛽 0 caso contra rio O valor esperado e a variância de uma distribuição Uniforme Contínua são 𝐸𝑋 𝛼 𝛽 2 e 𝑉𝑎𝑟𝑋 𝛽 𝛼2 12 𝑥 1 𝛽 𝛼 𝑓𝑥 43 Exemplo Sabese que a variável aleatória 𝑋 está distribuída uniformemente entre 10 e 15 a Apresente o gráfico da função densidade de probabilidade b Calcule 𝑃𝑋 125 c Calcule 𝑃10 𝑋 125 d Calcule 𝑃10 𝑋 125 e Calcule 𝑃12 𝑋 14 f Calcule 𝑃135 𝑋 155 g Calcule 𝑃𝑋 135 Exemplo Admitese que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10 quilômetros a Qual é a probabilidade da pane ocorrer nos primeiros 500 metros E de ocorrer nos 3 km centrais da rede b O custo de reparo da rede depende da distância do centro de serviço ao local da pane Considere que o centro de serviço está na origem da rede e que o custo é de R 200 para distâncias até 3 km de R 400 entre 3 e 8 km e de R 1000 para as distâncias acima de 8 km Qual é o custo médio do conserto 44 53 Distribuição Exponencial A distribuição Exponencial tem forte relação com a distribuição de Poisson Enquanto esta última é usada para determinar o número de ocorrências do evento de interesse em um intervalo contínuo a distribuição Exponencial é usada para determinar o intervalo de tempo ou de distância até que o evento de interesse ocorra Portanto a distribuição Exponencial somente poderá ser usada se as suposições da distribuição de Poisson forem satisfeitas taxa média de ocorrência constante no intervalo independência entre as ocorrências dos eventos Na distribuição Exponencial 𝑋 distância entre ocorrências sucessivas do evento de interesse em um processo Poisson A notação é 𝑋 𝐸𝑥𝑝𝜆 onde 𝜆 é a taxa média de ocorrência por intervalo Sua função de densidade de probabilidade é dada por 𝑓𝑥 λ𝑒λ𝑥 𝑥 0 0 caso contra rio Se a distribuição Exponencial for usada para modelar a vida útil de um equipamento então 𝜆 representa a taxa de falha O valor esperado e a variância de uma distribuição Exponencial são 𝐸𝑋 1 𝜆 e 𝑉𝑎𝑟𝑋 1 𝜆2 45 Exemplos de uso da distribuição Exponencial X distância entre os buracos de uma rodovia X tempo entre as chegadas de aeronaves em um aeroporto X tempo até a próxima consulta a uma base de dados X tempo entre as falhas de um equipamento X distância entre os defeitos de uma fita magnética X tempo entre as chegadas de veículos ao posto de pedágio de uma estrada Se 𝑋 𝐸𝑥𝑝𝜆 o cálculo de probabilidades é facilitado com o uso da distribuição de probabilidade acumulada da distribuição Exponencial dada por 𝐹𝑥 0 𝑥 0 1 𝑒𝜆𝑥 𝑥 0 00 02 04 06 08 10 12 14 16 18 20 00 05 10 15 20 25 30 35 40 45 50 55 60 fx x X Expλ 46 Exemplo Adaptado de Kokoska 2013 Uma bomba de aquecimento projetada para aquecer uma casa nos dias frios de inverno e refrigerar a casa no verão dura 16 anos em média Se a vida útil em anos desse equipamento pode ser modelada por uma variável aleatória exponencial responda a Qual é a probabilidade de que a bomba dure pelo menos 5 anos b Suponha que a bomba já tenha durado 5 anos Qual é a probabilidade de que dure por pelo menos outros 5 anos 47 54 Distribuição Normal ou de Gauss Se a va X tem distribuição normal com parâmetros 𝜇 e 𝜎 sua função densidade de probabilidade é dada por 𝑓𝑥 1 𝜎2𝜋 𝑒𝑥𝜇2 2𝜎2 𝑥 Propriedades A curva da distribuição tem forma de sino 𝑓𝑥 é simétrica em relação a A área total sob a curva é igual a 1 ou 100 𝑓𝑥 0 quando 𝑥 O valor máximo de 𝑓𝑥 ocorre em 𝑥 e são os pontos de inflexão da curva 𝑥 𝜎 𝜇 𝜎 𝜇 𝜎 𝜇 𝑓𝑥 48 Distribuição Normal Padrão ou reduzida Quando 0 e 𝜎 1 temos uma distribuição normal padrão ou reduzida ou simplesmente 𝑁0 1 Se 𝑋 𝑁 𝜎 então a va definida por 𝑍 𝑋 𝜇 𝜎 terá média igual a zero e variância igual a um ou seja 𝑍 𝑁0 1 49 Exemplo Dada uma va 𝑍 𝑁0 1 calcule as seguintes probabilidades a 𝑃0 𝑍 201 b 𝑃0 𝑍 201 c 𝑃193 𝑍 0 d 𝑃064 𝑍 132 e 𝑃𝑍 099 f 𝑃𝑍 331 g 𝑃120 𝑍 220 Exemplo A durabilidade de um tipo de pneu da marca Rodabem é descrita por uma variável aleatória Normal de média 60000 km e desviopadrão de 8300 km a Se a Rodabem garante os pneus pelos primeiros 48000 km qual a proporção de pneus que deverá ser trocada pela garantia b O que aconteceria com a proporção do item a se a garantia fosse entre 45000km e 48000km c Qual deveria ser a garantia em km de tal forma a assegurar que o fabricante trocaria sob garantia no máximo 2 dos pneus d Se você comprar 4 pneus Rodabem quantos você esperaria trocar durante a garantia 45000 km 50 Tabela da Distribuição NormalPadrão Parte inteira e primeira decimal de z Segunda decimal de z Parte inteira e primeira decimal de z 0 1 2 3 4 5 6 7 8 9 00 000000 000399 000798 001197 001595 001994 002392 002790 003188 003586 00 01 003983 004380 004776 005172 005567 005962 006356 006749 007142 007535 01 02 007926 008317 008706 009095 009483 009871 010257 010642 011026 011409 02 03 011791 012172 012552 012930 013307 013683 014058 014431 014803 015173 03 04 015542 015910 016276 016640 017003 017364 017724 018082 018439 018793 04 05 019146 019497 019847 020194 020540 020884 021226 021566 021904 022240 05 06 022575 022907 023237 023565 023891 024215 024537 024857 025175 025490 06 07 025804 026115 026424 026730 027035 027337 027637 027935 028230 028524 07 08 028814 029103 029389 029673 029955 030234 030511 030785 031057 031327 08 09 031594 031859 032121 032381 032639 032894 033147 033398 033646 033891 09 10 034134 034375 034614 034849 035083 035314 035543 035769 035993 036214 10 11 036433 036650 036864 037076 037286 037493 037698 037900 038100 038298 11 12 038493 038686 038877 039065 039251 039435 039617 039796 039973 040147 12 13 040320 040490 040658 040824 040988 041149 041309 041466 041621 041774 13 14 041924 042073 042220 042364 042507 042647 042785 042922 043056 043189 14 15 043319 043448 043574 043699 043822 043943 044062 044179 044295 044408 15 16 044520 044630 044738 044845 044950 045053 045154 045254 045352 045449 16 17 045543 045637 045728 045818 045907 045994 046080 046164 046246 046327 17 18 046407 046485 046562 046638 046712 046784 046856 046926 046995 047062 18 19 047128 047193 047257 047320 047381 047441 047500 047558 047615 047670 19 20 047725 047778 047831 047882 047932 047982 048030 048077 048124 048169 20 21 048214 048257 048300 048341 048382 048422 048461 048500 048537 048574 21 22 048610 048645 048679 048713 048745 048778 048809 048840 048870 048899 22 23 048928 048956 048983 049010 049036 049061 049086 049111 049134 049158 23 24 049180 049202 049224 049245 049266 049286 049305 049324 049343 049361 24 25 049379 049396 049413 049430 049446 049461 049477 049492 049506 049520 25 26 049534 049547 049560 049573 049585 049598 049609 049621 049632 049643 26 27 049653 049664 049674 049683 049693 049702 049711 049720 049728 049736 27 28 049744 049752 049760 049767 049774 049781 049788 049795 049801 049807 28 29 049813 049819 049825 049831 049836 049841 049846 049851 049856 049861 29 30 049865 049869 049874 049878 049882 049886 049889 049893 049896 049900 30 31 049903 049906 049910 049913 049916 049918 049921 049924 049926 049929 31 32 049931 049934 049936 049938 049940 049942 049944 049946 049948 049950 32 33 049952 049953 049955 049957 049958 049960 049961 049962 049964 049965 33 34 049966 049968 049969 049970 049971 049972 049973 049974 049975 049976 34 35 049977 049978 049978 049979 049980 049981 049981 049982 049983 049983 35 36 049984 049985 049985 049986 049986 049987 049987 049988 049988 049989 36 37 049989 049990 049990 049990 049991 049991 049992 049992 049992 049992 37 38 049993 049993 049993 049994 049994 049994 049994 049995 049995 049995 38 39 049995 049995 049996 049996 049996 049996 049996 049996 049997 049997 39 40 049997 049997 049997 049997 049997 049997 049998 049998 049998 049998 40 45 050000 050000 050000 050000 050000 050000 050000 050000 050000 050000 45 Área ou probabilidade 51 VI INFERÊNCIA ESTATÍSTICA 61 Estimação de parâmetros Exemplo Um fabricante de lâmpadas garante que a vida média de um determinado tipo de lâmpada é de pelo menos 750 horas Se uma amostra ao acaso com 26 lâmpadas tiver uma vida média de 745 horas e desvio padrão de 60 horas você tem evidência suficiente para rejeitar a alegação do fabricante Inferência Estatística Procedimentos para fazer generalizações sobre as características de uma população a partir da informação contida na amostra AMOSTRAGEM INFERÊNCIA 52 Estimação É o processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros populacionais desconhecidos Qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória Exemplo média desvio padrão e proporção Parâmetros São as características populacionais geralmente desconhecidas µ média populacional desvio padrão populacional p proporção populacional Como o cálculo destes parâmetros é quase impossível estimamos os valores a partir de uma amostra da população Estimadores ou Estatísticas São as características amostrais usadas para estimar os parâmetros Parâmetro Estimador 𝜇 𝑥 𝑥1 𝑥2 𝑥𝑛 𝑛 𝜎 𝑠 𝑥𝑖 𝑥2 𝑛 1 𝑝 𝑝 nº de elementos com a caracterí stica de interesse 𝑛 53 Estimativa Os valores dos estimadores 𝑥 𝑠 e 𝑝 observados na amostra são chamados de estimativas pontuais dos parâmetros As estimativas pontuais nem sempre são iguais aos valores populacionais embora estes possam ser bem próximos Devido à variabilidade amostral devese incluir uma estimativa intervalar para acompanhar a estimativa pontual Estimativa intervalar Fornece um intervalo de valores possíveis no qual se admite com certa confiança que contenha o verdadeiro valor do parâmetro populacional 54 62 Distribuições Amostrais dos Estimadores Quando selecionamos uma amostra aleatória simples qualquer estimador associado à amostra é uma variável aleatória A distribuição destas variáveis aleatórias amostrais se aproxima de distribuições contínuas conhecidas à medida que a o tamanho da amostra cresce Distribuição Amostral da Média Considere uma amostra de tamanho 𝑛 de uma variável aleatória 𝑋 com média 𝜇 𝐸𝑋 e desviopadrão 𝜎 𝑉𝑎𝑟𝑋 que vamos denotar por 𝑋1 𝑋2 𝑋𝑛 Sabemos que tal amostra pode ser proveniente de uma distribuição conhecida como Binomial ou Normal ou desconhecida Mas qual seria a distribuição do estimador 𝑋 A distribuição da média depende da distribuição da amostra Podemos demonstrar esse fato através do Teorema Central do Limite Teorema Central do Limite Distribuição de 𝑿 Tamanho da amostra Distribuição de 𝑿 𝑋𝑁𝜇 𝜎 Qualquer 𝑋𝑁 𝜇 𝜎 𝑛 Qualquer 𝑛 30 𝑋𝑁 𝜇 𝜎 𝑛 55 Distribuições amostrais de três populações diferentes População 𝑛 2 𝑛 5 𝑛 30 𝑋 𝑋 𝑋 𝑋 𝑋 𝑋 𝑋 𝑋 𝑋 𝑋 𝑋 𝑋 56 Distribuição Amostral da Proporção Considere uma população em que a proporção de elementos com a característica de interesse é 𝑝 Logo podemos definir uma va 𝑋 da seguinte maneira 𝑋 1 0 se o indiví duo tiver a caracterí stica se o indiví duo na o tiver a caracterí stica Logo 𝜇 𝐸𝑋 𝑝 e 𝜎2 𝑉𝑎𝑟𝑋 𝑝1 𝑝 Então pelo Teorema Central do Limite para 𝑛 grande podemos considerar que 𝑝𝑁 𝑝 𝑝1 𝑝 𝑛 57 63 Intervalos de Confiança Com a construção de intervalos de confiança agregamos ao estimador pontual informação sobre sua variabilidade Um intervalo de confiança consiste em um limite inferior e um limite superior construídos através de duas partes uma estimativa pontual para o parâmetro de interesse um valor que descreve a precisão da estimativa Esse valor é chamado de margem de erro Intervalos de Confiança para 𝜇 média populacional Seja 𝑧𝛼 2 o valor de 𝑧 tal que 𝑃 𝑍 𝑧𝛼 2 𝛼 2 ou seja 1001 𝛼 é denominado coeficiente de confiança ou nível de confiança ou ainda índice de confiança IC 58 Exemplo A medida de uma peça usinada tem distribuição Normal com média igual a 5 e desviopadrão igual a 3 Foram retiradas 100 amostras diferentes de tamanho 𝑛 30 desta população e calculados intervalos de 95 de confiança para cada uma destas amostras Os resultados dos 100 intervalos obtidos são apresentados na figura a seguir 0 5 10 0 20 40 60 80 100 59 Caso 1 População Normal 𝝈 conhecido Neste caso um intervalo de 1001 𝛼 de confiança para 𝜇 é dado por 𝑥 𝑧𝛼 2 𝜎 𝑛 𝜇 𝑥 𝑧𝛼 2 𝜎 𝑛 ou simplesmente 𝑥 𝑧𝛼 2 𝜎 𝑛 Exemplo Uma máquina automática de refrescos é regulada de modo que a quantidade suprida de cada vez tenha distribuição aproximadamente normal com desvio padrão de 13ml Uma amostra de 30 copos de refresco acusou conteúdo médio de 210ml a Determine um intervalo de 95 de confiança para a quantidade média de todos os refrescos servidos b Determine um intervalo de 99 de confiança para a quantidade média de todos os refrescos servidos c Mantendo a confiança de 95 quantos copos a mais deveriam ser incluídos na amostra para que a margem de erro fosse de no máximo 3ml 60 Caso 2 População Normal 𝝈 desconhecido Neste caso como não conhecemos o 𝜎 podemos estimálo pelo desvio padrão da amostra 𝑠 Neste caso temos uma nova estatística 𝑇 𝑋 𝜇 𝑠 𝑛 Essa estatística tem distribuição conhecida como Distribuição t de Student com 𝑛 1 graus de liberdade onde 𝑛 é o tamanho da amostra A distribuição 𝑡 é muito parecida com a Normal Padrão tem forma de sino e é simétrica em zero mas possui maior dispersão por causa da substituição de 𝜎 por 𝑠 No entanto à medida que 𝑛 cresce a distribuição 𝑡 aproximase da 𝑁0 1 pois 𝑠 aproximase de 𝜎 Portanto no caso de 𝜎 desconhecido podemos estimar o erro padrão da média 𝜎𝑋 𝜎 𝑛 utilizando o 𝑠 ou seja 𝜎𝑋 𝜎 𝑛 𝑠 𝑛 75 50 25 00 25 50 04 03 02 01 00 N01 t com 2 gl 4 3 2 1 0 1 2 3 4 04 03 02 01 00 N01 t com 30 gl 61 Tabela da Distribuição t de Student gl Valores 𝑡𝐶 tais que 𝑃𝑇 𝑡𝐶 2 gl 45 40 35 30 25 20 15 10 5 25 2 1 05 01 005 1 0158 0325 0510 0727 1000 1376 1963 3078 6314 12706 15895 31821 63657 31831 63662 1 2 0142 0289 0445 0617 0816 1061 1386 1886 2920 4303 4849 6965 9925 22327 31599 2 3 0137 0277 0424 0584 0765 0978 1250 1638 2353 3182 3482 4541 5841 10215 12924 3 4 0134 0271 0414 0569 0741 0941 1190 1533 2132 2776 2999 3747 4604 7173 8610 4 5 0132 0267 0408 0559 0727 0920 1156 1476 2015 2571 2757 3365 4032 5893 6869 5 6 0131 0265 0404 0553 0718 0906 1134 1440 1943 2447 2612 3143 3707 5208 5959 6 7 0130 0263 0402 0549 0711 0896 1119 1415 1895 2365 2517 2998 3499 4785 5408 7 8 0130 0262 0399 0546 0706 0889 1108 1397 1860 2306 2449 2896 3355 4501 5041 8 9 0129 0261 0398 0543 0703 0883 1100 1383 1833 2262 2398 2821 3250 4297 4781 9 10 0129 0260 0397 0542 0700 0879 1093 1372 1812 2228 2359 2764 3169 4144 4587 10 11 0129 0260 0396 0540 0697 0876 1088 1363 1796 2201 2328 2718 3106 4025 4437 11 12 0128 0259 0395 0539 0695 0873 1083 1356 1782 2179 2303 2681 3055 3930 4318 12 13 0128 0259 0394 0538 0694 0870 1079 1350 1771 2160 2282 2650 3012 3852 4221 13 14 0128 0258 0393 0537 0692 0868 1076 1345 1761 2145 2264 2624 2977 3787 4140 14 15 0128 0258 0393 0536 0691 0866 1074 1341 1753 2131 2249 2602 2947 3733 4073 15 16 0128 0258 0392 0535 0690 0865 1071 1337 1746 2120 2235 2583 2921 3686 4015 16 17 0128 0257 0392 0534 0689 0863 1069 1333 1740 2110 2224 2567 2898 3646 3965 17 18 0127 0257 0392 0534 0688 0862 1067 1330 1734 2101 2214 2552 2878 3610 3922 18 19 0127 0257 0391 0533 0688 0861 1066 1328 1729 2093 2205 2539 2861 3579 3883 19 20 0127 0257 0391 0533 0687 0860 1064 1325 1725 2086 2197 2528 2845 3552 3850 20 21 0127 0257 0391 0532 0686 0859 1063 1323 1721 2080 2189 2518 2831 3527 3819 21 22 0127 0256 0390 0532 0686 0858 1061 1321 1717 2074 2183 2508 2819 3505 3792 22 23 0127 0256 0390 0532 0685 0858 1060 1319 1714 2069 2177 2500 2807 3485 3768 23 24 0127 0256 0390 0531 0685 0857 1059 1318 1711 2064 2172 2492 2797 3467 3745 24 25 0127 0256 0390 0531 0684 0856 1058 1316 1708 2060 2167 2485 2787 3450 3725 25 26 0127 0256 0390 0531 0684 0856 1058 1315 1706 2056 2162 2479 2779 3435 3707 26 27 0127 0256 0389 0531 0684 0855 1057 1314 1703 2052 2158 2473 2771 3421 3690 27 28 0127 0256 0389 0530 0683 0855 1056 1313 1701 2048 2154 2467 2763 3408 3674 28 29 0127 0256 0389 0530 0683 0854 1055 1311 1699 2045 2150 2462 2756 3396 3659 29 30 0127 0256 0389 0530 0683 0854 1055 1310 1697 2042 2147 2457 2750 3385 3646 30 35 0127 0255 0388 0529 0682 0852 1052 1306 1690 2030 2133 2438 2724 3340 3591 35 40 0126 0255 0388 0529 0681 0851 1050 1303 1684 2021 2123 2423 2704 3307 3551 40 50 0126 0255 0388 0528 0679 0849 1047 1299 1676 2009 2109 2403 2678 3261 3496 50 60 0126 0254 0387 0527 0679 0848 1045 1296 1671 2000 2099 2390 2660 3232 3460 60 120 0126 0254 0386 0526 0677 0845 1041 1289 1658 1980 2076 2358 2617 3160 3373 120 0126 0253 0385 0524 0674 0842 1036 1282 1645 1960 2054 2326 2576 3090 3291 45 40 35 30 25 20 15 10 5 25 2 1 05 01 005 62 Assim um intervalo de 1001 𝛼 de confiança para 𝜇 é dado por 𝑥 𝑡𝑛1𝛼 2 𝑠 𝑛 𝜇 𝑥 𝑡𝑛1𝛼 2 𝑠 𝑛 ou simplesmente 𝑥 𝑡𝑛1𝛼 2 𝑠 𝑛 Exemplo Um pesquisador está estudando a resistência de um determinado material sob determinadas condições Ele sabe que essa variável é normalmente distribuída Utilizando os valores a seguir em unidades obtidos de uma amostra de tamanho 9 determine o intervalo de 90 de confiança para a resistência média 49 70 81 45 56 68 72 57 62 No entanto quando o tamanho da amostra é grande 𝑛 30 o Teorema Central do Limite permite usar a distribuição Normal para estimar 𝜇 63 Caso 3 População Normal 𝝈 desconhecido grandes amostras Neste caso um intervalo de 1001 𝛼 de confiança para 𝜇 é dado por 𝑥 𝑧𝛼 2 𝑠 𝑛 𝜇 𝑥 𝑧𝛼 2 𝑠 𝑛 ou simplesmente 𝑥 𝑧𝛼 2 𝑠 𝑛 Exemplo De 50000 válvulas fabricadas por uma companhia retirase uma amostra de 400 válvulas e obtémse a vida média de 800 horas e o desvio padrão de 100 horas a Qual o intervalo de confiança de 99 para a vida média da população b Com que confiança podese dizer que a vida média é 800 098 c Que tamanho deve ter a amostra para que seja de 95 a confiança na estimativa 800 784 64 Intervalos de Confiança para 𝑝 proporção populacional Seja 𝑋 o número de sucessos em 𝑛 provas de um experimento com distribuição Binomial𝑛 𝑝 Então através do TCL podemos afirmar que para grandes amostras 𝑍 𝑋 𝑛𝑝 𝑛𝑝1 𝑝 𝑁0 1 Assim um intervalo de 1001 𝛼 de confiança para 𝑝 é dado por 𝑝 𝑧𝛼 2 𝑝1 𝑝 𝑛 𝑝 𝑝 𝑧𝛼 2 𝑝1 𝑝 𝑛 ou simplesmente 𝑝 𝑧𝛼 2 𝑝1 𝑝 𝑛 Exemplo Antes de uma eleição um determinado partido está interessado em estimar a proporção 𝑝 de eleitores favoráveis ao seu candidato Uma amostra piloto de tamanho 100 revelou que 60 dos eleitores eram favoráveis ao candidato em questão a Determine o tamanho da amostra necessário para que o erro cometido na estimação seja de no máximo 001 com confiança de 80 b Se na amostra final com tamanho igual ao obtido em a observouse que 55 dos eleitores eram favoráveis ao candidato em questão construa um intervalo de 95 de confiança para a proporção p c Se a pesquisa foi divulgada na TV com margem de erro de 2 qual a confiança do intervalo divulgado 65 Exemplo Suponha que em uma amostra de 500 famílias em certa cidade haja 341 com TV a cabo Se quisermos estimar o número de famílias que possuem TV a cabo qual o tamanho da amostra necessário para que tenhamos 95 de confiança em que o erro de nossa estimativa não seja superior a 002 a Utilizando a informação das 500 famílias b Sem utilizar essa informação 64 Determinação do Tamanho da Amostra Determinando o tamanho da amostra para estimação de 𝜇 𝑛 𝑧𝛼 2 𝜎 𝐸 2 onde 𝐸 é a margem de erro máxima admitida Determinando o tamanho da amostra para estimação de 𝑝 𝑛 𝑝1 𝑝 𝑧𝛼 2 𝐸 2 onde 𝐸 é a margem de erro máxima admitida 66 65 Testes de Hipóteses Em muitos casos o pesquisador não está interessado apenas em estimar o parâmetro está interessado em verificar se o parâmetro de interesse apresenta um valor hipotético ou se difere em grupos diferentes Nestes casos testes de hipóteses são os métodos estatísticos adequados para responder à pergunta do pesquisador Exemplos 1 O tempo médio de execução de determinada tarefa é de no máximo 70 minutos 2 A proporção de peças defeituosas produzidas pela turma B é menor que 5 3 A resistência média das peças é de pelo menos 100 Mpa 4 Uma máquina automática de refrescos é regulada de modo que a quantidade suprida de cada vez tenha distribuição aproximadamente normal com desvio padrão de 13 ml Uma amostra de 30 copos de refresco acusou conteúdo médio de 210 ml Se a máquina é regulada para encher copos de 200 ml existem evidências estatísticas que comprovem que a máquina está desregulada 67 Hipóteses Hipótese nula 𝐻0 é a hipótese aceita como verdadeira até que existam evidências estatísticas que comprovem o contrário Hipótese alternativa 𝐻1 é a hipótese de interesse a hipótese que rejeita a hipótese nula Teste bilateral Teste unilateral à esquerda Teste unilateral à direita Testes para uma média 𝐻0 𝜇 𝜇0 𝐻1 𝜇 𝜇0 𝐻0 𝜇 𝜇0 𝐻1 𝜇 𝜇0 𝐻0 𝜇 𝜇0 𝐻1 𝜇 𝜇0 Testes para uma proporção 𝐻0 𝑝 𝑝0 𝐻1 𝑝 𝑝0 𝐻0 𝑝 𝑝0 𝐻1 𝑝 𝑝0 𝐻0 𝑝 𝑝0 𝐻1 𝑝 𝑝0 Exemplos 1 𝐻0 𝜇 70 𝐻1 𝜇 70 2 𝐻0 𝑝 5 𝐻1 𝑝 5 3 𝐻0 𝜇 100 𝐻1 𝜇 100 4 𝐻0 𝜇 200 𝐻1 𝜇 200 68 Erro Tipo I e Erro Tipo II A situação real na população é que 𝐻0 é Verdadeira Falsa O pesquisador realiza um teste estatístico e decide que 𝐻0 é Verdadeira aceita 𝐻0 Decisão correta Erro Tipo II Falsa rejeita 𝐻0 Erro Tipo I Decisão correta Exemplos 1 Erro tipo I Concluir através do teste de hipóteses que o tempo médio de execução de determinada tarefa é maior que 70 minutos quando na verdade o tempo é igual a 70 minutos Erro tipo II Concluir através do teste de hipóteses que o tempo médio de execução de determinada tarefa é igual a 70 minutos quando na verdade o tempo é maior que 70 minutos 69 Nível de significância É a probabilidade de ocorrência do erro Tipo I ou seja 𝛼 𝑃rejeitar 𝐻0 𝐻0 é verdadeira Valor Padrão 005 usual 010 Aceitamos o risco de que a cada 100 amostras a hipótese nula verdadeira será rejeitada 5 vezes Estatística de Teste Valor calculado com base nos dados amostrais através do qual decidiremos sobre a rejeição ou não de 𝐻0 após comparação com a região de rejeição Testes para uma média Teste para uma proporção conhecido 𝑍 𝑥 𝜇0 𝜎 𝑛 desconhecido 𝑇 𝑥 𝜇0 𝑠 𝑛 n 30 𝑍 𝑥 𝜇0 𝑠 𝑛 𝑍 𝑝 𝑝0 𝑝01 𝑝0 𝑛 70 Região de Rejeição ou Região Crítica É um valor obtido através das tabelas das distribuições 𝑍 𝑇 𝜒2 𝐹 que será comparado com o valor da estatística de teste para que se decida sobre a rejeição ou não de 𝐻0 A região de rejeição depende da hipótese alternativa bilateral ou unilateral No caso dos testes de hipóteses bilaterais rejeitamos 𝑯𝟎 se 𝒁 𝒛𝜶 𝟐 ou 𝒁 𝒛𝜶 𝟐 ou se 𝑻 𝒕𝒏𝟏𝜶 𝟐 ou 𝑻 𝒕𝒏𝟏𝜶 𝟐 71 Exemplo adaptado de Montgomery 2003 O rendimento de um processo químico está sendo estudado De experiências prévias sabese que o desviopadrão do rendimento é igual a 3 Os últimos cinco dias de operação da planta resultaram nos seguintes rendimentos 916 8875 908 8995 913 Usando 10 de significância há evidência de que o rendimento médio não seja 90 Calcule o valorp Probabilidade de significância valorp É a probabilidade de que estejamos cometendo o Erro Tipo I caso 𝐻0 seja rejeitada Expressa a probabilidade de ocorrência de valores iguais ou superiores ao assumido pela estatística de teste em módulo Se essa probabilidade é menor do que 𝑝 existem evidências estatísticas para rejeitar 𝐻0 No caso das hipóteses bilaterais o valorp é calculado como o dobro da área à esquerda ou à direita de 𝒁 ou 𝑻 72 No caso de testes unilaterais à esquerda rejeitamos 𝑯𝟎 se 𝒁 𝒛𝜶 ou se 𝑻 𝒕𝒏𝟏𝜶 e o valorp é calculado como a área à esquerda de 𝒁 ou 𝑻 De forma análoga no caso de testes unilaterais à direita rejeitamos 𝑯𝟎 se 𝒁 𝒛𝜶 ou se 𝑻 𝒕𝒏𝟏𝜶 e o valorp é calculado como a área à direita de 𝒁 ou 𝑻 73 Exemplo adaptado de Barbetta 2004 Certo tipo de pneu dura em média 50000 km O fabricante investiu em uma nova composição de borracha para pneus Vinte pneus fabricados com essa nova composição duraram em média 55000 km com desviopadrão de 4000 km Supondo que a durabilidade dos pneus segue uma distribuição aproximadamente normal verificar se os dados provam que os novos pneus são mais duráveis Tire suas conclusões através da estatística de teste e do valorp Use 𝛼 1 Exemplo adaptado de Montgomery 2003 Uma amostra aleatória de 50 capacetes de corredores de motos e de automóveis foi sujeita a um teste de impacto sendo observado algum dano em 18 desses capacetes a Encontre um intervalo de 95 confiança para a verdadeira proporção de capacetes desse tipo que mostraria algum dano proveniente desse teste b Usando a estimativa de p obtida a partir da amostra preliminar de 50 capacetes quantos capacetes devem ser testados para que estejamos 95 confiantes de que o erro na estimação do verdadeiro valor de p seja menor do que 2 c Com base nos resultados do teste de impacto existem evidências de que a proporção de capacetes com danos é menor que 40 74 VII CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 71 Correlação Linear A correlação entre duas variáveis deve ser calculada quando se deseja saber se a variação de uma delas acompanha proporcional ou inversamente a variação da outra Diagrama de Dispersão O diagrama de dispersão apresenta os valores das duas variáveis que se deseja correlacionar cada uma em um eixo 𝑋 ou 𝑌 traçados em escalas adequadas para cada variável Exemplo Um estudo do departamento de transportes sobre a velocidade de condução e o rendimento medido pela distância percorrida em quilômetros por litro de combustível para automóveis de tamanho médio resultou nos seguintes dados Velocidade kmh 48 80 64 88 48 40 96 40 80 88 Rendimento kml 131 106 119 97 127 135 89 148 110 106 75 Diagramas de dispersão para diferentes associações entre 𝑋 e 𝑌 04 02 00 04 02 00 08 04 00 08 04 00 16 08 00 4 2 0 4 2 0 16 08 00 4 2 0 12 08 04 4 2 0 100 075 050 76 O Coeficiente de Correlação Linear de Pearson 𝑟𝑥𝑦 Enquanto o diagrama de dispersão é utilizado para visualizar o tipo de relação existente entre as variáveis 𝑋 e 𝑌 o coeficiente de correlação linear de Pearson 𝑟𝑥𝑦 mede o sentido e a intensidade da relação linear entre elas O coeficiente de correlação linear de Pearson pode ser calculado pela covariância entre 𝑋 e 𝑌 dividida pelo produto dos desviospadrão de 𝑋 e 𝑌 conforme a fórmula que se segue corr𝑋 𝑌 𝑟𝑥𝑦 cov𝑋 𝑌 𝑠𝑥 𝑠𝑦 onde cov𝑋 𝑌 𝑥𝑖 𝑥𝑦𝑖 𝑦 𝑛 1 e 𝑠𝑥 e 𝑠𝑦 são os desviospadrão de 𝑋 e 𝑌 respectivamente Observe que o sinal de 𝑟𝑥𝑦 é determinado pelo sinal da covariância Interpretação do Coeficiente de Correlação O coeficiente de correlação satisfaz a condição 1 𝑟𝑥𝑦 1 Se 𝑟𝑥𝑦 1 a relação linear entre 𝑋 e 𝑌 é perfeita e inversa Se 𝑟𝑥𝑦 0 não existe associação entre 𝑋 e 𝑌 Se 𝑟𝑥𝑦 1 a relação linear entre 𝑋 e 𝑌 é perfeita e positiva 1 0 1 Relação linear negativa perfeita Negativa forte Negativa moderada Negativa fraca Ausência de associação linear Relação linear positiva perfeita Positiva fraca Positiva moderada Positiva forte 77 Diagramas de dispersão para diferentes valores de 𝑟𝑥𝑦 Exemplo continuação Quantifique a associação entre a velocidade de condução e o rendimento para os automóveis de tamanho médio 04 02 00 04 02 00 08 04 00 08 04 00 16 08 00 4 2 0 4 2 0 16 08 00 4 2 0 12 08 04 4 2 0 100 075 050 r 1 r 0953 r 0648 r 0253 r 0003 r 0009 r 0598 r 0833 r 1 Gráficos de dispersão para diferentes valores de r 78 72 Regressão Linear Após a análise do diagrama de dispersão e do coeficiente de correlação se concluirmos que existe uma correlação linear significativa entre duas variáveis o próximo passo será tentar estimar uma equação que melhor descreva a relação entre essas variáveis A relação mais simples que conhecemos é aquela descrita pela equação de uma reta Uma vez que assumimos a relação linear entre as variáveis tal relação será descrita pela equação de regressão 𝑌 𝛽0 𝛽1𝑋 onde 𝑌 variável dependente ou resposta 𝑋 variável independente ou preditora ou explicativa 𝛽0 parâmetro que representa o coeficiente linear ou intercepto da reta 𝛽1 parâmetro que representa o coeficiente angular ou inclinação da reta Método dos Mínimos Quadrados Ordinais para ajuste da reta Usando apenas os dados amostrais não é possível obter os valores exatos dos parâmetros 𝛽0 e 𝛽1 Tais parâmetros serão estimados com base nos dados amostrais Assim a equação de regressão estimada será dada por 𝑦 𝑏0 𝑏1𝑥 onde 𝑏0 é uma estimativa de 𝛽0 e 𝑏1 é uma estimativa de 𝛽1 79 Os valores de b0 e b1 são calculados a partir de 𝑏1 𝑛 𝑥𝑖𝑦𝑖 𝑥𝑖 𝑦𝑖 𝑛 𝑥𝑖 2 𝑥𝑖2 e 𝑏0 𝑦 𝑏1𝑥 Exemplo continuação a Estime a equação de regressão que melhor descreve a associação entre a velocidade de condução e o rendimento para os automóveis de tamanho médio b Faça uma previsão do rendimento em kml para um automóvel que trafega em velocidade média de 45 kmh c Faça uma previsão do rendimento em kml para um automóvel que trafega em velocidade média de 160 kmh 80 Coeficiente de Determinação 𝑅2 O coeficiente de determinação 𝑅2 mede a proporção da variação em 𝑌 que é explicada pela equação de regressão estimada Quanto maior for o valor de 𝑅2 maior será a proporção da variação em 𝑌 explicada pela equação estimada É usada para verificar a adequação de um modelo de regressão e é dada por 𝑅2 𝑉𝐸 𝑉𝑇 𝑦𝑖 𝑦2 𝑦𝑖 𝑦2 0 𝑅2 100 onde 𝑉𝐸 é a variação explicada pelo modelo de regressão estimado e 𝑉𝑇 é a variação total Para uma equação de regressão linear simples 𝑅2 𝑟𝑥𝑦2 100 Exemplo continuação Calcule e interprete o coeficiente de determinação 𝑅2 para a equação de regressão estimada 81 ANEXO I EXERCÍCIOS DE REVISÃO AI1 Análise Descritiva de Dados 11 A tabela a seguir mostra a remuneração dos altos executivos CEOS Chief Executive Officer a classificação por setor as vendas anuais e os dados de avaliação da remuneração dos CEOS versus o retorno dos acionistas para 10 empresas Uma avaliação igual a 1 da remuneração dos CEOS versus o retorno dos acionistas indica que a empresa está no grupo de empresas que têm a melhor relação Uma avaliação igual a 2 indica que a empresa é similar às empresas que têm uma relação muito boa mas não a melhor Empresas com a pior relação têm uma avaliação igual a 5 Empresa Remuneração dos CEOS US 1000s Setor Vendas US milhões Remuneração dos CEOS vs Retorno dos Acionistas Bankers Trust 8925 Bancário 9565 3 CocaCola 2437 Bebidas 18546 5 General Mills 1410 Alimentação 5567 1 LSI Logic 696 Eletrônico 1239 2 Motorola 1847 Eletrônico 27973 4 Readers Digest 1490 Gráfico 2968 3 Sears 3414 Varejo 38236 4 Sprint 3344 Telecomunicações 14045 4 Walgreen 1490 Varejo 12140 2 Wells Fargo 2861 Bancário 8723 3 Fonte Business Week 21 de abril de 1997 a Qual é a população em estudo b Qual foi o tamanho da amostra utilizado c Quantas variáveis existem nesse conjunto de dados Classifiqueas d Qual a porcentagem das empresas que pertencem ao setor bancário e Que porcentagem das empresas recebeu um valor 3 na avaliação da remuneração dos CEOS versus o retorno dos acionistas f Calcule a média aritmética a mediana e a moda da remuneração dos altos executivos das empresas g Calcule a amplitude a variância o desviopadrão e o coeficiente de variação da remuneração dos altos executivos das empresas 12 Uma cidade turística tem 32 hotéis 3 estrelas Pretendese conhecer o custo médio de diária para apartamento de casal Os valores populacionais consistem nos seguintes preços diários em reais Hotel Preço Hotel Preço Hotel Preço Hotel Preço 1 25 9 30 17 25 25 25 2 20 10 38 18 23 26 23 3 35 11 24 19 20 27 20 4 21 12 20 20 24 28 24 5 22 13 20 21 28 29 28 6 22 14 25 22 24 30 24 7 24 15 20 23 24 31 24 8 25 16 19 24 22 32 22 a Qual é a variável em estudo Classifiquea b Apresente a distribuição dos dados em um ramoefolhas Use incremento 2 c Para os 32 hotéis construa uma tabela de frequências adotando classes de mesma amplitude d Com base na tabela do item b construa um histograma dos dados Utilize as frequências relativas e Considerando os 32 valores calcule 𝑄1 𝑄2 𝑄3 e AIQ 82 f Apresente a distribuição dos dados em um boxplot g Considerando os 32 valores calcule a média a mediana a moda a amplitude a variância o desvio padrão e o coeficiente de variação dos preços diários h Considere que para cidades com a mesma característica dessa a variação dos preços das diárias gira em torno de 40 Com base neste valor é possível afirmar que os preços desses 32 hotéis são homogêneos Justifique 13 Considere os seguintes dados 14 20 24 22 18 16 22 12 19 24 18 23 16 19 22 25 24 20 17 25 15 21 16 19 19 21 23 25 24 23 16 24 16 22 26 19 21 20 16 20 a Organize os dados em uma tabela de frequências adotando classes iguais Essa tabela deve conter as classes as frequências absoluta e relativa e as frequências acumuladas b Construa o histograma para os dados da tabela do item b Use as frequências relativas c Calcule as medidas de posição e de dispersão para o conjunto de dados Calcule também os quartis 14 O Serviço de Recursos Humanos da Roth Young relatou que os salários anuais para os gerentes assistentes de lojas de departamentos variam de R 28000 a R 57000 Assuma que os seguintes dados são uma amostra dos salários anuais de 40 gerentes assistentes de lojas de departamento os dados estão em mil reais 31 35 37 39 40 40 41 41 42 42 43 44 44 44 45 45 45 45 45 46 46 47 47 48 48 49 50 50 50 50 51 51 52 52 52 53 54 55 56 57 a Qual é a variável em estudo Classifiquea como categórica nominal ou ordinal ou quantitativa discreta ou contínua b Apresente a distribuição dos dados em um ramoefolhas Use incremento 5 c Organize os dados em uma tabela de frequências adotando classes de amplitudes iguais d Construa o histograma associado à tabela do item b Use as frequências absolutas 15 De acordo com uma pesquisa realizada pelo IBGE sobre o perfil do transporte rodoviário de cargas no Brasil classificouse 34586 empresas de acordo com a quantidade de funcionários empregados no setor de transportes Os resultados são apresentados na tabela a seguir N de funcionários n n acumulada acumulada 0 a 5 23908 6 a 19 8192 20 a 49 1693 50 a 99 447 Mais de 99 346 Total 34586 a Complete a tabela b Complete i O número de empresas que possuem de 6 a 19 funcionários empregados no setor de transportes é igual a o que equivale a 83 ii O percentual de empresas que possuem até 49 funcionários é igual a iii empresas possuem pelo menos 20 funcionários empregados no setor de transportes o que equivale a 16 Os dados abaixo representam 40 leituras de temperatura C de um pasteurizador de leite 740 744 734 732 741 743 729 745 747 775 744 768 734 756 747 748 747 765 750 749 746 771 760 747 759 736 742 735 747 751 751 748 760 770 750 746 758 733 773 743 a Construa uma tabela de frequências b Apresente a distribuição em um histograma c Calcule a mediana e os quartis d Apresente a distribuição dos dados em um boxplot 17 Bernardin UFSC 1994 realizou um experimento que tinha o objetivo de melhorar a qualidade do processo de formulação de massa cerâmica para pavimento Os corpos de prova eram biscoitos que saíam do processo de queima e a qualidade era avaliada por três variáveis 𝑋1 retração linear 𝑋2 resistência mecânica 𝑋3 absorção de água O experimento foi realizado sob 8 condições diferentes Foram feitos 5 ensaios em cada uma das 8 condições experimentais Os resultados são apresentados a seguir 𝐶1 𝑋1 𝑋2 𝑋3 𝐶1 𝑋1 𝑋2 𝑋3 𝐶1 𝑋1 𝑋2 𝑋3 𝐶1 𝑋1 𝑋2 𝑋3 1 89 411 55 3 94 500 08 5 134 606 05 7 129 411 02 1 92 390 48 3 99 483 06 5 134 600 05 7 124 390 04 1 80 369 62 3 96 501 06 5 136 684 02 7 126 369 05 1 87 392 57 3 92 499 07 5 134 608 07 7 126 392 04 1 87 359 55 3 94 562 05 5 124 514 10 7 129 359 03 2 126 527 09 4 66 312 90 6 96 412 39 8 82 408 44 2 136 535 04 4 64 253 102 6 106 530 45 8 92 438 39 2 116 470 13 4 59 228 105 6 89 370 33 8 92 486 40 2 101 311 18 4 59 275 106 6 75 301 30 8 85 469 43 2 121 509 11 4 68 319 93 6 89 416 35 8 87 462 41 𝐶 1 condição experimental a Como as variáveis 𝑋1 𝑋2 e 𝑋3 podem ser classificadas b Apresente a distribuição de frequências de 𝑋1 𝑋2 e 𝑋3 através de histogramas Comente as formas das distribuições c Apresente a distribuição dos valores de 𝑋1 𝑋2 e 𝑋3 através de boxplots Compare os resultados obtidos d Calcule a média e o desviopadrão de 𝑋3 para as condições experimentais 1 4 e 8 Quais as informações que podem ser extraídas com estas medidas e Calcule a mediana e os quartis de 𝑋1 f Compare as variáveis 𝑋1 𝑋2 e 𝑋3 com relação à variabilidade e à homogeneidade 18 Os dados abaixo apresentam a distância em km entre a residência e o local de trabalho dos funcionários da empresa AAA 18 25 04 19 44 22 35 17 08 32 151 21 14 05 09 17 09 21 11 17 12 23 19 08 15 05 14 14 18 20 11 10 08 02 14 37 Na empresa BBB a distância em km até a residência de seus 300 funcionários apresenta as seguintes medidas descritivas 1 Quartil 16 Mediana 28 3 Quartil 42 Mínimo 08 Máximo 88 84 a Compare as empresas AAA e BBB em termos da distância entre a residência e o local de trabalho dos funcionários b Construa um diagrama de pontos para representar os dados dos funcionários da empresa AAA Comente 19 O relatório oficial sobre seguros e acidentes de carros dos Estados Unidos avalia modelos de carros com base no número de reclamações de seguro preenchidas após os acidentes e utiliza um índice para classificálos de acordo com a segurança Os índices avaliados próximos de 100 são considerados médios Avaliações menores são melhores indicando um modelo de carro mais seguro A seguir são mostradas avaliações para 20 carros de tamanho médio e 20 carros de tamanho pequeno Carros médios Carros pequenos 51 68 81 91 103 73 100 108 118 124 58 75 81 91 119 80 102 108 119 127 60 76 82 93 127 96 103 109 120 133 68 81 82 100 128 100 103 113 122 140 a Apresente os resultados obtidos em um diagrama de pontos onde seja possível diferenciar os carros médios dos carros pequenos b Complete a tabela abaixo Carros n Média Mediana Moda Variância Desvio padrão Amplitude Médios 21494 Pequenos 109900 c Qual dos dois grupos mostrouse o mais homogêneo Justifique com os cálculos 110 Um processo químico de purificação é executado numa determinada indústria a quatro temperaturas diferentes Os resultados obtidos para o teor final da substância de interesse em para cada um dos 48 processos analisados N 48 são apresentados abaixo Temperatura oC Teor final em 25 oC 60 62 62 60 61 63 63 62 62 63 63 63 50 oC 64 63 63 64 65 64 65 65 65 65 66 66 75 oC 68 68 68 68 69 68 69 68 70 70 70 69 100 oC 72 73 72 72 73 73 74 74 75 74 75 74 a Qual é a variável em estudo Classifiquea b Complete a tabela a seguir Temperatura n Média Mediana Moda Amplitude Variância Desvio padrão CV 25C 50C 75C 100C c Compare os processos a 100C e a 50C quanto à homogeneidade d Utilize boxplots para comparar a distribuição dos valores de teor final para as diferentes temperaturas 85 AI2 Probabilidade 21 Apresente os espaços amostrais dos seguintes experimentos aleatórios a Lançamento de uma moeda honesta e observação da face voltada para cima b Observação da qualidade de peças produzidas registrando o número de peças defeituosas c Contagem do número de clientes de um fila única de banco que chegam durante uma hora d Medição da velocidade do vento em kmh na pista de um aeroporto e Medição da temperatura em graus Celsius numa estação meteorológica da cidade de Florianópolis 22 Considere que você vai cronometrar o tempo em segundos para carregar uma página da web a Represente em forma de conjuntos os seguintes eventos i 𝐴 mais do que 5 e no máximo 10 segundos ii 𝐵 mais do que 10 segundos iii 𝐶 mais do que 8 segundos iv 𝐷 𝐴 𝐵 v 𝐸 𝐴 𝐵 vi 𝐹 𝐴 𝐶 vii 𝐺 𝐴 b Represente geometricamente como intervalos na reta dos números reais os conjuntos do item anterior 23 Num estudo das necessidades futuras de um aeroporto C é o evento de que existirão fundos suficientes para a expansão planejada e E é o evento de que a expansão planejada incluirá um estacionamento suficientemente amplo Expresse em palavras o que significam as probabilidades PC PE PC E e PC E 24 Quais dos valores abaixo não podem ser probabilidades Justifique cada um deles a 02 b 3 2 c 0000001 d 2 e 1 25 Quanto é PA se A é o evento fevereiro tem 30 dias este ano 26 Retirase ao acaso uma carta de um baralho de 52 cartas Calcule a probabilidade de a A carta não ser de ouros b Ser uma carta de ouros ou uma figura 27 De um conjunto de cinco empresas desejase selecionar aleatoriamente uma empresa mas com probabilidade proporcional ao número de funcionários O número de funcionários da Empresa A é 20 da Empresa B é 15 da Empresa C é 7 da Empresa D é 5 e da Empresa E é 3 a Qual é a probabilidade de cada uma das empresas ser selecionada b Qual é a probabilidade de a Empresa A não ser selecionada 28 Considere as seguintes probabilidades para A e B 𝑃𝐴 1 2 𝑃𝐵 1 4 𝑃𝐴𝐵 1 3 a Utilizando as leis de probabilidade calcular 𝑃𝐴 𝑃𝐴 𝐵 e 𝑃𝐴 𝐵 b Usar o diagrama de Venn para calcular 𝑃𝐴 𝐵 e 𝑃𝐴 𝐵 86 29 Um sistema tem dois componentes que operam independentemente Suponhamos que as probabilidades de falha dos componentes 1 e 2 sejam 01 e 02 respectivamente Determinar a probabilidade de o sistema funcionar nos dois casos seguintes a Os componentes são ligados em série isto é ambos devem funcionar para que o sistema funcione b Os componentes são ligados em paralelo basta um funcionar para que o sistema funcione 210 A e B são duas estações meteorológicas em certo estado Denotemos por A e B respectivamente a ocorrência de chuva em cada uma delas em um dia do mês de novembro A experiência indica que PA PB 045 e PA B 030 Determine a 𝑃𝐴 ou 𝐵 b 𝑃𝐴𝐵 c 𝑃𝐵𝐴 211 A probabilidade de um ônibus da linha RioSão Paulo partir no horário é de 080 e a probabilidade de o ônibus partir no horário e chegar também no horário é de 072 a Qual é a probabilidade de um ônibus que partiu no horário chegar também no horário b Se há uma probabilidade de 075 de um ônibus chegar no horário qual é a probabilidade de um ônibus que chegou no horário ter partido também no horário 212 O daltonismo é hereditário Devido ao fato do gen responsável ser ligado ao sexo o daltonismo ocorre mais frequentemente em pessoas do sexo masculino Numa amostra de 10000 pessoas foi observada a incidência de daltonismo da cor vermelhaverde Os resultados foram Daltonismo Sexo Total Masculino Feminino Presente 423 65 488 Ausente 4848 4664 9512 Total 5271 4729 10000 Uma pessoa é escolhida ao acaso desta população a Calcule a probabilidade de ela ser i Daltônica ii Daltônica e do sexo feminino iii Daltônica ou do sexo feminino iv Daltônica dado que é do sexo feminino b Os eventos ser daltônico e ser do sexo feminino são independentes Justifique com os cálculos O que isto significa na prática 87 213 Para estudar a forma de transporte preferida para a exportação de seus produtos 150 indústrias foram pesquisadas e os resultados encontrados são apresentados a seguir Produto exportado Transporte preferido Total Fluvial Aéreo Ferroviário Produtos metálicos 12 30 10 52 Máquinas 8 2 4 14 Equipamentos elétricos 11 14 6 31 Equipamentos de transporte 10 3 4 17 Instrumentos de precisão 8 27 1 36 Total 49 76 25 150 Selecionandose aleatoriamente uma destas indústrias responda a Qual a probabilidade de que a empresa exporte produtos metálicos b Qual a probabilidade de que a empresa prefira o transporte aéreo c Qual a probabilidade de que a empresa exporte máquinas e prefira o transporte fluvial d Qual a probabilidade de que a empresa prefira o transporte ferroviário ou exporte instrumentos de precisão e Sabendose que a empresa exporta equipamentos de transporte qual a probabilidade de que ela prefira o transporte fluvial f O fato de exportar equipamentos elétricos e preferir o transporte aéreo são eventos independentes Justifique com os cálculos 214 Os dados de 200 peças usinadas estão resumidos a seguir Condição da extremidade Profundidade do orifício Acima do valor desejado Abaixo do valor desejado Grosseira 15 10 Moderada 25 20 Lisa 60 70 a Qual é a probabilidade de que uma peça selecionada tenha uma extremidade em condição moderada e uma profundidade do orifício abaixo do valor alvo b Qual é a probabilidade de que uma peça selecionada tenha uma extremidade em condição moderada ou uma profundidade do orifício abaixo do valor alvo c Construa um diagrama de Venn com a representação dos eventos no espaço amostral 215 A Telektronic fabrica computadores televisores aparelhos de CD e outros produtos eletrônicos Quando os itens expedidos são danificados as causas do dano são categorizadas como água A esmagamento E perfuração P e embalagem danificada D A seguir apresentamse a distribuição dos 200 últimos produtos expedidos pela empresa que voltaram devido a reclamações de danos na expedição Produto Causas do dano Água Esmagamento Perfuração Emb danificada Computadores 10 9 18 36 Televisores 12 7 23 40 Aparelhos de CD 3 3 0 14 Outros 5 3 7 10 Escolhido um produto ao acaso a Qual a probabilidade de que seja um aparelho de CD b Qual a probabilidade de que seja um computador danificado por perfuração c Qual a probabilidade que seja um televisor ou um produto danificado por água d Selecionandose um produto com embalagem danificada qual a probabilidade de que seja um aparelho de CD 88 216 Uma desculpa clássica para a ausência em uma prova é dada por quatro estudantes que afirmam que o pneu do carro onde os quatro estavam furou Para confirmar essas alegações o professor coloca cada um em uma sala e pede que eles escrevam em um papel qual pneu furou Se nenhum pneu furou e eles escolhem aleatoriamente um pneu que supostamente teria furado qual é a probabilidade de que eles escolham o mesmo pneu 217 Um programa computacional para detectar fraudes em cartões telefônicos dos consumidores rastreia todo dia o número de áreas metropolitanas de onde as chamadas se originam Sabese que 1 dos usuários legítimos fazem suas chamadas de duas ou mais áreas metropolitanas em um único dia Entretanto 30 dos usuários fraudulentos fazem suas chamadas de duas ou mais áreas metropolitanas em um único dia A proporção de usuários fraudulentos é 001 Se um usuário fizer as suas chamadas de duas ou mais áreas metropolitanas em um único dia qual será a probabilidade de que o usuário seja fraudulento 218 Consumidores são usados para avaliar projetos iniciais de produtos No passado 95 dos produtos altamente aprovados recebiam boas críticas 60 dos produtos moderadamente aprovados recebiam boas críticas e 10 dos produtos ruins recebiam boas críticas Além disso 40 dos produtos tinham sido altamente aprovados 35 tinham sido moderadamente aprovados e 25 tinham sido produtos ruins a Qual a probabilidade de que um produto atinja uma boa crítica b Se um projeto recebeu uma boa crítica qual a probabilidade de que ele se torne um produto altamente aprovado c Se um projeto não recebeu uma boa crítica qual a probabilidade de que ele se torne um produto moderadamente aprovado d Se um projeto recebeu uma crítica ruim qual a probabilidade de que ele se torne um produto ruim 219 Em uma indústria de enlatados as linhas de produção I II e III respondem por 50 30 e 20 da produção respectivamente As proporções de latas com defeito de produção nas linhas I II e III são 04 06 e 12 Qual a probabilidade de uma lata defeituosa descoberta ao final da inspeção do produto acabado provir da linha I 220 Um estudante é submetido a um teste de múltipla escolha em que cada questão apresenta cinco respostas apenas UMA sendo correta Se o estudante sabe a questão escolhe a resposta certa Se ele não sabe escolhe ao acaso uma das respostas Suponha que ele saiba 70 das questões a Qual a probabilidade de ele acertar determinada questão b Se ele responde corretamente a uma questão qual a probabilidade de sabêla 221 Sabese que um soro da verdade quando ministrado a um suspeito é 90 eficaz quando a pessoa é culpada e 99 eficaz quando é inocente Em outras palavras 10 dos culpados são julgados inocentes e 1 dos inocentes são julgados culpados Se o suspeito foi retirado de um grupo em que 95 jamais cometeram qualquer crime e o soro indica culpado qual a probabilidade de o suspeito ser inocente 222 Num certo estado onde os automóveis devem ser testados quanto à emissão de gases poluentes 25 de todos os automóveis emitem quantidades excessivas de gases poluentes Ao serem testados 99 de todos os automóveis que emitem quantidades excessivas de gases poluentes são reprovados mas 17 dos que não emitem quantidades excessivas de gases poluentes também são reprovados Qual é a probabilidade de um automóvel que é reprovado no teste efetivamente emitir uma quantidade excessiva de gases poluentes 89 223 Um jovem amigo meu foi diagnosticado como tendo um tipo de câncer extremamente raro em pessoas jovens Naturalmente ele ficou muito abalado Eu disse a ele que houve um erro com o seguinte raciocínio Nenhum teste médico é perfeito existe sempre incidência de falso positivo1 e falso negativo2 Denotemos por C o evento que ele tem câncer e por o evento que um indivíduo tenha resposta positiva ao teste Assuma que a proporção de pessoas com esse tipo de câncer nesta idade é de 1 em 1 milhão e o teste para detectar este câncer é extremamente bom dando somente 1 de falsos positivos e 1 de falsos negativos Encontre a probabilidade de que ele tenha mesmo câncer dado que seu teste deu resultado positivo para câncer AI3 Distribuições Discretas de Probabilidade 31 Considere que a probabilidade de ocorrer 𝑘 defeitos ortográficos em uma página de jornal é dada por 𝑝𝑘 1 𝑒 𝑘 𝑒 27183 Tomandose uma página qualquer calcule a probabilidade de a Não ocorrer erro b Ocorrer mais do que dois erros 32 Martins Uma variável aleatória tem função distribuição de probabilidade dada pela seguinte fórmula 𝑃𝑋 𝑥 𝑘 𝑥 para 𝑥 1 3 5 7 a Determine o valor de k b Calcule 𝑃2 𝑋 6 c Quanto vale 𝐹5 33 Martins Um vendedor calcula que cada contato resulta em venda com probabilidade de 20 Certo dia ele contata dois possíveis clientes Construa a tabela da distribuição de probabilidade para a variável Y número de clientes que assinam um contrato de venda 34 Martins Uma variável aleatória discreta pode assumir cinco valores conforme a distribuição de probabilidade 𝑥𝑖 1 2 3 5 8 𝑝𝑥𝑖 020 025 030 010 a Encontrar o valor de 𝑝3 b Qual é o valor da função acumulada para 𝑥 5 c Encontrar a média da distribuição d Calcular a variância e o desviopadrão 1 Falsos positivos são os testes com resultados positivos em pacientes sabidamente sadios 2 Falsos negativos são os testes com resultados negativos em pacientes sabidamente doentes 90 35 Martins A distribuição de probabilidade de uma variável aleatória discreta 𝑋 é dada pela fórmula 𝑝𝑥 0802𝑥1 𝑥 1 2 3 a Calcular 𝑝𝑥 para 𝑥 1 𝑥 2 𝑥 3 𝑥 4 e 𝑥 5 b Some as probabilidades obtidas no item a O que você diria a respeito das probabilidades para valores maiores que 5 36 Martins O número de chamadas telefônicas recebidas por uma central e suas respectivas probabilidades para um intervalo de um minuto são Número de chamadas 𝑥 0 1 2 3 4 5 Probabilidades 055 025 010 004 004 002 a Calcular 𝐹2 b Determinar 𝑃1 𝑋 4 e 𝑃𝑋 1 c Qual é o número esperado de chamadas em um minuto d Avalie o coeficiente de variação para essa distribuição 37 Martins Em uma sala temos cinco rapazes e quatro moças São escolhidas aleatoriamente três pessoas Seja 𝑋 o número de rapazes a Determinar a distribuição de probabilidade da variável 𝑋 b Calcular as seguintes probabilidades b1 𝑃𝑋 2 b2 𝑃𝑋 0 b3 𝑃1 𝑋 3 b4 𝑃2 𝑋 3 b5 𝑃𝑋 2 b6 𝑃𝑋 1 b7 𝑃𝑋 5 c Determinar c1 𝐹25 c2 𝐹3 c3 𝐹05 c4 𝐹35 c5 𝐹2 c6 𝐹1 c7 𝐹6 c8 𝐹05 38 Montgomery O espaço amostral de um experimento aleatório é a b c d e f e cada resultado é igualmente provável Uma variável aleatória 𝑋 é definida como segue resultado a b c d e f 𝑥 0 0 15 15 2 3 a Determine a função distribuição de probabilidade de 𝑋 b Determine a função de distribuição acumulada de 𝑋 c Determine a esperança e a variância de 𝑋 39 Montgomery O setor de comercialização estima que um novo instrumento para análise de amostras de solo terá grande sucesso moderado sucesso ou não terá sucesso com probabilidades de 03 06 e 01 respectivamente A receita anual associada com um produto de grande sucesso moderado sucesso ou nenhum sucesso é de R 10 milhões R 5 milhões e R 1 milhão respectivamente Seja a variável aleatória 𝑋 a renda anual do produto 91 a Determine a função distribuição de probabilidade de 𝑋 b Determine a função de distribuição acumulada de 𝑋 c Determine a esperança e a variância 𝑋 310 Montgomery Em um processo de fabricação de semicondutores três pastilhas de um lote são testadas Cada pastilha é classificada como passa ou falha Suponha que a probabilidade de uma pastinha passar no teste seja de 08 e que as pastilhas sejam independentes a Qual a probabilidade de que todas as três pastilhas passem no teste b Determine a função de probabilidade do número de pastilhas de um lote que passam no teste c Determine a função de distribuição acumulada do número de pastilhas de um lote que passam no teste 311 Montgomery Um arranjo consiste em três componentes mecânicos Suponha que as probabilidades do primeiro do segundo e do terceiro componentes encontrarem as especificações sejam iguais a 095 098 e 099 Considere que os componentes sejam independentes a Qual a probabilidade de que todos os componentes em um arranjo encontrem as especificações b Determine a função de probabilidade do número de componentes no arranjo que encontram as especificações 312 Montgomery Determine a constante c de modo que a seguinte função seja uma função de probabilidade 𝑓𝑥 𝑐𝑥 para 𝑥 1 2 3 4 313 O presidente da Martin Corporation está considerando duas alternativas de investimento X e Y Se cada uma das alternativas for levada adiante há quatro possibilidades de resultado O lucro líquido e sua respectiva probabilidade de ocorrência são mostrados abaixo INVESTIMENTO X INVESTIMENTO Y Resultado Lucro milhões Probabilidade Resultado Lucro milhões Probabilidade 1 20 02 1 12 01 2 08 03 2 09 03 3 10 04 3 16 01 4 03 01 4 11 05 a Qual é o valor esperado do lucro para os investimentos X e Y Qual das oportunidades é a mais interessante b Qual a variância do lucro para os investimentos X e Y Qual das oportunidades é a mais arriscada 314 Na venda de um produto têmse duas opções i Cobrar R 100000 por peça sem inspeção ii Classificar o lote em de 1a ou 2a qualidade mediante a seguinte inspeção retiramos cinco peças do lote e se não encontrarmos mais que uma defeituosa o lote será classificado de 1a qualidade sendo de 2a qualidade o lote que não satisfizer tal condição Sabese que o preço de venda é de R 120000 por peça do lote de 1a e R 80000 por peça do lote de 2a Se cerca de 10 das peças produzidas são defeituosas e que serão vendidos 50 lotes contendo 10 peças cada analisar qual das duas opções é mais vantajosa para o vendedor 92 315 A Indústria Controlada SA tem dois eventuais compradores de seu produto que pagam preços em função da qualidade i O comprador A paga R 15000 por peça se em uma amostra de 100 peças não encontrar nenhuma defeituosa e R 5000 por peça caso contrário ii O comprador B paga R 20000 por peça desde que encontre no máximo uma peça defeituosa em 120 peças e R 3000 por peça caso contrário Para qual dos dois compradores o empresário deveria vender se ele sabe que na produção 3 das peças são defeituosas 316 Martins De acordo com uma pesquisa do Data Journal 70 das pessoas que trabalham em escritórios utilizam PCs da IBM Se dois indivíduos que trabalham em escritórios são selecionados encontrar a distribuição de probabilidade da variável 𝑋 número de usuários dos PCs da IBM Calcular a média e o desviopadrão dessa variável 317 Martins Uma moeda é jogada 10 vezes Calcule as seguintes probabilidades a De ocorrer seis caras b De dar pelo menos duas caras c De não dar nenhuma coroa d De dar pelo menos uma coroa e De não dar cinco caras e cinco coroas 318 Martins Um time 𝑋 tem 2 3 de probabilidade de vitória sempre que joga Se 𝑋 jogar cinco partidas calcule a probabilidade de a 𝑋 vencer exatamente três partidas b 𝑋 vencer ao menos uma partida c 𝑋 vencer mais da metade das partidas 319 Martins A probabilidade de um atirador acertar o alvo é 1 3 Se ele atirar seis vezes qual a probabilidade de a Acertar exatamente dois tiros b Não acertar nenhum tiro 320 Martins Em um teste do tipo certoerrado com 100 perguntas qual a probabilidade de um aluno respondendo às questões ao acaso acertar 70 das perguntas 321 Martins Uma variável aleatória 𝑌 com distribuição Binomial tem a função acumulada dada por 𝐹0 1 243 𝐹1 11 243 𝐹2 51 243 𝐹3 131 243 𝐹4 211 243 𝐹5 1 Determinar a 𝑛 b 𝑝 e 1 𝑝 c Média de 𝑌 d Variância de 𝑌 e 𝑃𝑌 1 f 𝑃2 𝑌 4 93 322 Martins Se 5 das lâmpadas de certa marca são defeituosas encontre a probabilidade de que numa amostra de 100 lâmpadas escolhidas ao acaso tenhamos a Nenhuma defeituosa b Três defeituosas c Mais do que uma boa 323 Montgomery Determine a função de distribuição acumulada de uma variável aleatória Binomial com 𝑛 3 e 𝑝 1 4 324 Montgomery Seja 𝑋 o número de bits recebidos com erros em um canal digital de comunicação e considere que 𝑋 seja uma variável aleatória Binomial com 𝑝 0001 Se 1000 bits forem transmitidos determine o seguinte DICA use a aproximação pela distribuição de Poisson para calcular as probabilidades a 𝑃𝑋 1 b 𝑃𝑋 1 c 𝑃𝑋 2 d A média e a variância de 𝑋 325 Montgomery Bateladas que consistem em 50 molas provenientes de um processo de produção são verificadas com relação à conformidade aos requerimentos dos consumidores O número médio de molas não conformes em uma batelada é igual a 5 Suponha que o número de molas não conformes em uma batelada denotada como X seja uma variável aleatória Binomial a Quais são os valores de 𝑛 e 𝑝 b Qual é 𝑃𝑋 2 c Qual é 𝑃𝑋 49 326 Montgomery Porque nem todos os passageiros de aviões aparecem na hora do embarque uma companhia aérea vende 125 bilhetes para um voo que suporta somente 120 passageiros A probabilidade de que um passageiro não apareça é 010 e os passageiros se comportam independentemente a Qual a probabilidade de que cada passageiro que apareça possa embarcar b Qual é a probabilidade de que o voo decole com assentos vazios 327 Montgomery Um teste de múltipla escolha contém 25 questões cada uma com quatro respostas Suponha que um estudante apenas tente adivinhar chutar cada questão a Qual é a probabilidade de que o estudante responda mais de 20 questões corretamente b Qual é a probabilidade de que o estudante responda menos de 5 questões corretamente 328 Martins O pessoal de inspeção de qualidade afirma que os rolos de fita isolante apresentam em média uma emenda a cada 50 metros Admitindo que a distribuição do número de emendas é dada pela Poisson calcule a probabilidade a De nenhuma emenda em um rolo de 125 metros b De ocorrerem no máximo duas emendas em um rolo de 125 metros c De ocorrer pelo menos uma emenda em um rolo de 100 metros 329 Martins Admitindo que 𝑋 tem distribuição de probabilidade de Poisson encontrar as probabilidades a 𝑃𝑋 5 quando 𝜆 30 b 𝑃𝑋 2 quando 𝜆 55 c 𝑃𝑋 4 quando 𝜆 75 d 𝑃𝑋 8 quando 𝜆 40 94 330 Martins Suponha que 𝑋 tenha distribuição Binomial com 𝑛 100 e 𝑝 002 Usar a aproximação de Poisson para encontrar a 𝑃𝑋 3 b 𝑃𝑋 5 c 𝑃𝑋 0 d 𝑃𝑋 2 331 Martins Uma fábrica de pneus verificou que ao testar seus pneus nas pistas havia em média um estouro de pneu a cada 5000 km a Qual a probabilidade de que num teste de 3000 km haja no máximo um pneu estourado b Qual a probabilidade de que um carro ande 8000 km sem estourar nenhum pneu 332 Martins Certo posto de bombeiros recebe em média três chamadas por dia Calcular a probabilidade de a Receber quatro chamadas num dia b Receber três ou mais chamadas num dia 333 Martins Na pintura de paredes aparecem defeitos em média na proporção de um defeito por metro quadrado Qual a probabilidade de aparecerem três defeitos numa parede de 2 x 2 m 334 Martins Suponha que haja em média dois suicídios por ano numa população de 50000 habitantes Em cada cidade de 100000 habitantes encontre a probabilidade de que em dado ano tenha havido a Nenhum suicídio b Um suicídio c Dois suicídios d Dois ou mais suicídios 335 Martins Suponha 400 erros de impressão distribuídos aleatoriamente em um livro de 500 páginas Encontre a probabilidade de que dada página contenha a Nenhum erro b Exatamente dois erros 336 Martins Certa loja recebe em média cinco clientes por hora Qual a probabilidade de a Receber dois clientes em 24 minutos b Receber pelo menos três clientes em 18 minutos 337 Martins A média de chamadas telefônicas em uma hora é três Qual a probabilidade de a Receber três chamadas em 20 minutos b Receber no máximo duas chamadas em 30 minutos 338 Martins Um contador Geiser marca em média 40 sinais por minuto quando nas proximidades de certa substância radioativa Determinar a probabilidade de que haja dois sinais em um período de seis segundos 339 Martins Em uma estrada passam em média 17 carro por minuto Qual a probabilidade de passarem exatamente dois carros em dois minutos 95 340 Martins Um distribuidor de gasolina tem capacidade de receber nas condições atuais no máximo três caminhões por dia Se chegarem mais de três caminhões o excesso deve ser enviado a outro distribuidor Sabendo que em média chegam diariamente dois caminhões qual a probabilidade de em certo dia ter que enviar caminhões para outro distribuidor 341 Martins Uma fábrica produz tecidos com 22 defeitos em média por peça Determinar a probabilidade de haver ao menos dois defeitos em duas peças 342 Montgomery Um técnico de instalação de um sistema especializado de comunicação é enviado para uma cidade somente quando existirem três ou mais ordens de serviço Suponha que as ordens de serviço sigam uma distribuição de Poisson com uma média de 025 por semana para uma cidade com uma população de 100000 habitantes e suponha que sua cidade contenha 800000 habitantes a Qual é a probabilidade de que um técnico seja requisitado depois de um período de uma semana b Se você for o primeiro da cidade a pedir uma ordem de serviço qual será a probabilidade de que você tenha que esperar mais de duas semanas a partir do tempo do pedido da ordem de serviço até que o técnico seja despachado 343 Montgomery Em uma seção de uma autoestrada o número de buracos grandes o bastante para que requeiram reparo é suposto seguir uma distribuição de Poisson com uma média de dois buracos por milha a Qual é a probabilidade de que não haja buracos que requeiram reparo em 5 milhas da autoestrada b Qual é a probabilidade de que no mínimo um buraco requeira reparo em 05 milha da autoestrada c Se o número de buracos estiver relacionado à carga do veículo na autoestrada e algumas seções dessa autoestrada estiverem sujeitas a uma carga leve de veículos como você se sente a respeito da suposição de distribuição de Poisson para o número de buracos que requerem reparo 344 Montgomery O número de insucessos de um instrumento de teste para partículas de contaminação no produto é uma variável aleatória de Poisson com uma média de 002 insucesso por hora a Qual é a probabilidade de que o instrumento não falhe em um turno de 8 horas b Qual é a probabilidade de no mínimo um insucesso em um dia 24 horas 345 Montgomery O número de erros em um livrotexto segue uma distribuição de Poisson com média de 001 erro por página Qual é a probabilidade de que haja três ou menos erros em 100 páginas 346 Um jogo de loteria consiste em selecionar seis dezenas de um conjunto de 60 dezenas com uma bola para cada dezena sem reposição Num volante cartão aposta o jogador pode escolher de 6 a 12 dezenas Qual é a probabilidade de um jogador acertar a quina 5 dezenas se marcar 10 dezenas no volante 347 Barros O dono de uma festa encomendou a um buffet 100 empadinhas de frango e 50 de camarão Um convidado guloso sequestra a bandeja do garçom que contém 20 empadinhas O convidado é além de guloso alérgico a camarão e se comer mais de duas empadas de camarão corre o risco de passar o resto da festa no hospital Qual a probabilidade disso acontecer 348 A Panini colocou em seus pacotes de figurinhas do álbum do Campeonato Brasileiro deste ano figurinhas premiadas que valem 30 pacotes extras de figurinhas Dentro de cada pacote tem cinco figurinhas comuns ou quatro comuns e uma premiada Suponha que seu amigo esteja com 20 pacotinhos e que em dois deles haja figurinhas premiadas Ele resolve te dar 6 pacotinhos a Qual é a probabilidade de que nenhum dos seis tenha a figurinha premiada b Qual é a probabilidade de você ganhar os dois pacotinhos com figurinha premiada 96 c Quantos pacotinhos ele deveria te dar para que você pudesse esperar 1 com figurinha premida 349 Morettin Uma fábrica de motores para máquinas de lavar roupas separa de sua linha de produção diária de 350 peças uma amostra de 30 itens para inspeção O número de peças defeituosas é de 14 por dia Qual a probabilidade de que a amostra contenha pelo menos 3 motores defeituosos 350 Morettin Numa cidade é selecionada uma amostra de 60 adultos e a esses indivíduos é pedido para opinarem se são a favor ou contra determinado projeto Com resultado obtido observouse 40 a favor Se na realidade as opiniões pró e contra são igualmente divididas qual é a probabilidade de ter obtido tal resultado 351 Morettin Um órgão governamental credencia a firma A para fazer vistorias em carros recuperados ou construídos particularmente e dar a aprovação ou não para que determinado carro possa ser lacrado no Detran Resolve testar se a firma A está trabalhando de acordo com suas especificações De um lote de 250 carros vistoriados e aprovados por A escolhe 50 e faz novas vistorias Se encontrar no mínimo 2 que não mereçam a aprovação descredencia A Sabendose que no lote de 250 há 8 carros que foram aprovados irregularmente qual a probabilidade do descredenciamento AI4 Distribuições Contínuas de Probabilidade 41 Suponha que o nível salarial em certo setor na economia em um tem a seguinte fdp 𝑓𝑥 𝑘 𝑥3 𝑥 8 0 𝑐 𝑐 a Determine o valor de 𝑘 b Qual a probabilidade de um salário nesse setor ser superior a 10 um c Qual o salário médio nesse setor da economia 42 Uma variável aleatória contínua tem fdp dada por 𝑓𝑥 𝑥 4 1 𝑥 3 0 𝑐 𝑐 a Faça um gráfico da função acima e verifique que ela satisfaz as condições para ser densidade b Calcule b1 𝑃𝑋 2 b2 𝑃𝑋 2 b3 𝑃𝑋 2 b4 𝑃 0 𝑋 3 2 b5 𝑃 𝑋 3 2 b6 𝑃 𝑋 3 2 97 43 O tempo de corrosão em anos de uma certa peça metálica é uma variável com densidade 𝑓𝑥 𝑎𝑥 0 𝑥 1 𝑎 1 𝑥 2 𝑎𝑥 3𝑎 2 𝑥 3 0 𝑐 𝑐 a Calcule a constante 𝑎 b Uma peça é considerada como tendo boa resistência à corrosão se dura mais que 15 anos Em um lote de 3 peças qual a probabilidade de termos exatamente 1 delas com boa resistência 44 Uma variável aleatória contínua X é definida pela seguinte função densidade 𝑓𝑥 3 2 𝑥 12 0 𝑥 2 0 𝑐 𝑐 Determinar 𝐸𝑋 e 𝑉𝑎𝑟𝑋 45 Indique quais das seguintes funções reais podem ser funções de densidades de variáveis aleatórias contínuas a 𝑓𝑥 2𝑥 3 1 𝑥 2 0 𝑐 𝑐 b 𝑓𝑥 𝑒𝑥 𝑥 0 0 𝑥 0 c 𝑓𝑥 𝑥2 2 𝑥 3 0 𝑐 𝑐 46 A função fx é uma função real definida por fx 4k2 5 2k x 1 k x k 0 c c a Para que valor de 𝑘 a 𝑓𝑥 pode representar uma função densidade de probabilidade da variável aleatória 𝑋 b Para o valor de 𝑘 encontrado determine as probabilidades 𝑃𝑋 1 𝑃𝑋 0 𝑃𝑋 0 𝑃0 𝑋 1 𝑃0 𝑋 3 𝑃𝑋 1 𝑃3 𝑋 4 c Calcule a média e a variância da va 𝑋 d Determine a função de distribuição acumulada da va 𝑋 47 Depois de terem sido pesadas várias embalagens de 1 kg de café da marca Apetitoso chegouse à conclusão de que embora a embalagem indique 1 kg o verdadeiro peso é uma variável aleatória uniformemente distribuída no intervalo 085 kg 105 kg isto é a fdp tem a seguinte forma 𝑓𝑥 𝑘 085 𝑥 105 0 𝑐 𝑐 a Calcule 𝑘 e represente graficamente 𝑓𝑥 b Determine a média e a variância do peso das embalagens c Qual a probabilidade de uma embalagem de café da marca Apetitoso pesar menos de 1 kg d Em 200 embalagens quantas você esperaria que tivessem o peso superior ao indicado no rótulo 98 48 Anderson A maioria das linguagens de computador contém uma função que pode ser usada para gerar números aleatórios No Excel a função ALEATÓRIO pode ser usada para gerar números aleatórios entre 0 e 1 Se admitirmos que 𝑥 denota um número aleatório gerado pela função ALEATÓRIO então 𝑥 é uma variável aleatória contínua com a seguinte função densidade de probabilidade 𝑓𝑥 1 0 𝑥 1 0 𝑐 𝑐 a Trace o gráfico da função densidade de probabilidade b Qual é a probabilidade de se gerar um número aleatório entre 025 e 075 c Qual é a probabilidade de se gerar um número aleatório com valor menor ou igual a 030 d Qual é a probabilidade de se gerar um número aleatório com valor maior que 060 49 Anderson O rótulo de uma garrafa de detergente líquido indica que o conteúdo é de 12 onças por garrafa 1 onça 29574 ml A operação de produção preenche a garrafa uniformemente de acordo com a seguinte função densidade de probabilidade 𝑓𝑥 8 11975 𝑥 12100 0 𝑐 𝑐 a Qual é a probabilidade de uma garrafa ser preenchida com volume entre 12 e 1205 onças b Qual é a probabilidade de uma garrafa ser preenchida com 1202 onças ou mais c O controle da qualidade aceita uma margem de erro de 002 onças no preenchimento de uma garrafa em relação ao volume indicado no seu rótulo Qual é a probabilidade de a garrafa desse detergente líquido deixar de cumprir o padrão estabelecido pelo controle de qualidade 410 Montgomery Em uma grande rede corporativa de computadores as conexões de usuários ao sistema podem ser modeladas como um processo de Poisson com uma média de 25 conexões por hora a Qual é a probabilidade de não haver conexões em um intervalo de 6 minutos b Qual é a probabilidade de que o tempo até a próxima conexão esteja entre 2 e 3 minutos c Determine o intervalo de tempo tal que a probabilidade de nenhuma conexão ocorrer no intervalo seja 090 411 Montgomery O tempo entre as chamadas para uma loja de suprimentos de encanamentos é distribuído exponencialmente com um tempo médio de 15 minutos entre as chamadas a Qual é a probabilidade de não haver chamadas dentro do intervalo de 30 minutos b Qual é a probabilidade de que no mínimo uma chamada chegue dentro do intervalo de 10 minutos c Qual é a probabilidade de que a primeira chamada chegue dentro de 5 e 10 minutos depois da loja aberta d Determine o comprimento de um intervalo de tempo tal que exista uma probabilidade igual a 090 de haver no mínimo uma chamada no intervalo 412 Montgomery O tempo entre as chegadas de táxis a uma interseção movimentada é distribuído exponencialmente com uma média de 10 minutos a Qual é a probabilidade de você esperar mais de uma hora por um táxi b Suponha que você já estivesse esperando uma hora por um táxi qual será a probabilidade de que um táxi chegue dentro dos próximos 10 minutos c Determine x tal que a probabilidade de você esperar mais de x minutos seja 010 d Determine x tal que a probabilidade de você esperar menos de x minutos seja 090 e Determine x tal que a probabilidade de você esperar menos de x minutos seja 050 413 Montgomery O tempo de vida de um arranjo mecânico em um teste vibracional é distribuído exponencialmente com uma média de 400 horas a Qual é a probabilidade de que um arranjo em teste falhe em menos de 100 horas 99 b Qual é a probabilidade de que um arranjo opere por mais de 500 horas antes da falha c Se um arranjo estiver em teste por 400 horas sem apresentar falha qual será a probabilidade de uma falha ocorrer nas próximas 100 horas d Se 10 arranjos estão sendo testados qual é a probabilidade de que no mínimo um falhe em menos de 100 horas Considere que os arranjos falhem independentemente e Se 10 arranjos estão sendo testados qual é a probabilidade de que todos tenham falhado em 800 horas Considere que os arranjos falhem independentemente 41 Mensa é a sociedade internacional de indivíduos de alto QI Para fazer parte da Mensa uma pessoa precisa ter um QI de 132 ou mais Se as contagens de QI são distribuídas normalmente com uma média de 100 e um desviopadrão de 15 que porcentagem da população se qualifica para membro da Mensa 42 Para uma va X com distribuição aproximadamente Normal com média e desviopadrão calcule 𝑃𝜇 𝜎 𝑋 𝜇 𝜎 𝑃𝜇 2𝜎 𝑋 𝜇 2𝜎 e 𝑃𝜇 3𝜎 𝑋 𝜇 3𝜎 43 Suponha que o diâmetro de uma peça siga uma distribuição Normal com média 204 mm e variância de 06084 mm2 a Determine a probabilidade de uma peça apresentar diâmetro i menor que 281 mm ii maior que 18 mm iii entre 101 e 250 mm b Se considerarmos 200 dessas peças quantas podemos esperar que tenham o diâmetro entre 220 e 380 mm c Qual intervalo simétrico em torno da média que abrange 98 dos diâmetros das peças 44 A vida média de certo aparelho é de oito anos com desviopadrão de 18 anos O fabricante substitui os aparelhos que acusam defeito dentro do prazo de garantia Se ele deseja substituir no máximo 5 dos aparelhos que apresentem defeito qual deve ser o prazo de garantia 45 Uma máquina de encher copos de refrigerantes o faz segundo uma distribuição Normal com média igual a 225 ml e desviopadrão de 10 ml a Calcule a probabilidade de um copo apresentar volume líquido i inferior a 250 ml ii superior a 200 ml iii entre 210 e 240 ml b Se você está enchendo um copo com capacidade de 300 ml qual a probabilidade do refrigerante transbordar durante o enchimento 46 Um determinado tipo de lâmpada apresenta vida média de 1440 horas com desviopadrão igual a 72 horas Considerando que o tempo deste tipo de lâmpada siga uma distribuição aproximadamente Normal qual a probabilidade de uma lâmpada durar a Mais de 1650 horas b Menos de 1300 horas c Entre 55 e 65 dias d Determine um intervalo simétrico em torno da média que contenha o tempo de vida de 95 destas lâmpadas 47 A precipitação pluviométrica média em certa cidade no mês de dezembro é de 89 cm Admitindo a distribuição normal com desviopadrão de 25 cm determinar a probabilidade de que no mês de dezembro próximo a precipitação seja c Inferior a 16 cm 100 d Superior a 5 cm mas não superior a 75 cm e Superior a 12 cm f Encontre um intervalo simétrico em torno da média que contenha 99 dos valores de precipitação pluviométrica 48 Martins O salário semanal dos operários industriais é distribuído normalmente em torno de uma média de R 180 com desviopadrão de R 25 Pedese d Encontrar a probabilidade de um operário ter salário semanal situado entre R 150 e R 178 e Dentro de que desvio de ambos os lados da média cairão 96 dos salários 49 Martins Em uma grande empresa a avaliação do desempenho profissional nos funcionários acusou média 70 e desviopadrão 10 Se desejamos atribuir aos 15 superiores o grau A aos 20 seguintes o grau B aos 30 médios o grau C aos próximos 25 o grau D e aos últimos 10 o grau E quais os intervalos de notas que serão abrangidos por essas classificações 410 Martins O tempo necessário em uma oficina para o conserto da transmissão de um tipo de carro segue uma distribuição normal com média 45 minutos e desviopadrão de 8 minutos a O mecânico comunicou a um cliente que o carro estará pronto em até 50 minutos Qual a probabilidade de que o mecânico esteja enganado b Qual deve ser a previsão de tempo de trabalho para que haja 90 de probabilidade de que o conserto da transmissão seja efetuado dentro do tempo previsto 411 Martins Suponha que as notas de uma prova sejam normalmente distribuídas com média 73 e desvio padrão 15 Quinze por cento dos alunos mais adiantados recebem a nota A e 12 dos mais atrasados recebem nota F Encontrar o mínimo para receber A e o mínimo para não receber F 412 Martins Constatouse que o tempo médio para se fazer um testepadrão de matemática é aproximadamente normal com média de 80 minutos e desviopadrão de 20 minutos a Que porcentagem de candidatos levará menos de 80 minutos b Que porcentagem não terminará o teste se o tempo máximo concedido é de duas horas c Se 200 pessoas fazem o teste quantas podemos esperar que o terminem na primeira hora 413 Martins Uma pessoa tem 20 minutos para chegar ao escritório Para tal pode optar entre dois caminhos A ou B Sabendo que o tempo para percorrer o caminho A é N1815 e que o tempo para percorrer o caminho B é N202 qual a melhor escolha do trajeto 414 Um processo industrial produz peças com diâmetro de 200 e desviopadrão de 001 As peças com diâmetro que se afaste da média por mais de 003 são consideradas defeituosas Considerando que o diâmetro das peças tenha uma distribuição aproximadamente Normal responda d Qual a porcentagem de peças defeituosas e Qual a probabilidade de se encontrar duas peças defeituosas em sequência f Qual a probabilidade de se encontrar duas peças perfeitas em sequência 101 AI5 Intervalos de Confiança e Testes de Hipóteses 51 Adaptado de Montgomery A resistência à quebra de um fio usado na fabricação de material moldável necessita ser no mínimo 100 psi Experiência passada indicou que o desviopadrão da resistência à quebra foi 2 psi Uma amostra aleatória de nove espécimes é testada e a resistência média à quebra é de 98 psi a A fibra deve ser julgada como aceitável com 005 b Encontre um intervalo bilateral de confiança com 95 para a resistência média verdadeira à quebra 52 Barbetta Em uma amostra aleatória simples com 200 edifícios com cinco anos em certa cidade 55 apresentaram problemas estéticos relevantes após a entrega da obra Construir um intervalo de confiança para a proporção de edifícios da cidade que apresentam problemas estéticos relevantes nos cinco primeiros anos Use nível de confiança de 95 53 Barbetta Uma empresa fabricante de pastilhas para freios efetua um teste para controle de qualidade de seus produtos Selecionouse uma amostra de 600 pastilhas das quais 18 apresentaram níveis de desgaste acima do tolerado Construir um intervalo de confiança para a proporção de pastilhas com desgaste acima do tolerado com nível de confiança de 95 Interpretar o resultado 54 Adaptado de Barbetta Uma fundição produz blocos para motor de caminhões Os blocos têm furos e desejase verificar qual é o diâmetro médio no processo do furo A empresa retirou uma amostra de 36 blocos e mediu os diâmetros de 36 furos 1 a cada bloco A amostra acusou média de 980 mm e desvio padrão de 40 mm a Construir um intervalo de confiança para a média do processo com nível de confiança de 99 Interpretar o resultado b Se o processo deveria ter média de 100 mm há evidência com 99 de confiança de que a média do processo não está no valor ideal Explique 55 Barbetta Um pesquisador precisa determinar o tempo médio gasto para perfurar três orifícios em uma peça de metal Qual deve ser o tamanho da amostra para que a média amostral esteja a menos de 15 s da média populacional Por experiência prévia podese supor o desviopadrão em torno de 40 s Considere também que a estimação será realizada com nível de confiança de 95 56 Adaptado de Montgomery O diâmetro dos orifícios para arreios de cabo tem um desviopadrão de 001 in Uma amostra aleatória de tamanho 10 resulta em um diâmetro médio de 15045 in a Teste a hipótese de que o diâmetro médio verdadeiro do orifício seja igual a 150 in Use 001 b Qual seria o tamanho necessário da amostra para detectar o diâmetro médio verdadeiro do orifício com um erro menor que 0005 in com uma confiança de 90 57 Adaptado de Montgomery Um fabricante produz anéis para pistões de um motor de automóveis É sabido que o diâmetro do anel é distribuído de forma aproximadamente normal e tem um desviopadrão de 0001 mm Uma amostra aleatória de 15 anéis tem um diâmetro médio de 74036 mm a Teste a hipótese de que o diâmetro médio do anel do pistão seja 74035 mm b Teste a hipótese de que o diâmetro médio do anel do pistão seja maior que 74035 mm 58 Adaptado de Montgomery De 1000 casos selecionados aleatoriamente de câncer de pulmão 823 resultaram em morte a Construa um intervalo bilateral de confiança de 95 para a taxa de morte de câncer de pulmão b Quão grande seria a amostra requerida de modo a se estar pelo menos 95 confiante de que o erro na estimação da taxa de morte de câncer de pulmão seja menor do que 3 102 59 Adaptado de Montgomery Sabese que a vida em horas de um bulbo de uma lâmpada de 75 W é distribuída de forma aproximadamente normal com desviopadrão 25 horas Uma amostra de 20 bulbos apresentou uma vida média de 1014 horas a Há alguma evidência que suporte a alegação de que a vida do bulbo excede 1000 horas Use 005 b Construa um intervalo de 95 de confiança bilateral para a vida média c Suponha que quiséssemos estar 95 confiantes de que o erro na estimação da vida média fosse menor do que 5 horas Qual tamanho da amostra deveria ser usado 510 Adaptado de Montgomery Um engenheiro de desenvolvimento de um fabricante de pneu está investigando a vida do pneu em relação a um novo componente da borracha Ele fabricou 16 pneus e testouos até o final da vida em um teste na estrada A média e o desviopadrão da amostra são 601397 e 364594 km respectivamente a Encontre um intervalo bilateral de 95 de confiança para a vida média do pneu b O engenheiro gostaria de demonstrar que a vida média desse novo pneu excede 60000 km Formule e teste as hipóteses apropriadas e retire conclusões usando 010 c Suponha que o engenheiro gostaria de detectar um erro de 1000 km para a vida média com uma confiança de 90 O tamanho da amostra usado foi adequado Use s como estimativa de para obter sua decisão 511 Adaptado de Montgomery Uma máquina produz bastões metálicos usados em um sistema de suspensão de automóveis Uma amostra aleatória de 15 bastões é selecionada sendo o diâmetro medido Os dados resultantes em mm são mostrados a seguir 824 821 823 825 826 823 820 826 819 823 820 828 824 825 824 a Existe alguma evidência forte para indicar que o diâmetro médio dos bastões exceda 820 mm usando 005 b Encontre um intervalo bilateral de 95 de confiança para o diâmetro médio dos bastões 512 Adaptado de Montgomery A espessura da parede de 25 garrafas de 2 litros foi medida por um engenheiro do controle da qualidade A média da amostra foi 405 mm e o desviopadrão da amostra foi 008 mm a Suponha ser importante demonstrar que a espessura da parede excede 400 mm Formule e teste uma hipótese apropriada usando esses dados Obtenha conclusões para 001 b Encontre um intervalo de 99 de confiança para a espessura média Interprete o intervalo que você obteve 513 Montgomery Um fabricante de calculadoras eletrônicas está interessado em estimar a fração de unidades defeituosas produzidas Uma amostra aleatória de 800 calculadoras contém 10 defeitos Calcule um intervalo de confiança de 99 para a fração defeituosa 514 Adaptado de Montgomery Um artigo em Fortune 21 de setembro de 1992 afirma que aproximadamente metade de todos os engenheiros continuam seus estudos acadêmicos além do grau de bacharelado recebendo no final o grau de mestre ou doutor Dados de um artigo em Engineering Horizons primavera de 1990 indicou que 117 de 484 novos engenheiros graduados estavam planejando fazer uma pósgraduação Os dados da Engineering Horizons são consistentes com a afirmação reportada pela Fortune Use 005 para encontrar as suas conclusões 103 515 A garantia para baterias de fones móveis é estabelecida em 200 horas operacionais seguindo os procedimentos apropriados de recarga Um estudo com 5000 baterias foi executado e 15 pararam de operar antes das 200 horas Esses experimentos confirmam a afirmação de que mais de 02 das baterias da companhia falhará durante o período de garantia usando os procedimentos apropriados de recarga Use o procedimento de teste de hipóteses com 001 516 Barbetta Uma empresa tem 2400 empregados Desejase extrair uma amostra de empregados para verificar o grau de satisfação em relação à qualidade da comida no refeitório Em uma amostra piloto numa escala de 0 a 10 o grau de satisfação recebeu nota média 65 e desviopadrão 20 pontos a Determine o tamanho mínimo da amostra supondo amostragem aleatória simples com erro máximo de 05 ponto e nível de confiança de 99 b Considere que a amostra planejada no item anterior tenha sido realizada e obtevese média 53 e desviopadrão 18 ponto Construa um intervalo de 99 de confiança para o parâmetro de interesse c Considerando o resultado do item anterior você diria com nível de confiança de 99 que a nota média seria superior a cinco se a pesquisa fosse aplicada a todos os 2400 funcionários Justifique d Realizada a amostra planejada no item a suponha que 70 atribuíram notas iguais ou superiores a cinco Apresente um intervalo de 90 de confiança para a porcentagem de indivíduos da população que atribuiriam notas iguais ou superiores a cinco 517 Barbetta Um fabricante garante que 90 de seus itens estão dentro das especificações Um comprador examinou uma amostra aleatória de 50 itens e verificou que apenas 84 estavam dentro das especificações Há evidência de que o nível de qualidade é menor do que o alegado pelo fabricante Use 2 AI6 Correlação e Regressão Linear 61 Os pesos em kg de oito veículos e a variabilidade de suas distâncias de frenagem em metros em uma superfície seca estão dispostos na tabela a seguir Peso 1837 1937 2268 2273 2495 2495 2595 2781 Variabilidade na distância de frenagem 0457 0485 0588 0491 0506 0518 0543 0582 a Escolha adequadamente X e Y b Você espera uma relação linear direta ou inversa entre as variáveis X e Y Explique c Construa o diagrama de dispersão entre X e Y d Calcule o coeficiente de correlação linear de Pearson Interprete o valor obtido e Obtenha a equação de regressão que melhor descreve a associação entre X e Y Interprete os valores de b0 e b1 f Faça uma previsão da variabilidade da distância de frenagem em superfícies secas para um veículo com 900 kg e para um veículo com 3 ton g Calcule e interprete o coeficiente de determinação R2 para a equação de regressão estimada no item f Considere agora as variabilidades nas distâncias de frenagem em metros dos mesmos veículos mas agora em uma superfície molhada 104 Peso 1837 1937 2268 2273 2495 2495 2595 2781 Variabilidade na distância de frenagem 0741 0841 0878 0991 1042 107 1152 1411 h Escolha adequadamente X e Y i Você espera uma relação linear direta ou inversa entre as variáveis X e Y Explique j Construa o diagrama de dispersão entre X e Y k Calcule o coeficiente de correlação linear de Pearson Interprete o valor obtido l Obtenha a equação de regressão que melhor descreve a associação entre X e Y Interprete os valores de b0 e b1 m Faça uma previsão da variabilidade da distância de frenagem em superfícies molhadas para um veículo com 900 kg e para um veículo com 3 ton n Calcule e interprete o coeficiente de determinação R2 para a equação de regressão estimada no item n o Existe diferença entre a variabilidade da frenagem em superfícies secas e molhadas O que você recomendaria aos motoristas 62 Os dados a seguir referemse ao número de CDs vendidos por uma determinada gravadora em milhares de unidades em 10 semanas consecutivas após o lançamento do mesmo Semana 1 2 3 4 5 6 7 8 9 10 CDs x 1000 50 67 60 87 62 86 110 119 106 108 a Escolha adequadamente X e Y b Você espera uma relação linear direta ou inversa entre as variáveis X e Y Explique c Construa o diagrama de dispersão entre X e Y d Calcule o coeficiente de correlação linear de Pearson Interprete o valor obtido e Obtenha a equação de regressão que melhor descreve a associação entre X e Y Interprete os valores de b0 e b1 f Faça uma previsão da quantidade de CDs que serão vendidos na 20ª semana g Calcule e interprete o coeficiente de determinação R2 para a equação de regressão estimada no item f 63 As exportações de castanha in natura em toneladas processadas pela empresa Yasmin Ltda no período que se estende de 1983 a 1989 encontramse na tabela a seguir Ano 1983 1984 1985 1986 1987 1988 1989 Quantidade 50 46 36 31 25 11 18 a Escolha adequadamente X e Y b Construa o diagrama de dispersão entre X e Y c Calcule o coeficiente de correlação linear de Pearson Interprete o valor obtido d Obtenha a equação de regressão que melhor descreve a associação entre X e Y Interprete os valores de b0 e b1 e Encontre a quantidade de exportações estimada para o ano de 1990 64 Numa pesquisa feita com 10 famílias com renda bruta mensal entre 10 e 60 salários mínimos mediram se as seguintes variáveis Renda renda bruta mensal em salários mínimos Renda porcentagem da renda bruta anual gasta com assistência médica Renda 12 16 18 20 28 30 40 48 50 54 Renda 72 74 70 65 66 67 60 56 60 55 105 a Escolha adequadamente X e Y b Construa o diagrama de dispersão entre X e Y c Calcule o coeficiente de correlação linear de Pearson Interprete o valor obtido d Obtenha a equação de regressão que melhor descreve a associação entre X e Y Interprete os valores de b0 e b1 e Faça uma previsão da porcentagem da renda bruta anual gasta com assistência médica para uma família com renda bruta mensal de 10 salários mínimos f Calcule e interprete o coeficiente de determinação R2 para a equação de regressão estimada no item d 65 Os dados adiante fornecem para 11 países o consumo de cigarros per capta em 1930 e as mortes por 1000000 de habitantes em 1950 causadas por câncer no pulmão País Consumo de cigarros Mortes por 1000000 de hab Islândia 240 63 Noruega 255 100 Suécia 340 140 Dinamarca 375 175 Canadá 510 160 Austrália 490 180 Holanda 490 250 Suíça 180 180 Finlândia 1125 360 GrãBretanha 1150 470 EUA 1275 200 a Escolha adequadamente X e Y b Construa o diagrama de dispersão entre X e Y c Calcule o coeficiente de correlação linear de Pearson Interprete o valor obtido d Obtenha a equação de regressão que melhor descreve a associação entre X e Y Interprete os valores de b0 e b1 e Se no ano de 1930 o consumo de cigarros per capta no Brasil foi 630 estime o número de mortes causadas por câncer de pulmão no ano de 1950 f Calcule e interprete o coeficiente de determinação R2 para a equação de regressão estimada no item d 106 ANEXO II RESPOSTAS DOS EXERCÍCIOS AII1 Análise Descritiva de Dados 11 a As empresas que possuem executivos CEOS b n 10 c Quatro variáveis Remuneração dos CEOS quantitativa contínua Setor qualitativa nominal Vendas quantitativa contínua Remuneração dos CEOS vs Retorno dos Acionistas qualitativa ordinal d 20 e 30 f Média aritmética 2791400 Mediana 21420 Moda 1490 g Amplitude 8229 Variância 5446959156 Desviopadrão 2333872 CV 836 12 a O preço da diária para apartamento de casal quantitativa contínua b 1 1 9 8 2 0000001 14 2 222233 13 2 4444444455555 5 2 5 2 88 3 3 0 2 3 2 3 5 1 3 1 3 8 Chave 19 19 c Preço da diária n n acum acum 19 22 8 25000 8 25000 22 25 14 43750 22 68750 25 28 5 15625 27 84375 28 31 3 9375 30 93750 31 34 0 0000 30 93750 34 37 1 3125 31 96875 37 40 1 3125 32 100000 Total 32 100000 d e 𝑄1 215 𝑄2 240 𝑄3 250 𝐴𝐼𝑄 15 107 f g Média 240625 Moda 240 Variância 17351 CV 17311 Mediana 240 Amplitude 19 Desviopadrão 4165 h Sim O CV é menor que 40 13 a Classes n n acum acum 12 14 1 2500 1 2500 14 16 2 5000 3 7500 16 18 7 17500 10 25000 18 20 7 17500 17 42500 20 22 7 17500 24 60000 22 24 7 17500 31 77500 24 26 8 20000 39 97500 26 28 1 2500 40 100000 Total 40 100000 b 0 5 10 15 20 25 1 2 3 4 5 6 7 8 9 10 Freqüência relativa Classes 12 14 16 18 20 22 24 26 28 c Média 20150 Mediana 200 Moda 16 Amplitude 140 Variância 12285 Desviopadrão 3505 CV 17395 Q1 175 Q2 200 Q3 230 14 a Os salários anuais para os gerentes assistentes de lojas de departamentos Quantitativa contínua b 1 3 1 4 3 579 14 4 0011223444 12 4 555556677889 14 5 00001122234 3 5 567 Chave 31 31 40 35 30 25 20 D iá ria para apartamento de casal 108 c Salários n n acum acum 31 35 1 2500 1 2500 35 39 2 5000 3 7500 39 43 7 17500 10 25000 43 47 11 27500 21 52500 47 51 9 22500 30 75000 51 55 7 17500 37 92500 55 59 3 7500 40 100000 Total 40 100000 d 0 2 4 6 8 10 12 1 2 3 4 5 6 7 8 9 Freqüência absoluta Salários em mil reais 31 35 39 43 47 51 55 59 15 a N de funcionários n n acumulada acumulada 0 a 5 23908 69126 23908 69126 6 a 19 8192 23686 32100 92812 20 a 49 1693 4895 33793 97707 50 a 99 447 1292 34240 98999 Mais de 99 346 1000 34586 100000 Total 34586 100000 b i 8192 23686 ii 97707 iii 2486 7188 16 a Temperatura C n n acum acum 729 737 7 17500 7 17500 737 745 7 17500 14 35000 745 753 15 37500 29 72500 753 761 5 12500 34 85000 761 769 2 5000 36 90000 769 777 4 10000 40 100000 Total 40 100000 b c 𝑄1 7425 𝑄2 747 𝑄3 757 777 769 761 753 745 737 729 36 32 28 24 20 16 12 8 4 0 Temperatura ºC Frequência relativa 109 d 17 a 𝑋1 Quantitativa contínua 𝑋2 Quantitativa contínua 𝑋3 Quantitativa contínua b c 78 77 76 75 74 73 Temperatura ºC 137 124 111 98 85 72 59 14 12 10 8 6 4 2 0 Retração Linear Frequência absoluta 760 684 608 532 456 380 304 228 12 10 8 6 4 2 0 Resistência Mecânica Frequência absoluta 121 104 87 70 53 36 19 02 20 15 10 5 0 Absorção de Água Frequência absoluta 14 13 12 11 10 9 8 7 6 5 Retr açã o Linear 70 60 50 40 30 20 Resis tê ncia Me câ nica 12 10 8 6 4 2 0 Abso rçã o de Á gua 110 d Condição 1 Condição 4 Condição 8 𝑥3 554 𝑥3 9920 𝑥3 4140 𝑠3 0503 𝑠3 0726 𝑠3 0207 e 𝑄1 87 𝑄2 94 𝑄3 125 f 𝑥1 10037 𝑥2 43575 𝑥3 3240 𝑠1 2337 𝑠2 10413 𝑠3 3179 𝐶𝑉1 23279 𝐶𝑉2 23898 𝐶𝑉3 98115 19 a 𝑄1 095 𝑄2 16 𝑄3 21 Máx 151 Mín 02 b 110 a b Carros n Média Mediana Moda Variância Desvio padrão Amplitude Médios 20 8575 815 81 461987 21494 77 Pequenos 20 1099 1085 100 103 108 270937 16460 67 c 𝐶𝑉𝑀é𝑑𝑖𝑜𝑠 25066 𝐶𝑉𝑃𝑒𝑞𝑢𝑒𝑛𝑜𝑠 14977 O grupo dos carros pequenos é mais homogêneo porque possui menor coeficiente de variação 111 c O teor final da substância de interesse quantitativa contínua b Temperatura n Média Mediana Moda Amplitude Variância Desviopadrão CV 25C 12 62000 620 63 3 1273 1128 1819 50C 12 64583 650 65 3 0992 0996 1542 75C 12 68750 685 68 2 0750 0866 1260 100C 12 73417 735 74 3 1174 1084 1476 c O processo a 100C é mais homogêneo possui menor CV d 100 ºC 75 ºC 50 ºC 25 ºC 76 74 72 70 68 66 64 62 60 Teor Final 111 AII2 Probabilidade 21 a 𝐸 𝑐𝑎𝑟𝑎 𝑐𝑜𝑟𝑜𝑎 b 𝐸 0 1 2 c 𝐸 0 1 2 d 𝐸 𝑣 tal que 𝑣 0 e 𝐸 𝑡 tal que 𝑡 22 a i 𝐴 𝑡 tal que 5 𝑡 10 b i ii 𝐵 𝑡 tal que 𝑡 10 ii iii 𝐶 𝑡 tal que 𝑡 8 iii iv 𝐷 𝑡 tal que 𝑡 5 iv v 𝐸 v vi 𝐹 𝑡 tal que 8 𝑡 10 vi vii 𝐺 𝑡 tal que 𝑡 5 e 𝑡 10 vii 23 𝑃𝐶 na o existira o fundos suficientes para a expansa o planejada 𝑃𝐸 a expansa o planejada na o incluira um estacionamento suficientemente amplo 𝑃𝐶 𝐸 na o existira o fundos suficientes para a expansa o planejada e a expansa o planejada incluira um estacionamento suficientemente amplo 𝑃𝐶 𝐸 existira o fundos suficientes para a expansa o planejada e a expansa o planejada na o incluira um estacionamento suficientemente amplo 24 a Porque não existe probabilidade negativa b Porque não existe probabilidade maior que um d Porque não existe probabilidade maior que um 25 𝑃𝐴 0 26 a 0750 b 0423 27 a 𝑃𝐴 0400 𝑃𝐵 0300 𝑃𝐶 0140 𝑃𝐷 0100 𝑃𝐸 0060 b 𝑃𝐴 0600 28 a 𝑃𝐴 05 𝑃𝐴 𝐵 0083 𝑃𝐴 𝐵 0667 d 𝑃𝐴 𝐵 0417 𝑃𝐴 𝐵 0917 29 a 𝑃1 2 072 𝑃1 2 098 210 a 𝑃𝐴 ou 𝐵 0600 b 𝑃𝐴𝐵 0667 c 𝑃𝐵𝐴 0667 211 a 𝑃𝐶𝑃 0900 b 𝑃𝑃𝐶 0960 212 a i 00488 ii 00065 iii 05152 iv 00137 b Não 213 a 0347 b 0507 c 0053 d 0400 e 0588 f Não 10 5 10 8 8 5 10 10 5 112 214 a 0100 b 0625 c 215 a 0100 b 0090 c 0500 d 0140 216 00039 217 000299 218 a 0615 b 0618 c 0364 d 0584 219 03226 220 a 0760 b 0921 221 0174 222 0660 223 000009899 AII3 Distribuições Discretas de Probabilidade 31 a 𝑃𝑋 0 0368 b 𝑃𝑋 2 0080 31 a 05966 b 03182 c 09148 32 𝑦 0 1 2 𝑝𝑦 064 032 004 33 a 015 b 090 c 𝜇 345 d 𝜎2 45475 e 𝜎 2132 34 a 𝑝1 08 𝑝2 016 𝑝3 0032 𝑝4 00064 𝑝5 000128 b 𝑝𝑥𝑖 5 𝑖1 099968 35 a 09 b 043 e 02 c 083 d CV 145673 𝑬 Acima do valor desejado Abaixo do valor desejado Moderada Lisa Grosseira 113 36 a 𝑥 0 1 2 3 𝑝𝑥 00476 03571 04762 01190 b b1 08810 b2 0476 b3 05952 b4 0000 b5 01190 b6 1000 b7 1000 c c1 08810 c2 1000 c3 00476 c4 1000 c5 08810 c6 04048 c7 1000 c8 0000 37 a 𝑥 0 15 2 3 𝑝𝑥 1 3 1 3 1 6 1 6 b 𝑥 0 15 2 3 𝐹𝑥 1 3 2 3 5 6 1 c 𝜇 1333 e 𝜎2 114 38 a 𝑥 10 5 1 𝑝𝑥 03 06 01 b 𝑥 10 5 1 𝐹𝑥 03 09 10 c 𝜇 61 milhões e 𝜎2 789 milhões 39 a 0512 b 𝑥 0 1 2 3 𝑝𝑥 0008 0096 0384 0512 c 𝑥 0 1 2 3 𝐹𝑥 0008 0104 0488 1000 310 a 092169 b 𝑥 0 1 2 3 𝑝𝑥 000001 000167 007663 092169 311 𝑐 01 312 a 𝜇𝑋 107 e 𝜇𝑌 110 Resposta 𝑌 é mais interessante b 𝜎𝑋 2 2561 e 𝜎𝑌 2 38 Resposta 𝑋 é mais arriscada 313 𝜇𝑖 R 500000 e 𝜇𝑖𝑖 R 583708 Resposta opção ii com inspeção 314 𝜇𝐴 R 50 e 𝜇𝐵 R 30 Resposta comprador A 315 𝑥 0 1 2 𝑝𝑥 009 042 049 𝜇 14 e 𝜎 0648 316 a 0205 b 0989 c 000098 d 09990 e 0754 317 a 0329 b 09959 c 0790 114 318 a 0329 b 0088 319 0000023 320 a 𝑛 5 b 𝑝 0667 e 1 𝑝 0333 c 𝜇 3333 d 𝜎2 1111 e 0996 f 0823 321 a 00059 b 0140 c 1000 322 𝑥 0 1 2 3 𝐹𝑥 04219 08438 09844 1000 323 a 0368 b 0632 c 0920 d 𝜇 1 e 𝜎2 0999 324 a 𝑛 50 e 𝑝 01 b 0112 c 0000 325 a 0996 b 0989 326 a 000000000096769 Obs Menor do que a probabilidade de ganhar na Megasena b 02137 327 a 0082 b 0544 c 0865 328 a 0101 b 0088 c 0941 d 0030 329 a 0323 b 0036 c 0135 d 0406 330 a 0878 b 0202 331 a 0168 b 0577 332 0195 333 a 0018 b 0073 c 0147 d 0908 334 a 0449 b 0144 335 a 0271 b 0191 336 a 0061 b 0809 337 0147 338 0193 339 0143 340 0934 115 341 a 06767 b 0092 342 a 000005 b 0632 343 a 0852 b 0381 344 0981 345 13973 000025 346 0999852 Nunca faça isso se você for alérgico a camarão 347 a 04789 b 00789 c 10 348 0108453 349 000364 350 0499071 AII4 Distribuições Contínuas de Probabilidade 41 a k 128 b 064 c 16 42 a b b1 0625 b2 0625 b3 0000 b4 0156 b5 0844 b6 0844 43 a 05 b 0375 44 𝐸𝑋 1 𝑉𝑎𝑟𝑋 06 45 Nenhuma 0 01 02 03 04 05 06 07 08 0 05 1 15 2 25 3 35 4 116 46 a k 1 b 𝑃𝑋 1 0000 𝑃𝑋 0 0750 𝑃𝑋 0 0750 𝑃0 𝑋 1 025 𝑃0 𝑋 3 025 𝑃𝑋 1 0000 𝑃3 𝑋 4 0000 c 𝐸𝑋 1 3 e 𝑉𝑎𝑟𝑋 1 3 d 𝐹𝑋 0 𝑥 1 𝑥22𝑥3 4 1 𝑥 1 1 𝑥 1 47 a 𝑘 5 b 𝐸𝑋 095 e 𝑉𝑎𝑟𝑋 0003 c 075 d 50 48 a b 050 c 030 d 040 49 a 040 b 064 c 068 410 a 0082 b 0148 c 000421 hora 025 minuto 411 a 01353 b 04866 c 02031 d 3454 412 a 00025 b 06321 c 23026 d 23026 e 6931 0 1 2 3 4 5 6 075 08 085 09 095 1 105 11 115 0 05 1 15 0 05 1 15 2 25 3 117 413 a 02212 b 02865 c 02212 d 09179 e 02336 41 166 42 06826 09545 09973 43 a i 08389 ii 06217 iii 0629 b 80984 c 02233857 44 5 anos 45 a i 09938 ii 09938 iii 08664 b 0000 46 a 000175 b 002619 c 090508 d 129888158112 47 a 000175 b 022836 c 010749 d 2451535 48 a 03530 b 205 49 410 a 026763 b 5524 minutos 411 886 e 553 412 a 50 b 228 c 32 413 Caminho A 414 a 027 b 000000729 c 0994607 AII5 Intervalos de Confiança e Testes de Hipóteses 51 a 𝐻0 𝜇 100 𝑍 3000 p 000135 𝐻1 𝜇 100 𝑧𝛼 164 Resposta Como 30 está na região de rejeição ou ainda como 000135 005 rejeitamos 𝐻0 Logo existem evidências de que a fibra não deve ser julgada como aceitável com 5 de significância b IC95 96693 99307 52 IC95 0481 0619 E D C B A 572 661 739 804 118 53 IC95 0016 0044 Com 95 de confiança o processo está produzindo entre 16 e 44 das pastilhas com nível de desgaste acima do tolerado 54 a IC99 9628 9972 b 𝐻0 𝜇 100 𝑍 3000 p 00027 𝐻1 𝜇 100 𝑧𝛼 2 258 Resposta Como 30 está na região de rejeição ou ainda como 00027 001 rejeitamos 𝐻0 Logo existem evidências de que a média do processo não está no valor ideal com 1 de significância 55 n 28 56 a 𝐻0 𝜇 150 𝑍 1423 p 01556 𝐻1 𝜇 150 𝑧𝛼 2 258 Resposta Como 1423 não está na região de rejeição ou ainda como 01556 001 não rejeitamos 𝐻0 Logo existem evidências de que o diâmetro médio verdadeiro dos orifícios é igual a 150 in com 1 de significância b n 11 57 a 𝐻0 𝜇 74035 𝑍 3873 p 00001 𝐻1 𝜇 74035 𝑧𝛼 2 196 Resposta Como 3873 está na região de rejeição ou ainda como 00001 005 rejeitamos 𝐻0 Logo existem evidências de que o diâmetro médio dos anéis de pistão é diferente de 74035 mm com 5 de significância b 𝐻0 𝜇 74035 𝑍 3873 p 000005 𝐻1 𝜇 74035 𝑧𝛼 164 Resposta Como 3873 está na região de rejeição ou ainda como 000005 005 rejeitamos 𝐻0 Logo existem evidências de que o diâmetro médio dos anéis de pistão é maior que 74035 mm com 5 de significância 58 a IC95 0799 0847 b n 622 59 a 𝐻0 𝜇 1000 𝑍 2504 p 000621 𝐻1 𝜇 1000 𝑧𝛼 164 Resposta Como 2504 está na região de rejeição ou ainda como 000621 005 rejeitamos 𝐻0 Logo existem evidências de que a vida do bulbo excede 1000 horas com 5 de significância b IC95 1003043 1024957 c n 97 510 a IC95 58197325 62082075 b 𝐻0 𝜇 60000 𝑇 0153 040 p 045 𝐻1 𝜇 60000 𝑡𝑛1𝛼 1341 Resposta Como 0153 não está na região de rejeição ou ainda como p 010 não rejeitamos 𝐻0 Logo existem evidências de que a vida média desse novo pneu não excede 60000 km com 10 de significância c Não O tamanho da amostra deveria ser de pelo menos n 36 pneus 511 a 𝐻0 𝜇 820 𝑇 5267 p 00005 𝐻1 𝜇 820 𝑡𝑛1𝛼 1761 Resposta Como 5267 está na região de rejeição ou ainda como p 005 rejeitamos 𝐻0 Logo existem evidências para indicar que o diâmetro médio dos bastões excede 820 mm com 5 de significância b IC95 8220 8248 119 512 a 𝐻0 𝜇 400 𝑇 3125 0001 p 0005 𝐻1 𝜇 400 𝑡𝑛1𝛼 2492 Resposta Como 3125 está na região de rejeição ou ainda como p 001 rejeitamos 𝐻0 Logo existem evidências de que a espessura da parede da garrafa excede 400 mm com 1 de significância b IC99 4005 4095 Com 99 de confiança é possível afirmar que a espessura média das garrafas está entre 4005 e 4095 mm 513 IC99 00024 00226 514 𝐻0 𝑝 05 𝑍 11352 p 0000 𝐻1 𝑝 05 𝑧𝛼 2 196 Resposta Como 11352 está na região de rejeição ou ainda como 0000 005 rejeitamos 𝐻0 Logo existem evidências de que os dados da Engineering Horizons não são consistentes com a afirmação reportada pela Fortune com 5 de significância 515 𝐻0 𝑝 0002 𝑍 1583 p 0057 𝐻1 𝑝 0002 𝑧𝛼 233 Resposta Como 1583 não está na região de rejeição ou ainda como 0057 001 não rejeitamos 𝐻0 Logo não existem evidências de que mais de 02 das baterias da companhia falhará durante o período da garantia com 1 de significância 516 a n 107 b IC99 4851 5749 c 𝐻0 𝜇 5 Resposta Não porque o intervalo de confiança construído apresenta valores menores que 5 𝐻1 𝜇 5 d IC90 0579 0729 517 𝐻0 𝑝 090 𝑍 1414 p 007927 𝐻1 𝑝 090 𝑧𝛼 205 Resposta Como 1414 não está na região de rejeição ou ainda como 007927 001 não rejeitamos 𝐻0 Logo não existem evidências de que o nível de qualidade é menor do que o alegado pelo fabricante com 1 de significância AII6 Intervalos de Confiança e Testes de Hipóteses 61 a X Peso Y Variabilidade na distância de frenagem em superfícies secas b Direta quanto maior o peso maior a variabilidade c d corrXY rXY 0697 e Y 0287 00001X f 900 kg 0377 metros 3 ton 0587 metros g R2 48615 h X Peso Y Variabilidade na distância de frenagem em superfícies molhadas i Direta Quanto maior o peso maior a variabilidade Peso Ys 2800 2600 2400 2200 2000 1800 0600 0575 0550 0525 0500 0475 0450 Scatterplot of Ys vs Peso 120 j k corrXY rXY 0936 l Y 0393 00006X m 900 kg 0147 metros 3 ton 1407 metros n R2 87621 o Sim 62 a X Semana Y Número de CDs vendidos b Direta conforme o tempo passa o número de CDs vendidos aumenta c d corrXY rXY 0882 e Y 4607 0717 X f 18947 milhares de unidades 18947 unidades g R2 77721 63 a X ano Y quantidade de castanha in natura exportada b c corrXY rXY 0959 d Y 12585357 6321 X e 621 toneladas 64 a X renda Y Renda b c corrXY rXY 0940 d Y 7716 0040 X Peso Ym 2800 2600 2400 2200 2000 1800 15 14 13 12 11 10 09 08 07 Scatterplot of Ym vs Peso Semana CDs 10 8 6 4 2 0 12 11 10 9 8 7 6 5 Scatterplot of CDs vs Semana Ano Quantidade 1989 1988 1987 1986 1985 1984 1983 50 40 30 20 10 Scatterplot of Quantidade vs Ano Renda Renda 60 50 40 30 20 10 75 70 65 60 55 Scatterplot of Renda vs Renda 121 e 7316 f R2 88447 65 a X consumo de cigarros Y mortes b c corrXY rXY 0744 d Y 8068 0216 X e 21676 mortes por 1000000 de habitantes f R2 55313 Consumo de cigarros Mortes 1400 1200 1000 800 600 400 200 500 400 300 200 100 Scatterplot of Mortes vs Consumo de cigarros 122 ANEXO III TABELAS Tabela da Distribuição t de Student gl Valores 𝑡𝐶 tais que 𝑃𝑇 𝑡𝐶 2 gl 45 40 35 30 25 20 15 10 5 25 2 1 05 01 005 1 0158 0325 0510 0727 1000 1376 1963 3078 6314 12706 15895 31821 63657 31831 63662 1 2 0142 0289 0445 0617 0816 1061 1386 1886 2920 4303 4849 6965 9925 22327 31599 2 3 0137 0277 0424 0584 0765 0978 1250 1638 2353 3182 3482 4541 5841 10215 12924 3 4 0134 0271 0414 0569 0741 0941 1190 1533 2132 2776 2999 3747 4604 7173 8610 4 5 0132 0267 0408 0559 0727 0920 1156 1476 2015 2571 2757 3365 4032 5893 6869 5 6 0131 0265 0404 0553 0718 0906 1134 1440 1943 2447 2612 3143 3707 5208 5959 6 7 0130 0263 0402 0549 0711 0896 1119 1415 1895 2365 2517 2998 3499 4785 5408 7 8 0130 0262 0399 0546 0706 0889 1108 1397 1860 2306 2449 2896 3355 4501 5041 8 9 0129 0261 0398 0543 0703 0883 1100 1383 1833 2262 2398 2821 3250 4297 4781 9 10 0129 0260 0397 0542 0700 0879 1093 1372 1812 2228 2359 2764 3169 4144 4587 10 11 0129 0260 0396 0540 0697 0876 1088 1363 1796 2201 2328 2718 3106 4025 4437 11 12 0128 0259 0395 0539 0695 0873 1083 1356 1782 2179 2303 2681 3055 3930 4318 12 13 0128 0259 0394 0538 0694 0870 1079 1350 1771 2160 2282 2650 3012 3852 4221 13 14 0128 0258 0393 0537 0692 0868 1076 1345 1761 2145 2264 2624 2977 3787 4140 14 15 0128 0258 0393 0536 0691 0866 1074 1341 1753 2131 2249 2602 2947 3733 4073 15 16 0128 0258 0392 0535 0690 0865 1071 1337 1746 2120 2235 2583 2921 3686 4015 16 17 0128 0257 0392 0534 0689 0863 1069 1333 1740 2110 2224 2567 2898 3646 3965 17 18 0127 0257 0392 0534 0688 0862 1067 1330 1734 2101 2214 2552 2878 3610 3922 18 19 0127 0257 0391 0533 0688 0861 1066 1328 1729 2093 2205 2539 2861 3579 3883 19 20 0127 0257 0391 0533 0687 0860 1064 1325 1725 2086 2197 2528 2845 3552 3850 20 21 0127 0257 0391 0532 0686 0859 1063 1323 1721 2080 2189 2518 2831 3527 3819 21 22 0127 0256 0390 0532 0686 0858 1061 1321 1717 2074 2183 2508 2819 3505 3792 22 23 0127 0256 0390 0532 0685 0858 1060 1319 1714 2069 2177 2500 2807 3485 3768 23 24 0127 0256 0390 0531 0685 0857 1059 1318 1711 2064 2172 2492 2797 3467 3745 24 25 0127 0256 0390 0531 0684 0856 1058 1316 1708 2060 2167 2485 2787 3450 3725 25 26 0127 0256 0390 0531 0684 0856 1058 1315 1706 2056 2162 2479 2779 3435 3707 26 27 0127 0256 0389 0531 0684 0855 1057 1314 1703 2052 2158 2473 2771 3421 3690 27 28 0127 0256 0389 0530 0683 0855 1056 1313 1701 2048 2154 2467 2763 3408 3674 28 29 0127 0256 0389 0530 0683 0854 1055 1311 1699 2045 2150 2462 2756 3396 3659 29 30 0127 0256 0389 0530 0683 0854 1055 1310 1697 2042 2147 2457 2750 3385 3646 30 35 0127 0255 0388 0529 0682 0852 1052 1306 1690 2030 2133 2438 2724 3340 3591 35 40 0126 0255 0388 0529 0681 0851 1050 1303 1684 2021 2123 2423 2704 3307 3551 40 50 0126 0255 0388 0528 0679 0849 1047 1299 1676 2009 2109 2403 2678 3261 3496 50 60 0126 0254 0387 0527 0679 0848 1045 1296 1671 2000 2099 2390 2660 3232 3460 60 120 0126 0254 0386 0526 0677 0845 1041 1289 1658 1980 2076 2358 2617 3160 3373 120 0126 0253 0385 0524 0674 0842 1036 1282 1645 1960 2054 2326 2576 3090 3291 45 40 35 30 25 20 15 10 5 25 2 1 05 01 005 123 Tabela da Distribuição NormalPadrão Parte inteira e primeira decimal de z Segunda decimal de z Parte inteira e primeira decimal de z 0 1 2 3 4 5 6 7 8 9 00 000000 000399 000798 001197 001595 001994 002392 002790 003188 003586 00 01 003983 004380 004776 005172 005567 005962 006356 006749 007142 007535 01 02 007926 008317 008706 009095 009483 009871 010257 010642 011026 011409 02 03 011791 012172 012552 012930 013307 013683 014058 014431 014803 015173 03 04 015542 015910 016276 016640 017003 017364 017724 018082 018439 018793 04 05 019146 019497 019847 020194 020540 020884 021226 021566 021904 022240 05 06 022575 022907 023237 023565 023891 024215 024537 024857 025175 025490 06 07 025804 026115 026424 026730 027035 027337 027637 027935 028230 028524 07 08 028814 029103 029389 029673 029955 030234 030511 030785 031057 031327 08 09 031594 031859 032121 032381 032639 032894 033147 033398 033646 033891 09 10 034134 034375 034614 034849 035083 035314 035543 035769 035993 036214 10 11 036433 036650 036864 037076 037286 037493 037698 037900 038100 038298 11 12 038493 038686 038877 039065 039251 039435 039617 039796 039973 040147 12 13 040320 040490 040658 040824 040988 041149 041309 041466 041621 041774 13 14 041924 042073 042220 042364 042507 042647 042785 042922 043056 043189 14 15 043319 043448 043574 043699 043822 043943 044062 044179 044295 044408 15 16 044520 044630 044738 044845 044950 045053 045154 045254 045352 045449 16 17 045543 045637 045728 045818 045907 045994 046080 046164 046246 046327 17 18 046407 046485 046562 046638 046712 046784 046856 046926 046995 047062 18 19 047128 047193 047257 047320 047381 047441 047500 047558 047615 047670 19 20 047725 047778 047831 047882 047932 047982 048030 048077 048124 048169 20 21 048214 048257 048300 048341 048382 048422 048461 048500 048537 048574 21 22 048610 048645 048679 048713 048745 048778 048809 048840 048870 048899 22 23 048928 048956 048983 049010 049036 049061 049086 049111 049134 049158 23 24 049180 049202 049224 049245 049266 049286 049305 049324 049343 049361 24 25 049379 049396 049413 049430 049446 049461 049477 049492 049506 049520 25 26 049534 049547 049560 049573 049585 049598 049609 049621 049632 049643 26 27 049653 049664 049674 049683 049693 049702 049711 049720 049728 049736 27 28 049744 049752 049760 049767 049774 049781 049788 049795 049801 049807 28 29 049813 049819 049825 049831 049836 049841 049846 049851 049856 049861 29 30 049865 049869 049874 049878 049882 049886 049889 049893 049896 049900 30 31 049903 049906 049910 049913 049916 049918 049921 049924 049926 049929 31 32 049931 049934 049936 049938 049940 049942 049944 049946 049948 049950 32 33 049952 049953 049955 049957 049958 049960 049961 049962 049964 049965 33 34 049966 049968 049969 049970 049971 049972 049973 049974 049975 049976 34 35 049977 049978 049978 049979 049980 049981 049981 049982 049983 049983 35 36 049984 049985 049985 049986 049986 049987 049987 049988 049988 049989 36 37 049989 049990 049990 049990 049991 049991 049992 049992 049992 049992 37 38 049993 049993 049993 049994 049994 049994 049994 049995 049995 049995 38 39 049995 049995 049996 049996 049996 049996 049996 049996 049997 049997 39 40 049997 049997 049997 049997 049997 049997 049998 049998 049998 049998 40 45 050000 050000 050000 050000 050000 050000 050000 050000 050000 050000 45 Área ou probabilidade 124 ANEXO IV REGRAS DE ARREDONDAMENTO O arredondamento pode ser feito de diversas maneiras porém há norma nacional ABNT NBR 58911977 e internacional ISO 3101992 Anexo B O arredondamento conforme essas normas deve ser feito segundo o seguinte critério Se o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é menor que 5 o algarismo da posição para a qual será feito o arredondamento fica inalterado Exemplos 5843 arredondado a 1 decimal passa a ser 584 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 3 2349876432 arredondado a 4 decimais passa a ser 2349876 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 4 432391 arredondado a 2 decimais passa a ser 43239 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 1 1236702 arredondado a 3 decimais passa a ser 123670 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 2 Se o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é maior que 5 ou sendo 5 há pelo menos um algarismo subsequente diferente de zero o algarismo da posição para a qual será feito o arredondamento deve ser aumentado de uma unidade Exemplos 5846 arredondado a 1 decimal passa a ser 585 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 6 2349876732 arredondado a 4 decimais passa a ser 2349877 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 7 43236512 arredondado a 2 decimais passa a ser 43237 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 5 e este é seguido de pelo menos um algarismo diferente de zero 123670501 arredondado a 3 decimais passa a ser 123671 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 5 e este é seguido de pelo menos um algarismo diferente de zero Se o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é igual a 5 e não há algarismos subsequentes ou sendo igual a 5 os algarismos subsequentes são constituídos de zeros sem nenhum algarismo diferente de zero o arredondamento deve ser feito para o número par mais próximo Em outras palavras se o algarismo da posição para a qual deve ser feito o arredondamento é par este será mantido e se for ímpar a ele deve ser somada uma unidade Exemplos 123465 arredondado a 2 decimais passa a ser 12346 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 5 sem nenhum algarismo subsequente e o algarismo da posição para a qual deve ser feito o arredondamento é par 123425000 arredondado a 2 decimais passa a ser 12342 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 5 seguido de zeros sem nenhum algarismo subsequente diferente de zero e o algarismo da posição para a qual deve ser feito o arredondamento é par 1234915 arredondado a 3 decimais passa a ser 123492 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 5 sem nenhum algarismo subsequente e o algarismo da posição para a qual deve ser feito o arredondamento é ímpar sendo a ele somada uma unidade 123435 000 arredondado a 2 decimais passa a ser 12344 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 5 seguido de zeros sem nenhum algarismo subsequente diferente de zero e o algarismo da posição para a qual deve ser feito o arredondamento é ímpar sendo a ele somada uma unidade 1295000 arredondado a inteiro passa a ser 130 o algarismo imediatamente à direita da posição para a qual será feito o arredondamento é 5 seguido de zeros sem nenhum algarismo subsequente diferente de zero e o algarismo da posição para a qual deve ser feito o arredondamento é ímpar sendo a ele somada uma unidade