• Home
  • Chat IA
  • Guru IA
  • Tutores
  • Central de ajuda
Home
Chat IA
Guru IA
Tutores

·

Cursos Gerais ·

Estatística 2

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Analise ANOVA de Faixas Salariais - Estudo Comparativo

10

Analise ANOVA de Faixas Salariais - Estudo Comparativo

Estatística 2

UFAL

Prova Estatística - Análise de Associação entre Variáveis

6

Prova Estatística - Análise de Associação entre Variáveis

Estatística 2

UFAL

Probabilidade - Conceitos Basicos Regras e Teorema de Bayes

55

Probabilidade - Conceitos Basicos Regras e Teorema de Bayes

Estatística 2

UFAL

Checklist para Selecao e Avaliacao de Artigo Cientifico em Area de Atuacao

1

Checklist para Selecao e Avaliacao de Artigo Cientifico em Area de Atuacao

Estatística 2

UFAL

Influência da espessura dos segmentos de anel corneano na correção do astigmatismo ceratométrico em pacientes com ceratocone

5

Influência da espessura dos segmentos de anel corneano na correção do astigmatismo ceratométrico em pacientes com ceratocone

Estatística 2

UFAL

Checklist Analise Inferencial Dados Abertos Teste Estatistico

1

Checklist Analise Inferencial Dados Abertos Teste Estatistico

Estatística 2

UFAL

Analise de Obito Infantil e Raca no Brasil 2021 - Datasus

7

Analise de Obito Infantil e Raca no Brasil 2021 - Datasus

Estatística 2

UFAL

Gráfico de Controle: Média Móvel do pH (Dias 5 a 15)

1

Gráfico de Controle: Média Móvel do pH (Dias 5 a 15)

Estatística 2

UFAL

Lista de Estatística

21

Lista de Estatística

Estatística 2

UFAL

Resolucao de Exercicios de Regressao Linear Simples e Econometria

7

Resolucao de Exercicios de Regressao Linear Simples e Econometria

Estatística 2

UFAL

Texto de pré-visualização

61 Revisão e Visão Geral 62 A Distribuição Normal Padrão 63 Aplicações da Distribuição Normal 64 Distribuições Amostrais e Estimadores 65 O Teorema Limite Central 66 A Normal como Aproximação da Binomial 67 Determinação de Normalidade 6 Distribuição de Probabilidade Normal PROBLEMA DO CAPÍTULO Como projetar aviões barcos carros e casas com segurança e conforto A ergonomia envolve o estudo do ajuste das pessoas aos ambientes A ergonomia é usada em uma grande variedade de aplicações tais como as seguintes Projeto de uma porta pela qual a maioria das pessoas possa passar sem se curvar e sem bater a cabeça projeto de um carro de modo que o painel fique facilmente ao alcance da maioria dos motoristas projeto de uma tampa de rosco de garrafa que a maioria das pessoas tenha pega suficiente para abrila projeto de uma cobertura de poço de inspeção que a maioria dos trabalhadores passe por ela O bom planejamento ergonômico resulta em um ambiente seguro funcional eficiente e confortável Mau planejamento ergonômico resulta em condições desconfortáveis não seguras ou possivelmente fatais Por exemplo as seguintes situações reais ilustram a dificuldade na determinação de cargas seguras em aviões e barcos Temos uma emergência para o voo 5480 da Air Midwest disse a piloto Katie Leslie imediatamente antes de seu avião se chocar contra o solo em Charlotte Carolina do Norte A queda do avião Beech matou todas as 21 pessoas a bordo Na investigação subsequente o peso dos passageiros foi considerado como um dos fatores que contribuíram para a queda Isso levou a Administração Federal de Aviação a ordenar que as empresas aéreas coletassem informação sobre peso em voos selecionados aleatoriamente para que fossem atualizadas as antigas hipóteses sobre pesos de passageiros Vinte passageiros foram mortos quando o barco de turismo Ethan Allen virou no Lago George em Nova York Com base no peso médio suposto de 140 libras 6350 kg o barco estava liberado para carregar 50 pessoas Investigação subsequente mostrou que a maioria dos passageiros pesava mais de 200 libras 9072 kg e o barco deveria ter sido liberado para um número menor de passageiros Um táxi aquático afundou recentemente no porto interno de Baltimore Entre as 25 pessoas a bordo 5 morreram e 16 ficaram feridas Uma investigação revelou que a carga segura de passageiros era de 3500 libras Supondo que um passageiro médio pese 140 libras o barco tinha permissão para carregar 25 passageiros mas a média de 140 libras havia sido determinada há 44 anos quando as pessoas não eram tão pesadas quanto agora O peso médio dos 25 passageiros a bordo do barco que afundou era de 168 libras ou 762 kg O Conselho Nacional de Transporte e Segurança sugeriu que a antiga média estimada de 140 libras fosse atualizada para 174 libras 7893 kg de modo que a carga de segurança de 3500 libras permitiria agora apenas 20 passageiros em vez de 25 Este capítulo introduz as ferramentas estatísticas básicas para um bom planejamento ergonômico Depois de completar este capítulo seremos capazes de resolver problemas em uma grande variedade de disciplinas incluindo ergonomia 61 Revisão e Visão Geral No Capítulo 2 consideramos a distribuição de dados e no Capítulo 3 consideramos algumas importantes medidas de conjuntos de dados incluindo medidas de centro e de variação No Capítulo 4 discutimos os princípios básicos de probabilidade e no Capítulo 5 apresentamos o conceito de distribuição de probabilidade No Capítulo 5 consideramos apenas distribuições de probabilidade discretas mas neste capítulo apresentaremos distribuições de probabilidade contínuas Para ilustrar a correspondência entre área e probabilidade começamos com a distribuição uniforme mas a maior parte do capítulo concentrase nas distribuições normais As distribuições normais ocorrem frequentemente em aplicações reais e desempenham papel importante nos métodos de inferência estatística Neste capítulo apresentamos conceitos de distribuições normais que serão bastante usados ao longo deste livro Vários dos métodos estatísticos discutidos em capítulos posteriores se baseiam nos conceitos relacionados ao teorema limite central discutido na Seção 65 Muitas outras seções requerem populações normalmente distribuídas e a Seção 67 apresenta métodos para a análise de dados amostrais para se determinar se a amostra parece ser ou não proveniente de uma população com distribuição normal Figura 61 A Distribuição Normal Curva em forma de sino e simétrica Valor DEFINIÇÃO Se uma variável aleatória contínua tem uma distribuição com um gráfico simétrico e em forma de sino como na Figura 61 e que pode ser descrito pela equação dada como a Fórmula 61 dizemos que ela tem uma distribuição normal Fórmula 61 y e12xμσ2σ2π A Fórmula 61 é matematicamente desafiadora mas nós a mostramos apenas para ilustrar o fato de que qualquer distribuição normal particular é determinada por dois parâmetros a média μ e o desviopadrão σ A Fórmula 61 é como muitas equações com uma variável y no lado esquerdo e uma variável x no lado direito As letras π e e representam os valores constantes de 314159 e 271828 respectivamente Os símbolos μ e σ representam valores fixos para a média e o desviopadrão respectivamente Uma vez selecionados valores específicos para μ e σ podemos fazer o gráfico para a Fórmula 61 do mesmo modo que faríamos o gráfico de qualquer equação que relacionasse x e y o resultado é uma distribuição de probabilidade contínua com a mesma forma de sino mostrada na Figura 61 Pela Fórmula 61 vemos que uma distribuição normal é determinada pelos valores fixos da média μ e do desviopadrão σ E isso é tudo que precisamos saber sobre a Fórmula 61 62 A Distribuição Normal Padrão Conceitochave Esta seção apresenta a distribuição normal padrão que tem as seguintes propriedades 1 Seu gráfico tem forma de sino como na Figura 61 2 Sua média é igual a 0 isto é μ 0 3 Seu desviopadrão é igual a 1 isto é σ 1 Nesta seção desenvolveremos a habilidade para a determinação de áreas ou probabilidades ou frequências relativas correspondentes a várias regiões sob o gráfico da distribuição normal padrão E também encontraremos escores z que correspondem a áreas sob o gráfico Distribuições Uniformes O foco deste capítulo é o conceito de uma distribuição de probabilidade normal mas vamos começar com a distribuição uniforme A distribuição uniforme torna mais fácil vermos estas duas propriedades importantes 1 A área sob o gráfico de uma distribuição de probabilidade é igual a 1 2 Há uma correspondência entre área e probabilidade ou frequência relativa de modo que algumas probabilidades podem ser encontradas pela identificação das áreas correspondentes O Capítulo 5 considerou apenas distribuições de probabilidade discretas mas agora consideraremos distribuições de probabilidade contínuas começando com a distribuição uniforme Uma variável aleatória contínua tem uma distribuição uniforme se seus valores se espalham uniformemente sobre a faixa de valores possíveis O gráfico de uma distribuição uniforme resulta em uma forma retangular Suprimento de Energia Domiciliar A Companhia de Energia e Luz de Newport fornece eletricidade com níveis de voltagem que são uniformemente distribuídos entre 1230 e 1250 volts Isto é qualquer quantidade de voltagem entre 1230 e 1250 volts é possível e todos os possíveis valores são equiprováveis Se selecionamos aleatoriamente um dos níveis de voltagem e representamos seu valor pela variável aleatória x então x tem uma distribuição que tem um gráfico como o da Figura 62 O gráfico de uma distribuição de probabilidade contínua como o da Figura 62 é chamado de curva de densidade e deve satisfazer os dois seguintes requisitos Requisitos para uma Curva de Densidade 1 A área total sob a curva tem que ser igual a 1 2 Cada ponto na curva tem que ter uma altura vertical maior ou igual a 0 Isto é a curva não pode estar abaixo do eixo x Ao fixarmos a altura do retângulo na Figura 62 como 05 forçamos a área compreendida a ser 2 05 1 como exigido Em geral a área de um retângulo se torna 1 quando fazemos sua altura igual ao valor de 1amplitude Essa propriedade área 1 torna muito fácil a resolução de problemas de probabilidade de modo que a afirmativa seguinte é importante Como a área total sob a curva de densidade é igual a 1 existe uma correspondência entre área e probabilidade Nível de Voltagem Dada a distribuição uniforme ilustrada na Figura 62 ache a probabilidade de que um nível de voltagem selecionado aleatoriamente seja maior do que 1245 volts SOLUÇÃO A área sombreada na Figura 63 representa os níveis de voltagem que são maiores do que 1245 volts Como a área total sob a curva de densidade é igual a 1 há uma correspondência entre área e probabilidade Podemos achar a probabilidade desejada usando áreas como segue Pvoltagem maior do que 1245 volts área da região sombreada na Figura 63 05 05 025 A probabilidade de se selecionar aleatoriamente um nível de voltagem maior que 1245 é 025 Distribuição Normal Padrão A curva de densidade de uma distribuição uniforme é uma reta horizontal de modo que podemos achar a área de qualquer região retangular aplicando esta fórmula Área largura altura Como a curva de densidade de uma distribuição normal tem a forma de sino complicada exibida na Figura 61 é mais difícil acharmos a área mas o princípio básico é o mesmo há uma correspondência entre área e probabilidade Na Figura 64 mostramos que para uma distribuição normal padrão a área sob a curva de densidade é igual a 1 A distribuição normal padrão é uma distribuição de probabilidade normal com média μ 0 e desviopadrão σ 1 e a área total sob a curva de densidade é 1 Veja a Figura 64 Não é fácil a determinação de áreas na Figura 64 de modo que os matemáticos calcularam muitas áreas diferentes sob a curva que estão incluídas na Tabela A2 no Apêndice A Determinação de Probabilidades para Valores Dados de Escores z Usando a Tabela A2 no Apêndice A e no encarte Fórmulas e Tabelas podemos achar áreas ou probabilidades para muitas regiões diferentes Tais áreas também podem ser encontradas usandose a calculadora TI8384 Plus ou programas como STATDISK Minitab ou Excel As principais características dos diferentes métodos estão resumidas na Tabela 61 Como as calculadoras e os programas em geral dão resultados mais precisos do que a Tabela A2 é recomendado o uso de tais tecnologias No caso de haver discrepâncias as respostas no Apêndice D geralmente incluirão resultados baseados na Tabela A2 bem como baseados em alguma tecnologia Ao usar a Tabela A2 é fundamental que você compreenda os seguintes pontos 1 A Tabela A2 referese apenas à distribuição normalpadrão que tem média 0 e desviopadrão 1 2 A Tabela A2 é apresentada em duas páginas uma para escores z negativos e a outra para escores z positivos 3 Cada valor no corpo da tabela é a área acumulada a partir da esquerda até uma reta vertical sobre um valor específico do escore z 4 Ao trabalhar com um gráfico evite confusão entre escores z e áreas 5 A parte do escore z que designa os centésimos encontrase na linha do topo da Tabela A2 Ao trabalhar com uma distribuição normal evite confusão entre escores z e áreas METODOS PARA ENCONTRAR ÁREAS DA DISTRIBUIÇÃO NORMAL D á a área acumulada a partir da esquerda até uma linha vertical acima do valor específico de z O procedimento para uso da Tabela A2 está descrito no texto Selecione Analysis Probability Distributions Normal Distribution Introduza o valor z e clique em Evaluate Selecione Calc Probability Distributions Normal Na caixa de diálogo selecione Cumulative Probability Input Constant Selecione fx Statistical DIST NORM Na caixa de diálogo introduza o valor da média do desviopadrão e VERDADEIRO Pressione 2norm cdf e introduza os dois escores z separados por vírgula como em valor z esquerdo valor z direito Capítulo 6 O exemplo a seguir requer que achemos a probabilidade associada a um escore z menor que 127 Comece com o escore z de 127 localizando 12 na coluna à esquerda em seguida ache o valor na linha adjacente das probabilidades que está exatamente abaixo de 007 conforme mostrado na parte extraída da Tabela A2 TABELA A2 continuação Área Acumulada à ESQUERDA z 000 001 002 003 004 005 006 007 008 009 00 05000 05040 05080 05120 05160 05199 05239 05279 05319 05359 01 05398 05438 05478 05517 05557 05596 05636 05675 05714 05753 02 05793 05832 05871 05910 05948 05987 06026 06064 06103 06141 10 08413 08438 08461 08485 08508 08531 08554 08577 08599 08621 11 08643 08665 08686 08708 08729 08749 08770 08790 08810 08830 12 08849 08869 08888 08907 08925 08944 08962 08980 08997 09015 13 09032 09049 09066 09082 09099 09115 09131 09147 09162 09177 14 09192 09207 09222 09236 09251 09265 09279 09292 09306 09319 O valor da área ou probabilidade de 08980 indica que há uma probabilidade de 08980 de selecionarmos aleatoriamente um escore z menor que 127 As seções seguintes considerarão casos nos quais a média não é 0 ou o desviopadrão não é 1 SC EXEMPLO 3 Termômetros Científicos A Companhia de Instrumentos Científicos de Precisão fabrica termômetros que devem informar temperaturas de 0C no ponto de congelamento da água Testes em uma grande amostra desses instrumentos revelam que no ponto de congelamento da água alguns termômetros indicam temperaturas abaixo de 0 indicadas por números negativos e alguns dão temperaturas acima de 0 indicadas por números positivos Suponha que a leitura média seja 0C e que o desviopadrão das leituras seja 100C Suponha também que as leituras sejam normalmente distribuídas Se um termômetro é selecionado aleatoriamente ache a probabilidade de que no ponto de congelamento da água a leitura seja menor que 127 SOLUÇÃO A distribuição de probabilidade das leituras é a distribuição normal padrão porque as leituras são normalmente distribuídas com μ 0 e σ 1 Precisamos achar a área na Figura 65 abaixo de z 127 A área abaixo de z 127 é igual à probabilidade de selecionarmos aleatoriamente um termômetro com leitura inferior a 127 Pela Tabela A2 vemos que essa área é 08980 Figura 65 Achando a Área Abaixo de z 127 INTERPRETAÇÃO A probabilidade de selecionarmos aleatoriamente um termômetro com leitura inferior a 127 no ponto de congelamento da água é igual à área de 08980 mostrada como a região sombreada na Figura 65 Outra maneira de interpretarmos esse resultado é concluir que 8980 dos termômetros terão leituras abaixo de 127 SC EXEMPLO 4 Termômetros Científicos Usando os termômetros do Exemplo 3 ache a probabilidade de selecionarmos aleatoriamente um termômetro que apresente leitura no ponto de congelamento da água superior a 123 SOLUÇÃO Novamente calculamos a probabilidade achando a área correspondente Estamos procurando a área da região que está sombreada na Figura 66 mas a Tabela A2 só se aplica a áreas acumuladas à esquerda Na página para escores z negativos na Tabela A2 vemos que a área à esquerda de z 123 é 01093 conforme exibido Como a área total sob a curva é 1 podemos achar a área sombreada subtraindo 01093 de 1 O resultado é 08907 Embora a Tabela A2 forneça apenas áreas acumuladas à esquerda podemos usála para achar áreas acumuladas à direita conforme mostrado na Figura 66 Figura 66 Achando a Área Acima de z 123 INTERPRETAÇÃO Por causa da correspondência entre probabilidade e área concluímos que a probabilidade de selecionarmos aleatoriamente um termômetro com leitura acima de 123 no ponto de congelamento da água é 08907 que é a área à direita de z 123 Em outras palavras 8907 dos termômetros têm leitura superior a 123 O Exemplo 4 ilustra uma maneira pela qual a Tabela A2 pode ser usada indiretamente para achar áreas acumuladas à direita O exemplo seguinte ilustra outra forma de acharmos áreas usando a Tabela A2 SC EXEMPLO 5 Termômetros Científicos Faça uma seleção aleatória da mesma amostra de termômetros do Exemplo 3 Ache a probabilidade de que o termômetro escolhido apresente leitura no ponto de congelamento da água entre 200 e 150 SOLUÇÃO Estamos novamente lidando com valores normalmente distribuídos com média de 0 e desviopadrão de 1 A probabilidade de selecionarmos um termômetro com leitura entre 200 e 150 corresponde à área sombreada na Figura 67 A Tabela A2 não pode ser usada diretamente para acharmos tal área mas podemos usála para achar que z 200 corresponde à área de 00228 e z 150 corresponde à área de 09332 como mostrado na figura Pela Figura 67 vemos que a área sombreada é a diferença entre 09332 e 00228 A área sombreada é então 09332 00228 09104 Figura 67 Achando a Área entre Dois Valores INTERPRETAÇÃO Usando a correspondência entre probabilidade e área concluímos que há uma probabilidade de 09104 de um termômetro selecionado aleatoriamente apresentar leitura entre 200 e 150 no ponto de congelamento da água Outra maneira de interpretarmos esse resultado é dizer que se muitos termômetros são selecionados e testados no ponto de congelamento da água 09104 ou 9104 deles apresentarão leituras entre 200 e 150 O Exemplo 5 pode ser generalizado como a seguinte regra A área correspondente à região entre dois escores z específicos pode ser encontrada achandose a diferença entre as duas áreas da Tabela A2 A Figura 68 ilustra essa regra geral Note que a região sombreada B pode ser calculada pela diferença entre duas áreas da Tabela A2 áreas A e B combinadas encontrada na Tabela A2 como a área correspondente a zDireita e área A encontrada na Tabela A2 como a área correspondente a zEsquerda Recomendação Não tente memorizar uma regra ou fórmula para esse caso Concentrese em entender como a Tabela A2 funciona Se necessário desenhe um gráfico sombreie a região desejada e pense em uma maneira de achar a área correspondente dada a condição de que a Tabela A2 fornece apenas áreas acumuladas à esquerda Figura 68 Achando a Área entre Dois Valores Área B sombreada áreas A e B combinadas área A área pela Tabela A2 usando zDireita área pela Tabela A2 usando zEsquerda Probabilidades como aquelas dos exemplos precedentes também podem ser expressas com a seguinte notação Notação Pa z b denota a probabilidade de o escore z estar entre a e b Pz a denota a probabilidade de o escore z ser maior que a Pz a denota a probabilidade de o escore z ser menor que a Usando essa notação podemos expressar o resultado do último exemplo como P200 z 150 09104 que afirma em símbolos que a probabilidade de um escore z estar entre 200 e 150 é 09104 Com uma distribuição de probabilidade contínua tal como a distribuição normal a probabilidade de se obter qualquer valor único exato é 0 Isto é Pz a 0 Por exemplo há uma probabilidade 0 de selecionarmos aleatoriamente uma pessoa com altura exatamente igual a 6812345678 polegadas Na distribuição normal qualquer ponto isolado na escala horizontal é representado não por uma região sob a curva mas sim por uma linha vertical acima do ponto Para Pz 150 temos uma linha vertical acima de z 150 mas uma linha vertical não contém qualquer área de modo que Pz 150 0 Para qualquer variável aleatória contínua a probabilidade de qualquer valor exato é 0 o que implica que Pa z b Pa z b Segue também que a probabilidade de se obter um escore z no máximo igual a b é igual à probabilidade de se obter um escore z menor que b É importante interpretar corretamente fraseschave tais como no máximo pelo menos mais do que não mais do que e assim por diante Determinação de Escores z a Partir de Áreas Conhecidas Até agora os exemplos desta seção envolvendo a distribuição normal padrão têm todos seguido o mesmo formato dados escores z achamos áreas sob a curva Essas áreas correspondem a probabilidades Em muitos outros casos temos o inverso dada uma área ou probabilidade achar o escore z correspondente Em tais casos é muito importante que se evite confusão entre escores z e áreas Lembrese escores z são distâncias ao longo da escala horizontal enquanto áreas ou probabilidades são regiões sob a curva A Tabela A2 lista os escores z na coluna à esquerda e ao longo da linha do topo mas as áreas são encontradas no corpo da tabela Também escores z posicionados na metade esquerda da curva são sempre negativos Se já conhecemos a probabilidade e queremos determinar o escore z correspondente nós o encontramos da seguinte maneira Procedimento para a Determinação de um Escore z a Partir de uma Área Conhecida 1 Desenhe uma curva em forma de sino e identifique a região sob a curva que corresponde à probabilidade dada Se a região não é uma região acumulada à esquerda trabalhe com regiões conhecidas que sejam regiões acumuladas à esquerda 2 Usando a área acumulada à esquerda localize a probabilidade mais próxima no corpo da Tabela A2 e identifique o escore z correspondente Ao consultar a Tabela A2 lembrese de que o corpo da tabela dá as áreas acumuladas a partir da esquerda Termômetros Científicos Use os mesmos termômetros do Exemplo 3 com leituras de temperatura no ponto de congelamento da água normalmente distribuídas com média de 0C e desviopadrão de 1C Ache a temperatura correspondente a P95 o 95º percentil Isto é ache a temperatura que separa os 95 inferiores dos 5 superiores Veja a Figura 69 Figura 69 Achando o 95º Percentil Área 095 0 z Solução A Figura 69 mostra o escore z que é o 95º percentil com 95 da área ou 095 abaixo dele Consultando a Tabela A2 procuramos a área 095 no corpo da tabela e então achamos o escore z correspondente Na Tabela A2 encontramos as áreas 09495 e 09505 mas há um asterisco com uma nota especial indicando que 09500 corresponde ao escore z de 1645 Podemos concluir que o escore z na Figura 69 é 1645 de modo que o 95º percentil é a temperatura de 1645C Interpretação Ao se testarem os termômetros no ponto de congelamento 95 das leituras serão menores do que ou iguais a 1645C e 5 serão maiores do que ou iguais a 1645C Tabela A2 Casos Especiais Escore z Área acumulada à Esquerda 1645 09500 1645 00500 2575 09950 2575 00050 Acima de 349 09999 Abaixo de 349 00001 Note que na solução anterior a Tabela A2 nos levou ao escore z de 1645 que está a meio caminho entre 164 e 165 Ao usarmos a Tabela A2 podemos em geral evitar interpolação simplesmente usando o valor mais próximo Há casos especiais listados na tabela na margem que são importantes por serem usados frequentemente em uma ampla variedade de aplicações Para um desses casos especiais o valor z 2576 fornece uma área um pouco mais próxima de 09950 mas z 2575 tem a vantagem de estar a meio caminho entre z 257 e z 258 Com exceção desses casos especiais podemos selecionar o valor mais próximo na tabela Se um valor desejado está a meio caminho entre dois valores da tabela selecione o maior Também para escores z acima de 349 podemos usar 09999 como uma aproximação para a área acumulada à esquerda para escores z abaixo de 349 podemos usar 00001 como uma aproximação para a área acumulada à esquerda Exemplo 7 Termômetros Científicos Usando os mesmos termômetros do Exemplo 3 ache as temperaturas separando os 25 inferiores e os 25 superiores Solução Os escores z pedidos são exibidos na Figura 610 Para achar o escore z localizado à esquerda consulte a Tabela A2 e procure no corpo da tabela a área de 0025 O resultado é z 196 Para achar o escore z localizado à direita consulte a Tabela A2 e procure no corpo da tabela a área de 0975 Lembrese de que a Tabela A2 sempre fornece áreas acumuladas à esquerda O resultado é z 196 Os valores z 196 e z 196 separam os 25 inferiores e os 25 superiores conforme mostrado na Figura 610 Figura 610 Achando Escores z Para encontrar esse escore localize a área acumulada à esquerda na Tabela A2 Localize 0975 no corpo da Tabela A2 Interpretação Ao se testar os termômetros no ponto de congelamento 25 das leituras dos termômetros serão menores do que ou iguais a 196 e 25 das leituras serão maiores do que ou iguais a 196 Outra interpretação é a de que no ponto de congelamento da água 95 de todos os termômetros terão leituras entre 196 e 196 Valores Críticos Para uma distribuição normal um valor crítico é um escore z na fronteira que separa os escores z que têm ocorrência provável daqueles que têm ocorrência improvável Valores críticos comuns são z 196 e z 196 e eles são obtidos como mostrado no Exemplo 7 Nesse exemplo os valores abaixo de z 196 são improváveis de acontecer pois ocorrem em apenas 25 das leituras e os valores acima de z 196 também são improváveis de acontecer pois também ocorrem em apenas 25 das leituras A referência a valores críticos não é tão importante neste capítulo mas se tornará de extrema importância nos capítulos seguintes Usase a notação que segue para valores críticos z encontrados a partir do uso da distribuição normal padrão Notação A expressão zα denota o escore z com uma área α à sua direita α é a letra grega alfa Exemplo 8 Achando zα Na expressão zα faça α 0025 e ache o valor de z0025 Solução A notação de z0025 é usada para representar o escore z com uma área de 0025 à sua direita Consulte a Figura 610 e note que o valor de z 196 tem uma área dez 0025 à sua direita de modo que z0025 196 Cuidado Ao usar a Tabela A2 para encontrar um valor de zα para um valor particular de α note que α é a área à direita de zα mas a Tabela A2 lista áreas acumuladas à esquerda de um dado escore z Para encontrar o valor de zα usando a Tabela A2 resolva isso usando o valor de 1 α No Exemplo 8 o valor de z0025 pode ser encontrado localizandose a área de 09750 no corpo da tabela Os exemplos desta seção foram elaborados de forma tal que a média de 0 e o desviopadrão de 1 coincidissem exatamente com os parâmetros da distribuição normal padrão Na verdade é pouco comum encontraremse tais parâmetros convenientes porque as distribuições normais típicas envolvem médias diferentes de 0 e desviospadrão diferentes de 1 Na próxima seção introduziremos métodos para se trabalhar com tais distribuições que são muito mais realistas Utilizando a Tecnologia Ao se trabalhar com a distribuição normal padrão podese usar a tecnologia para a determinação de escores z ou áreas em lugar da Tabela A2 As instruções que seguem descrevem como encontrar escores z ou áreas Statdisk Selecione Analysis Probability Distributions Normal Distribution Digite o escore z para achar a área correspondente ou digite a área acumulada à esquerda para achar o escore z Depois de digitado algum desses valores clique no botão Evaluate Veja a apresentação que segue para uma entrada de z 200 Minitab Para achar a área acumulada à esquerda de um escore z como na Tabela A2 selecione Calc Probability Distributions Normal Cumulative probabilities Introduza a média 0 e o desviopadrão 1 a seguir clique no botão Input Constant e introduza o escore z Para achar um valor correspondente a uma probabilidade conhecida selecione Calc Probability Distributions Normal Selecione então Inverse cumulative probabilities e a opção Input Constant introduzindo aí a área total à esquerda do valor dado Excel Para achar a área acumulada à esquerda de um valor como na Tabela A2 clique em fx e selecione Estatística e DIST NORMP e introduza o valor do escore z No Excel 2010 selecione DISTNORMN Para achar um valor correspondente a uma probabilidade conhecida clique em fx e selecione Estatística e INVNORMP e introduza a área total à esquerda do valor dado No Excel 2010 selecione INVNORMPN TI8384 Plus Para achar a área entre dois valores pressione 2nd Vars e selecione normalcdf Prossiga para introduzir os dois escores z separados por uma vírgula como em valor esquerdo valor direito O Exemplo 5 poderia ser resolvido com o comando normalcdf200150 que resultaria na probabilidade de 09104 arredondada como exibido na seguinte tela TI8384 Plus normalcdf200 150 9104427093 Para achar um escore z correspondente a uma probabilidade conhecida selecione 2nd VARS e selecione invNorm Prossiga para introduzir a área total à esquerda do escore z Por exemplo o comando invNorm0975 fornece um escore z de 1959963986 que é arredondado para 196 como no Exemplo 6 62 Habilidades e Conceitos Básicos Letramento Estatístico e Pensamento Crítico 1 Distribuição Normal Quando nos referimos a uma distribuição normal a palavra normal tem o mesmo significado que tem na linguagem corrente ou ela tem um significado especial em estatística O que é exatamente uma distribuição normal 2 Distribuição Normal Uma distribuição normal é de uma maneira informal e livre descrita como uma distribuição de probabilidade que tem a forma de sino quando se desenha seu gráfico O que é forma de sino 3 Distribuição Normal Padrão Quais requisitos são necessários para que uma distribuição de probabilidade normal seja uma distribuição de probabilidade normal padrão 4 Notação O que significa a notação zα Distribuição Uniforme Contínua Nos Exercícios 58 consulte a distribuição uniforme contínua ilustrada na Figura 62 Suponha que se selecione aleatoriamente um nível de voltagem entre 1230 volts e 1250 volts e ache a probabilidade de o nível de voltagem dado ser selecionado 5 Maior que 1240 volts 6 Menor que 1235 volts 7 Entre 1232 volts e 1247 volts 8 Entre 1241 volts e 1245 volts Distribuição Normal Padrão Nos Exercícios 912 ache a área da região sombreada O gráfico representa a distribuição normal padrão com média 0 e desviopadrão 1 Distribuição Normal Padrão Nos Exercícios 1316 ache o escore z indicado O gráfico representa a distribuição normal padrão com média 0 e desviopadrão 1 Distribuição Normal Padrão Nos Exercícios 1736 suponha que as leituras de termômetros sejam normalmente distribuídas com média de 0 e desviopadrão de 100C Um termômetro é selecionado aleatoriamente e testado Em cada caso faça um esboço e ache a probabilidade de cada leitura Os valores dados estão em graus Celsius Se usar a tecnologia em vez da Tabela A2 arredonde as respostas para 4 casas decimais 17 Menor que 150 18 Menor que 275 19 Menor que 123 20 Menor que 234 21 Maior que 222 22 Maior que 233 23 Maior que 175 24 Maior que 196 25 Entre 050 e 100 26 Entre 100 e 300 27 Entre 300 e 100 28 Entre 100 e 050 29 Entre 120 e 195 30 Entre 287 e 134 31 Entre 250 e 500 32 Entre 450 e 100 33 Menor que 355 34 Maior que 368 35 Maior que 0 36 Menor que 0 Base para a Regra Empírica da Amplitude e para a Regra Empírica Nos Exercícios 3740 ache a área indicada sob a curva da distribuição normal padrão convertaa em porcentagem e preencha os espaços em branco Os resultados formam a base para a regra empírica introduzida na Seção 33 37 Cerca de da área estão entre z 1 e z 1 ou a até 1 desviopadrão da média 38 Cerca de da área estão entre z 2 e z 2 ou a até 2 desviospadrão da média 39 Cerca de da área estão entre z 3 e z 3 ou a até 3 desviospadrão da média 40 Cerca de da área estão entre z 35 e z 35 ou a até 35 desviospadrão da média Achando Valores Críticos Nos Exercícios 4144 ache os valores indicados 41 z005 42 z001 43 z010 44 z002 Achando Probabilidades Nos Exercícios 4548 suponha que as leituras de termômetros sejam normalmente distribuídas com média de 0C e desviopadrão de 100C Ache a probabilidade indicada onde z é a leitura em graus 45 P196 z 196 46 Pz 1645 47 Pz 2575 ou z 2575 48 Pz 196 ou z 196 Achando Valores de Temperatura Nos Exercícios 4952 suponha que as leituras de termômetros sejam normalmente distribuídas com média de 0C e desviopadrão de 100C Um termômetro é selecionado aleatoriamente e testado Em cada caso faça um esboço e ache a leitura de temperatura correspondente à informação dada 49 Ache P95 o 95º percentil Esta é a leitura de temperatura que separa os 95 inferiores dos 5 superiores 50 Ache P1 o 1º percentil Esta é a leitura de temperatura que separa o 1 inferior dos 99 superiores 51 Se 25 dos termômetros são rejeitados por terem leituras muito altas e outros 25 são rejeitados por terem leituras muito baixas ache as duas leituras de temperatura de corte que separam os termômetros rejeitados dos demais 52 Se 05 dos termômetros são rejeitados por terem leituras muito altas e 05 são rejeitados por terem leituras muito baixas ache as duas leituras de temperatura de corte que separam os termômetros rejeitados dos demais 62 Além do Básico 53 Para uma distribuição normal padrão ache a porcentagem dos dados que estão a dentro de dois desviospadrão da média b a mais de 1 desviopadrão da média c a mais de 196 desviopadrão da média d entre μ 3σ e μ 3σ e a mais de três desviospadrão da média 54 Se uma distribuição uniforme contínua tem parâmetros μ 0 e σ 1 então o mínimo é 3 e o máximo é 3 a Para essa distribuição ache P1 x 1 b Ache P1 x 1 se você supuser incorretamente que a distribuição é normal em vez de uniforme c Compare os resultados das partes a e b A distribuição afeta muito os resultados 55 Suponha que escores z sejam normalmente distribuídos com média 0 e desviopadrão 1 a Se Pz a 09599 ache a b Se Pz b 09772 ache b c Se Pz c 00668 ache c d Se Pd z d 05878 ache d e Se Pe z e 00956 ache e 56 Em uma distribuição uniforme contínua μ mínimo máximo2 e σ amplitude12 Ache a média e o desviopadrão para a distribuição uniforme representada na Figura 62 63 Aplicações da Distribuição Normal Conceitochave Nesta seção introduzimos aplicações reais e importantes que envolvem distribuições normais não padronizadas estendendo os procedimentos apresentados na Seção 62 Usamos uma conversão simples Fórmula 62 que nos permite padronizar qualquer distribuição normal de modo que os métodos da seção precedente podem ser usados com distribuições normais com média diferente de 0 e desviopadrão diferente de 1 Especificamente dada alguma distribuição normal não padronizada devemos ser capazes de encontrar probabilidades correspondentes a valores da variável x e dado algum valor de probabilidade devemos ser capazes de encontrar o valor correspondente da variável x Para trabalhar com distribuições normais não padronizadas simplesmente padronize os valores para usar os mesmos procedimentos da Seção 62 Se convertermos valores para escores z padronizados usando a Fórmula 62 então os procedimentos para se trabalhar com distribuições normais serão os mesmos que aqueles usados para a distribuição normal padrão Fórmula 62 z x μ σ arredonde os escores z para 2 casas decimais Algumas calculadoras e alguns programas computacionais não requerem a conversão para escores z porque as probabilidades podem ser calculadas diretamente No entanto se você usar a Tabela A2 para encontrar probabilidades deverá primeiro converter os valores para escores z padronizados Independentemente do método usado é necessário que você entenda claramente o princípio básico anterior porque ele é uma base importante para conceitos introduzidos em capítulos posteriores A Figura 611 ilustra a conversão de uma distribuição normal não padronizada para uma distribuição normal padrão A área em qualquer distribuição normal limitada por algum escore x como na Figura 611a é igual à área limitada pelo escore z equivalente na distribuição normal padrão como na Fig 611b Isso significa que ao trabalhar com uma distribuição normal não padrão você pode usar a Tabela A2 da mesma forma vista na Seção 62 desde que você converta os valores para escores z Figura 611 Convertendo uma Distribuição Normal Não Padronizada para a Distribuição Normal Padrão Ao achar áreas com uma distribuição normal não padronizada use o seguinte procedimento 1 Esboce a curva normal marque a média e os valores específicos de x e então sombreie a região que representa a probabilidade desejada 2 Para cada valor relevante de x que representa um limite da região sombreada use a Fórmula 62 para converter o valor em seu escore z equivalente 3 Consulte a Tabela A2 ou use uma calculadora ou um programa para achar a área da região sombreada Essa área é a probabilidade desejada O exemplo a seguir aplica esses três passos e ilustra a relação entre uma distribuição normal não padronizada típica e a distribuição normal padrão Por que as Portas Têm Altura de 6 pés e 8 Polegadas Uma porta típica de casa tem uma altura de 6 pés e 8 polegadas ou 80 polegadas 2 metros Como os homens tendem a ser mais altos do que as mulheres consideraremos apenas os homens ao investigar as limitações para alturas de portaspadrão Dado que as alturas de homens são normalmente distribuídas com média de 690 polegadas 1725 m e desviopadrão de 28 polegadas 7 cm ache a porcentagem de homens que passarão por uma portapadrão sem se curvar e sem bater a cabeça Essa porcentagem é alta o bastante para que se continue a usar 80 polegadas como padrão de altura Uma altura de porta de 80 polegadas será suficiente nos próximos anos SOLUÇÃO Passo 1 Veja a Figura 612 que incorpora esta informação Os homens têm alturas que são distribuídas normalmente com uma média de 690 polegadas e um desviopadrão de 28 polegadas A região sombreada representa os homens que passam por portas de altura de 80 polegadas Figura 612 Alturas em polegadas de Homens Passo 2 Para usarmos a Tabela A2 primeiro usamos a Fórmula 62 para passar da distribuição não padronizada para a distribuição normal padrão A altura de 80 polegadas é convertida para um escore z da seguinte forma Passo 3 Consultando a Tabela A2 e usando z 393 encontramos que esse escore z está na categoria de 350 ou mais de modo que a área acumulada à esquerda de 80 polegadas é 09999 como mostrado na Figura 612 Se usarmos a tecnologia em vez da Tabela A2 obteremos uma área acumulada mais precisa de 0999957 em vez de 09999 INTERPRETAÇÃO A proporção de homens que podem passar pelas portas com alturapadrão de 80 polegadas é 09999 ou 9999 Muito poucos homens não poderão passar sem se abaixarem ou baterem a cabeça Essa porcentagem é alta o suficiente para justificar o uso de 80 polegadas como alturapadrão para portas No entanto as alturas de homens e de mulheres vêm aumentando gradual e continuamente nas últimas décadas de modo que haverá um tempo em que a alturapadrão de porta de 80 polegadas não será mais adequada EXEMPLO 2 Pesos ao Nascer Os pesos ao nascer nos Estados Unidos são distribuídos normalmente com média de 3420 g e desviopadrão de 495 g O Hospital Geral de Newport exige tratamento especial para bebês que nasçam com menos de 2450 g não usualmente leves ou mais de 4390 g não usualmente pesados Qual é a porcentagem de bebês que não requerem tratamento especial por terem pesos ao nascer entre 2450 g e 4390 g Sob essas condições muitos bebês precisam de cuidados especiais SOLUÇÃO A Figura 613 mostra a região sombreada que representa pesos ao nascer entre 2450 g e 4390 g Não podemos achar a área sombreada diretamente da Tabela A2 mas podemos achála indiretamente usando os procedimentos básicos apresentados na Seção 62 da seguinte forma 1 Ache a área acumulada à esquerda de 2450 2 ache a área acumulada à esquerda de 4390 3 ache a diferença entre essas áreas Ache a área acumulada à esquerda de 2450 Usando a Tabela A2 vemos que z 196 corresponde à área de 00250 como mostrado na Figura 613 Figura 613 Pesos ao Nascer Ache a área acumulada à esquerda de 4390 Usando a Tabela A2 vemos que z 196 corresponde à área de 09750 como mostrado na Figura 613 Achando a área entre 2450 e 4390 Área sombreada 09750 00250 09500 INTERPRETAÇÃO Expressando o resultado em porcentagem podemos concluir que 9500 dos bebês não exigem cuidados especiais por terem pesos entre 2450 g e 4390 g Segue que 500 dos bebês requerem tratamento especial por serem não usualmente leves ou pesados A taxa de 500 provavelmente não é muito alta para hospitais típicos Encontrando Valores a Partir de Áreas Conhecidas Apresentamos aqui sugestões úteis para aqueles casos em que a área ou probabilidade ou porcentagem é conhecida e devemos achar os valores relevantes 1 Não confunda escores z e áreas Lembre escores z são distâncias ao longo da escala horizontal mas áreas são regiões sob a curva normal A Tabela A2 mostra os escores z nas colunas à esquerda e na linha do topo mas as áreas são encontradas no corpo da tabela 2 Escolha o lado correto direitoesquerdo do gráfico Um valor que separa os 10 superiores dos demais valores está na parte direita do gráfico mas um valor que separa os 10 inferiores está localizado na parte esquerda do gráfico 3 Um escore z tem que ser negativo sempre que se localizar na metade esquerda da distribuição normal 4 Áreas ou probabilidades são valores positivos ou nulos mas nunca são negativos Gráficos são extremamente úteis na visualização na compreensão e no trabalho correto com distribuições de probabilidade normais de modo que você deve usálos sempre que possível Procedimento para Achar Valores Usando a Tabela A2 e a Fórmula 62 1 Esboce a curva da distribuição normal introduza a probabilidade ou porcentagem dada na região apropriada do gráfico e identifique os valores x de interesse 2 Use a Tabela A2 para achar o escore z correspondente à área acumulada à esquerda de x Consulte o corpo da Tabela A2 para achar a área mais próxima e em seguida identifique o escore z correspondente 3 Usando a Fórmula 62 introduza o valor de μ de σ e do escore z encontrado no Passo 2 e resolva em relação a x Com base na Fórmula 62 você pode resolvêla em relação a x como segue x μ z σ outra forma da Fórmula 62 Se z estiver localizado à esquerda da média certifiquese de que seja um número negativo 4 Consulte o esboço da curva para verificar se a solução faz sentido no contexto do gráfico e no contexto do problema O exemplo seguinte usa o procedimento acima esboçado SC EXEMPLO 3 Planejando Alturas de Portas No planejamento de um ambiente um critério comum é que se ajuste a 95 da população Qual a altura de uma porta se 95 dos homens devem passar por ela sem se abaixar e sem bater a cabeça Isto é ache o 95º percentil das alturas dos homens que são normalmente distribuídas com média de 690 polegadas e desviopadrão de 28 polegadas SOLUÇÃO Passo 1 A Figura 614 mostra a distribuição normal com a altura x que desejamos identificar A área sombreada representa 95 dos homens que passam pela porta que estamos planejando Passo 2 Na Tabela A2 procuramos uma área de 09500 no corpo da tabela A área de 0950 mostrada na Figura 614 é a área acumulada à esquerda e é exatamente o tipo de área listada na Tabela A2 A área de 0950 está entre as áreas da tabela de 09495 e 09505 mas há um asterisco e rodapé indicando que uma área de 0950 corresponde a z 1645 Passo 3 Com z 1645 μ 690 e σ 28 podemos resolver em relação a x usando a Fórmula 62 tornase Passo 4 A solução de x 736 polegadas arredondada na Figura 614 é razoável porque é maior do que a média de 690 polegadas INTERPRETAÇÃO Uma altura de porta de 736 polegadas ou 18694 cm permitiria que 95 dos homens passassem sem se curvar ou bater a cabeça Assim 5 dos homens não passariam por uma porta com altura de 736 polegadas Como muitos homens passam por portas com muita frequência essa taxa de 5 provavelmente não seria prática Figura 614 Determinando Altura Ganhando Várias Vezes na Loteria Evelyn Marie Adams ganhou na Loteria de Nova Jersey duas vezes em quatro meses Esse feliz acontecimento foi considerado pela mídia como uma incrível coincidência com uma chance de apenas 1 em 17 trilhões Mas os matemáticos Persi Diaconis e Frederick Mosteller de Harvard mostraram que há uma chance em 17 trilhões de que uma pessoa particular com um bilhete em cada um dos dois jogos da Loteria de Nova Jersey ganhe em ambos Todavia há cerca de 1 chance em 30 de que alguém nos Estados Unidos ganhe duas vezes em um período de quatro meses Diaconis e Mosteller analisaram coincidências e concluíram que com uma amostra suficientemente grande qualquer coisa pode acontecer Mais recentemente de acordo com o Detroit News Joe e Dolly Hornick ganharam na loteria da Pensilvânia quatro vezes em 12 anos com prêmios em dólares de 25 milhões 68000 206217 e 71037 EXEMPLO 4 Pesos ao Nascer O Hospital Geral de Newport deseja redefinir os pesos ao nascer mínimo e máximo que exigem tratamento especial por serem não usualmente baixos ou altos Depois de considerar fatores relevantes um comitê recomenda um tratamento especial para os 3 inferiores e os 1 superiores dos pesos ao nascer Os membros do comitê logo percebem que precisam determinar pesos ao nascer específicos Ajude o comitê a identificar os pesos ao nascer que separam os 3 inferiores e os 1 superior Os pesos ao nascer nos Estados Unidos são normalmente distribuídos com média de 3420 g e desviopadrão de 495 g SOLUÇÃO Passo 1 Iniciamos com o gráfico exibido na Figura 615 Introduzimos a média de 3420 g e identificamos os valores de x que separam os 3 inferiores e o 1 superior Passo 2 Se usarmos a Tabela A2 devemos usar áreas acumuladas à esquerda Para o valor mais à esquerda a área acumulada a partir da esquerda é 003 de modo que procure por uma área de 003 no corpo da tabela para obter z 188 que corresponde à área mais próxima de 00301 Para o valor de x mais à direita a área acumulada a partir da esquerda é 099 de modo que procure por uma área de 099 no corpo da tabela para obter z 233 que corresponde à área mais próxima de 09901 Passo 3 Agora resolvemos em relação aos dois valores de x usando a Fórmula 62 diretamente ou usando a seguinte versão da Fórmula 62 Valor de x mais à esquerda x μ z σ 3420 188 495 24894 Valor de x mais à direita x μ z σ 3420 233 495 457335 Passo 4 Consultando a Figura 615 vemos que o valor mais à esquerda x 24894 g é razoável porque é inferior à média de 3420 g Também o valor mais à direita x 457335 g é razoável porque está acima da média de 3420 g A tecnologia resulta nos valores de 24890 g e 45715 g Figura 615 Encontrando os Valores que Separam os 3 Inferiores e o 1 Superior INTERPRETAÇÃO O peso ao nascer de 2489 g arredondado separa os 3 inferiores dos pesos ao nascer e 4573 arredondado separa o 1 superior dos pesos ao nascer Agora o hospital tem critérios bem definidos para determinar se um bebê recémnascido deve receber tratamento especial relativo a um peso ao nascer não usualmente baixo ou alto Ao usar os métodos desta seção com aplicações que envolvem uma distribuição normal é importante determinar primeiro se você está procurando uma probabilidade ou área a partir de um valor conhecido de x ou se está procurando um valor de x a partir de uma probabilidade conhecida ou área A Figura 616 é um fluxograma que resume os principais procedimentos dessa seção Aplicações com Distribuições Normais Início O que deseja achar Achar uma probabilidade a partir de um valor conhecido de x Está usando tecnologia ou a Tabela A2 Tabela A2 Converta para a distribuição normal padronizada encontrando z z x μσ Procure z na Tabela A2 e encontre a área acumulada à esquerda de z Ache a probabilidade usando a tecnologia Identifique a área acumulada à esquerda de x Está usando tecnologia ou a Tabela A2 Tabela A2 Procure a área acumulada à esquerda na Tabela A2 e ache o escore z correspondente Resolva em relação a x x μ z σ Tecnologia Ache x diretamente pela tecnologia Tecnologia Figura 616 Procedimentos para Aplicações com Distribuições Normais UTILIZANDO A TECNOLOGIA Ao se trabalhar com uma distribuição normal não padronizada podese usar uma tecnologia para a determinação de áreas ou valores da variável relevante em lugar da Tabela A2 As instruções que seguem descrevem o uso da tecnologia em tais casos STATDISK Selecione Analysis Probability Distributions Normal Distribution Digite o escore z para achar a área correspondente ou digite a área acumulada à esquerda para achar o escore z Depois de digitado algum desses valores clique no botão Evaluate MINITAB Para achar a área acumulada à esquerda de um escore z como na Tabela A2 selecione Calc Probability Distributions Normal Cumulative probabilities Introduza a média e o desviopadrão a seguir clique no botão Input Constant e introduza o valor Para achar o escore z correspondente a uma área conhecida selecione Calc Probability Distributions Normal e então selecione Inverse cumulative probabilities Introduza a média e o desviopadrão Selecione a opção Input constant e introduza a área total à esquerda do valor dado EXCEL Para achar a área acumulada à esquerda de um valor como na Tabela A2 clique em fx a seguir selecione Estatística e DISTNORM No Excel 2010 selecione DISTNORMN Na caixa de diálogo introduza o valor de x introduza a média e o desviopadrão e introduza 1 no espaço para cumulativa Para achar o valor correspondente a uma área conhecida clique em fx a seguir selecione Estatística e INVNORM ou INVNORMN no Excel 2010 e faça as entradas na caixa de diálogo Ao fornecer o valor da probabilidade introduza a área total à esquerda do valor dado Veja a apresentação do Excel para o Exemplo 3 EXCEL TI8384 PLUS Para achar a área entre dois valores pressione 2nd VARS 2 para normalcdf e então prossiga para introduzir os dois valores a média e o desviopadrão todos separados por uma vírgula como em valor esquerdo valor direito média desviopadrão Sugestão Se não houver um valor esquerdo introduza 999999 como valor esquerdo e se não houver valor direito introduza 999999 como valor direito No Exemplo 1 desejamos a área à esquerda de x 80 polegadas de modo que use o comando normalcdf999999 80 690 28 como mostrado na apresentação que segue TI8384 PLUS Para achar um valor correspondente a uma área conhecida selecione 2nd VARS selecione invNorm e prossiga para introduzir a área total à esquerda do valor a média e o desviopadrão no formato área total à esquerda média desviopadrão com as vírgulas incluídas TI8384 PLUS normalcdf99999 98069028 9999572562 14 Habilidades e Conceitos Básicos Letramento Estatístico e Pensamento Crítico 1 Distribuições Normais Qual é a diferença entre uma distribuição normal padrão e uma distribuição normal não padronizada 2 Escores de QI A distribuição dos escores de QI é uma distribuição normal não padronizada com média 100 e desviopadrão 15 e desenhase um gráfico em forma de sino para representar essa distribuição a Qual é a área sob a curva b Qual é o valor da mediana c Qual é o valor da moda 3 Distribuições Normais A distribuição dos escores de QI é uma distribuição normal não padronizada com média 100 e desviopadrão 15 Quais são os valores da média e do desviopadrão depois que todos os escores de QI são padronizados com o uso de z x μσ 4 Dígitos Aleatórios Em geral usamse computadores para gerarem dígitos aleatórios de números de telefone a serem usados em sondagens Os métodos desta seção podem ser usados para se achar a probabilidade de que quando um dígito é gerado ele seja menor do que 5 Por que sim ou por que não Qual é a probabilidade de se obter um dígito menor do que 5 Escores de QI Nos Exercícios 58 ache a área da região sombreada O gráfico representa os escores de QI de adultos e esses escores são normalmente distribuídos com média 100 e desviopadrão 15 como no teste Wechsler 5 6 120 80 7 8 90 115 75 110 Escores de QI Nos Exercícios 912 ache o escore de QI indicado O gráfico representa os escores de QI de adultos e esses escores são normalmente distribuídos com média 100 e desviopadrão 15 como no teste Wechsler 9 10 06 08 x x 11 12 095 099 x Escores de QI Nos Exercícios 1320 suponha que os adultos tenham escores de QI normalmente distribuídos com média 100 e desviopadrão 15 como no teste de Wechsler Sugestão Faça um gráfico em cada caso 13 Ache a probabilidade de que um adulto selecionado aleatoriamente tenha um QI menor do que 115 14 Ache a probabilidade de que um adulto selecionado aleatoriamente tenha um QI maior do que 1315 que é a exigência para ser membro da sociedade Mensa 15 Ache a probabilidade de que um adulto selecionado aleatoriamente tenha um QI entre 90 e 110 considerado como a faixa normal 16 Ache a probabilidade de que um adulto selecionado aleatoriamente tenha um QI entre 110 e 120 considerado como a faixa normal brilhante 17 Ache P30 que é o escore de QI que separa os 30 inferiores dos 70 superiores 18 Ache o primeiro quartil Q1 que é o escore de QI que separa os 25 inferiores dos 75 superiores 19 Ache o terceiro quartil Q3 que é o escore de QI que separa os 25 superiores dos demais 20 Ache o escore de QI que separa os 37 superiores dos demais Nos Exercícios 2126 use as seguintes informações baseadas em dados da Pesquisa Nacional de Saúde As alturas de homens são normalmente distribuídas com média de 690 polegadas e desviopadrão de 28 polegadas As alturas de mulheres são normalmente distribuídas com média de 636 polegadas e desviopadrão de 25 polegadas 21 Altura de Porta O monotrilho Mark VI usado na Disney World e o avião comercial Boeing 757200 ER têm portas com altura de 72 polegadas a Qual é a porcentagem de homens adultos que podem passar por essas portas sem se curvar b Qual é a porcentagem de mulheres adultas que podem passar por essas portas sem se curvar c O projeto de porta com 72 polegadas de altura parece ser adequado Explique d Qual altura de porta permitiria que 98 dos homens adultos passassem sem se curvar 22 Altura de Porta O Gulfstream 100 é um jato executivo de seis lugares que tem uma porta de 516 polegadas de altura a Qual é a porcentagem de homens adultos que podem passar por essa porta sem se curvar b Qual é a porcentagem de mulheres adultas que podem passar por essa porta sem se curvar c O projeto de porta com 516 polegadas de altura parece ser adequado Por que os engenheiros não projetaram uma porta maior d Qual altura de porta permitiria que 60 dos homens adultos passassem sem se curvar 23 Tall Clubs International O Tall Clubs International é uma organização social para pessoas altas Ele exige que os homens tenham no mínimo 74 polegadas 18796 cm de altura e as mulheres no mínimo 70 polegadas 17780 cm de altura a Qual porcentagem de homens satisfaz tal exigência b Qual porcentagem de mulheres satisfaz tal exigência c As exigências para homens e mulheres são razoáveis Por que sim ou por que não 24 Tall Clubs International O Tall Clubs International tem exigências de alturas mínimas para homens e mulheres a Se essas exigências são alteradas de modo que os 4 dos homens mais altos é que sejam aceitos qual será a nova altura mínima para homens b Se essas exigências são alteradas de modo que os 4 das mulheres mais altas é que sejam aceitas qual será a nova altura mínima para mulheres 25 Exigência de Altura para Mulheres nas Forças Armadas Americanas As Forças Armadas Americanas exigem que as mulheres tenham alturas entre 58 e 80 polegadas 14732 e 20320 cm a Ache a porcentagem de mulheres que satisfaçam essa exigência Muitas mulheres estão perdendo a oportunidade de entrar para as Forças Armadas por serem muito baixas ou muito altas b Se as Forças Armadas mudam as exigências de altura de modo que todas as mulheres possam entrar exceto o 1 das mulheres mais baixas e os 2 das mulheres mais altas quais seriam as novas exigências de altura 26 Exigência de Altura para Homens na Marinha Americana A Marinha Americana exige que os homens tenham alturas entre 64 e 80 polegadas 16256 e 20320 cm a Ache a porcentagem de homens que satisfaçam as exigências de altura Muitos homens estão perdendo a oportunidade de se tornarem membros da Marinha Americana por não satisfazerem as exigências de altura b Se as exigências de altura são alteradas de modo que todos os homens possam entrar exceto os 3 mais baixos e os 4 mais altos quais seriam as novas exigências de altura 27 Pesos ao Nascer Na Noruega os pesos ao nascer são normalmente distribuídos com uma média de 3570 g e um desviopadrão de 500 g a Se o Hospital Universitário Ulleval em Oslo exige tratamento especial para bebês com pesos ao nascer inferiores a 2700 g qual é a porcentagem de bebês recémnascidos que exigirão tratamento especial b Se os diretores do Hospital Universitário Ulleval planejam pedir tratamento especial para os 3 mais leves dos bebês nascidos qual peso ao nascer separa os que exigem tratamento especial dos que não exigem c Por que não é prático para o hospital estabelecer que os bebês que exigem tratamento especial são os dos 3 inferiores dos pesos ao nascer 28 Pesos de Passageiros de Táxis Aquáticos No Problema do Capítulo vimos que quando um táxi aquático afundou no porto interno de Baltimore uma investigação revelou que a carga segura de passageiros para o táxi aquático era de 3500 libras 15876 kg Vimos também que se supunha que o peso médio dos passageiros fosse de 140 libras Suponha o cenário do pior caso no qual todos os passageiros são homens adultos Isso poderia facilmente ocorrer em uma cidade que recebe convenções nas quais pessoas do mesmo gênero frequentemente viajam em grupos Com base nos dados da National Health and Nutrition Examination Survey suponha que os pesos dos homens sejam normalmente distribuídos com média de 172 libras e desviopadrão de 29 libras a Se um homem é selecionado aleatoriamente ache a probabilidade de que ele pese menos do que 174 libras o novo valor sugerido pelo Conselho Nacional de Transporte e Segurança b Com um limite de carga de 3500 libras quantos passageiros homens poderão embarcar se admitirmos um peso médio de 140 libras c Com um limite de carga de 3500 libras quantos passageiros homens poderão embarcar se usarmos o novo peso médio de 174 libras d Por que é necessário que periodicamente seja revisto e alterado o número de passageiros permitidos em um barco 29 Temperaturas do Corpo Com base nos resultados amostrais do Conjunto de Dados 2 do Apêndice B suponha que as temperaturas do corpo humano sejam distribuídas normalmente com média de 9820F e desviopadrão de 062F a O Hospital Bellevue na Cidade de Nova York usa 1006F como a menor temperatura considerada como febre Qual é a porcentagem de pessoas normais e saudáveis que seriam consideradas febris Tal porcentagem sugere que o corte de 1006F seja apropriado b Os médicos desejam selecionar uma temperatura mínima para a requisição de exames médicos adicionais Qual deve ser essa temperatura se eles desejam que somente 5 das pessoas saudáveis tenham temperatura superior Tal resultado é chamado um falsopositivo o que significa que o resultado do teste deu positivo mas a pessoa não está realmente doente 30 Largura de Assentos de Aeronaves Os engenheiros desejam projetar assentos em aviões comerciais de modo que sejam largos o bastante para acomodarem 99 de todos os homens Acomodar 100 dos homens exigiria assentos muito largos que seriam muito caros Os homens têm larguras de quadris que são normalmente distribuídas com uma média de 144 polegadas e um desviopadrão de 10 polegada com base em dados da sondagem antropométrica de Gordon Clauser et al Ache P99 Isto é ache a largura de quadril que separa os 99 menores do 1 maior 31 Tempos de Gravidez Os tempos de gravidez são normalmente distribuídos com média de 268 dias e desviopadrão de 15 dias a Um uso clássico da distribuição normal é inspirado em uma carta para Dear Abby na qual uma mulher afirmava ter dado à luz 308 dias depois da visita de seu marido que estava em serviço na Marinha Dada essa informação ache a probabilidade de uma gravidez durar 308 dias ou mais O que esse resultado sugere b Se um bebê é classificado como prematuro no caso de a duração da gravidez estar dentro dos 4 tempos inferiores ache o tempo de gravidez que separa os bebês prematuros dos demais Bebês prematuros em geral requerem tratamentos especiais e esse resultado pode ser útil para os administradores de hospitais no planejamento de tais cuidados 32 Distância de Assento Uma exigência comum é de que um item tal como um assento de avião ou de teatro se ajuste a pessoas na faixa entre o 5º percentil para mulheres e o 95º percentil para homens Se essa exigência é adotada quais são as distâncias mínima e máxima de assento Para a distância de assento use o comprimento das nádegas ao joelho Os homens têm esses comprimentos distribuídos normalmente com média de 235 polegadas e desviopadrão de 11 polegada As mulheres têm esses comprimentos distribuídos normalmente com média de 227 polegadas e desviopadrão de 10 polegada Grandes Conjuntos de Dados Nos Exercícios 33 e 34 consulte os conjuntos de dados no Apêndice B e use programas de computador ou uma calculadora 33 Conjunto de Dados do Apêndice B Pressão Sanguínea Sistólica Consulte o Conjunto de Dados 1 no Apêndice B e use os níveis de pressão sanguínea sistólica para homens a Usando os níveis de pressão sanguínea sistólica para homens ache a média e o desviopadrão e verifique que os dados têm uma distribuição que é aproximadamente normal b Supondo que os níveis de pressão sanguínea sistólica de homens sejam normalmente distribuídos ache o 5º e o 95º percentis Considere as estatísticas da parte a como se fossem parâmetros populacionais Tais percentis podem ser úteis para os médicos ao determinarem se níveis de pressão sanguínea sistólica são muito baixos ou muito altos 34 Conjunto de Dados do Apêndice B Tempos de Voos de Ônibus Espacial Consulte o Conjunto de Dados 10 no Apêndice B e use os tempos horas dos voos do ônibus espacial da NASA a Ache a média e o desviopadrão e verifique que os dados têm uma distribuição que é aproximadamente normal b Considere as estatísticas da parte a como se fossem parâmetros populacionais e suponha uma distribuição normal para encontrar os valores dos quartis Q1 Q2 e Q3 63 Além do Básico 35 Unidades de Medida Alturas de mulheres são normalmente distribuídas a Se as alturas de mulheres individuais são expressas em centímetros quais são as unidades usadas para os escores z correspondentes a alturas individuais b Se as alturas de todas as mulheres são convertidas para escores z quais são a média o desviopadrão e a distribuição desses escores z 36 Usando a Correção de Continuidade Há muitas situações em que uma distribuição normal pode ser usada como uma boa aproximação para uma variável aleatória que assume apenas valores discretos Em tais casos podemos usar a correção de continuidade Represente cada número inteiro por um intervalo que se estende de 05 abaixo do número até 05 acima dele Suponha que os escores de QI sejam números inteiros que tenham uma distribuição aproximadamente normal com média de 100 e desviopadrão de 15 a Sem usar a correção de continuidade ache a probabilidade de que uma pessoa selecionada aleatoriamente tenha um escore de QI maior que 103 b Usando a correção de continuidade ache a probabilidade de que uma pessoa selecionada aleatoriamente tenha um escore de QI maior que 103 c Compare os resultados das partes a e b 37 Ajustando Escores de Teste Uma professora de estatística dá um teste e verifica que os escores são normalmente distribuídos com média de 25 e desviopadrão de 5 Ela planeja ajustar os escores a Se ela ajusta as notas adicionando 50 a cada uma qual é a nova média Qual é o novo desviopadrão b É razoável o ajuste pela adição de 50 a cada nota Por que sim ou por que não c Se as notas são ajustadas com o esquema seguinte em vez da adição de 50 ache os limites numéricos para cada conceito A 10 superiores B Escores acima dos 70 inferiores e abaixo dos 10 superiores C Escores acima dos 30 inferiores e abaixo dos 30 superiores D Escores acima dos 10 inferiores e abaixo dos 70 superiores E 10 inferiores d Qual método de ajuste de notas é mais justo a adição de 50 a cada nota ou o uso do esquema dado na parte c Explique 38 Testes SAT e ACT Os escores no teste SAT são normalmente distribuídos com média de 1518 e desviopadrão de 325 Os escores no teste ACT são normalmente distribuídos com média de 211 e desviopadrão de 48 Suponha que os dois testes usem diferentes escalas para medir a mesma aptidão a Se alguém obtém um escore SAT que é o 67º percentil ache seu escore SAT efetivo e o escore ACT equivalente b Se alguém obtém o escore 1900 no SAT ache o escore ACT equivalente 39 Outliers Valores Atípicos Para a construção de diagramas em caixa como descrito na Seção 34 os valores atípicos foram definidos como valores de dados que estão acima de Q3 por uma quantidade maior do que 15 AIQ ou abaixo de Q1 por uma quantidade maior do que 15 AIQ em que AIQ é a amplitude interquartil Usando essa definição de outlier ache a probabilidade de que um valor selecionado aleatoriamente de uma distribuição normal seja um outlier 64 Distribuições Amostrais e Estimadores Conceitochave Nesta seção consideraremos o conceito de uma distribuição amostral de uma estatística Aprenderemos também algumas propriedades importantes das distribuições amostrais da média da mediana da variância do desviopadrão da amplitude e da proporção Veremos que algumas estatísticas tais como a média a variância e a proporção são estimadores não viesados dos parâmetros populacionais enquanto outras estatísticas tais como a mediana e a amplitude não o são Os capítulos que seguem introduzem métodos para o uso das estatísticas amostrais para a estimação de valores de parâmetros populacionais Esses procedimentos se baseiam na compreensão de como se comportam as estatísticas amostrais e tal comportamento é o foco desta seção Começamos com a definição de distribuição amostral de uma estatística DEFINIÇÃO A distribuição amostral de uma estatística tal como a média amostral ou a proporção amostral é a distribuição de todos os valores da estatística quando são extraídas da mesma população todas as amostras possíveis de mesmo tamanho n A distribuição amostral é tipicamente representada como uma distribuição de probabilidade no formato de uma tabela histograma de probabilidade ou fórmula Distribuição Amostral da Média A definição precedente é geral de modo que vamos considerar especificamente a distribuição amostral da média DEFINIÇÃO A distribuição amostral da média é a distribuição das médias amostrais com todas as amostras de mesmo tamanho n extraídas da mesma população A distribuição amostral da média é tipicamente representada como uma distribuição de probabilidade no formato de uma tabela histograma de probabilidade ou fórmula EXEMPLO 1 Distribuição Amostral da Média Considere a repetição deste processo Jogue um dado 5 vezes e ache a média 𝑥 dos resultados Veja a Tabela 62 a seguir O que você sabe sobre o comportamento de todas as médias amostrais que são geradas à medida que esse processo continua indefinidamente Meninos ou Meninas Dominam em uma Família O autor deste livro seus irmãos e os filhos de seus irmãos são ao todo 11 homens e apenas uma mulher Este é um exemplo de um fenômeno pelo qual um gênero domina em uma família Esse problema foi estudado examinandose uma amostra aleatória de 8770 famílias nos Estados Unidos Os resultados foram publicados na revista Chance no artigo Does Having Boys or Girls Run in the Families de Joseph Rodgers e Debby Doughty Parte da análise que fizeram envolve o uso da distribuição de probabilidade binomial A conclusão deles é a de que Não encontramos evidência forte de que a tendência para um gênero domine em uma família SOLUÇÃO A porção superior da Tabela 62 ilustra um processo de jogada de um dado 5 vezes e cálculo da média dos resultados A Tabela 62 mostra resultados da repetição desse processo 10000 vezes mas a verdadeira distribuição amostral da média envolve a repetição do processo indefinidamente Como os valores de 1 2 3 4 5 6 são todos igualmente prováveis a população tem uma média de μ 35 e a Tabela 62 mostra que as 10000 médias amostrais têm uma média de 349 Se o processo continuasse indefinidamente a média das médias amostrais seria 35 Além disso a Tabela 62 mostra que a distribuição das médias amostrais é aproximadamente uma distribuição normal INTERPRETAÇÃO Com base nos resultados amostrais reais mostrados no topo da Tabela 62 podemos descrever a distribuição amostral da média pelo histograma no topo da Tabela 62 A distribuição amostral real seria descrita por um histograma com base em todas as possíveis amostras e não apenas nas 10000 amostras incluídas no histograma mas o número de tentativas é grande o bastante para sugerir que a verdadeira distribuição amostral das médias seja uma distribuição normal Os resultados do Exemplo 1 nos permitem observar estas duas importantes propriedades da distribuição amostral da média 1 As médias amostrais tendem para o valor da média populacional Isto é a média das médias amostrais é a média populacional O valor esperado da média amostral é igual à média populacional 2 A distribuição das médias amostrais tende a ser uma distribuição normal Isso será discutido mais profundamente na seção que segue mas a distribuição tende a se tornar próxima de uma distribuição normal à medida que o tamanho amostral aumenta Distribuição Amostral da Variância Tendo discutido a distribuição amostral da média vamos agora considerar a distribuição amostral da variância DEFINIÇÃO A distribuição amostral da variância é a distribuição das variâncias amostrais com todas as amostras de mesmo tamanho n extraídas da mesma população A distribuição amostral da variância é tipicamente representada como uma distribuição de probabilidade no formato de uma tabela histograma de probabilidade ou fórmula Atenção Ao trabalhar com desviospadrão ou variâncias populacionais certifiquese de calculálos corretamente Relembre da Seção 33 que os cálculos para desviospadrão ou variâncias populacionais envolvem divisão por N não por n 1 como mostrado a seguir Desviopadrão populacional σ Σx μ² N Variância populacional σ² Σx μ² N Como os cálculos são normalmente realizados por um programa de computador ou calculadora tenha cuidado em distinguir entre o desviopadrão de uma amostra e o desviopadrão de uma população Também tenha cuidado em distinguir entre a variância de uma amostra e a variância de uma população Tabela 62 Resultados Específicos para 10000 Tentativas Médias Procedimento Amostral Jogue um dado 5 vezes e encontre a média x População μ 35 Médias Amostrais x Amostra 1 34 Amostra 2 44 Amostra 3 28 Média 349 Aproximadamente normal Variâncias Procedimento Amostral Jogue um dado 5 vezes e ache a variância s² População σ² 29 Variâncias Amostrais s² Amostra 1 18 Amostra 2 23 Amostra 3 22 Média 288 Assimétrica Proporções Procedimento Amostral Jogue um dado 5 vezes e ache a proporção de números ímpares População P 05 Proporções Amostrais Amostra 1 02 Amostra 2 04 Amostra 3 08 Média 050 Aproximadamente normal EXEMPLO 2 Distribuição Amostral da Variância Considere a repetição deste processo Jogue um dado 5 vezes e ache a variância s² dos resultados O que você sabe sobre o comportamento de todas as variâncias amostrais que são geradas à medida que esse processo continua indefinidamente SOLUÇÃO A porção média da Tabela 62 ilustra um processo da jogada de um dado 5 vezes e do cálculo da variância dos resultados A Tabela 62 mostra os resultados da repetição desse processo 10000 vezes mas a verdadeira distribuição amostral da variância envolve a repetição do processo indefinidamente Como os valores de 1 2 3 4 5 6 são todos igualmente prováveis a população tem variância de σ² 29 e a Tabela 62 mostra que as variâncias amostrais têm uma média de 288 Se o processo continuasse indefinidamente a média das variâncias amostrais seria 29 Além disso a parte média da Tabela 62 mostra que a distribuição das variâncias amostrais é uma distribuição assimétrica INTERPRETAÇÃO Com base nos resultados amostrais reais mostrados na parte média da Tabela 62 podemos descrever a distribuição amostral da variância pelo histograma do meio da Tabela 62 A distribuição amostral real seria descrita por um histograma com base em todas as possíveis amostras não apenas nas 10000 amostras incluídas no histograma mas o número de tentativas é grande o bastante para sugerir que a distribuição amostral das variâncias é uma distribuição assimétrica à direita Os resultados do Exemplo 2 nos permitem observar estas duas importantes propriedades da distribuição amostral da variância 1 A variância amostral tende para o valor da variância populacional Isto é a média das variâncias amostrais é a variância populacional O valor esperado da variância amostral é igual à variância populacional 2 A distribuição amostral das variâncias tende a ser uma distribuição assimétrica à direita Distribuição Amostral da Proporção Consideramos agora a distribuição amostral da proporção DEFINIÇÃO A distribuição amostral da proporção é a distribuição das proporções amostrais com todas as amostras de mesmo tamanho n extraídas da mesma população Precisamos fazer a distinção entre uma proporção populacional p e alguma proporção amostral Para isso a seguinte notação é comumente usada Notação para Proporções p proporção populacional p proporção amostral EXEMPLO 3 Distribuição Amostral da Proporção Considere a repetição deste processo Jogue um dado 5 vezes e ache a proporção de números ímpares O que você sabe sobre o comportamento de todas as proporções amostrais geradas à medida que esse processo continua indefinidamente SOLUÇÃO A porção inferior da Tabela 62 ilustra um processo da jogada de um dado 5 vezes e do cálculo da proporção de números ímpares A Tabela 62 mostra os resultados da repetição desse processo 10000 vezes mas a verdadeira distribuição amostral da proporção envolve a repetição do processo indefinidamente Como os valores de 1 2 3 4 5 6 são todos igualmente prováveis a proporção de números ímpares na população é 05 e a Tabela 62 mostra que 10000 proporções amostrais têm uma média de 050 Se o processo continuasse indefinidamente a média das proporções amostrais seria 05 Além disso a parte inferior da Tabela 62 mostra que a distribuição das proporções amostrais é uma distribuição aproximadamente normal INTERPRETAÇÃO Com base nos resultados reais na parte inferior da Tabela 62 podemos descrever a distribuição amostral da proporção pelo histograma da parte inferior da Tabela 62 A distribuição amostral real da proporção seria descrita por um histograma com base em todas as possíveis amostras não apenas nas 10000 amostras incluídas no histograma mas o número de tentativas é grande o suficiente para sugerir que a verdadeira distribuição amostral das proporções seja uma distribuição normal Os resultados do Exemplo 3 nos permitem observar estas duas importantes propriedades da distribuição amostral da proporção 1 A proporção amostral tende para o valor da proporção populacional Isto é a média das proporções amostrais é a proporção populacional O valor esperado da proporção amostral é igual à proporção populacional 2 A distribuição das proporções amostrais tende a ser uma distribuição normal Os três exemplos precedentes se baseiam em 10000 tentativas e os resultados estão resumidos na Tabela 62 A Tabela 63 descreve o comportamento geral das distribuições amostrais da média da variância e da proporção supondo que certas condições sejam satisfeitas Por exemplo a Tabela 63 mostra que a distribuição amostral da média tende a ser uma distribuição normal mas a seção que segue descreve condições que devem ser satisfeitas antes de podermos admitir que a distribuição seja normal Tabela 63 Comportamento Geral de Distribuições Amostrais Médias Médias Amostrais Procedimento Amostral Selecione aleatoriamente n valores e ache a média População Média é Amostra 1 Amostra 2 Amostra 3 Medida de Centro Média Normal Média Variâncias Variâncias Amostrais Procedimento Amostral Selecione aleatoriamente n valores e ache a variância População Variância é Amostra Amostra Amostra Medida de Centro Média Assimétrica Variâncias Amostrais Proporções Proporções Amostrais Procedimento Amostral Selecione aleatoriamente n valores e ache a proporção amostral População Proporção é Amostra 1 Amostra 2 Amostra 3 Medida de Centro Média Normal Proporções Amostrais Capítulo 6 Estimadores Não Viesados Os três exemplos precedentes mostram que as médias variâncias e proporções amostrais tendem para os correspondentes parâmetros populacionais Mais formalmente dizemos que as médias as variâncias e as proporções amostrais são estimadores não viesados Isto é suas distribuições amostrais têm uma média que é igual ao parâmetro populacional correspondente Se desejamos usar uma estatística amostral como a proporção amostral de uma pesquisa para estimar um parâmetro populacional como a proporção populacional é importante que a estatística amostral usada como estimador tenda para o parâmetro populacional em vez de ser um estimado enviesado no sentido de que sistematicamente subestima ou superestima o parâmetro Os três exemplos precedentes e a Tabela 62 envolvem a média a variância e a proporção mas eis um resumo que envolve outras estatísticas Estimadores Não Viesados e Viesados Estimadores Não Viesados As estatísticas seguintes são estimadores não viesados Isto é elas tendem para o valor do parâmetro populacional Média Variância Proporção Estimadores Viesados As estatísticas seguintes são estimadores viesados Isto é elas não tendem para o valor do parâmetro populacional Mediana Amplitude Desviopadrão Nota Importante Os desviospadrão amostrais não tendem para o desviopadrão populacional mas o viés é relativamente pequeno em grandes amostras de modo que s é em geral usado para estimar embora s seja um estimador viesado de σ Os três exemplos precedentes envolveram a jogada de um dado 5 vezes de modo que o número de diferentes amostras possíveis é 6 x 6 x 6 x 6 x 6 7776 Como há 7776 diferentes amostras possíveis não é prática a listagem manual de todas elas O exemplo que segue envolve um número menor de amostras diferentes possíveis de modo que poderemos listálas e descrever a distribuição amostral da amplitude no formato de uma tabela para a distribuição de probabilidade EXEMPLO 4 Distribuição Amostral da Amplitude Três famílias selecionadas aleatoriamente são entrevistadas em um projeto piloto para uma pesquisa maior a ser realizada posteriormente Os números de pessoas nas famílias são 2 3 e 10 com base no Conjunto de Dados 22 no Apêndice B Considere os valores de 2 3 e 10 como uma população Suponha que amostras de tamanho n 2 sejam selecionadas aleatoriamente com reposição da população de 2 3 e 10 a Liste todas as diferentes amostras possíveis e ache a amplitude de cada amostra b Descreva a distribuição amostral das amplitudes no formato de uma tabela que resume a distribuição de probabilidade c Descreva a distribuição amostral das amplitudes no formato de um histograma de probabilidade d Com base nos resultados as amplitudes amostrais tendem para a amplitude populacional que é 10 2 8 e O que esses resultados indicam sobre a amplitude amostral como um estimador da amplitude populacional SOLUÇÃO a Na Tabela 64 listamos as nove diferentes amostras possíveis de tamanho n 2 selecionadas com reposição da população de 2 3 e 10 A Tabela 64 também mostra a amplitude para cada uma das nove amostras b As nove amostras na Tabela 64 são todas igualmente prováveis de modo que cada uma tem probabilidade 19 As duas últimas colunas da Tabela 64 listam os valores da amplitude junto com as probabilidades correspondentes de modo que as duas últimas colunas constituem uma tabela que resume a distribuição de probabilidade que pode ser condensada conforme mostrado na Tabela 65 Portanto a Tabela 65 descreve a distribuição amostral das amplitudes amostrais c A Figura 617 é o histograma de probabilidade com base na Tabela 65 d A média das nove amplitudes amostrais é 36 mas a amplitude da população é 8 Consequentemente as amplitudes amostrais não tendem para a amplitude populacional e Como a média das amplitudes amostrais 36 não é igual à amplitude populacional 8 a amplitude amostral é um estimador viesado da amplitude populacional Isso pode ser visto também pelo simples exame da Tabela 65 notando que na maior parte das vezes a amplitude amostral está bem abaixo da amplitude populacional de 8 Tabela 64 Distribuição Amostral da Amplitude Amostra Amplitude Amostral Probabilidade 2 2 0 19 2 3 1 19 2 10 8 19 3 2 1 19 3 3 0 19 3 10 7 19 10 2 8 19 10 3 7 19 10 10 0 19 Média das amplitudes amostrais 36 arredondada Tabela 65 Distribuição de Probabilidade para a Amplitude Amplitude Amostral Probabilidade 0 39 1 29 7 29 8 29 Figura 617 Histograma de Probabilidade Distribuição Amostral das Amplitudes Amostrais INTERPRETAÇÃO Neste exemplo concluímos que a amplitude amostral é um estimador viesado da amplitude populacional Isso implica que em geral a amplitude amostral não deve ser usada para se estimar o valor da amplitude populacional 232 Capítulo 6 EXEMPLO 5 Distribuição Amostral da Proporção Em estudo de métodos de seleção de gênero um analista considera o processo de geração de 2 nascimentos Quando se selecionam aleatoriamente 2 nascimentos o espaço amostral é mm mf fm ff Esses 4 resultados são igualmente prováveis de modo que a probabilidade de 0 menina é 025 a probabilidade de 1 menina é 05 e a probabilidade de 2 meninas é 025 Descreva a distribuição amostral da proporção de meninas em dois nascimentos como uma distribuição de probabilidade e também como um histograma de probabilidade SOLUÇÃO Veja a apresentação que segue A tabela do topo resume a distribuição de probabilidade para o número de meninas em 2 nascimentos Essa tabela pode ser usada para a construção da distribuição de probabilidade para a proporção de meninas em 2 nascimentos como mostrado Essa mesma tabela também pode ser usada para a construção do histograma de probabilidade como se mostra Número de Meninas em 2 Nascimentos x Px 0 025 1 050 2 025 Distribuição amostral da proporção de meninas em 2 nascimentos Tabela Histograma de probabilidade Proporção de meninas em 2 nascimentos Probabilidade 0 05 1 025 050 025 O Exemplo 5 mostra que uma distribuição amostral pode ser descrita com uma tabela ou um gráfico Distribuições amostrais podem também ser descritas por uma fórmula como no Exercício 21 ou podem ser descritas de algum outra maneira tal como A distribuição amostral da média amostral é uma distribuição normal com μ 100 e σ 15 Por que amostrar com reposição Todos os exemplos nesta seção envolveram amostragem com reposição Amostragem sem reposição teria a vantagem muito prática de evitar duplicação Distribuição de Probabilidade Normal 233 desnecessária sempre que o mesmo item fosse selecionado mais de uma vez No entanto estamos particularmente interessados em amostragem com reposição por essas duas razões 1 Ao se selecionar uma amostra relativamente pequena de uma grande população não faz diferença significativa se amostramos com ou sem reposição 2 A amostragem com reposição resulta em eventos independentes que não são afetados pelos resultados anteriores e eventos independentes são mais fáceis de serem analisados e resultam em cálculos e fórmulas mais simples Pelas razões anteriores nos concentramos no comportamento de amostras que são selecionadas aleatoriamente com reposição Muitos dos procedimentos estatísticos discutidos nos capítulos seguintes se baseiam na suposição de que a amostragem tenha sido feita com reposição O pontochave desta seção é a introdução do conceito da distribuição amostral de uma estatística Considere a tentativa de se obter a temperatura corporal média de todos os adultos Como essa população é muito grande não é prático medirse a temperatura de cada adulto Em vez disso obtemos uma amostra de temperaturas corporais e a usamos para obter uma estimativa da média populacional O Conjunto de Dados 2 no Apêndice B inclui uma amostra de 106 temperaturas corporais A média para essa amostra é x 9820F As conclusões a que podemos chegar sobre a temperatura média populacional de todos os adultos exigem que compreendamos o comportamento da distribuição amostral de todas tais médias amostrais Embora não seja prático obterse cada amostra possível e termos apenas uma amostra podemos chegar a algumas conclusões significativas sobre a população de todas as temperaturas corporais Um objetivo principal das seções e capítulos que seguem é aprendermos como usar efetivamente uma amostra para tirar conclusões sobre uma população Na Seção 65 consideramos mais detalhes sobre a distribuição amostral de médias amostrais e na Seção 66 consideramos mais detalhes sobre a distribuição amostral de proporções amostrais ATENÇÃO Muitos métodos de estatística requerem uma amostra aleatória simples Algumas amostras tais como amostras de resposta voluntária ou amostras de conveniência poderiam facilmente apresentar resultados muito errados 64 Habilidades e Conceitos Básicos Letramento Estatístico e Pensamento Crítico 1 Distribuição Amostral Com suas próprias palavras descreva uma distribuição amostral 2 Distribuição Amostral O Conjunto de Dados 24 no Apêndice B inclui uma amostra de escores de classificação de crédito FICO de consumidores selecionados aleatoriamente Se examinarmos essa amostra através da construção de um histograma e encontrarmos a média e o desviopadrão amostrais estaremos examinando a distribuição amostral da média Por que sim ou por que não 3 Estimador Não Viesado O que significa dizermos que a média amostral é um estimador não viesado da média populacional ou que a média amostral tende para a média populacional 4 Amostragem com Reposição Dê duas razões pelas quais os métodos estatísticos tendem a se basear na hipótese de que a amostragem seja feita com reposição em vez de ser sem reposição 5 Boa Amostra Você deseja estimar a proporção de todos os estudantes de faculdades nos Estados Unidos que têm o profundo bom senso de fazer um curso de estatística Você obtém uma amostra aleatória simples na New York University A proporção amostral resultante é um bom estimador da proporção populacional Por que sim ou por que não 6 Estimadores Não Viesados Quais das seguintes estatísticas são estimadores não viesados de parâmetros populacionais a Média amostral usada para estimar uma média populacional b Mediana amostral usada para estimar uma mediana populacional c Proporção amostral usada para estimar uma proporção populacional d Variância amostral usada para estimar uma variância populacional e Desviopadrão amostral usado para estimar um desviopadrão populacional f Amplitude amostral usada para estimar uma amplitude populacional 7 Distribuição Amostral da Média Amostras de tamanho n 1000 são selecionadas aleatoriamente da população do último dígito de números de telefone Ao se encontrar a média amostral para cada amostra qual é a distribuição das médias amostrais 8 Distribuição Amostral da Proporção Amostras de tamanho n 1000 são selecionadas aleatoriamente da população do último dígito de números de telefone e se encontra a proporção de números pares para cada amostra Qual é a distribuição das proporções amostrais Nos Exercícios 912 consulte a população e lista de amostras no Exemplo 4 9 Distribuição Amostral da Mediana No Exemplo 4 assumimos que amostras de tamanho n 2 são selecionadas aleatoriamente com reposição da população que consiste em 2 3 e 10 em que os valores são números de pessoas em famílias A Tabela 64 lista as nove diferentes amostras possíveis a Ache a mediana de cada uma das nove amostras e resuma a distribuição amostral das medianas no formato de uma tabela que representa a 234 Capítulo 6 distribuição de probabilidade Sugestão Use uma forma semelhante à Tabela 65 b Compare a mediana populacional com a média das medianas amostrais c As medianas amostrais tendem para o valor da mediana populacional Em geral as medianas amostrais constituem bons estimadores das medianas populacionais Por que sim ou por que não 10 Distribuição Amostral do DesvioPadrão Repita o Exercício 9 usando os desviospadrão em lugar das medianas 11 Distribuição Amostral da Variância Repita o Exercício 9 usando variâncias em lugar de medianas 12 Distribuição Amostral da Média Repita o Exercício 9 usando médias em lugar das medianas 13 Presidentes Assassinados Distribuição Amostral da Média As idades anos dos quatro presidentes dos Estados Unidos quando foram assassinados no exercício do cargo são 56 Lincoln 49 Garfield 58 McKinley e 46 Kennedy a Supondo que duas das idades sejam selecionadas com reposição liste as 16 diferentes amostras possíveis b Ache a média de cada uma das 16 amostras e então resuma a distribuição amostral das médias no formato de uma tabela que represente a distribuição de probabilidade Use um formato semelhante ao da Tabela 65 c Compare a média populacional com a média das médias amostrais d As médias amostrais tendem para o valor da média populacional Em geral as médias amostrais são bons estimadores das médias populacionais Por que sim ou por que não 14 Distribuição Amostral da Mediana Repita o Exercício 13 usando medianas em lugar de médias 15 Distribuição Amostral da Amplitude Repita o Exercício 13 usando amplitudes em lugar de médias 16 Distribuição Amostral da Variância Repita o Exercício 13 usando variâncias em lugar de médias 17 Distribuição Amostral da Proporção O Exemplo 4 se referia a três famílias selecionadas aleatoriamente nas quais os números de pessoas eram de 2 3 e 10 Como naquele exemplo considere os valores de 2 3 e 10 como uma população e suponha que amostras de tamanho n 2 sejam extraídas aleatoriamente com reposição Construa uma distribuição de probabilidade que descreva a distribuição amostral da proporção de números ímpares nessas amostras A média das proporções amostrais é igual à proporção de números ímpares na população As proporções amostrais tendem ao valor da proporção populacional A proporção amostral é um bom estimador da proporção populacional 18 Nascimentos Distribuição Amostral da Proporção Quando 3 nascimentos são selecionados aleatoriamente o espaço amostral é mmm mmf fm ff Esses 8 resultados sejam equiprováveis Descreva a distribuição amostral da proporção de meninas em 3 nascimentos como uma tabela de distribuição de probabilidade A média das proporções amostrais é igual à proporção de meninas em 3 nascimentos Sugestão Veja o Exemplo 5 19 Genética Distribuição Amostral da Proporção Um experimento genético envolve uma população de moscas de frutas que consiste em 1 macho Mike e 3 fêmeas chamadas Ana Bárbara e Cristina Suponha que duas moscas de frutas sejam selecionadas aleatoriamente com reposição a Depois de listar as 16 diferentes amostras possíveis ache a proporção de fêmeas em cada amostra e então use uma tabela para descrever a distribuição amostral das proporções de fêmeas b Ache a média da distribuição amostral c A média da distribuição amostral da parte b é igual à proporção populacional de fêmeas A média da distribuição amostral de proporções é sempre igual à proporção populacional 20 Controle da Qualidade Distribuição Amostral da Proporção Depois de construir uma nova máquina de fabricação 5 chips protótipos de circuito integrado são produzidos e verificase que 2 estão defeituosos D e 3 são aceitáveis A Suponha que dois chips sejam aleatoriamente selecionados dessa população com reposição a Depois de identificar as 25 diferentes amostras possíveis ache a proporção de defeituosos em cada uma delas e então use uma tabela para descrever a distribuição amostral das proporções de defeituosos b Ache a média da distribuição amostral c A média da distribuição amostral da parte b é igual à proporção populacional de defeituosos A média da distribuição amostral das proporções é sempre igual à proporção populacional 64 Além do Básico 21 Usando uma Fórmula para Descrever uma Distribuição Amostral O Exemplo 5 inclui uma tabela e um gráfico para descrever a distribuição amostral das proporções de meninas em dois nascimentos Considere a fórmula mostrada a seguir e calcule o valor dessa fórmula para as proporções x de 0 05 e 1 Com base nesses resultados a fórmula descreve uma distribuição amostral Por que sim ou por que não 1 Px em que x 0 05 122 2x2x 22 Desvio Médio Absoluto O desvio médio absoluto de uma amostra é uma boa estatística para se estimar o desvio médio absoluto da população Por que sim ou por que não Sugestão Veja o Exemplo 4 65 O Teorema Limite Central Conceitochave Nesta seção introduzimos a aplicamos o teorema limite central Esse teorema nos diz que para uma população com qualquer distribuição a distribuição das médias amostrais se aproxima de uma distribuição normal à medida que o tamanho amostral aumenta Em outras palavras se o tamanho amostral for bastante grande a distribuição das médias amostrais pode ser aproximada por uma distribuição normal mesmo que a população original não seja normalmente distribuída Além disso se a população original tem média μ e desviopadrão σ a média das médias amostrais será também μ e o desviopadrão das médias amostrais será igual a σn em que n é o tamanho amostral Distribuição de Probabilidade Normal Na Seção 64 discutimos a distribuição amostral de x e nesta seção descrevemos procedimentos para o uso dessa distribuição amostral em aplicações práticas Os procedimentos desta seção constituem o fundamento para a estimação de parâmetros populacionais e teste de hipótese tópicos que serão discutidos em profundidade nos capítulos seguintes Ao se selecionar uma amostra aleatória de n objetos de uma população com média µ e desviopadrão σ é essencial o conhecimento destes princípios 1 Para uma população com distribuição qualquer se n 30 então as médias amostrais têm uma distribuição que pode ser aproximada por uma distribuição normal com média µ e desviopadrão σn 2 Se n 30 e a população original tem uma distribuição normal então as médias amostrais têm uma distribuição normal com média µ e desviopadrão σn 3 Se n 30 mas a população original não tem uma distribuição normal então os métodos desta seção não se aplicam Eis os pontoschave que fornecem a fundamentação para os capítulos que seguem O Teorema Limite Central e a Distribuição Amostral de x Dados 1 A variável aleatória x tem uma distribuição que pode ser ou não normal com média µ e desviopadrão σ 2 Selecionamse amostras aleatórias simples de mesmo tamanho n da população As amostras são selecionadas de tal modo que todas as amostras possíveis de tamanho n têm a mesma chance de serem escolhidas Conclusões 1 À medida que o tamanho amostral aumenta a distribuição das médias amostrais x se aproxima de uma distribuição normal 2 A média das médias amostrais é a média populacional µ 3 O desviopadrão de todas as médias amostrais é σn Regras Práticas Comumente Usadas 1 Se a população original não é normalmente distribuída eis uma diretriz comum Para n 30 a distribuição das médias amostrais pode ser aproximada razoavelmente bem por uma distribuição normal Há exceções tais como populações com distribuições muito distantes de serem normais e que exigem tamanhos amostrais muito maiores do que 30 mas tais exceções são relativamente raras 2 A distribuição das médias amostrais se aproxima cada vez mais de uma distribuição normal à medida que o tamanho amostral n aumenta 2 Se a população original é normalmente distribuída então para qualquer tamanho amostral n as médias amostrais serão normalmente distribuídas O teorema limite central envolve duas distribuições diferentes a distribuição da população original e a distribuição das médias amostrais Como nos capítulos anteriores vamos usar os símbolos µ e σ para designar a média e o desviopadrão da população original mas agora precisamos de uma nova notação para a média e o desviopadrão da distribuição das médias amostrais Notação para a Distribuição Amostral de x Se todas as possíveis amostras de tamanho n são selecionadas de uma população com média µ e desviopadrão σ a média das médias amostrais é designada por µx de modo que µx µ Também o desviopadrão das médias amostrais é designado por σx de modo que σx σ n σx é frequentemente chamado erropadrão da média Capítulo 6 Tabela 66 Distribuições Amostrais O Nebuloso Teorema Limite Central Em The Cartoon Guide to Statistics de Gonick e Smith os autores assim descrevem o Nebuloso Teorema Limite Central Dados que são influenciados por muitos efeitos aleatórios pequenos e não relacionados são distribuídos aproximadamente segundo uma normal Isso explica por que a normal aparece em todos os lugares flutuações do mercado de ações pesos de estudantes temperaturas médias anuais escores SAT todos são resultados de muitos efeitos diferentes A altura de pessoas por exemplo é resultado de fatores hereditários fatores ambientais nutrição cuidados com a saúde região geográfica e outras influências que combinadas produzem valores normalmente distribuídos EXEMPLO 1 Distribuições Normais Uniformes e em Forma de U A Tabela 66 ilustra o teorema limite central Os gráficos de pontos no topo da tabela mostram uma distribuição aproximadamente normal uma distribuição uniforme e uma distribuição que lembra a letra U Em cada coluna o segundo gráfico de pontos mostra a distribuição das médias amostrais em que n 10 e os gráficos de pontos na parte inferior mostram a distribuição das médias amostrais em que n 50 À medida que caminhamos para baixo em cada coluna da Tabela 66 podemos ver que a distribuição das médias amostrais se aproxima de uma distribuição normal Tal característica está incluida entre as seguintes observações que podemos fazer relativas à Tabela 66 À medida que o tamanho amostral aumenta a distribuição das médias amostrais tende a se aproximar de uma distribuição normal A média das médias amostrais é a mesma média da população original À medida que o tamanho amostral aumenta os gráficos de pontos se tornam mais estreitos mostrando que o desviopadrão das médias amostrais se torna menor Aplicando o Teorema Limite Central Muitos problemas práticos podem ser resolvidos com o teorema limite central Ao trabalhar com tais problemas lembre que se o tamanho amostral for maior do que 30 ou se a população original for normalmente distribuída a distribuição das médias amostrais pode ser tratada como se fosse uma distribuição normal com média µ e desviopadrão σn No Exemplo 2 a parte a envolve um valor individual mas a parte b envolve a média de uma amostra de 20 homens de modo que devemos usar o teorema limite central ao trabalhar com a variável aleatória x Estude esse exemplo cuidadosamente para entender a diferença fundamental entre os procedimentos nas partes a e b Valores individuais Ao trabalhar com um valor individual de uma população normalmente distribuída use os métodos da Seção 63 Use z x µ σ Distribuição de Probabilidade Normal Amostra de valores Ao trabalhar com uma média para alguma amostra ou grupo certifiquese de usar σn para o desviopadrão das médias amostrais Use z x µ σn SC EXEMPLO 2 Segurança de Táxi Aquático No Problema do Capítulo notamos que alguns passageiros morreram quando um táxi afundou no porto interior de Baltimore Os homens são tipicamente mais pesados do que mulheres e crianças de modo que ao examinarmos a carga de táxi aquático vamos supor o cenário do pior caso no qual todos os passageiros são homens Com base em dados da Pesquisa Nacional do Exame de Saúde e Nutrição suponha que os pesos dos homens sejam normalmente distribuídos com média de 172 libras e desviopadrão de 29 libras Isto é suponha que a população dos pesos dos homens seja normalmente distribuída com µ 172 libras e σ 29 libras a Ache a probabilidade de que para um indivíduo selecionado aleatoriamente seu peso seja superior a 175 793 kg libras b Ache a probabilidade de que 20 homens selecionados aleatoriamente tenham peso médio superior a 175 libras de modo que o peso total dos 20 exceda a capacidade de segurança de 3500 libras SOLUÇÃO a Abordagem Use os métodos apresentados na Seção 63 porque estamos lidando com um valor individual de uma população normalmente distribuída Procuramos a área da região sombreada na Figura 618a Se usarmos a Tabela A2 convertemos o peso de 175 libras para o escore z correspondente z x µ σ 175 172 29 010 Use a Tabela A2 e use z 010 para encontrar a área acumulada à esquerda de 175 libras que é 05398 A área sombreada é portanto 1 05398 04602 A probabilidade de um homem selecionado aleatoriamente pesar mais do que 175 libras é 04602 Se usarmos uma calculadora ou programa em vez da Tabela A2 o resultado mais preciso é 04588 em lugar de 04602 Figura 618 Pesos de Homens a Distribuição dos Pesos Individuais de Homens b Distribuição das Médias Amostrais b Abordagem Use o Teorema Limite Central porque estamos lidando com a média para uma amostra de 20 homens não com um homem individual Embora o tamanho amostral não seja superior a 30 usamos uma distribuição normal porque a população original de pesos de homens tem uma distribuição normal de modo que amostras de qualquer tamanho resultam em médias que são normalmente distribuídas Como estamos agora lidando com uma distribuição de médias amostrais devemos usar os parâmetros μx e σx que são encontrados como segue μx μ 172 σx σn 2920 64845971 Desejamos encontrar a área sombreada na Figura 618b Veja como a distribuição na Figura 618b é mais estreita porque o desviopadrão é menor Usando a Tabela A2 encontramos o escore z relevante que é calculado como segue z x μxσx 175 1722920 364845971 046 Pela Tabela A2 encontramos que z 046 corresponde a uma área acumulada à esquerda de 06772 de modo que a área sombreada é 1 06772 03228 A probabilidade de que 20 homens tenham peso médio superior a 175 libras é 03228 Se usarmos uma calculadora ou programa o resultado é 03218 em vez de 03228 INTERPRETAÇÃO Há uma probabilidade de 04602 de que um homem individual pese mais de 175 libras e há uma probabilidade de 03228 de que 20 homens tenham peso médio de mais de 175 libras Dado que a capacidade de segurança do táxi aquático é 3500 libras há uma boa chance com probabilidade 03228 de que haja uma sobrecarga se o táxi for ocupado por 20 homens selecionados aleatoriamente Dado que 21 já morreram e dada a alta chance de sobrecarga seria aconselhável limitarse o número de passageiros em algum nível abaixo de 20 A capacidade de 20 passageiros não é bastante segura Os cálculos usados aqui são exatamente o tipo de cálculos usados por engenheiros ao projetarem elevadores de esqui elevadores escadas rolantes aviões e outros aparelhos que conduzem pessoas Introdução ao Teste de Hipótese Os dois próximos exemplos ilustram aplicações do teorema limite central mas examine cuidadosamente as conclusões a que se chega Esses exemplos mostram o tipo de raciocínio que é a base para o importante procedimento de teste de hipótese discutido no Capítulo 8 Esses exemplos usam a regra do evento raro para a inferência estatística apresentada pela primeira vez na Seção 41 Regra do Evento Raro para Inferência Estatística Se sob dada hipótese a probabilidade de ocorrência de um evento for excepcionalmente pequena tal como menor do que 005 concluímos que a hipótese é provavelmente incorreta EXEMPLO 3 Enchendo Latas de CocaCola Latas de CocaCola são rotuladas para indicar que contêm 12 onças O Conjunto de Dados 17 no Apêndice B lista as quantidades medidas para uma amostra de latas de Coca As estatísticas amostrais correspondentes são n 36 e x 1219 onças Se as latas de Coca são cheias de modo que μ 1200 onças Capítulo 6 Qual o Comprimento de um Parafuso de 34 de Polegada Não é totalmente impensável que consideremos que parafusos rotulados como tendo 34 polegada de comprimento tenham um comprimento médio próximo de 34 polegada O Conjunto de Dados 19 no Apêndice B inclui os comprimentos de uma amostra de 50 tais parafusos com um comprimento médio de 07468 polegada Suponha que a população de todos tais parafusos tenha um desviopadrão descrito por σ 00123 polegada com base no Conjunto de Dados 19 a Supondo que os parafusos tenham comprimento médio de 075 polegada ou 34 polegada como rotulado ache a probabilidade de que uma amostra de 50 desses parafusos tenha um comprimento médio de 07468 polegada ou menos Veja a Figura 620 b A probabilidade de se obter uma média amostral que seja pelo menos tão extrema quanto a média amostral dada é duas vezes a probabilidade encontrada na parte a Ache essa probabilidade Note que a média amostral de 07468 polegada difere da média rotulada de 075 polegada por 00032 polegada de modo que outra média é tão extrema quanto a média amostral se for inferior a 075 polegada por 00032 polegada ou mais ou se for superior a 075 polegada por 00032 polegada ou mais c Com base no resultado da parte b parece que a média amostral difira da média rotulada de 075 polegada por uma quantidade significante Explique Figura 620 Distribuição do Comprimento Médio de Parafusos para Amostras de Tamanho n 50 SOLUÇÃO a Não nos foi dada a distribuição da população mas como o tamanho amostral n 50 excede 30 usamos o teorema limite central e concluímos que a distribuição das médias amostrais é uma distribuição normal com estes parâmetros μx μ 075 por hipótese σx σn 0012350 0001739 A Figura 620 mostra a área sombreada correspondente à probabilidade de que 50 parafusos tenham média de 07468 polegada ou menos Podemos encontrar a área sombreada usando os mesmos procedimentos desenvolvidos na Seção 63 Para usar a Tabela A2 primeiro encontramos o escore z z x μxσx 07468 0750001739 184 Consultando a Tabela A2 encontramos que z 184 corresponde a uma área acumulada à esquerda de 00329 A probabilidade de se obter uma média amostral de 07468 polegada ou menos é 00329 b A probabilidade de se obter uma média amostral que seja pelo menos tão extrema quanto a média amostral dada é duas vezes a probabilidade encontrada na parte a de modo que é 2 X 00329 00658 como rotulado e o desviopadrão populacional é σ 011 onça com base nos resultados amostrais ache a probabilidade de que uma amostra de 36 latas tenha média de 1219 onças ou mais Esses resultados sugerem que as latas de Coca são cheias com uma quantidade maior do que 1200 onças SOLUÇÃO Não nos é dada a distribuição da população mas como o tamanho amostral n 36 excede 30 aplicamos o teorema limite central e concluímos que a distribuição das médias amostrais é aproximadamente normal com estes parâmetros μx μ 1200 por hipótese σx σn 01136 0018333 A Figura 619 mostra a área sombreada veja a pequena região à direita do gráfico correspondente à probabilidade procurada Tendo já achado os parâmetros que se aplicam à distribuição mostrada na Figura 619 podemos agora encontrar a área sombreada usando os mesmos procedimentos desenvolvidos na Seção 63 Para usar a Tabela A2 primeiro encontramos o escore z z x μxσx 1219 12000018333 1036 Consultando a Tabela A2 vemos que z 1036 está fora da tabela No entanto para valores de z acima de 349 usamos 09999 para a área acumulada à esquerda Assim concluímos que a área da região sombreada na Figura 619 é 00001 Se usarmos a calculadora TI8384 Plus ou um programa a área da região sombreada é muito menor de modo que relatamos com segurança que a probabilidade é muito pequena tal como 00001 Figura 619 Distribuição das Quantidades de CocaCola em onças INTERPRETAÇÃO O resultado mostra que se a quantidade média de Coca nas latas é realmente 1200 onças então há uma probabilidade extremamente pequena de se obter uma média amostral de 1219 onças ou maior ao selecionarmos aleatoriamente 36 latas Como obtivemos realmente tal média amostral há duas explicações possíveis Ou a média populacional é 1200 onças e a amostra representa um evento que é extremamente raro ou a média populacional é realmente maior do que 1200 onças e a amostra é típica Como a probabilidade é tão baixa parece mais razoável concluirmos que a média populacional é maior do que 1200 onças Parece que as latas de Coca estão sendo cheias com mais de 1200 onças No entanto a média amostral de 1219 onças sugere que a quantidade média de excesso é muito pequena Parece que a companhia CocaCola encontrou uma maneira de garantir que muito poucas latas tenham menos de 12 onças e ao mesmo tempo não desperdiçar muito de seu produto c O resultado da parte b mostra que há uma probabilidade de 00658 de se obter uma média amostral que seja pelo menos tão extrema quanto a média amostral dada Usando uma probabilidade de corte de 005 para distinguir entre eventos usuais de não usuais vemos que a probabilidade de 00658 excede 005 de modo que a média amostral não é não usual Consequentemente concluímos que a média amostral dada não difere da média rotulada de 075 polegada por uma quantidade substancial O rótulo de 34 polegada ou 075 polegada parece justificado O raciocínio dos Exempos 3 e 4 é o tipo do raciocínio usado no teste de hipótese a ser introduzido no Capítulo 8 Por enquanto focalizamos o uso do teorema limite central para encontrar probabilidades indicadas mas devemos reconhecer que esse teorema será usado mais tarde no desenvolvimento de importantes conceitos em estatística Correção para uma População Finita Na aplicação do teorema central do limite o uso de σx σ n supõe que a população seja infinitamente grande Quando amostramos com reposição isto é colocamos de volta cada item selecionado antes de fazer a próxima seleção a população é efetivamente infinita No entanto muitas aplicações reais envolvem amostragem sem reposição de modo que as seleções sucessivas dependem dos resultados anteriores Em fábricas inspetores de controle de qualidade comumente amostram itens sem reposição de uma sequência finita de produção Para tal população finita é necessário fazerse um ajuste em σx Eis uma regra empírica comum Quando tirar amostras sem reposição e o tamanho amostral n for maior que 5 do tamanho finito N da população isto é n 005N ajuste o desviopadrão das médias amostrais σx multiplicandoo pelo fator de correção para população finita N n N 1 Com exceção dos Exercícios 22 e 23 os exemplos e exercícios desta seção supõem que o fator de correção para população finita não se aplica porque estamos tirando amostras com reposição ou porque a população é infinita ou porque o tamanho da amostra não excede 5 do tamanho da população O teorema limite central é tão importante porque permite o uso de métodos básicos da distribuição normal em uma grande variedade de circunstâncias diferentes No Capítulo 7 por exemplo aplicaremos o teorema ao usarmos dados amostrais para estimar médias de populações No Capítulo 8 vamos aplicálo ao usar dados amostrais para testar afirmativas feitas sobre médias populacionais A Tabela 67 resume as condições sob as quais podemos e não podemos usar a distribuição normal Tabela 67 Distribuições de Médias Amostrais População com média μ e desviopadrão σ Distribuição das Médias Amostrais Média das Médias Amostrais Desviopadrão das Médias Amostrais Normal Normal para qualquer tamanho amostral n μx μ σx σ n Não normal com n 30 Normal aproximadamente μx μ σx σ n Não normal com n 30 Não normal μx μ σx σ n 65 Habilidades e Conceitos Básicos Letramento Estatístico e Pensamento Crítico 1 ErroPadrão da Média O que é o erropadrão da média 2 Amostra Pequena Quando selecionamos amostras de tamanho n 2 de uma população com média e desviopadrão conhecidos quais exigências devem ser satisfeitas para se poder admitir que a distribuição das médias amostrais seja uma distribuição normal 3 Notação O que significa a notação μx O que significa a notação σx 4 Distribuição de Rendas Suponha que coletemos uma grande amostra aleatória simples grande n 30 de rendas anuais de adultos nos Estados Unidos Como a amostra é grande podemos aproximar a distribuição dessas rendas por uma distribuição normal Por que sim ou por que não Usando o Teorema Limite Central Nos Exercícios 58 suponha que os escores SAT sejam normalmente distribuídos com média μ 1518 e desviopadrão σ 325 com base nos dados do College Board 5 a Se 1 escore SAT é selecionado aleatoriamente ache a probabilidade de que seja menor que 1500 b Se 100 escores SAT são selecionados aleatoriamente ache a probabilidade de que tenham média menor que 1500 6 a Se 1 escore SAT é selecionado aleatoriamente ache a probabilidade de que seja maior que 1600 b Se 64 escores SAT são selecionados aleatoriamente ache a probabilidade de que tenham média maior que 1600 7 a Se 1 escore SAT é selecionado aleatoriamente ache a probabilidade de que esteja entre 1550 e 1575 b Se 25 escores SAT são selecionados aleatoriamente ache a probabilidade de que tenham média entre 1550 e 1575 c Por que o teorema limite central pode ser aplicado na parte b mesmo com tamanho de amostra menor que 30 8 a Se 1 escore SAT é selecionado aleatoriamente ache a probabilidade de que esteja entre 1440 e 1480 b Se 16 escores SAT são selecionados aleatoriamente ache a probabilidade de que tenham média entre 1440 e 1480 c Por que o teorema limite central pode ser aplicado na parte b mesmo com tamanho de amostra menor que 30 9 Segurança em Táxi Aquático Com base em dados da Pesquisa Nacional de Exame de Saúde e Nutrição suponha que os pesos de homens sejam normalmente distribuídos com média de 172 libras e desviopadrão de 29 libras a Ache a probabilidade de que se um homem individual é selecionado aleatoriamente seu peso seja superior a 180 libras b Ache a probabilidade de que 20 homens selecionados aleatoriamente tenham peso médio superior a 180 libras c Se 20 homens têm peso médio superior a 180 libras o peso total excede o limite de carga de segurança de 3500 libras de um táxi aquático particular Com base nos resultados anteriores isso constitui uma preocupação para a segurança Por que sim ou por que não 10 Mensa Associarse à Mensa requer um escore de QI acima de 1315 Nove candidatos fazem testes de QI e seus resultadosresumo indicam que seu QI médio é 133 Os escores de QI são distribuídos normalmente com média 100 e desviopadrão 15 a Se uma pessoa é selecionada aleatoriamente da população geral ache a probabilidade de ser uma pessoa com escore de QI de pelo menos 133 b Se 9 pessoas são selecionadas aleatoriamente ache a probabilidade de que seu escore médio de QI seja de pelo menos 133 c Embora os resultadosresumo estejam disponíveis os escores de QI individuais se perderam Podese concluir que todos os 9 candidatos têm escores de QI acima de 1315 de modo que podem ser admitidos como membros da Mensa 11 Segurança em Góndolas Uma gôndola de esqui em Vail Colorado carrega esquiadores para o topo de uma montanha Ela leva uma placa na qual se diz que a capacidade máxima é de 12 pessoas ou 2004 libras Tal capacidade será excedida se 12 pessoas tiverem pesos com uma média superior a 200412 167 libras Como os homens tendem a pesar mais do que as mulheres a pior situação envolve 12 passageiros que sejam todos homens Os homens têm pesos que são normalmente distribuídos com média de 172 lb e desviopadrão de 29 lb com base em dados da Pesquisa Nacional de Saúde a Ache a probabilidade de que um homem individual selecionado aleatoriamente tenha peso superior a 167 libras b Ache a probabilidade de que 12 homens selecionados aleatoriamente tenham um peso médio superior a 167 libras de modo que o peso total será maior do que a capacidade máxima da gôndola de 2004 lb c A gôndola parece ter o limite de peso correto Por que sim ou por que não 12 Efeito da Dieta sobre Duração da Gravidez A duração da gravidez é normalmente distribuída com média de 268 dias e desviopadrão de 15 dias a Se 1 mulher grávida é selecionada aleatoriamente ache a probabilidade de que a duração de sua gravidez seja inferior a 260 dias b Se 25 mulheres selecionadas aleatoriamente são colocadas sob dieta logo antes de engravidarem ache a probabilidade de que a duração de sua gravidez tenha média inferior a 260 dias supondose que a dieta não tenha nenhum efeito c Se as 25 mulheres realmente têm duração média de gravidez inferior a 260 dias parece que a dieta tem algum efeito sobre a duração da gravidez e os supervisores médicos deveriam ficar preocupados 13 Pressão Sanguínea Para mulheres de 1824 anos a pressão sanguínea sistólica em mmHg é normalmente distribuída com média de 1148 e desviopadrão de 131 com base nos dados da Pesquisa Nacional de Saúde A hipertensão é comumente definida como pressão sanguínea sistólica acima de 140 a Se uma mulher com idade entre 18 e 24 anos é selecionada aleatoriamente ache a probabilidade de sua pressão sanguínea sistólica ser maior do que 140 b Se 4 mulheres nessa mesma faixa etária são selecionadas aleatoriamente ache a probabilidade de sua pressão sanguínea sistólica média ser maior do que 140 c Dado que a parte b envolve uma amostra inferior a 30 por que o teorema limite central ainda pode ser aplicado d Se um médico recebe um relatório afirmando que 4 mulheres apresentaram pressão sanguínea sistólica média inferior a 140 ele pode concluir que nenhuma delas tem hipertensão com pressão sanguínea superior a 140 14 Projetando Capacetes de Motociclistas Os engenheiros têm que considerar a largura da cabeça dos homens ao desenhar capacetes para motociclistas Os homens têm cabeças com larguras normalmente distribuídas com média de 60 polegadas e desviopadrão de 10 polegada com base nos dados de uma pesquisa antropométrica de Gordon Churchill et al a Se um homem é selecionado aleatoriamente ache a probabilidade de que sua cabeça tenha largura inferior a 62 polegadas b A Companhia Capacetes de Segurança planeja uma sequência inicial de produção de 100 capacetes Ache a probabilidade de 100 homens of Diseases of Children Vol 140 Suponha que 36 dessas crianças sejam selecionadas aleatoriamente para um estudo de acompanhamento a Ao se considerar a distribuição das idades médias para grupos de 36 crianças σx deve ser corrigido usandose o fator de correção para população finita Explique b Ache a probabilidade de que a idade média do grupo amostral de acompanhamento seja superior a 100 anos 23 Corrigindo para uma População Finita O Newport Varsity Club tem 210 membros cujos pesos têm uma distribuição aproximadamente normal com média de 163 libras e desviopadrão de 32 libras O projeto para uma nova construção no clube inclui um elevador com capacidade limitada de 12 passageiros a Considerandose a distribuição dos pesos médios de 12 passageiros σx deve ser corrigido usandoo fator de correção para população finita Explique b Se o elevador for projetado para carregar com segurança uma carga de até 2100 libras qual é o peso médio máximo de segurança quando o elevador levar 12 passageiros c Se o elevador leva 12 membros do clube selecionados aleatoriamente qual é a probabilidade de que o peso total ultrapasse o limite de segurança de 2100 libras Essa probabilidade é baixa o bastante d Qual é o número máximo de passageiros que se deve permitir no elevador se desejamos uma probabilidade de 0999 de que o elevador não será sobrecarregado quando levar 12 membros do clube selecionados aleatoriamente 24 Parâmetros Populacionais Três famílias selecionadas aleatoriamente são entrevistadas em um projeto piloto para uma pesquisa maior a ser realizada posteriormente Os números de pessoas nas famílias são 2 3 e 10 com base no Conjunto de Dados 22 no Apêndice B Considere os valores 2 3 e 10 como uma população Suponha que amostras de tamanho n 2 sejam selecionadas aleatoriamente sem reposição a Ache μ e σ b Depois de encontrar todas as possíveis amostras de tamanho n 2 sem reposição ache a população dos valores de x encontrando a média de cada uma das amostras de tamanho n 2 c Ache a média μx e o desviopadrão σx para a população de médias amostrais encontrada na parte b d Verifique que μx μ e σx σn N nN 1 66 A Normal como Aproximação da Binomial Conceitochave Esta seção apresenta um método para se usar uma distribuição normal como uma aproximação da distribuição binomial Se as condições np 5 e nq 5 são ambas satisfeitas então as probabilidades de uma distribuição de probabilidade binomial podem ser aproximadas razoavelmente bem por uma distribuição normal com média μ np e desviopadrão σ npq Como uma distribuição de probabilidade binomial usa tipicamente apenas números inteiros para a variável aleatória x enquanto a aproximação normal é contínua devemos usar uma correção de continuidade com um número inteiro x representado pelo intervalo de x 05 a x 05 Nota Em vez de usar uma distribuição normal como uma aproximação para uma distribuição de probabilidade binomial muitas aplicações práticas da distribuição binomial podem ser tratadas com o uso de programas computacionais ou calculadoras mas esta seção introduz o princípio de que uma distribuição binomial pode ser aproximada por uma distribuição normal e esse princípio será usado em capítulos posteriores Na Seção 53 estabeleceuse que uma distribuição de probabilidade binomial tem 1 um número fixo de tentativas 2 as tentativas são independentes 3 tentativas são classificadas em duas categorias comumente chamadas de sucesso e fracasso 4 as tentativas têm a propriedade de que a probabilidade de sucesso permanece constante Lembrese também desta notação n o número fixo de tentativas x o número específico de sucessos em n tentativas p probabilidade de sucesso em uma de n tentativas q probabilidade de fracasso em uma de n tentativas Considere esta situação O autor recebeu por correio uma pesquisa da Viking River Cruises supostamente enviada a muitas pessoas Suponha que a pesquisa pedisse um endereço de email que tenha sido enviada a 40000 pessoas e que a porcentagem devolvida com endereço de email seja de 3 Suponha que o verdadeiro objetivo da pesquisa fosse obter uma listagem de pelo menos 1150 endereços de email para uma campanha agressiva Para obtermos a probabilidade de se ter pelo menos 1150 respostas com endereços de email podemos usar a distribuição de probabilidade binomial com n 40000 p 003 e q 097 Veja a apresentação do Minitab ao lado que mostra um gráfico da probabilidade para cada número de sucessos de 1100 a 1300 e note que o gráfico parece ser uma distribuição normal embora os pontos grafados sejam de uma distribuição binomial Os outros valores de x têm probabilidades muito próximas de zero Esse gráfico sugere que podemos usar uma distribuição normal para aproximar a distribuição binomial Note que os requisitos incluem verificação de que np 5 e nq 5 O valor mínimo de 5 é comum mas não é absolutamente rígido e alguns livrostexto usam 10 Esse requisito está incluído no procedimento seguinte para uso da normal como aproximação de uma distribuição binomial Distribuição Normal como uma Aproximação para a Distribuição Binomial Requisitos 1 A amostra é uma amostra aleatória simples de tamanho n de uma população na qual a probabilidade de sucessos é p ou a amostra é o resultado da realização de n tentativas independentes de um experimento binomial no qual a probabilidade de sucessos é p 2 np 5 e nq 5 Aproximação Normal Se os requisitos anteriores são satisfeitos então a distribuição de probabilidade da variável aleatória x pode ser aproximada por uma distribuição normal com estes parâmetros μ np σ npq Correção de Continuidade Ao usar a aproximação normal ajuste o número inteiro discreto x usando a correção de continuidade de modo que x seja representado pelo intervalo de x 05 a x 05 Procedimento para o Uso de uma Distribuição Normal como Aproximação de uma Distribuição Binomial 1 Verifique que ambos os requisitos precedentes sejam satisfeitos Se esses requisitos não são ambos satisfeitos então você deve usar um software ou uma calculadora ou a Tabela A1 ou a fórmula da probabilidade binomial 2 Ache os valores dos parâmetros μ e σ calculando μ np e σ npq 3 Identifique o valor discreto x que é relevante para o problema de probabilidade binomial Por exemplo se você estiver tentando encontrar a probabilidade de se obter pelo menos 1150 sucessos entre 40000 tentativas como no Exemplo 1 o número inteiro relevante é x 1150 Primeiro atente para o valor de 1150 e ignore temporariamente se você deseja pelo menos 1150 mais do que 1150 menos do que 1150 no máximo 1150 ou exatamente 1150 4 Esboce uma distribuição normal centrada em torno de μ então desenhe uma faixa vertical acima de x centrada em x Marque o lado esquerdo da faixa como número x 05 e marque o lado direito da faixa com o número x 05 Com x 1150 por exemplo desenhe uma faixa de 11495 a 11505 Considere que toda a área da faixa inteira representa a probabilidade do número inteiro discreto x 5 Agora determine se o próprio valor de x deve ser incluído na probabilidade que você deseja Por exemplo pelo menos x inclui x mas mais do que x não inclui x Em seguida determine se você deseja a probabilidade de pelo menos x no máximo x mais do que x menos do que x ou exatamente x Sombreie a área à direita ou à esquerda da faixa conforme apropriado sombreie também o interior da faixa se e somente se o próprio valor de x deva ser incluído Essa região total sombreada corresponde à probabilidade procurada 6 Usando x 05 ou x 05 no lugar de x ache a área da região sombreada no Passo 5 como segue Primeiro encontre o escore z z x μσ com ou x 05 ou x 05 usado no lugar de x Em segundo lugar use o escore z para achar a área à esquerda do valor ajustado de x Em terceiro lugar essa área acumulada à esquerda pode agora ser usada para identificar a área sombreada correspondente à probabilidade desejada Voltaire Vence a Loteria Em 1729 o filósofo Voltaire tornouse rico ao vislumbrar um esquema para vencer a loteria de Paris O governo patrocinava um jogo para repor bônus municipais que haviam perdido valor A cidade acrescentou grandes quantias de dinheiro de modo que os prêmios totalizavam mais do que o custo de todos os bilhetes Voltaire formou um grupo que comprou todos os bilhetes na loteria mensal e ganhou por mais de um ano Um apostador na Loteria do Estado de Nova York tentou ganhar uma parte de um prêmio excepcionalmente grande que cresceu por falta de ganhadores nos concursos anteriores Ele tentou dar um cheque de 6135756 dólares que cobriria todas as combinações mas o estado recusou alegando que a natureza da loteria teria sido alterada SC EXEMPLO 1 Pesquisa por Correio O autor recebeu pelo correio uma pesquisa da Viking River Cruises e essa pesquisa incluía um pedido de um endereço de email Suponha que a pesquisa tenha sido enviada a 40000 pessoas e que a porcentagem de respostas com endereços de email seja de 3 Se o verdadeiro objetivo era conseguir um banco de pelo menos 1150 endereços de email ache a probabilidade de serem obtidos pelo menos 1150 respostas com endereços de email SOLUÇÃO O problema dado envolve uma distribuição binomial com um número fixo de tentativas n 40000 que são independentes Há duas categorias para cada pesquisa obtémse uma resposta com um endereço de email ou não A probabilidade de sucesso p 003 presumidamente permanece constante de uma para outra tentativa Os cálculos com a fórmula da probabilidade binomial não são práticos porque teríamos de aplicála 38851 vezes uma para cada valor de x de 1150 a 40000 inclusive As calculadoras não podem realizar o primeiro cálculo para a probabilidade de exatamente 1150 sucessos Algumas calculadoras fornecem tal resultado mas usam um método de aproximação em vez de um cálculo exato A melhor estratégia é prosseguir com a abordagem do uso da distribuição normal para aproximar a distribuição binomial Passo 1 Verificação de requisitos Embora se desconheça como os indivíduos da pesquisa foram selecionados prosseguiremos sob a hipótese de que temos uma amostra aleatória simples Devemos verificar se é razoável aproximarmos a distribuição binomial pela distribuição normal por serem np 5 e nq 5 Com n 40000 p 003 e q 1 p 097 verificamos os requisitos como segue np 40000 003 1200 Portanto np 5 nq 40000 097 38800 Portanto nq 5 Passo 2 Prosseguimos agora para encontrar os valores para os parâmetros μ e σ que são necessários para a distribuição normal Obtivemos o seguinte μ np 40000 003 1200 σ npq 40000 003 097 34117444 Passo 3 Desejamos a probabilidade de pelo menos 1150 respostas com endereço de email de modo que x 1150 é o número inteiro relevante para esse exemplo Passo 4 Veja a Figura 621 que mostra uma distribuição normal com média μ 1200 e desviopadrão σ 34117444 A Figura 621 mostra também a faixa vertical de 11495 a 11505 Passo 5 Desejamos encontrar a probabilidade de se obterem pelo menos 1150 respostas com endereço de email de modo que desejamos sombrear a faixa vertical que representa 1150 bem com a área à sua direita A área desejada está sombreada na Figura 621 Passo 6 Desejamos a área à direita de 11495 na Figura 621 de modo que o escore z é encontrado usandose os valores de μ e σ do Passo 2 e o valor de fronteira de 11495 como segue z x μσ 11495 120034117444 148 Usando a Tabela A2 encontramos que z 148 corresponde a uma área de 00694 de modo que a região sombreada na Figura 621 é 1 00694 09306 A área desse intervalo aproxima a probabilidade de exatamente 1150 sucessos Figura 621 Encontrando a Probabilidade para pelo menos 1150 Sucessos entre 40000 Tentativas Há uma probabilidade de 09306 de se obterem pelo menos 1150 respostas com endereço de email entre as 40000 pesquisas enviadas Essa probabilidade é alta o bastante para se concluir que é muito provável que Viking Cruises alcance seu objetivo de pelo menos 1150 respostas com endereço de email Se a Viking River Cruises usa um método de amostragem que não fornece uma amostra aleatória simples então a probabilidade resultante de 09306 pode estar bastante errada Por exemplo se eles pesquisaram apenas clientes anteriores eles provavelmente obterão uma taxa de resposta mais alta de modo que os cálculos anteriores podem estar incorretos Não devemos nunca nos esquecer da importância de um método adequado de amostragem Passo 2 Achamos agora os valores de μ e de σ Obtivemos o seguinte μ 𝑛𝑝 2822 075 21165 Quando usamos a distribuição normal como aproximação da distribuição binomial nosso objetivo final não é simplesmente obter uma probabilidade Frequentemente desejamos fazer algum julgamento baseado no valor da probabilidade O critério que segue da Seção 52 descreve o uso das probabilidades para a distinção de resultados que podem facilmente ocorrer por acaso daqueles que são altamente incomuns Usando Probabilidades para Determinar Quando Resultados São Não Usuais Não usualmente alto x sucessos entre n tentativas é um número de sucessos não usualmente alto se Px ou mais é muito pequena tal como 005 ou menos Não usualmente baixo x sucessos entre n tentativas é um número de sucessos não usualmente baixo se Px ou menos é muito pequena tal como 005 ou menos Quase todas as aplicações práticas da distribuição de probabilidade binomial podem agora ser bem trabalhadas com um programa computacional ou uma calculadora TI8384 Plus Nesta seção apresentamos métodos para o uso da aproximação normal em vez de programas mas mais importante ilustramos o princípio de que sob circunstâncias apropriadas a distribuição de probabilidade binomial pode ser aproximada por uma distribuição normal Capítulos posteriores incluirão procedimentos que se baseiam no uso de uma distribuição normal como aproximação para uma distribuição binomial de modo que esta seção constitui um alicerce para tais importantes procedimentos 15 Com n 8 e p 09 ache Ppelo menos 6 16 Com n 15 e p 04 ache Pmenos de 3 17 Pesquisa por Correio No Exemplo 1 vimos que o autor recebeu pelo correio uma pesquisa da Viking River Cruises que incluía um pedido de envio de endereço de email Como no Exemplo 1 suponha que a pesquisa tenha sido enviada a 40000 pessoas e que a porcentagem de respostas com um endereço de email tenha sido de 3 Se o objetivo da pesquisa era a obtenção de um banco de pelo menos 1300 endereços de email ache a probabilidade de se obterem pelo menos 1300 respostas com endereços de email É provável que o objetivo seja alcançado 18 Pesquisa sobre Penetração da Internet No Exemplo 2 vimos que uma pesquisa recente do Pew Research Center mostrou que entre 2822 adultos selecionados aleatoriamente 2060 ou 73 afirmavam ser usuários da Internet Um especialista em tecnologia afirma que 75 dos adultos são usuários da Internet e os resultados da pesquisa mostram uma porcentagem menor devido à variação aleatória nas pesquisas Supondo que a taxa de 75 seja correta um resultado de 2060 usuários da Internet é um número não usualmente baix o quando 2822 adultos são selecionados aleatoriamente Explique 19 Seleção de Gênero O Genetics IVF Institute desenvolveu seu método XSORT para aumentar a probabilidade de ser concebida uma menina Entre 574 mulheres que usavam esse método 525 tiveram meninas Supondo que o método não tenha qualquer efeito de modo que meninos e meninas são equiprováveis ache a probabilidade de se obterem pelo menos 525 meninas entre 574 bebês Esse resultado sugere que o método XSORT seja eficaz Por que sim ou por que não 20 Seleção de Gênero O Genetics IVF Institute desenvolveu seu método YSORT para aumentar a probabilidade de ser concebido um menino Entre 152 mulheres que usavam esse método 127 tiveram meninos Supondo que o método não tenha qualquer efeito de modo que meninos e meninas são equiprováveis ache a probabilidade de se obterem pelo menos 127 meninos entre 152 bebês Esse resultado sugere que o método YSORT seja eficaz Por que sim ou por que não 21 Experimento de Hibridização de Mendel Quando Mendel realizou seu famoso experimento de hibridização ele usou ervilhas com vagens verdes e ervilhas com vagens amarelas Um dos experimentos consistiu no cruzamento de ervilhas de tal modo que se esperava que 25 ou 145 das 580 ervilhas descendentes tivessem vagens amarelas Em vez de obter 145 ervilhas com vagens amarelas ele obteve 152 Suponha que a taxa de 25 de Mendel esteja correta a Ache a probabilidade de que entre 580 ervilhas descendentes exatamente 152 ervilhas tenham vagens amarelas b Ache a probabilidade de que entre 580 ervilhas descendentes pelo menos 152 ervilhas tenham vagens amarelas c Qual resultado é útil para se determinar se a taxa de 25 afirmada por Mendel é incorreta Parte a ou parte b d Há alguma evidência forte que sugira que a taxa de 25 de Mendel seja incorreta 22 Eleitores Mentem Em uma pesquisa com 1002 pessoas 701 disseram ter votado em recente eleição presidencial com base em dados do Grupo de Pesquisa ICR Os registros de votos mostram que 61 dos eleitores em condições de voto realmente votaram Uma vez que 61 dos eleitores em condições de votar realmente votaram ache a probabilidade de que entre 1002 eleitores em condições de votar selecionados aleatoriamente pelo menos 701 realmente tenham votado O que o resultado sugere 23 Telefones Celulares e Câncer de Cérebro Em um estudo com 420095 usuários de telefone celular na Dinamarca descobriuse que 135 desenvolveram câncer de cérebro ou do sistema nervoso Supondo que os telefones celulares não tenham nenhum efeito sobre o desenvolvimento de tais tipos de câncer há uma probabilidade de 0000340 de uma pessoa desenvolver câncer de cérebro ou do sistema nervoso Esperamos então 143 casos de tais cânceres em um grupo de 420095 pessoas selecionadas aleatoriamente Estime a probabilidade de 135 ou menos casos de tais cânceres em um grupo de 420095 pessoas O que o resultado sugere sobre telefones celulares serem uma causa de câncer de cérebro ou do sistema nervoso 24 Contratação de Empreg ado Há 80 de chance de que um empregador verifique o histórico escolar de um candidato a emprego com base em dados do Birô de Assuntos Nacionais Para 100 candidatos selecionados aleatoriamente ache a probabilidade de que exatamente 85 tenham seus históricos verificados 25 Doadores Universais Seis por cento das pessoas típicas têm sangue do tipo O e Rh Essas pessoas são consideradas doadores universais pois podem doar sangue para qualquer pessoa O Providence Memorial Hospital está realizando uma campanha de doação de sangue pois precisa de sangue de pelo menos 10 doadores universais Se 200 voluntários doam sangue qual é a probabilidade de que o número de doadores universais seja de pelo menos 10 É provável que os 200 doadores sejam suficientes 26 Amostragem de Aceitação Com o procedimento chamado amostragem de aceitação uma amostra de itens é selecionada aleatoriamente e o lote inteiro é ou aceito ou rejeitado dependendo dos resultados A Telektronics Company acabou de fabricar um grande lote de unidades de suprimento de energia para computadores e 75 são defeituosos Se o planejamento da amostragem de aceitação é selecionaremse aleatoriamente 80 unidades e aceitarse o lote inteiro se no máximo 4 unidades forem defeituosas qual é a probabilidade de que o lote inteiro seja aceito Com base nos resultados a Telektronics Company tem problemas de controle da qualidade 27 Balas MM 24 São Azuis De acordo com Mars a fábrica das balas não o planeta 24 de todas as balas simples MM são azuis O Conjunto de Dados 18 do Apêndice B mostra que entre 100 balas MM selecionadas 27 são azuis Supondo que a taxa de 24 de balas azuis esteja correta ache a probabilidade de na seleção aleatória de 100 balas MM serem obtidas 27 ou mais balas azuis Com base no resultado é não usual obteremse 27 ou mais balas azuis quando 100 são selecionadas aleatoriamente 28 Detectando Fraude Quando trabalhava para a Procuradoria do Distrito de Brooklyn o investigador Robert Burton analisou os dígitos iniciais em quantias de cheques de companhias sob suspeita de fraude Entre 784 cheques 479 tinham quantias com 5 como dígito inicial mas esperase que entre os cheques emitidos em transações honestas normais 79 tenham quantias com dígito inicial igual a 5 Há forte evidência que indique que as quantias sejam significativamente diferentes de quantias que normalmente são esperadas Explique 29 Medicamento para Redução do Colesterol A probabilidade de uma pessoa que não esteja recebendo qualquer tratamento apresentar os sintomas de gripe é 0019 Em um experimento clínico com Lipitor atorvastatina um medicamento comum usado para baixar o colesterol um grupo de 863 pacientes recebeu tratamento com comprimidos de 10 mg de atorvastatina e 19 desses pacientes apresentaram sintomas de gripe com base nos dados da Pfizer Inc Supondo que esses comprimidos não tenham qualquer efeito sobre os sintomas de gripe estime a probabilidade de pelo menos 19 pessoas entre 863 apresentarem sintomas de gripe O que esses resultados sugerem sobre os sintomas de gripe como reação adversa ao medicamento 30 Precisão de Polígrafo Experimentos com polígrafo realizados pelos pesquisadores Charles R Honts Boise State University e Gordon H Barland Instituto de Polígrafo do Departamento de Defesa mostraram que entre 57 indicações de mentira dadas por polígrafos a verdade havia sido dita em 15 das vezes de modo que a proporção de resultados falsospositivos entre 57 resultados positivos é 1557 Supondo que o polígrafo faça adivinhações aleatórias determine se 15 é um número não usualmente baixo de resultados falsospositivos entre 57 resultados positivos Parece que o polígrafo está fazendo adivinhações aleatórias Explique 31 Superlotando um Boeing 767300 Um avião Boeing 767300 tem 213 assentos Quando alguém compra uma passagem para um voo há uma probabilidade de 00995 de que ela não compareça ao embarque com base em dados do artigo de pesquisa da IBM de Lawrence Hong e Cherrier Um agente de passagens aceita 236 reservas para um voo que usa um Boeing 767300 Ache a probabilidade de não haver assentos suficientes Essa probabilidade é baixa o bastante para que o excesso de reservas não seja uma preocupação 32 Carga de Passageiros em um Boeing 767300 Um avião Boeing 767300 da American Airlines tem 213 assentos Quando totalmente carregado com passageiros carga e combustível o piloto deve verificar se o peso bruto está abaixo do máximo permitido e se o peso está distribuído adequadamente de modo que o equilíbrio do avião fique dentro de limites aceitáveis de segurança Ao se considerarem os pesos dos passageiros esses devem ser estimados de acordo com as regras da Administração Federal de Aviação Homens têm um peso médio de 172 libras enquanto as mulheres têm peso médio de 143 libras de modo que mais passageiros homens resultam em situação insegura de sobrepeso Suponha que se houver pelo menos 122 homens em uma lista de 213 passageiros a carga deve ser de alguma forma ajustada Suponha que as reservas sejam feitas aleatoriamente e que passageiros homens e mulheres sejam equiprováveis Se o avião está cheio de adultos ache a probabilidade de que um Boeing 767300 com 213 passageiros tenha pelo menos 122 homens Com base no resultado parece que a carga deva ser ajustada com frequência 66 Além do Básico 33 Estratégia de Aposta Marc Taylor planeja fazer 200 apostas de 5 dólares em um jogo no cassino Mirage em Las Vegas a Uma estratégia é apostar no número 7 na roleta O rateio da vitória tem chance de 351 e em qualquer giro há uma probabilidade de 138 de que o 7 seja o número vencedor Entre as 200 apostas qual é o número mínimo de vitórias necessárias para que Marc tenha lucro Ache a probabilidade de que ele tenha lucro b Outra estratégia é apostar no pass line no jogo de dados de craps O rateio da vitória tem chance de 11 e em qualquer jogo há uma probabilidade de 244495 de que ele ganhe Entre as 200 apostas qual é o número mínimo de vitórias necessárias para que Marc tenha lucro Ache a probabilidade de que Marc tenha lucro c Com base nos resultados anteriores qual jogo é o melhor investimento o jogo de roleta da parte a ou o jogo de craps da parte b Por quê 34 Sobrecarga em um Boeing 767300 Um avião Boeing 767300 tem 213 assentos Quando alguém compra uma passagem para um voo há uma probabilidade de 00995 de que ela não compareça ao embarque com base em dados do artigo de pesquisa da IBM de Lawrence Hong e Cherrier Quantas reservas podem ser aceitas para um Boeing 767300 para que haja uma probabilidade de pelo menos 095 de que todas as pessoas com reserva que se apresentem para embarque sejam acomodadas 35 Alcançando Joe Suponha que um jogador de beisebol acerte 0350 de modo que sua probabilidade de acerto é 0350 Ignore as complicações causadas pelas caminhadas Suponha também que suas tentativas de acerto sejam independentes umas das outras a Ache a probabilidade de pelo menos 1 acerto em 4 tentativas em um único jogo b Supondo que esse rebatedor esteja em posição de rebater 4 vezes em cada jogo ache a probabilidade de um total de pelo menos 56 acertos em 56 jogos c Supondo que esse rebatedor esteja em posição de rebater 4 vezes em cada jogo ache a probabilidade de pelo menos 1 acerto em cada um de 56 jogos consecutivos o recorde de Joe DiMaggio de 1941 d Qual o número médio mínimo de rebatimentos necessários para que a probabilidade na parte c seja maior do que 01 36 Necessidade de Aproximação pela Normal Essa seção incluiu a afirmativa de que quase todas as aplicações práticas da distribuição de probabilidade binomial podem ser agora tratadas com programas computacionais ou com uma calculadora TI8384 Plus Usando um pacote computacional específico ou uma calculadora TI8384 Plus identifique um caso no qual a tecnologia falha de modo que a aproximação normal para uma distribuição binomial é necessária

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Analise ANOVA de Faixas Salariais - Estudo Comparativo

10

Analise ANOVA de Faixas Salariais - Estudo Comparativo

Estatística 2

UFAL

Prova Estatística - Análise de Associação entre Variáveis

6

Prova Estatística - Análise de Associação entre Variáveis

Estatística 2

UFAL

Probabilidade - Conceitos Basicos Regras e Teorema de Bayes

55

Probabilidade - Conceitos Basicos Regras e Teorema de Bayes

Estatística 2

UFAL

Checklist para Selecao e Avaliacao de Artigo Cientifico em Area de Atuacao

1

Checklist para Selecao e Avaliacao de Artigo Cientifico em Area de Atuacao

Estatística 2

UFAL

Influência da espessura dos segmentos de anel corneano na correção do astigmatismo ceratométrico em pacientes com ceratocone

5

Influência da espessura dos segmentos de anel corneano na correção do astigmatismo ceratométrico em pacientes com ceratocone

Estatística 2

UFAL

Checklist Analise Inferencial Dados Abertos Teste Estatistico

1

Checklist Analise Inferencial Dados Abertos Teste Estatistico

Estatística 2

UFAL

Analise de Obito Infantil e Raca no Brasil 2021 - Datasus

7

Analise de Obito Infantil e Raca no Brasil 2021 - Datasus

Estatística 2

UFAL

Gráfico de Controle: Média Móvel do pH (Dias 5 a 15)

1

Gráfico de Controle: Média Móvel do pH (Dias 5 a 15)

Estatística 2

UFAL

Lista de Estatística

21

Lista de Estatística

Estatística 2

UFAL

Resolucao de Exercicios de Regressao Linear Simples e Econometria

7

Resolucao de Exercicios de Regressao Linear Simples e Econometria

Estatística 2

UFAL

Texto de pré-visualização

61 Revisão e Visão Geral 62 A Distribuição Normal Padrão 63 Aplicações da Distribuição Normal 64 Distribuições Amostrais e Estimadores 65 O Teorema Limite Central 66 A Normal como Aproximação da Binomial 67 Determinação de Normalidade 6 Distribuição de Probabilidade Normal PROBLEMA DO CAPÍTULO Como projetar aviões barcos carros e casas com segurança e conforto A ergonomia envolve o estudo do ajuste das pessoas aos ambientes A ergonomia é usada em uma grande variedade de aplicações tais como as seguintes Projeto de uma porta pela qual a maioria das pessoas possa passar sem se curvar e sem bater a cabeça projeto de um carro de modo que o painel fique facilmente ao alcance da maioria dos motoristas projeto de uma tampa de rosco de garrafa que a maioria das pessoas tenha pega suficiente para abrila projeto de uma cobertura de poço de inspeção que a maioria dos trabalhadores passe por ela O bom planejamento ergonômico resulta em um ambiente seguro funcional eficiente e confortável Mau planejamento ergonômico resulta em condições desconfortáveis não seguras ou possivelmente fatais Por exemplo as seguintes situações reais ilustram a dificuldade na determinação de cargas seguras em aviões e barcos Temos uma emergência para o voo 5480 da Air Midwest disse a piloto Katie Leslie imediatamente antes de seu avião se chocar contra o solo em Charlotte Carolina do Norte A queda do avião Beech matou todas as 21 pessoas a bordo Na investigação subsequente o peso dos passageiros foi considerado como um dos fatores que contribuíram para a queda Isso levou a Administração Federal de Aviação a ordenar que as empresas aéreas coletassem informação sobre peso em voos selecionados aleatoriamente para que fossem atualizadas as antigas hipóteses sobre pesos de passageiros Vinte passageiros foram mortos quando o barco de turismo Ethan Allen virou no Lago George em Nova York Com base no peso médio suposto de 140 libras 6350 kg o barco estava liberado para carregar 50 pessoas Investigação subsequente mostrou que a maioria dos passageiros pesava mais de 200 libras 9072 kg e o barco deveria ter sido liberado para um número menor de passageiros Um táxi aquático afundou recentemente no porto interno de Baltimore Entre as 25 pessoas a bordo 5 morreram e 16 ficaram feridas Uma investigação revelou que a carga segura de passageiros era de 3500 libras Supondo que um passageiro médio pese 140 libras o barco tinha permissão para carregar 25 passageiros mas a média de 140 libras havia sido determinada há 44 anos quando as pessoas não eram tão pesadas quanto agora O peso médio dos 25 passageiros a bordo do barco que afundou era de 168 libras ou 762 kg O Conselho Nacional de Transporte e Segurança sugeriu que a antiga média estimada de 140 libras fosse atualizada para 174 libras 7893 kg de modo que a carga de segurança de 3500 libras permitiria agora apenas 20 passageiros em vez de 25 Este capítulo introduz as ferramentas estatísticas básicas para um bom planejamento ergonômico Depois de completar este capítulo seremos capazes de resolver problemas em uma grande variedade de disciplinas incluindo ergonomia 61 Revisão e Visão Geral No Capítulo 2 consideramos a distribuição de dados e no Capítulo 3 consideramos algumas importantes medidas de conjuntos de dados incluindo medidas de centro e de variação No Capítulo 4 discutimos os princípios básicos de probabilidade e no Capítulo 5 apresentamos o conceito de distribuição de probabilidade No Capítulo 5 consideramos apenas distribuições de probabilidade discretas mas neste capítulo apresentaremos distribuições de probabilidade contínuas Para ilustrar a correspondência entre área e probabilidade começamos com a distribuição uniforme mas a maior parte do capítulo concentrase nas distribuições normais As distribuições normais ocorrem frequentemente em aplicações reais e desempenham papel importante nos métodos de inferência estatística Neste capítulo apresentamos conceitos de distribuições normais que serão bastante usados ao longo deste livro Vários dos métodos estatísticos discutidos em capítulos posteriores se baseiam nos conceitos relacionados ao teorema limite central discutido na Seção 65 Muitas outras seções requerem populações normalmente distribuídas e a Seção 67 apresenta métodos para a análise de dados amostrais para se determinar se a amostra parece ser ou não proveniente de uma população com distribuição normal Figura 61 A Distribuição Normal Curva em forma de sino e simétrica Valor DEFINIÇÃO Se uma variável aleatória contínua tem uma distribuição com um gráfico simétrico e em forma de sino como na Figura 61 e que pode ser descrito pela equação dada como a Fórmula 61 dizemos que ela tem uma distribuição normal Fórmula 61 y e12xμσ2σ2π A Fórmula 61 é matematicamente desafiadora mas nós a mostramos apenas para ilustrar o fato de que qualquer distribuição normal particular é determinada por dois parâmetros a média μ e o desviopadrão σ A Fórmula 61 é como muitas equações com uma variável y no lado esquerdo e uma variável x no lado direito As letras π e e representam os valores constantes de 314159 e 271828 respectivamente Os símbolos μ e σ representam valores fixos para a média e o desviopadrão respectivamente Uma vez selecionados valores específicos para μ e σ podemos fazer o gráfico para a Fórmula 61 do mesmo modo que faríamos o gráfico de qualquer equação que relacionasse x e y o resultado é uma distribuição de probabilidade contínua com a mesma forma de sino mostrada na Figura 61 Pela Fórmula 61 vemos que uma distribuição normal é determinada pelos valores fixos da média μ e do desviopadrão σ E isso é tudo que precisamos saber sobre a Fórmula 61 62 A Distribuição Normal Padrão Conceitochave Esta seção apresenta a distribuição normal padrão que tem as seguintes propriedades 1 Seu gráfico tem forma de sino como na Figura 61 2 Sua média é igual a 0 isto é μ 0 3 Seu desviopadrão é igual a 1 isto é σ 1 Nesta seção desenvolveremos a habilidade para a determinação de áreas ou probabilidades ou frequências relativas correspondentes a várias regiões sob o gráfico da distribuição normal padrão E também encontraremos escores z que correspondem a áreas sob o gráfico Distribuições Uniformes O foco deste capítulo é o conceito de uma distribuição de probabilidade normal mas vamos começar com a distribuição uniforme A distribuição uniforme torna mais fácil vermos estas duas propriedades importantes 1 A área sob o gráfico de uma distribuição de probabilidade é igual a 1 2 Há uma correspondência entre área e probabilidade ou frequência relativa de modo que algumas probabilidades podem ser encontradas pela identificação das áreas correspondentes O Capítulo 5 considerou apenas distribuições de probabilidade discretas mas agora consideraremos distribuições de probabilidade contínuas começando com a distribuição uniforme Uma variável aleatória contínua tem uma distribuição uniforme se seus valores se espalham uniformemente sobre a faixa de valores possíveis O gráfico de uma distribuição uniforme resulta em uma forma retangular Suprimento de Energia Domiciliar A Companhia de Energia e Luz de Newport fornece eletricidade com níveis de voltagem que são uniformemente distribuídos entre 1230 e 1250 volts Isto é qualquer quantidade de voltagem entre 1230 e 1250 volts é possível e todos os possíveis valores são equiprováveis Se selecionamos aleatoriamente um dos níveis de voltagem e representamos seu valor pela variável aleatória x então x tem uma distribuição que tem um gráfico como o da Figura 62 O gráfico de uma distribuição de probabilidade contínua como o da Figura 62 é chamado de curva de densidade e deve satisfazer os dois seguintes requisitos Requisitos para uma Curva de Densidade 1 A área total sob a curva tem que ser igual a 1 2 Cada ponto na curva tem que ter uma altura vertical maior ou igual a 0 Isto é a curva não pode estar abaixo do eixo x Ao fixarmos a altura do retângulo na Figura 62 como 05 forçamos a área compreendida a ser 2 05 1 como exigido Em geral a área de um retângulo se torna 1 quando fazemos sua altura igual ao valor de 1amplitude Essa propriedade área 1 torna muito fácil a resolução de problemas de probabilidade de modo que a afirmativa seguinte é importante Como a área total sob a curva de densidade é igual a 1 existe uma correspondência entre área e probabilidade Nível de Voltagem Dada a distribuição uniforme ilustrada na Figura 62 ache a probabilidade de que um nível de voltagem selecionado aleatoriamente seja maior do que 1245 volts SOLUÇÃO A área sombreada na Figura 63 representa os níveis de voltagem que são maiores do que 1245 volts Como a área total sob a curva de densidade é igual a 1 há uma correspondência entre área e probabilidade Podemos achar a probabilidade desejada usando áreas como segue Pvoltagem maior do que 1245 volts área da região sombreada na Figura 63 05 05 025 A probabilidade de se selecionar aleatoriamente um nível de voltagem maior que 1245 é 025 Distribuição Normal Padrão A curva de densidade de uma distribuição uniforme é uma reta horizontal de modo que podemos achar a área de qualquer região retangular aplicando esta fórmula Área largura altura Como a curva de densidade de uma distribuição normal tem a forma de sino complicada exibida na Figura 61 é mais difícil acharmos a área mas o princípio básico é o mesmo há uma correspondência entre área e probabilidade Na Figura 64 mostramos que para uma distribuição normal padrão a área sob a curva de densidade é igual a 1 A distribuição normal padrão é uma distribuição de probabilidade normal com média μ 0 e desviopadrão σ 1 e a área total sob a curva de densidade é 1 Veja a Figura 64 Não é fácil a determinação de áreas na Figura 64 de modo que os matemáticos calcularam muitas áreas diferentes sob a curva que estão incluídas na Tabela A2 no Apêndice A Determinação de Probabilidades para Valores Dados de Escores z Usando a Tabela A2 no Apêndice A e no encarte Fórmulas e Tabelas podemos achar áreas ou probabilidades para muitas regiões diferentes Tais áreas também podem ser encontradas usandose a calculadora TI8384 Plus ou programas como STATDISK Minitab ou Excel As principais características dos diferentes métodos estão resumidas na Tabela 61 Como as calculadoras e os programas em geral dão resultados mais precisos do que a Tabela A2 é recomendado o uso de tais tecnologias No caso de haver discrepâncias as respostas no Apêndice D geralmente incluirão resultados baseados na Tabela A2 bem como baseados em alguma tecnologia Ao usar a Tabela A2 é fundamental que você compreenda os seguintes pontos 1 A Tabela A2 referese apenas à distribuição normalpadrão que tem média 0 e desviopadrão 1 2 A Tabela A2 é apresentada em duas páginas uma para escores z negativos e a outra para escores z positivos 3 Cada valor no corpo da tabela é a área acumulada a partir da esquerda até uma reta vertical sobre um valor específico do escore z 4 Ao trabalhar com um gráfico evite confusão entre escores z e áreas 5 A parte do escore z que designa os centésimos encontrase na linha do topo da Tabela A2 Ao trabalhar com uma distribuição normal evite confusão entre escores z e áreas METODOS PARA ENCONTRAR ÁREAS DA DISTRIBUIÇÃO NORMAL D á a área acumulada a partir da esquerda até uma linha vertical acima do valor específico de z O procedimento para uso da Tabela A2 está descrito no texto Selecione Analysis Probability Distributions Normal Distribution Introduza o valor z e clique em Evaluate Selecione Calc Probability Distributions Normal Na caixa de diálogo selecione Cumulative Probability Input Constant Selecione fx Statistical DIST NORM Na caixa de diálogo introduza o valor da média do desviopadrão e VERDADEIRO Pressione 2norm cdf e introduza os dois escores z separados por vírgula como em valor z esquerdo valor z direito Capítulo 6 O exemplo a seguir requer que achemos a probabilidade associada a um escore z menor que 127 Comece com o escore z de 127 localizando 12 na coluna à esquerda em seguida ache o valor na linha adjacente das probabilidades que está exatamente abaixo de 007 conforme mostrado na parte extraída da Tabela A2 TABELA A2 continuação Área Acumulada à ESQUERDA z 000 001 002 003 004 005 006 007 008 009 00 05000 05040 05080 05120 05160 05199 05239 05279 05319 05359 01 05398 05438 05478 05517 05557 05596 05636 05675 05714 05753 02 05793 05832 05871 05910 05948 05987 06026 06064 06103 06141 10 08413 08438 08461 08485 08508 08531 08554 08577 08599 08621 11 08643 08665 08686 08708 08729 08749 08770 08790 08810 08830 12 08849 08869 08888 08907 08925 08944 08962 08980 08997 09015 13 09032 09049 09066 09082 09099 09115 09131 09147 09162 09177 14 09192 09207 09222 09236 09251 09265 09279 09292 09306 09319 O valor da área ou probabilidade de 08980 indica que há uma probabilidade de 08980 de selecionarmos aleatoriamente um escore z menor que 127 As seções seguintes considerarão casos nos quais a média não é 0 ou o desviopadrão não é 1 SC EXEMPLO 3 Termômetros Científicos A Companhia de Instrumentos Científicos de Precisão fabrica termômetros que devem informar temperaturas de 0C no ponto de congelamento da água Testes em uma grande amostra desses instrumentos revelam que no ponto de congelamento da água alguns termômetros indicam temperaturas abaixo de 0 indicadas por números negativos e alguns dão temperaturas acima de 0 indicadas por números positivos Suponha que a leitura média seja 0C e que o desviopadrão das leituras seja 100C Suponha também que as leituras sejam normalmente distribuídas Se um termômetro é selecionado aleatoriamente ache a probabilidade de que no ponto de congelamento da água a leitura seja menor que 127 SOLUÇÃO A distribuição de probabilidade das leituras é a distribuição normal padrão porque as leituras são normalmente distribuídas com μ 0 e σ 1 Precisamos achar a área na Figura 65 abaixo de z 127 A área abaixo de z 127 é igual à probabilidade de selecionarmos aleatoriamente um termômetro com leitura inferior a 127 Pela Tabela A2 vemos que essa área é 08980 Figura 65 Achando a Área Abaixo de z 127 INTERPRETAÇÃO A probabilidade de selecionarmos aleatoriamente um termômetro com leitura inferior a 127 no ponto de congelamento da água é igual à área de 08980 mostrada como a região sombreada na Figura 65 Outra maneira de interpretarmos esse resultado é concluir que 8980 dos termômetros terão leituras abaixo de 127 SC EXEMPLO 4 Termômetros Científicos Usando os termômetros do Exemplo 3 ache a probabilidade de selecionarmos aleatoriamente um termômetro que apresente leitura no ponto de congelamento da água superior a 123 SOLUÇÃO Novamente calculamos a probabilidade achando a área correspondente Estamos procurando a área da região que está sombreada na Figura 66 mas a Tabela A2 só se aplica a áreas acumuladas à esquerda Na página para escores z negativos na Tabela A2 vemos que a área à esquerda de z 123 é 01093 conforme exibido Como a área total sob a curva é 1 podemos achar a área sombreada subtraindo 01093 de 1 O resultado é 08907 Embora a Tabela A2 forneça apenas áreas acumuladas à esquerda podemos usála para achar áreas acumuladas à direita conforme mostrado na Figura 66 Figura 66 Achando a Área Acima de z 123 INTERPRETAÇÃO Por causa da correspondência entre probabilidade e área concluímos que a probabilidade de selecionarmos aleatoriamente um termômetro com leitura acima de 123 no ponto de congelamento da água é 08907 que é a área à direita de z 123 Em outras palavras 8907 dos termômetros têm leitura superior a 123 O Exemplo 4 ilustra uma maneira pela qual a Tabela A2 pode ser usada indiretamente para achar áreas acumuladas à direita O exemplo seguinte ilustra outra forma de acharmos áreas usando a Tabela A2 SC EXEMPLO 5 Termômetros Científicos Faça uma seleção aleatória da mesma amostra de termômetros do Exemplo 3 Ache a probabilidade de que o termômetro escolhido apresente leitura no ponto de congelamento da água entre 200 e 150 SOLUÇÃO Estamos novamente lidando com valores normalmente distribuídos com média de 0 e desviopadrão de 1 A probabilidade de selecionarmos um termômetro com leitura entre 200 e 150 corresponde à área sombreada na Figura 67 A Tabela A2 não pode ser usada diretamente para acharmos tal área mas podemos usála para achar que z 200 corresponde à área de 00228 e z 150 corresponde à área de 09332 como mostrado na figura Pela Figura 67 vemos que a área sombreada é a diferença entre 09332 e 00228 A área sombreada é então 09332 00228 09104 Figura 67 Achando a Área entre Dois Valores INTERPRETAÇÃO Usando a correspondência entre probabilidade e área concluímos que há uma probabilidade de 09104 de um termômetro selecionado aleatoriamente apresentar leitura entre 200 e 150 no ponto de congelamento da água Outra maneira de interpretarmos esse resultado é dizer que se muitos termômetros são selecionados e testados no ponto de congelamento da água 09104 ou 9104 deles apresentarão leituras entre 200 e 150 O Exemplo 5 pode ser generalizado como a seguinte regra A área correspondente à região entre dois escores z específicos pode ser encontrada achandose a diferença entre as duas áreas da Tabela A2 A Figura 68 ilustra essa regra geral Note que a região sombreada B pode ser calculada pela diferença entre duas áreas da Tabela A2 áreas A e B combinadas encontrada na Tabela A2 como a área correspondente a zDireita e área A encontrada na Tabela A2 como a área correspondente a zEsquerda Recomendação Não tente memorizar uma regra ou fórmula para esse caso Concentrese em entender como a Tabela A2 funciona Se necessário desenhe um gráfico sombreie a região desejada e pense em uma maneira de achar a área correspondente dada a condição de que a Tabela A2 fornece apenas áreas acumuladas à esquerda Figura 68 Achando a Área entre Dois Valores Área B sombreada áreas A e B combinadas área A área pela Tabela A2 usando zDireita área pela Tabela A2 usando zEsquerda Probabilidades como aquelas dos exemplos precedentes também podem ser expressas com a seguinte notação Notação Pa z b denota a probabilidade de o escore z estar entre a e b Pz a denota a probabilidade de o escore z ser maior que a Pz a denota a probabilidade de o escore z ser menor que a Usando essa notação podemos expressar o resultado do último exemplo como P200 z 150 09104 que afirma em símbolos que a probabilidade de um escore z estar entre 200 e 150 é 09104 Com uma distribuição de probabilidade contínua tal como a distribuição normal a probabilidade de se obter qualquer valor único exato é 0 Isto é Pz a 0 Por exemplo há uma probabilidade 0 de selecionarmos aleatoriamente uma pessoa com altura exatamente igual a 6812345678 polegadas Na distribuição normal qualquer ponto isolado na escala horizontal é representado não por uma região sob a curva mas sim por uma linha vertical acima do ponto Para Pz 150 temos uma linha vertical acima de z 150 mas uma linha vertical não contém qualquer área de modo que Pz 150 0 Para qualquer variável aleatória contínua a probabilidade de qualquer valor exato é 0 o que implica que Pa z b Pa z b Segue também que a probabilidade de se obter um escore z no máximo igual a b é igual à probabilidade de se obter um escore z menor que b É importante interpretar corretamente fraseschave tais como no máximo pelo menos mais do que não mais do que e assim por diante Determinação de Escores z a Partir de Áreas Conhecidas Até agora os exemplos desta seção envolvendo a distribuição normal padrão têm todos seguido o mesmo formato dados escores z achamos áreas sob a curva Essas áreas correspondem a probabilidades Em muitos outros casos temos o inverso dada uma área ou probabilidade achar o escore z correspondente Em tais casos é muito importante que se evite confusão entre escores z e áreas Lembrese escores z são distâncias ao longo da escala horizontal enquanto áreas ou probabilidades são regiões sob a curva A Tabela A2 lista os escores z na coluna à esquerda e ao longo da linha do topo mas as áreas são encontradas no corpo da tabela Também escores z posicionados na metade esquerda da curva são sempre negativos Se já conhecemos a probabilidade e queremos determinar o escore z correspondente nós o encontramos da seguinte maneira Procedimento para a Determinação de um Escore z a Partir de uma Área Conhecida 1 Desenhe uma curva em forma de sino e identifique a região sob a curva que corresponde à probabilidade dada Se a região não é uma região acumulada à esquerda trabalhe com regiões conhecidas que sejam regiões acumuladas à esquerda 2 Usando a área acumulada à esquerda localize a probabilidade mais próxima no corpo da Tabela A2 e identifique o escore z correspondente Ao consultar a Tabela A2 lembrese de que o corpo da tabela dá as áreas acumuladas a partir da esquerda Termômetros Científicos Use os mesmos termômetros do Exemplo 3 com leituras de temperatura no ponto de congelamento da água normalmente distribuídas com média de 0C e desviopadrão de 1C Ache a temperatura correspondente a P95 o 95º percentil Isto é ache a temperatura que separa os 95 inferiores dos 5 superiores Veja a Figura 69 Figura 69 Achando o 95º Percentil Área 095 0 z Solução A Figura 69 mostra o escore z que é o 95º percentil com 95 da área ou 095 abaixo dele Consultando a Tabela A2 procuramos a área 095 no corpo da tabela e então achamos o escore z correspondente Na Tabela A2 encontramos as áreas 09495 e 09505 mas há um asterisco com uma nota especial indicando que 09500 corresponde ao escore z de 1645 Podemos concluir que o escore z na Figura 69 é 1645 de modo que o 95º percentil é a temperatura de 1645C Interpretação Ao se testarem os termômetros no ponto de congelamento 95 das leituras serão menores do que ou iguais a 1645C e 5 serão maiores do que ou iguais a 1645C Tabela A2 Casos Especiais Escore z Área acumulada à Esquerda 1645 09500 1645 00500 2575 09950 2575 00050 Acima de 349 09999 Abaixo de 349 00001 Note que na solução anterior a Tabela A2 nos levou ao escore z de 1645 que está a meio caminho entre 164 e 165 Ao usarmos a Tabela A2 podemos em geral evitar interpolação simplesmente usando o valor mais próximo Há casos especiais listados na tabela na margem que são importantes por serem usados frequentemente em uma ampla variedade de aplicações Para um desses casos especiais o valor z 2576 fornece uma área um pouco mais próxima de 09950 mas z 2575 tem a vantagem de estar a meio caminho entre z 257 e z 258 Com exceção desses casos especiais podemos selecionar o valor mais próximo na tabela Se um valor desejado está a meio caminho entre dois valores da tabela selecione o maior Também para escores z acima de 349 podemos usar 09999 como uma aproximação para a área acumulada à esquerda para escores z abaixo de 349 podemos usar 00001 como uma aproximação para a área acumulada à esquerda Exemplo 7 Termômetros Científicos Usando os mesmos termômetros do Exemplo 3 ache as temperaturas separando os 25 inferiores e os 25 superiores Solução Os escores z pedidos são exibidos na Figura 610 Para achar o escore z localizado à esquerda consulte a Tabela A2 e procure no corpo da tabela a área de 0025 O resultado é z 196 Para achar o escore z localizado à direita consulte a Tabela A2 e procure no corpo da tabela a área de 0975 Lembrese de que a Tabela A2 sempre fornece áreas acumuladas à esquerda O resultado é z 196 Os valores z 196 e z 196 separam os 25 inferiores e os 25 superiores conforme mostrado na Figura 610 Figura 610 Achando Escores z Para encontrar esse escore localize a área acumulada à esquerda na Tabela A2 Localize 0975 no corpo da Tabela A2 Interpretação Ao se testar os termômetros no ponto de congelamento 25 das leituras dos termômetros serão menores do que ou iguais a 196 e 25 das leituras serão maiores do que ou iguais a 196 Outra interpretação é a de que no ponto de congelamento da água 95 de todos os termômetros terão leituras entre 196 e 196 Valores Críticos Para uma distribuição normal um valor crítico é um escore z na fronteira que separa os escores z que têm ocorrência provável daqueles que têm ocorrência improvável Valores críticos comuns são z 196 e z 196 e eles são obtidos como mostrado no Exemplo 7 Nesse exemplo os valores abaixo de z 196 são improváveis de acontecer pois ocorrem em apenas 25 das leituras e os valores acima de z 196 também são improváveis de acontecer pois também ocorrem em apenas 25 das leituras A referência a valores críticos não é tão importante neste capítulo mas se tornará de extrema importância nos capítulos seguintes Usase a notação que segue para valores críticos z encontrados a partir do uso da distribuição normal padrão Notação A expressão zα denota o escore z com uma área α à sua direita α é a letra grega alfa Exemplo 8 Achando zα Na expressão zα faça α 0025 e ache o valor de z0025 Solução A notação de z0025 é usada para representar o escore z com uma área de 0025 à sua direita Consulte a Figura 610 e note que o valor de z 196 tem uma área dez 0025 à sua direita de modo que z0025 196 Cuidado Ao usar a Tabela A2 para encontrar um valor de zα para um valor particular de α note que α é a área à direita de zα mas a Tabela A2 lista áreas acumuladas à esquerda de um dado escore z Para encontrar o valor de zα usando a Tabela A2 resolva isso usando o valor de 1 α No Exemplo 8 o valor de z0025 pode ser encontrado localizandose a área de 09750 no corpo da tabela Os exemplos desta seção foram elaborados de forma tal que a média de 0 e o desviopadrão de 1 coincidissem exatamente com os parâmetros da distribuição normal padrão Na verdade é pouco comum encontraremse tais parâmetros convenientes porque as distribuições normais típicas envolvem médias diferentes de 0 e desviospadrão diferentes de 1 Na próxima seção introduziremos métodos para se trabalhar com tais distribuições que são muito mais realistas Utilizando a Tecnologia Ao se trabalhar com a distribuição normal padrão podese usar a tecnologia para a determinação de escores z ou áreas em lugar da Tabela A2 As instruções que seguem descrevem como encontrar escores z ou áreas Statdisk Selecione Analysis Probability Distributions Normal Distribution Digite o escore z para achar a área correspondente ou digite a área acumulada à esquerda para achar o escore z Depois de digitado algum desses valores clique no botão Evaluate Veja a apresentação que segue para uma entrada de z 200 Minitab Para achar a área acumulada à esquerda de um escore z como na Tabela A2 selecione Calc Probability Distributions Normal Cumulative probabilities Introduza a média 0 e o desviopadrão 1 a seguir clique no botão Input Constant e introduza o escore z Para achar um valor correspondente a uma probabilidade conhecida selecione Calc Probability Distributions Normal Selecione então Inverse cumulative probabilities e a opção Input Constant introduzindo aí a área total à esquerda do valor dado Excel Para achar a área acumulada à esquerda de um valor como na Tabela A2 clique em fx e selecione Estatística e DIST NORMP e introduza o valor do escore z No Excel 2010 selecione DISTNORMN Para achar um valor correspondente a uma probabilidade conhecida clique em fx e selecione Estatística e INVNORMP e introduza a área total à esquerda do valor dado No Excel 2010 selecione INVNORMPN TI8384 Plus Para achar a área entre dois valores pressione 2nd Vars e selecione normalcdf Prossiga para introduzir os dois escores z separados por uma vírgula como em valor esquerdo valor direito O Exemplo 5 poderia ser resolvido com o comando normalcdf200150 que resultaria na probabilidade de 09104 arredondada como exibido na seguinte tela TI8384 Plus normalcdf200 150 9104427093 Para achar um escore z correspondente a uma probabilidade conhecida selecione 2nd VARS e selecione invNorm Prossiga para introduzir a área total à esquerda do escore z Por exemplo o comando invNorm0975 fornece um escore z de 1959963986 que é arredondado para 196 como no Exemplo 6 62 Habilidades e Conceitos Básicos Letramento Estatístico e Pensamento Crítico 1 Distribuição Normal Quando nos referimos a uma distribuição normal a palavra normal tem o mesmo significado que tem na linguagem corrente ou ela tem um significado especial em estatística O que é exatamente uma distribuição normal 2 Distribuição Normal Uma distribuição normal é de uma maneira informal e livre descrita como uma distribuição de probabilidade que tem a forma de sino quando se desenha seu gráfico O que é forma de sino 3 Distribuição Normal Padrão Quais requisitos são necessários para que uma distribuição de probabilidade normal seja uma distribuição de probabilidade normal padrão 4 Notação O que significa a notação zα Distribuição Uniforme Contínua Nos Exercícios 58 consulte a distribuição uniforme contínua ilustrada na Figura 62 Suponha que se selecione aleatoriamente um nível de voltagem entre 1230 volts e 1250 volts e ache a probabilidade de o nível de voltagem dado ser selecionado 5 Maior que 1240 volts 6 Menor que 1235 volts 7 Entre 1232 volts e 1247 volts 8 Entre 1241 volts e 1245 volts Distribuição Normal Padrão Nos Exercícios 912 ache a área da região sombreada O gráfico representa a distribuição normal padrão com média 0 e desviopadrão 1 Distribuição Normal Padrão Nos Exercícios 1316 ache o escore z indicado O gráfico representa a distribuição normal padrão com média 0 e desviopadrão 1 Distribuição Normal Padrão Nos Exercícios 1736 suponha que as leituras de termômetros sejam normalmente distribuídas com média de 0 e desviopadrão de 100C Um termômetro é selecionado aleatoriamente e testado Em cada caso faça um esboço e ache a probabilidade de cada leitura Os valores dados estão em graus Celsius Se usar a tecnologia em vez da Tabela A2 arredonde as respostas para 4 casas decimais 17 Menor que 150 18 Menor que 275 19 Menor que 123 20 Menor que 234 21 Maior que 222 22 Maior que 233 23 Maior que 175 24 Maior que 196 25 Entre 050 e 100 26 Entre 100 e 300 27 Entre 300 e 100 28 Entre 100 e 050 29 Entre 120 e 195 30 Entre 287 e 134 31 Entre 250 e 500 32 Entre 450 e 100 33 Menor que 355 34 Maior que 368 35 Maior que 0 36 Menor que 0 Base para a Regra Empírica da Amplitude e para a Regra Empírica Nos Exercícios 3740 ache a área indicada sob a curva da distribuição normal padrão convertaa em porcentagem e preencha os espaços em branco Os resultados formam a base para a regra empírica introduzida na Seção 33 37 Cerca de da área estão entre z 1 e z 1 ou a até 1 desviopadrão da média 38 Cerca de da área estão entre z 2 e z 2 ou a até 2 desviospadrão da média 39 Cerca de da área estão entre z 3 e z 3 ou a até 3 desviospadrão da média 40 Cerca de da área estão entre z 35 e z 35 ou a até 35 desviospadrão da média Achando Valores Críticos Nos Exercícios 4144 ache os valores indicados 41 z005 42 z001 43 z010 44 z002 Achando Probabilidades Nos Exercícios 4548 suponha que as leituras de termômetros sejam normalmente distribuídas com média de 0C e desviopadrão de 100C Ache a probabilidade indicada onde z é a leitura em graus 45 P196 z 196 46 Pz 1645 47 Pz 2575 ou z 2575 48 Pz 196 ou z 196 Achando Valores de Temperatura Nos Exercícios 4952 suponha que as leituras de termômetros sejam normalmente distribuídas com média de 0C e desviopadrão de 100C Um termômetro é selecionado aleatoriamente e testado Em cada caso faça um esboço e ache a leitura de temperatura correspondente à informação dada 49 Ache P95 o 95º percentil Esta é a leitura de temperatura que separa os 95 inferiores dos 5 superiores 50 Ache P1 o 1º percentil Esta é a leitura de temperatura que separa o 1 inferior dos 99 superiores 51 Se 25 dos termômetros são rejeitados por terem leituras muito altas e outros 25 são rejeitados por terem leituras muito baixas ache as duas leituras de temperatura de corte que separam os termômetros rejeitados dos demais 52 Se 05 dos termômetros são rejeitados por terem leituras muito altas e 05 são rejeitados por terem leituras muito baixas ache as duas leituras de temperatura de corte que separam os termômetros rejeitados dos demais 62 Além do Básico 53 Para uma distribuição normal padrão ache a porcentagem dos dados que estão a dentro de dois desviospadrão da média b a mais de 1 desviopadrão da média c a mais de 196 desviopadrão da média d entre μ 3σ e μ 3σ e a mais de três desviospadrão da média 54 Se uma distribuição uniforme contínua tem parâmetros μ 0 e σ 1 então o mínimo é 3 e o máximo é 3 a Para essa distribuição ache P1 x 1 b Ache P1 x 1 se você supuser incorretamente que a distribuição é normal em vez de uniforme c Compare os resultados das partes a e b A distribuição afeta muito os resultados 55 Suponha que escores z sejam normalmente distribuídos com média 0 e desviopadrão 1 a Se Pz a 09599 ache a b Se Pz b 09772 ache b c Se Pz c 00668 ache c d Se Pd z d 05878 ache d e Se Pe z e 00956 ache e 56 Em uma distribuição uniforme contínua μ mínimo máximo2 e σ amplitude12 Ache a média e o desviopadrão para a distribuição uniforme representada na Figura 62 63 Aplicações da Distribuição Normal Conceitochave Nesta seção introduzimos aplicações reais e importantes que envolvem distribuições normais não padronizadas estendendo os procedimentos apresentados na Seção 62 Usamos uma conversão simples Fórmula 62 que nos permite padronizar qualquer distribuição normal de modo que os métodos da seção precedente podem ser usados com distribuições normais com média diferente de 0 e desviopadrão diferente de 1 Especificamente dada alguma distribuição normal não padronizada devemos ser capazes de encontrar probabilidades correspondentes a valores da variável x e dado algum valor de probabilidade devemos ser capazes de encontrar o valor correspondente da variável x Para trabalhar com distribuições normais não padronizadas simplesmente padronize os valores para usar os mesmos procedimentos da Seção 62 Se convertermos valores para escores z padronizados usando a Fórmula 62 então os procedimentos para se trabalhar com distribuições normais serão os mesmos que aqueles usados para a distribuição normal padrão Fórmula 62 z x μ σ arredonde os escores z para 2 casas decimais Algumas calculadoras e alguns programas computacionais não requerem a conversão para escores z porque as probabilidades podem ser calculadas diretamente No entanto se você usar a Tabela A2 para encontrar probabilidades deverá primeiro converter os valores para escores z padronizados Independentemente do método usado é necessário que você entenda claramente o princípio básico anterior porque ele é uma base importante para conceitos introduzidos em capítulos posteriores A Figura 611 ilustra a conversão de uma distribuição normal não padronizada para uma distribuição normal padrão A área em qualquer distribuição normal limitada por algum escore x como na Figura 611a é igual à área limitada pelo escore z equivalente na distribuição normal padrão como na Fig 611b Isso significa que ao trabalhar com uma distribuição normal não padrão você pode usar a Tabela A2 da mesma forma vista na Seção 62 desde que você converta os valores para escores z Figura 611 Convertendo uma Distribuição Normal Não Padronizada para a Distribuição Normal Padrão Ao achar áreas com uma distribuição normal não padronizada use o seguinte procedimento 1 Esboce a curva normal marque a média e os valores específicos de x e então sombreie a região que representa a probabilidade desejada 2 Para cada valor relevante de x que representa um limite da região sombreada use a Fórmula 62 para converter o valor em seu escore z equivalente 3 Consulte a Tabela A2 ou use uma calculadora ou um programa para achar a área da região sombreada Essa área é a probabilidade desejada O exemplo a seguir aplica esses três passos e ilustra a relação entre uma distribuição normal não padronizada típica e a distribuição normal padrão Por que as Portas Têm Altura de 6 pés e 8 Polegadas Uma porta típica de casa tem uma altura de 6 pés e 8 polegadas ou 80 polegadas 2 metros Como os homens tendem a ser mais altos do que as mulheres consideraremos apenas os homens ao investigar as limitações para alturas de portaspadrão Dado que as alturas de homens são normalmente distribuídas com média de 690 polegadas 1725 m e desviopadrão de 28 polegadas 7 cm ache a porcentagem de homens que passarão por uma portapadrão sem se curvar e sem bater a cabeça Essa porcentagem é alta o bastante para que se continue a usar 80 polegadas como padrão de altura Uma altura de porta de 80 polegadas será suficiente nos próximos anos SOLUÇÃO Passo 1 Veja a Figura 612 que incorpora esta informação Os homens têm alturas que são distribuídas normalmente com uma média de 690 polegadas e um desviopadrão de 28 polegadas A região sombreada representa os homens que passam por portas de altura de 80 polegadas Figura 612 Alturas em polegadas de Homens Passo 2 Para usarmos a Tabela A2 primeiro usamos a Fórmula 62 para passar da distribuição não padronizada para a distribuição normal padrão A altura de 80 polegadas é convertida para um escore z da seguinte forma Passo 3 Consultando a Tabela A2 e usando z 393 encontramos que esse escore z está na categoria de 350 ou mais de modo que a área acumulada à esquerda de 80 polegadas é 09999 como mostrado na Figura 612 Se usarmos a tecnologia em vez da Tabela A2 obteremos uma área acumulada mais precisa de 0999957 em vez de 09999 INTERPRETAÇÃO A proporção de homens que podem passar pelas portas com alturapadrão de 80 polegadas é 09999 ou 9999 Muito poucos homens não poderão passar sem se abaixarem ou baterem a cabeça Essa porcentagem é alta o suficiente para justificar o uso de 80 polegadas como alturapadrão para portas No entanto as alturas de homens e de mulheres vêm aumentando gradual e continuamente nas últimas décadas de modo que haverá um tempo em que a alturapadrão de porta de 80 polegadas não será mais adequada EXEMPLO 2 Pesos ao Nascer Os pesos ao nascer nos Estados Unidos são distribuídos normalmente com média de 3420 g e desviopadrão de 495 g O Hospital Geral de Newport exige tratamento especial para bebês que nasçam com menos de 2450 g não usualmente leves ou mais de 4390 g não usualmente pesados Qual é a porcentagem de bebês que não requerem tratamento especial por terem pesos ao nascer entre 2450 g e 4390 g Sob essas condições muitos bebês precisam de cuidados especiais SOLUÇÃO A Figura 613 mostra a região sombreada que representa pesos ao nascer entre 2450 g e 4390 g Não podemos achar a área sombreada diretamente da Tabela A2 mas podemos achála indiretamente usando os procedimentos básicos apresentados na Seção 62 da seguinte forma 1 Ache a área acumulada à esquerda de 2450 2 ache a área acumulada à esquerda de 4390 3 ache a diferença entre essas áreas Ache a área acumulada à esquerda de 2450 Usando a Tabela A2 vemos que z 196 corresponde à área de 00250 como mostrado na Figura 613 Figura 613 Pesos ao Nascer Ache a área acumulada à esquerda de 4390 Usando a Tabela A2 vemos que z 196 corresponde à área de 09750 como mostrado na Figura 613 Achando a área entre 2450 e 4390 Área sombreada 09750 00250 09500 INTERPRETAÇÃO Expressando o resultado em porcentagem podemos concluir que 9500 dos bebês não exigem cuidados especiais por terem pesos entre 2450 g e 4390 g Segue que 500 dos bebês requerem tratamento especial por serem não usualmente leves ou pesados A taxa de 500 provavelmente não é muito alta para hospitais típicos Encontrando Valores a Partir de Áreas Conhecidas Apresentamos aqui sugestões úteis para aqueles casos em que a área ou probabilidade ou porcentagem é conhecida e devemos achar os valores relevantes 1 Não confunda escores z e áreas Lembre escores z são distâncias ao longo da escala horizontal mas áreas são regiões sob a curva normal A Tabela A2 mostra os escores z nas colunas à esquerda e na linha do topo mas as áreas são encontradas no corpo da tabela 2 Escolha o lado correto direitoesquerdo do gráfico Um valor que separa os 10 superiores dos demais valores está na parte direita do gráfico mas um valor que separa os 10 inferiores está localizado na parte esquerda do gráfico 3 Um escore z tem que ser negativo sempre que se localizar na metade esquerda da distribuição normal 4 Áreas ou probabilidades são valores positivos ou nulos mas nunca são negativos Gráficos são extremamente úteis na visualização na compreensão e no trabalho correto com distribuições de probabilidade normais de modo que você deve usálos sempre que possível Procedimento para Achar Valores Usando a Tabela A2 e a Fórmula 62 1 Esboce a curva da distribuição normal introduza a probabilidade ou porcentagem dada na região apropriada do gráfico e identifique os valores x de interesse 2 Use a Tabela A2 para achar o escore z correspondente à área acumulada à esquerda de x Consulte o corpo da Tabela A2 para achar a área mais próxima e em seguida identifique o escore z correspondente 3 Usando a Fórmula 62 introduza o valor de μ de σ e do escore z encontrado no Passo 2 e resolva em relação a x Com base na Fórmula 62 você pode resolvêla em relação a x como segue x μ z σ outra forma da Fórmula 62 Se z estiver localizado à esquerda da média certifiquese de que seja um número negativo 4 Consulte o esboço da curva para verificar se a solução faz sentido no contexto do gráfico e no contexto do problema O exemplo seguinte usa o procedimento acima esboçado SC EXEMPLO 3 Planejando Alturas de Portas No planejamento de um ambiente um critério comum é que se ajuste a 95 da população Qual a altura de uma porta se 95 dos homens devem passar por ela sem se abaixar e sem bater a cabeça Isto é ache o 95º percentil das alturas dos homens que são normalmente distribuídas com média de 690 polegadas e desviopadrão de 28 polegadas SOLUÇÃO Passo 1 A Figura 614 mostra a distribuição normal com a altura x que desejamos identificar A área sombreada representa 95 dos homens que passam pela porta que estamos planejando Passo 2 Na Tabela A2 procuramos uma área de 09500 no corpo da tabela A área de 0950 mostrada na Figura 614 é a área acumulada à esquerda e é exatamente o tipo de área listada na Tabela A2 A área de 0950 está entre as áreas da tabela de 09495 e 09505 mas há um asterisco e rodapé indicando que uma área de 0950 corresponde a z 1645 Passo 3 Com z 1645 μ 690 e σ 28 podemos resolver em relação a x usando a Fórmula 62 tornase Passo 4 A solução de x 736 polegadas arredondada na Figura 614 é razoável porque é maior do que a média de 690 polegadas INTERPRETAÇÃO Uma altura de porta de 736 polegadas ou 18694 cm permitiria que 95 dos homens passassem sem se curvar ou bater a cabeça Assim 5 dos homens não passariam por uma porta com altura de 736 polegadas Como muitos homens passam por portas com muita frequência essa taxa de 5 provavelmente não seria prática Figura 614 Determinando Altura Ganhando Várias Vezes na Loteria Evelyn Marie Adams ganhou na Loteria de Nova Jersey duas vezes em quatro meses Esse feliz acontecimento foi considerado pela mídia como uma incrível coincidência com uma chance de apenas 1 em 17 trilhões Mas os matemáticos Persi Diaconis e Frederick Mosteller de Harvard mostraram que há uma chance em 17 trilhões de que uma pessoa particular com um bilhete em cada um dos dois jogos da Loteria de Nova Jersey ganhe em ambos Todavia há cerca de 1 chance em 30 de que alguém nos Estados Unidos ganhe duas vezes em um período de quatro meses Diaconis e Mosteller analisaram coincidências e concluíram que com uma amostra suficientemente grande qualquer coisa pode acontecer Mais recentemente de acordo com o Detroit News Joe e Dolly Hornick ganharam na loteria da Pensilvânia quatro vezes em 12 anos com prêmios em dólares de 25 milhões 68000 206217 e 71037 EXEMPLO 4 Pesos ao Nascer O Hospital Geral de Newport deseja redefinir os pesos ao nascer mínimo e máximo que exigem tratamento especial por serem não usualmente baixos ou altos Depois de considerar fatores relevantes um comitê recomenda um tratamento especial para os 3 inferiores e os 1 superiores dos pesos ao nascer Os membros do comitê logo percebem que precisam determinar pesos ao nascer específicos Ajude o comitê a identificar os pesos ao nascer que separam os 3 inferiores e os 1 superior Os pesos ao nascer nos Estados Unidos são normalmente distribuídos com média de 3420 g e desviopadrão de 495 g SOLUÇÃO Passo 1 Iniciamos com o gráfico exibido na Figura 615 Introduzimos a média de 3420 g e identificamos os valores de x que separam os 3 inferiores e o 1 superior Passo 2 Se usarmos a Tabela A2 devemos usar áreas acumuladas à esquerda Para o valor mais à esquerda a área acumulada a partir da esquerda é 003 de modo que procure por uma área de 003 no corpo da tabela para obter z 188 que corresponde à área mais próxima de 00301 Para o valor de x mais à direita a área acumulada a partir da esquerda é 099 de modo que procure por uma área de 099 no corpo da tabela para obter z 233 que corresponde à área mais próxima de 09901 Passo 3 Agora resolvemos em relação aos dois valores de x usando a Fórmula 62 diretamente ou usando a seguinte versão da Fórmula 62 Valor de x mais à esquerda x μ z σ 3420 188 495 24894 Valor de x mais à direita x μ z σ 3420 233 495 457335 Passo 4 Consultando a Figura 615 vemos que o valor mais à esquerda x 24894 g é razoável porque é inferior à média de 3420 g Também o valor mais à direita x 457335 g é razoável porque está acima da média de 3420 g A tecnologia resulta nos valores de 24890 g e 45715 g Figura 615 Encontrando os Valores que Separam os 3 Inferiores e o 1 Superior INTERPRETAÇÃO O peso ao nascer de 2489 g arredondado separa os 3 inferiores dos pesos ao nascer e 4573 arredondado separa o 1 superior dos pesos ao nascer Agora o hospital tem critérios bem definidos para determinar se um bebê recémnascido deve receber tratamento especial relativo a um peso ao nascer não usualmente baixo ou alto Ao usar os métodos desta seção com aplicações que envolvem uma distribuição normal é importante determinar primeiro se você está procurando uma probabilidade ou área a partir de um valor conhecido de x ou se está procurando um valor de x a partir de uma probabilidade conhecida ou área A Figura 616 é um fluxograma que resume os principais procedimentos dessa seção Aplicações com Distribuições Normais Início O que deseja achar Achar uma probabilidade a partir de um valor conhecido de x Está usando tecnologia ou a Tabela A2 Tabela A2 Converta para a distribuição normal padronizada encontrando z z x μσ Procure z na Tabela A2 e encontre a área acumulada à esquerda de z Ache a probabilidade usando a tecnologia Identifique a área acumulada à esquerda de x Está usando tecnologia ou a Tabela A2 Tabela A2 Procure a área acumulada à esquerda na Tabela A2 e ache o escore z correspondente Resolva em relação a x x μ z σ Tecnologia Ache x diretamente pela tecnologia Tecnologia Figura 616 Procedimentos para Aplicações com Distribuições Normais UTILIZANDO A TECNOLOGIA Ao se trabalhar com uma distribuição normal não padronizada podese usar uma tecnologia para a determinação de áreas ou valores da variável relevante em lugar da Tabela A2 As instruções que seguem descrevem o uso da tecnologia em tais casos STATDISK Selecione Analysis Probability Distributions Normal Distribution Digite o escore z para achar a área correspondente ou digite a área acumulada à esquerda para achar o escore z Depois de digitado algum desses valores clique no botão Evaluate MINITAB Para achar a área acumulada à esquerda de um escore z como na Tabela A2 selecione Calc Probability Distributions Normal Cumulative probabilities Introduza a média e o desviopadrão a seguir clique no botão Input Constant e introduza o valor Para achar o escore z correspondente a uma área conhecida selecione Calc Probability Distributions Normal e então selecione Inverse cumulative probabilities Introduza a média e o desviopadrão Selecione a opção Input constant e introduza a área total à esquerda do valor dado EXCEL Para achar a área acumulada à esquerda de um valor como na Tabela A2 clique em fx a seguir selecione Estatística e DISTNORM No Excel 2010 selecione DISTNORMN Na caixa de diálogo introduza o valor de x introduza a média e o desviopadrão e introduza 1 no espaço para cumulativa Para achar o valor correspondente a uma área conhecida clique em fx a seguir selecione Estatística e INVNORM ou INVNORMN no Excel 2010 e faça as entradas na caixa de diálogo Ao fornecer o valor da probabilidade introduza a área total à esquerda do valor dado Veja a apresentação do Excel para o Exemplo 3 EXCEL TI8384 PLUS Para achar a área entre dois valores pressione 2nd VARS 2 para normalcdf e então prossiga para introduzir os dois valores a média e o desviopadrão todos separados por uma vírgula como em valor esquerdo valor direito média desviopadrão Sugestão Se não houver um valor esquerdo introduza 999999 como valor esquerdo e se não houver valor direito introduza 999999 como valor direito No Exemplo 1 desejamos a área à esquerda de x 80 polegadas de modo que use o comando normalcdf999999 80 690 28 como mostrado na apresentação que segue TI8384 PLUS Para achar um valor correspondente a uma área conhecida selecione 2nd VARS selecione invNorm e prossiga para introduzir a área total à esquerda do valor a média e o desviopadrão no formato área total à esquerda média desviopadrão com as vírgulas incluídas TI8384 PLUS normalcdf99999 98069028 9999572562 14 Habilidades e Conceitos Básicos Letramento Estatístico e Pensamento Crítico 1 Distribuições Normais Qual é a diferença entre uma distribuição normal padrão e uma distribuição normal não padronizada 2 Escores de QI A distribuição dos escores de QI é uma distribuição normal não padronizada com média 100 e desviopadrão 15 e desenhase um gráfico em forma de sino para representar essa distribuição a Qual é a área sob a curva b Qual é o valor da mediana c Qual é o valor da moda 3 Distribuições Normais A distribuição dos escores de QI é uma distribuição normal não padronizada com média 100 e desviopadrão 15 Quais são os valores da média e do desviopadrão depois que todos os escores de QI são padronizados com o uso de z x μσ 4 Dígitos Aleatórios Em geral usamse computadores para gerarem dígitos aleatórios de números de telefone a serem usados em sondagens Os métodos desta seção podem ser usados para se achar a probabilidade de que quando um dígito é gerado ele seja menor do que 5 Por que sim ou por que não Qual é a probabilidade de se obter um dígito menor do que 5 Escores de QI Nos Exercícios 58 ache a área da região sombreada O gráfico representa os escores de QI de adultos e esses escores são normalmente distribuídos com média 100 e desviopadrão 15 como no teste Wechsler 5 6 120 80 7 8 90 115 75 110 Escores de QI Nos Exercícios 912 ache o escore de QI indicado O gráfico representa os escores de QI de adultos e esses escores são normalmente distribuídos com média 100 e desviopadrão 15 como no teste Wechsler 9 10 06 08 x x 11 12 095 099 x Escores de QI Nos Exercícios 1320 suponha que os adultos tenham escores de QI normalmente distribuídos com média 100 e desviopadrão 15 como no teste de Wechsler Sugestão Faça um gráfico em cada caso 13 Ache a probabilidade de que um adulto selecionado aleatoriamente tenha um QI menor do que 115 14 Ache a probabilidade de que um adulto selecionado aleatoriamente tenha um QI maior do que 1315 que é a exigência para ser membro da sociedade Mensa 15 Ache a probabilidade de que um adulto selecionado aleatoriamente tenha um QI entre 90 e 110 considerado como a faixa normal 16 Ache a probabilidade de que um adulto selecionado aleatoriamente tenha um QI entre 110 e 120 considerado como a faixa normal brilhante 17 Ache P30 que é o escore de QI que separa os 30 inferiores dos 70 superiores 18 Ache o primeiro quartil Q1 que é o escore de QI que separa os 25 inferiores dos 75 superiores 19 Ache o terceiro quartil Q3 que é o escore de QI que separa os 25 superiores dos demais 20 Ache o escore de QI que separa os 37 superiores dos demais Nos Exercícios 2126 use as seguintes informações baseadas em dados da Pesquisa Nacional de Saúde As alturas de homens são normalmente distribuídas com média de 690 polegadas e desviopadrão de 28 polegadas As alturas de mulheres são normalmente distribuídas com média de 636 polegadas e desviopadrão de 25 polegadas 21 Altura de Porta O monotrilho Mark VI usado na Disney World e o avião comercial Boeing 757200 ER têm portas com altura de 72 polegadas a Qual é a porcentagem de homens adultos que podem passar por essas portas sem se curvar b Qual é a porcentagem de mulheres adultas que podem passar por essas portas sem se curvar c O projeto de porta com 72 polegadas de altura parece ser adequado Explique d Qual altura de porta permitiria que 98 dos homens adultos passassem sem se curvar 22 Altura de Porta O Gulfstream 100 é um jato executivo de seis lugares que tem uma porta de 516 polegadas de altura a Qual é a porcentagem de homens adultos que podem passar por essa porta sem se curvar b Qual é a porcentagem de mulheres adultas que podem passar por essa porta sem se curvar c O projeto de porta com 516 polegadas de altura parece ser adequado Por que os engenheiros não projetaram uma porta maior d Qual altura de porta permitiria que 60 dos homens adultos passassem sem se curvar 23 Tall Clubs International O Tall Clubs International é uma organização social para pessoas altas Ele exige que os homens tenham no mínimo 74 polegadas 18796 cm de altura e as mulheres no mínimo 70 polegadas 17780 cm de altura a Qual porcentagem de homens satisfaz tal exigência b Qual porcentagem de mulheres satisfaz tal exigência c As exigências para homens e mulheres são razoáveis Por que sim ou por que não 24 Tall Clubs International O Tall Clubs International tem exigências de alturas mínimas para homens e mulheres a Se essas exigências são alteradas de modo que os 4 dos homens mais altos é que sejam aceitos qual será a nova altura mínima para homens b Se essas exigências são alteradas de modo que os 4 das mulheres mais altas é que sejam aceitas qual será a nova altura mínima para mulheres 25 Exigência de Altura para Mulheres nas Forças Armadas Americanas As Forças Armadas Americanas exigem que as mulheres tenham alturas entre 58 e 80 polegadas 14732 e 20320 cm a Ache a porcentagem de mulheres que satisfaçam essa exigência Muitas mulheres estão perdendo a oportunidade de entrar para as Forças Armadas por serem muito baixas ou muito altas b Se as Forças Armadas mudam as exigências de altura de modo que todas as mulheres possam entrar exceto o 1 das mulheres mais baixas e os 2 das mulheres mais altas quais seriam as novas exigências de altura 26 Exigência de Altura para Homens na Marinha Americana A Marinha Americana exige que os homens tenham alturas entre 64 e 80 polegadas 16256 e 20320 cm a Ache a porcentagem de homens que satisfaçam as exigências de altura Muitos homens estão perdendo a oportunidade de se tornarem membros da Marinha Americana por não satisfazerem as exigências de altura b Se as exigências de altura são alteradas de modo que todos os homens possam entrar exceto os 3 mais baixos e os 4 mais altos quais seriam as novas exigências de altura 27 Pesos ao Nascer Na Noruega os pesos ao nascer são normalmente distribuídos com uma média de 3570 g e um desviopadrão de 500 g a Se o Hospital Universitário Ulleval em Oslo exige tratamento especial para bebês com pesos ao nascer inferiores a 2700 g qual é a porcentagem de bebês recémnascidos que exigirão tratamento especial b Se os diretores do Hospital Universitário Ulleval planejam pedir tratamento especial para os 3 mais leves dos bebês nascidos qual peso ao nascer separa os que exigem tratamento especial dos que não exigem c Por que não é prático para o hospital estabelecer que os bebês que exigem tratamento especial são os dos 3 inferiores dos pesos ao nascer 28 Pesos de Passageiros de Táxis Aquáticos No Problema do Capítulo vimos que quando um táxi aquático afundou no porto interno de Baltimore uma investigação revelou que a carga segura de passageiros para o táxi aquático era de 3500 libras 15876 kg Vimos também que se supunha que o peso médio dos passageiros fosse de 140 libras Suponha o cenário do pior caso no qual todos os passageiros são homens adultos Isso poderia facilmente ocorrer em uma cidade que recebe convenções nas quais pessoas do mesmo gênero frequentemente viajam em grupos Com base nos dados da National Health and Nutrition Examination Survey suponha que os pesos dos homens sejam normalmente distribuídos com média de 172 libras e desviopadrão de 29 libras a Se um homem é selecionado aleatoriamente ache a probabilidade de que ele pese menos do que 174 libras o novo valor sugerido pelo Conselho Nacional de Transporte e Segurança b Com um limite de carga de 3500 libras quantos passageiros homens poderão embarcar se admitirmos um peso médio de 140 libras c Com um limite de carga de 3500 libras quantos passageiros homens poderão embarcar se usarmos o novo peso médio de 174 libras d Por que é necessário que periodicamente seja revisto e alterado o número de passageiros permitidos em um barco 29 Temperaturas do Corpo Com base nos resultados amostrais do Conjunto de Dados 2 do Apêndice B suponha que as temperaturas do corpo humano sejam distribuídas normalmente com média de 9820F e desviopadrão de 062F a O Hospital Bellevue na Cidade de Nova York usa 1006F como a menor temperatura considerada como febre Qual é a porcentagem de pessoas normais e saudáveis que seriam consideradas febris Tal porcentagem sugere que o corte de 1006F seja apropriado b Os médicos desejam selecionar uma temperatura mínima para a requisição de exames médicos adicionais Qual deve ser essa temperatura se eles desejam que somente 5 das pessoas saudáveis tenham temperatura superior Tal resultado é chamado um falsopositivo o que significa que o resultado do teste deu positivo mas a pessoa não está realmente doente 30 Largura de Assentos de Aeronaves Os engenheiros desejam projetar assentos em aviões comerciais de modo que sejam largos o bastante para acomodarem 99 de todos os homens Acomodar 100 dos homens exigiria assentos muito largos que seriam muito caros Os homens têm larguras de quadris que são normalmente distribuídas com uma média de 144 polegadas e um desviopadrão de 10 polegada com base em dados da sondagem antropométrica de Gordon Clauser et al Ache P99 Isto é ache a largura de quadril que separa os 99 menores do 1 maior 31 Tempos de Gravidez Os tempos de gravidez são normalmente distribuídos com média de 268 dias e desviopadrão de 15 dias a Um uso clássico da distribuição normal é inspirado em uma carta para Dear Abby na qual uma mulher afirmava ter dado à luz 308 dias depois da visita de seu marido que estava em serviço na Marinha Dada essa informação ache a probabilidade de uma gravidez durar 308 dias ou mais O que esse resultado sugere b Se um bebê é classificado como prematuro no caso de a duração da gravidez estar dentro dos 4 tempos inferiores ache o tempo de gravidez que separa os bebês prematuros dos demais Bebês prematuros em geral requerem tratamentos especiais e esse resultado pode ser útil para os administradores de hospitais no planejamento de tais cuidados 32 Distância de Assento Uma exigência comum é de que um item tal como um assento de avião ou de teatro se ajuste a pessoas na faixa entre o 5º percentil para mulheres e o 95º percentil para homens Se essa exigência é adotada quais são as distâncias mínima e máxima de assento Para a distância de assento use o comprimento das nádegas ao joelho Os homens têm esses comprimentos distribuídos normalmente com média de 235 polegadas e desviopadrão de 11 polegada As mulheres têm esses comprimentos distribuídos normalmente com média de 227 polegadas e desviopadrão de 10 polegada Grandes Conjuntos de Dados Nos Exercícios 33 e 34 consulte os conjuntos de dados no Apêndice B e use programas de computador ou uma calculadora 33 Conjunto de Dados do Apêndice B Pressão Sanguínea Sistólica Consulte o Conjunto de Dados 1 no Apêndice B e use os níveis de pressão sanguínea sistólica para homens a Usando os níveis de pressão sanguínea sistólica para homens ache a média e o desviopadrão e verifique que os dados têm uma distribuição que é aproximadamente normal b Supondo que os níveis de pressão sanguínea sistólica de homens sejam normalmente distribuídos ache o 5º e o 95º percentis Considere as estatísticas da parte a como se fossem parâmetros populacionais Tais percentis podem ser úteis para os médicos ao determinarem se níveis de pressão sanguínea sistólica são muito baixos ou muito altos 34 Conjunto de Dados do Apêndice B Tempos de Voos de Ônibus Espacial Consulte o Conjunto de Dados 10 no Apêndice B e use os tempos horas dos voos do ônibus espacial da NASA a Ache a média e o desviopadrão e verifique que os dados têm uma distribuição que é aproximadamente normal b Considere as estatísticas da parte a como se fossem parâmetros populacionais e suponha uma distribuição normal para encontrar os valores dos quartis Q1 Q2 e Q3 63 Além do Básico 35 Unidades de Medida Alturas de mulheres são normalmente distribuídas a Se as alturas de mulheres individuais são expressas em centímetros quais são as unidades usadas para os escores z correspondentes a alturas individuais b Se as alturas de todas as mulheres são convertidas para escores z quais são a média o desviopadrão e a distribuição desses escores z 36 Usando a Correção de Continuidade Há muitas situações em que uma distribuição normal pode ser usada como uma boa aproximação para uma variável aleatória que assume apenas valores discretos Em tais casos podemos usar a correção de continuidade Represente cada número inteiro por um intervalo que se estende de 05 abaixo do número até 05 acima dele Suponha que os escores de QI sejam números inteiros que tenham uma distribuição aproximadamente normal com média de 100 e desviopadrão de 15 a Sem usar a correção de continuidade ache a probabilidade de que uma pessoa selecionada aleatoriamente tenha um escore de QI maior que 103 b Usando a correção de continuidade ache a probabilidade de que uma pessoa selecionada aleatoriamente tenha um escore de QI maior que 103 c Compare os resultados das partes a e b 37 Ajustando Escores de Teste Uma professora de estatística dá um teste e verifica que os escores são normalmente distribuídos com média de 25 e desviopadrão de 5 Ela planeja ajustar os escores a Se ela ajusta as notas adicionando 50 a cada uma qual é a nova média Qual é o novo desviopadrão b É razoável o ajuste pela adição de 50 a cada nota Por que sim ou por que não c Se as notas são ajustadas com o esquema seguinte em vez da adição de 50 ache os limites numéricos para cada conceito A 10 superiores B Escores acima dos 70 inferiores e abaixo dos 10 superiores C Escores acima dos 30 inferiores e abaixo dos 30 superiores D Escores acima dos 10 inferiores e abaixo dos 70 superiores E 10 inferiores d Qual método de ajuste de notas é mais justo a adição de 50 a cada nota ou o uso do esquema dado na parte c Explique 38 Testes SAT e ACT Os escores no teste SAT são normalmente distribuídos com média de 1518 e desviopadrão de 325 Os escores no teste ACT são normalmente distribuídos com média de 211 e desviopadrão de 48 Suponha que os dois testes usem diferentes escalas para medir a mesma aptidão a Se alguém obtém um escore SAT que é o 67º percentil ache seu escore SAT efetivo e o escore ACT equivalente b Se alguém obtém o escore 1900 no SAT ache o escore ACT equivalente 39 Outliers Valores Atípicos Para a construção de diagramas em caixa como descrito na Seção 34 os valores atípicos foram definidos como valores de dados que estão acima de Q3 por uma quantidade maior do que 15 AIQ ou abaixo de Q1 por uma quantidade maior do que 15 AIQ em que AIQ é a amplitude interquartil Usando essa definição de outlier ache a probabilidade de que um valor selecionado aleatoriamente de uma distribuição normal seja um outlier 64 Distribuições Amostrais e Estimadores Conceitochave Nesta seção consideraremos o conceito de uma distribuição amostral de uma estatística Aprenderemos também algumas propriedades importantes das distribuições amostrais da média da mediana da variância do desviopadrão da amplitude e da proporção Veremos que algumas estatísticas tais como a média a variância e a proporção são estimadores não viesados dos parâmetros populacionais enquanto outras estatísticas tais como a mediana e a amplitude não o são Os capítulos que seguem introduzem métodos para o uso das estatísticas amostrais para a estimação de valores de parâmetros populacionais Esses procedimentos se baseiam na compreensão de como se comportam as estatísticas amostrais e tal comportamento é o foco desta seção Começamos com a definição de distribuição amostral de uma estatística DEFINIÇÃO A distribuição amostral de uma estatística tal como a média amostral ou a proporção amostral é a distribuição de todos os valores da estatística quando são extraídas da mesma população todas as amostras possíveis de mesmo tamanho n A distribuição amostral é tipicamente representada como uma distribuição de probabilidade no formato de uma tabela histograma de probabilidade ou fórmula Distribuição Amostral da Média A definição precedente é geral de modo que vamos considerar especificamente a distribuição amostral da média DEFINIÇÃO A distribuição amostral da média é a distribuição das médias amostrais com todas as amostras de mesmo tamanho n extraídas da mesma população A distribuição amostral da média é tipicamente representada como uma distribuição de probabilidade no formato de uma tabela histograma de probabilidade ou fórmula EXEMPLO 1 Distribuição Amostral da Média Considere a repetição deste processo Jogue um dado 5 vezes e ache a média 𝑥 dos resultados Veja a Tabela 62 a seguir O que você sabe sobre o comportamento de todas as médias amostrais que são geradas à medida que esse processo continua indefinidamente Meninos ou Meninas Dominam em uma Família O autor deste livro seus irmãos e os filhos de seus irmãos são ao todo 11 homens e apenas uma mulher Este é um exemplo de um fenômeno pelo qual um gênero domina em uma família Esse problema foi estudado examinandose uma amostra aleatória de 8770 famílias nos Estados Unidos Os resultados foram publicados na revista Chance no artigo Does Having Boys or Girls Run in the Families de Joseph Rodgers e Debby Doughty Parte da análise que fizeram envolve o uso da distribuição de probabilidade binomial A conclusão deles é a de que Não encontramos evidência forte de que a tendência para um gênero domine em uma família SOLUÇÃO A porção superior da Tabela 62 ilustra um processo de jogada de um dado 5 vezes e cálculo da média dos resultados A Tabela 62 mostra resultados da repetição desse processo 10000 vezes mas a verdadeira distribuição amostral da média envolve a repetição do processo indefinidamente Como os valores de 1 2 3 4 5 6 são todos igualmente prováveis a população tem uma média de μ 35 e a Tabela 62 mostra que as 10000 médias amostrais têm uma média de 349 Se o processo continuasse indefinidamente a média das médias amostrais seria 35 Além disso a Tabela 62 mostra que a distribuição das médias amostrais é aproximadamente uma distribuição normal INTERPRETAÇÃO Com base nos resultados amostrais reais mostrados no topo da Tabela 62 podemos descrever a distribuição amostral da média pelo histograma no topo da Tabela 62 A distribuição amostral real seria descrita por um histograma com base em todas as possíveis amostras e não apenas nas 10000 amostras incluídas no histograma mas o número de tentativas é grande o bastante para sugerir que a verdadeira distribuição amostral das médias seja uma distribuição normal Os resultados do Exemplo 1 nos permitem observar estas duas importantes propriedades da distribuição amostral da média 1 As médias amostrais tendem para o valor da média populacional Isto é a média das médias amostrais é a média populacional O valor esperado da média amostral é igual à média populacional 2 A distribuição das médias amostrais tende a ser uma distribuição normal Isso será discutido mais profundamente na seção que segue mas a distribuição tende a se tornar próxima de uma distribuição normal à medida que o tamanho amostral aumenta Distribuição Amostral da Variância Tendo discutido a distribuição amostral da média vamos agora considerar a distribuição amostral da variância DEFINIÇÃO A distribuição amostral da variância é a distribuição das variâncias amostrais com todas as amostras de mesmo tamanho n extraídas da mesma população A distribuição amostral da variância é tipicamente representada como uma distribuição de probabilidade no formato de uma tabela histograma de probabilidade ou fórmula Atenção Ao trabalhar com desviospadrão ou variâncias populacionais certifiquese de calculálos corretamente Relembre da Seção 33 que os cálculos para desviospadrão ou variâncias populacionais envolvem divisão por N não por n 1 como mostrado a seguir Desviopadrão populacional σ Σx μ² N Variância populacional σ² Σx μ² N Como os cálculos são normalmente realizados por um programa de computador ou calculadora tenha cuidado em distinguir entre o desviopadrão de uma amostra e o desviopadrão de uma população Também tenha cuidado em distinguir entre a variância de uma amostra e a variância de uma população Tabela 62 Resultados Específicos para 10000 Tentativas Médias Procedimento Amostral Jogue um dado 5 vezes e encontre a média x População μ 35 Médias Amostrais x Amostra 1 34 Amostra 2 44 Amostra 3 28 Média 349 Aproximadamente normal Variâncias Procedimento Amostral Jogue um dado 5 vezes e ache a variância s² População σ² 29 Variâncias Amostrais s² Amostra 1 18 Amostra 2 23 Amostra 3 22 Média 288 Assimétrica Proporções Procedimento Amostral Jogue um dado 5 vezes e ache a proporção de números ímpares População P 05 Proporções Amostrais Amostra 1 02 Amostra 2 04 Amostra 3 08 Média 050 Aproximadamente normal EXEMPLO 2 Distribuição Amostral da Variância Considere a repetição deste processo Jogue um dado 5 vezes e ache a variância s² dos resultados O que você sabe sobre o comportamento de todas as variâncias amostrais que são geradas à medida que esse processo continua indefinidamente SOLUÇÃO A porção média da Tabela 62 ilustra um processo da jogada de um dado 5 vezes e do cálculo da variância dos resultados A Tabela 62 mostra os resultados da repetição desse processo 10000 vezes mas a verdadeira distribuição amostral da variância envolve a repetição do processo indefinidamente Como os valores de 1 2 3 4 5 6 são todos igualmente prováveis a população tem variância de σ² 29 e a Tabela 62 mostra que as variâncias amostrais têm uma média de 288 Se o processo continuasse indefinidamente a média das variâncias amostrais seria 29 Além disso a parte média da Tabela 62 mostra que a distribuição das variâncias amostrais é uma distribuição assimétrica INTERPRETAÇÃO Com base nos resultados amostrais reais mostrados na parte média da Tabela 62 podemos descrever a distribuição amostral da variância pelo histograma do meio da Tabela 62 A distribuição amostral real seria descrita por um histograma com base em todas as possíveis amostras não apenas nas 10000 amostras incluídas no histograma mas o número de tentativas é grande o bastante para sugerir que a distribuição amostral das variâncias é uma distribuição assimétrica à direita Os resultados do Exemplo 2 nos permitem observar estas duas importantes propriedades da distribuição amostral da variância 1 A variância amostral tende para o valor da variância populacional Isto é a média das variâncias amostrais é a variância populacional O valor esperado da variância amostral é igual à variância populacional 2 A distribuição amostral das variâncias tende a ser uma distribuição assimétrica à direita Distribuição Amostral da Proporção Consideramos agora a distribuição amostral da proporção DEFINIÇÃO A distribuição amostral da proporção é a distribuição das proporções amostrais com todas as amostras de mesmo tamanho n extraídas da mesma população Precisamos fazer a distinção entre uma proporção populacional p e alguma proporção amostral Para isso a seguinte notação é comumente usada Notação para Proporções p proporção populacional p proporção amostral EXEMPLO 3 Distribuição Amostral da Proporção Considere a repetição deste processo Jogue um dado 5 vezes e ache a proporção de números ímpares O que você sabe sobre o comportamento de todas as proporções amostrais geradas à medida que esse processo continua indefinidamente SOLUÇÃO A porção inferior da Tabela 62 ilustra um processo da jogada de um dado 5 vezes e do cálculo da proporção de números ímpares A Tabela 62 mostra os resultados da repetição desse processo 10000 vezes mas a verdadeira distribuição amostral da proporção envolve a repetição do processo indefinidamente Como os valores de 1 2 3 4 5 6 são todos igualmente prováveis a proporção de números ímpares na população é 05 e a Tabela 62 mostra que 10000 proporções amostrais têm uma média de 050 Se o processo continuasse indefinidamente a média das proporções amostrais seria 05 Além disso a parte inferior da Tabela 62 mostra que a distribuição das proporções amostrais é uma distribuição aproximadamente normal INTERPRETAÇÃO Com base nos resultados reais na parte inferior da Tabela 62 podemos descrever a distribuição amostral da proporção pelo histograma da parte inferior da Tabela 62 A distribuição amostral real da proporção seria descrita por um histograma com base em todas as possíveis amostras não apenas nas 10000 amostras incluídas no histograma mas o número de tentativas é grande o suficiente para sugerir que a verdadeira distribuição amostral das proporções seja uma distribuição normal Os resultados do Exemplo 3 nos permitem observar estas duas importantes propriedades da distribuição amostral da proporção 1 A proporção amostral tende para o valor da proporção populacional Isto é a média das proporções amostrais é a proporção populacional O valor esperado da proporção amostral é igual à proporção populacional 2 A distribuição das proporções amostrais tende a ser uma distribuição normal Os três exemplos precedentes se baseiam em 10000 tentativas e os resultados estão resumidos na Tabela 62 A Tabela 63 descreve o comportamento geral das distribuições amostrais da média da variância e da proporção supondo que certas condições sejam satisfeitas Por exemplo a Tabela 63 mostra que a distribuição amostral da média tende a ser uma distribuição normal mas a seção que segue descreve condições que devem ser satisfeitas antes de podermos admitir que a distribuição seja normal Tabela 63 Comportamento Geral de Distribuições Amostrais Médias Médias Amostrais Procedimento Amostral Selecione aleatoriamente n valores e ache a média População Média é Amostra 1 Amostra 2 Amostra 3 Medida de Centro Média Normal Média Variâncias Variâncias Amostrais Procedimento Amostral Selecione aleatoriamente n valores e ache a variância População Variância é Amostra Amostra Amostra Medida de Centro Média Assimétrica Variâncias Amostrais Proporções Proporções Amostrais Procedimento Amostral Selecione aleatoriamente n valores e ache a proporção amostral População Proporção é Amostra 1 Amostra 2 Amostra 3 Medida de Centro Média Normal Proporções Amostrais Capítulo 6 Estimadores Não Viesados Os três exemplos precedentes mostram que as médias variâncias e proporções amostrais tendem para os correspondentes parâmetros populacionais Mais formalmente dizemos que as médias as variâncias e as proporções amostrais são estimadores não viesados Isto é suas distribuições amostrais têm uma média que é igual ao parâmetro populacional correspondente Se desejamos usar uma estatística amostral como a proporção amostral de uma pesquisa para estimar um parâmetro populacional como a proporção populacional é importante que a estatística amostral usada como estimador tenda para o parâmetro populacional em vez de ser um estimado enviesado no sentido de que sistematicamente subestima ou superestima o parâmetro Os três exemplos precedentes e a Tabela 62 envolvem a média a variância e a proporção mas eis um resumo que envolve outras estatísticas Estimadores Não Viesados e Viesados Estimadores Não Viesados As estatísticas seguintes são estimadores não viesados Isto é elas tendem para o valor do parâmetro populacional Média Variância Proporção Estimadores Viesados As estatísticas seguintes são estimadores viesados Isto é elas não tendem para o valor do parâmetro populacional Mediana Amplitude Desviopadrão Nota Importante Os desviospadrão amostrais não tendem para o desviopadrão populacional mas o viés é relativamente pequeno em grandes amostras de modo que s é em geral usado para estimar embora s seja um estimador viesado de σ Os três exemplos precedentes envolveram a jogada de um dado 5 vezes de modo que o número de diferentes amostras possíveis é 6 x 6 x 6 x 6 x 6 7776 Como há 7776 diferentes amostras possíveis não é prática a listagem manual de todas elas O exemplo que segue envolve um número menor de amostras diferentes possíveis de modo que poderemos listálas e descrever a distribuição amostral da amplitude no formato de uma tabela para a distribuição de probabilidade EXEMPLO 4 Distribuição Amostral da Amplitude Três famílias selecionadas aleatoriamente são entrevistadas em um projeto piloto para uma pesquisa maior a ser realizada posteriormente Os números de pessoas nas famílias são 2 3 e 10 com base no Conjunto de Dados 22 no Apêndice B Considere os valores de 2 3 e 10 como uma população Suponha que amostras de tamanho n 2 sejam selecionadas aleatoriamente com reposição da população de 2 3 e 10 a Liste todas as diferentes amostras possíveis e ache a amplitude de cada amostra b Descreva a distribuição amostral das amplitudes no formato de uma tabela que resume a distribuição de probabilidade c Descreva a distribuição amostral das amplitudes no formato de um histograma de probabilidade d Com base nos resultados as amplitudes amostrais tendem para a amplitude populacional que é 10 2 8 e O que esses resultados indicam sobre a amplitude amostral como um estimador da amplitude populacional SOLUÇÃO a Na Tabela 64 listamos as nove diferentes amostras possíveis de tamanho n 2 selecionadas com reposição da população de 2 3 e 10 A Tabela 64 também mostra a amplitude para cada uma das nove amostras b As nove amostras na Tabela 64 são todas igualmente prováveis de modo que cada uma tem probabilidade 19 As duas últimas colunas da Tabela 64 listam os valores da amplitude junto com as probabilidades correspondentes de modo que as duas últimas colunas constituem uma tabela que resume a distribuição de probabilidade que pode ser condensada conforme mostrado na Tabela 65 Portanto a Tabela 65 descreve a distribuição amostral das amplitudes amostrais c A Figura 617 é o histograma de probabilidade com base na Tabela 65 d A média das nove amplitudes amostrais é 36 mas a amplitude da população é 8 Consequentemente as amplitudes amostrais não tendem para a amplitude populacional e Como a média das amplitudes amostrais 36 não é igual à amplitude populacional 8 a amplitude amostral é um estimador viesado da amplitude populacional Isso pode ser visto também pelo simples exame da Tabela 65 notando que na maior parte das vezes a amplitude amostral está bem abaixo da amplitude populacional de 8 Tabela 64 Distribuição Amostral da Amplitude Amostra Amplitude Amostral Probabilidade 2 2 0 19 2 3 1 19 2 10 8 19 3 2 1 19 3 3 0 19 3 10 7 19 10 2 8 19 10 3 7 19 10 10 0 19 Média das amplitudes amostrais 36 arredondada Tabela 65 Distribuição de Probabilidade para a Amplitude Amplitude Amostral Probabilidade 0 39 1 29 7 29 8 29 Figura 617 Histograma de Probabilidade Distribuição Amostral das Amplitudes Amostrais INTERPRETAÇÃO Neste exemplo concluímos que a amplitude amostral é um estimador viesado da amplitude populacional Isso implica que em geral a amplitude amostral não deve ser usada para se estimar o valor da amplitude populacional 232 Capítulo 6 EXEMPLO 5 Distribuição Amostral da Proporção Em estudo de métodos de seleção de gênero um analista considera o processo de geração de 2 nascimentos Quando se selecionam aleatoriamente 2 nascimentos o espaço amostral é mm mf fm ff Esses 4 resultados são igualmente prováveis de modo que a probabilidade de 0 menina é 025 a probabilidade de 1 menina é 05 e a probabilidade de 2 meninas é 025 Descreva a distribuição amostral da proporção de meninas em dois nascimentos como uma distribuição de probabilidade e também como um histograma de probabilidade SOLUÇÃO Veja a apresentação que segue A tabela do topo resume a distribuição de probabilidade para o número de meninas em 2 nascimentos Essa tabela pode ser usada para a construção da distribuição de probabilidade para a proporção de meninas em 2 nascimentos como mostrado Essa mesma tabela também pode ser usada para a construção do histograma de probabilidade como se mostra Número de Meninas em 2 Nascimentos x Px 0 025 1 050 2 025 Distribuição amostral da proporção de meninas em 2 nascimentos Tabela Histograma de probabilidade Proporção de meninas em 2 nascimentos Probabilidade 0 05 1 025 050 025 O Exemplo 5 mostra que uma distribuição amostral pode ser descrita com uma tabela ou um gráfico Distribuições amostrais podem também ser descritas por uma fórmula como no Exercício 21 ou podem ser descritas de algum outra maneira tal como A distribuição amostral da média amostral é uma distribuição normal com μ 100 e σ 15 Por que amostrar com reposição Todos os exemplos nesta seção envolveram amostragem com reposição Amostragem sem reposição teria a vantagem muito prática de evitar duplicação Distribuição de Probabilidade Normal 233 desnecessária sempre que o mesmo item fosse selecionado mais de uma vez No entanto estamos particularmente interessados em amostragem com reposição por essas duas razões 1 Ao se selecionar uma amostra relativamente pequena de uma grande população não faz diferença significativa se amostramos com ou sem reposição 2 A amostragem com reposição resulta em eventos independentes que não são afetados pelos resultados anteriores e eventos independentes são mais fáceis de serem analisados e resultam em cálculos e fórmulas mais simples Pelas razões anteriores nos concentramos no comportamento de amostras que são selecionadas aleatoriamente com reposição Muitos dos procedimentos estatísticos discutidos nos capítulos seguintes se baseiam na suposição de que a amostragem tenha sido feita com reposição O pontochave desta seção é a introdução do conceito da distribuição amostral de uma estatística Considere a tentativa de se obter a temperatura corporal média de todos os adultos Como essa população é muito grande não é prático medirse a temperatura de cada adulto Em vez disso obtemos uma amostra de temperaturas corporais e a usamos para obter uma estimativa da média populacional O Conjunto de Dados 2 no Apêndice B inclui uma amostra de 106 temperaturas corporais A média para essa amostra é x 9820F As conclusões a que podemos chegar sobre a temperatura média populacional de todos os adultos exigem que compreendamos o comportamento da distribuição amostral de todas tais médias amostrais Embora não seja prático obterse cada amostra possível e termos apenas uma amostra podemos chegar a algumas conclusões significativas sobre a população de todas as temperaturas corporais Um objetivo principal das seções e capítulos que seguem é aprendermos como usar efetivamente uma amostra para tirar conclusões sobre uma população Na Seção 65 consideramos mais detalhes sobre a distribuição amostral de médias amostrais e na Seção 66 consideramos mais detalhes sobre a distribuição amostral de proporções amostrais ATENÇÃO Muitos métodos de estatística requerem uma amostra aleatória simples Algumas amostras tais como amostras de resposta voluntária ou amostras de conveniência poderiam facilmente apresentar resultados muito errados 64 Habilidades e Conceitos Básicos Letramento Estatístico e Pensamento Crítico 1 Distribuição Amostral Com suas próprias palavras descreva uma distribuição amostral 2 Distribuição Amostral O Conjunto de Dados 24 no Apêndice B inclui uma amostra de escores de classificação de crédito FICO de consumidores selecionados aleatoriamente Se examinarmos essa amostra através da construção de um histograma e encontrarmos a média e o desviopadrão amostrais estaremos examinando a distribuição amostral da média Por que sim ou por que não 3 Estimador Não Viesado O que significa dizermos que a média amostral é um estimador não viesado da média populacional ou que a média amostral tende para a média populacional 4 Amostragem com Reposição Dê duas razões pelas quais os métodos estatísticos tendem a se basear na hipótese de que a amostragem seja feita com reposição em vez de ser sem reposição 5 Boa Amostra Você deseja estimar a proporção de todos os estudantes de faculdades nos Estados Unidos que têm o profundo bom senso de fazer um curso de estatística Você obtém uma amostra aleatória simples na New York University A proporção amostral resultante é um bom estimador da proporção populacional Por que sim ou por que não 6 Estimadores Não Viesados Quais das seguintes estatísticas são estimadores não viesados de parâmetros populacionais a Média amostral usada para estimar uma média populacional b Mediana amostral usada para estimar uma mediana populacional c Proporção amostral usada para estimar uma proporção populacional d Variância amostral usada para estimar uma variância populacional e Desviopadrão amostral usado para estimar um desviopadrão populacional f Amplitude amostral usada para estimar uma amplitude populacional 7 Distribuição Amostral da Média Amostras de tamanho n 1000 são selecionadas aleatoriamente da população do último dígito de números de telefone Ao se encontrar a média amostral para cada amostra qual é a distribuição das médias amostrais 8 Distribuição Amostral da Proporção Amostras de tamanho n 1000 são selecionadas aleatoriamente da população do último dígito de números de telefone e se encontra a proporção de números pares para cada amostra Qual é a distribuição das proporções amostrais Nos Exercícios 912 consulte a população e lista de amostras no Exemplo 4 9 Distribuição Amostral da Mediana No Exemplo 4 assumimos que amostras de tamanho n 2 são selecionadas aleatoriamente com reposição da população que consiste em 2 3 e 10 em que os valores são números de pessoas em famílias A Tabela 64 lista as nove diferentes amostras possíveis a Ache a mediana de cada uma das nove amostras e resuma a distribuição amostral das medianas no formato de uma tabela que representa a 234 Capítulo 6 distribuição de probabilidade Sugestão Use uma forma semelhante à Tabela 65 b Compare a mediana populacional com a média das medianas amostrais c As medianas amostrais tendem para o valor da mediana populacional Em geral as medianas amostrais constituem bons estimadores das medianas populacionais Por que sim ou por que não 10 Distribuição Amostral do DesvioPadrão Repita o Exercício 9 usando os desviospadrão em lugar das medianas 11 Distribuição Amostral da Variância Repita o Exercício 9 usando variâncias em lugar de medianas 12 Distribuição Amostral da Média Repita o Exercício 9 usando médias em lugar das medianas 13 Presidentes Assassinados Distribuição Amostral da Média As idades anos dos quatro presidentes dos Estados Unidos quando foram assassinados no exercício do cargo são 56 Lincoln 49 Garfield 58 McKinley e 46 Kennedy a Supondo que duas das idades sejam selecionadas com reposição liste as 16 diferentes amostras possíveis b Ache a média de cada uma das 16 amostras e então resuma a distribuição amostral das médias no formato de uma tabela que represente a distribuição de probabilidade Use um formato semelhante ao da Tabela 65 c Compare a média populacional com a média das médias amostrais d As médias amostrais tendem para o valor da média populacional Em geral as médias amostrais são bons estimadores das médias populacionais Por que sim ou por que não 14 Distribuição Amostral da Mediana Repita o Exercício 13 usando medianas em lugar de médias 15 Distribuição Amostral da Amplitude Repita o Exercício 13 usando amplitudes em lugar de médias 16 Distribuição Amostral da Variância Repita o Exercício 13 usando variâncias em lugar de médias 17 Distribuição Amostral da Proporção O Exemplo 4 se referia a três famílias selecionadas aleatoriamente nas quais os números de pessoas eram de 2 3 e 10 Como naquele exemplo considere os valores de 2 3 e 10 como uma população e suponha que amostras de tamanho n 2 sejam extraídas aleatoriamente com reposição Construa uma distribuição de probabilidade que descreva a distribuição amostral da proporção de números ímpares nessas amostras A média das proporções amostrais é igual à proporção de números ímpares na população As proporções amostrais tendem ao valor da proporção populacional A proporção amostral é um bom estimador da proporção populacional 18 Nascimentos Distribuição Amostral da Proporção Quando 3 nascimentos são selecionados aleatoriamente o espaço amostral é mmm mmf fm ff Esses 8 resultados sejam equiprováveis Descreva a distribuição amostral da proporção de meninas em 3 nascimentos como uma tabela de distribuição de probabilidade A média das proporções amostrais é igual à proporção de meninas em 3 nascimentos Sugestão Veja o Exemplo 5 19 Genética Distribuição Amostral da Proporção Um experimento genético envolve uma população de moscas de frutas que consiste em 1 macho Mike e 3 fêmeas chamadas Ana Bárbara e Cristina Suponha que duas moscas de frutas sejam selecionadas aleatoriamente com reposição a Depois de listar as 16 diferentes amostras possíveis ache a proporção de fêmeas em cada amostra e então use uma tabela para descrever a distribuição amostral das proporções de fêmeas b Ache a média da distribuição amostral c A média da distribuição amostral da parte b é igual à proporção populacional de fêmeas A média da distribuição amostral de proporções é sempre igual à proporção populacional 20 Controle da Qualidade Distribuição Amostral da Proporção Depois de construir uma nova máquina de fabricação 5 chips protótipos de circuito integrado são produzidos e verificase que 2 estão defeituosos D e 3 são aceitáveis A Suponha que dois chips sejam aleatoriamente selecionados dessa população com reposição a Depois de identificar as 25 diferentes amostras possíveis ache a proporção de defeituosos em cada uma delas e então use uma tabela para descrever a distribuição amostral das proporções de defeituosos b Ache a média da distribuição amostral c A média da distribuição amostral da parte b é igual à proporção populacional de defeituosos A média da distribuição amostral das proporções é sempre igual à proporção populacional 64 Além do Básico 21 Usando uma Fórmula para Descrever uma Distribuição Amostral O Exemplo 5 inclui uma tabela e um gráfico para descrever a distribuição amostral das proporções de meninas em dois nascimentos Considere a fórmula mostrada a seguir e calcule o valor dessa fórmula para as proporções x de 0 05 e 1 Com base nesses resultados a fórmula descreve uma distribuição amostral Por que sim ou por que não 1 Px em que x 0 05 122 2x2x 22 Desvio Médio Absoluto O desvio médio absoluto de uma amostra é uma boa estatística para se estimar o desvio médio absoluto da população Por que sim ou por que não Sugestão Veja o Exemplo 4 65 O Teorema Limite Central Conceitochave Nesta seção introduzimos a aplicamos o teorema limite central Esse teorema nos diz que para uma população com qualquer distribuição a distribuição das médias amostrais se aproxima de uma distribuição normal à medida que o tamanho amostral aumenta Em outras palavras se o tamanho amostral for bastante grande a distribuição das médias amostrais pode ser aproximada por uma distribuição normal mesmo que a população original não seja normalmente distribuída Além disso se a população original tem média μ e desviopadrão σ a média das médias amostrais será também μ e o desviopadrão das médias amostrais será igual a σn em que n é o tamanho amostral Distribuição de Probabilidade Normal Na Seção 64 discutimos a distribuição amostral de x e nesta seção descrevemos procedimentos para o uso dessa distribuição amostral em aplicações práticas Os procedimentos desta seção constituem o fundamento para a estimação de parâmetros populacionais e teste de hipótese tópicos que serão discutidos em profundidade nos capítulos seguintes Ao se selecionar uma amostra aleatória de n objetos de uma população com média µ e desviopadrão σ é essencial o conhecimento destes princípios 1 Para uma população com distribuição qualquer se n 30 então as médias amostrais têm uma distribuição que pode ser aproximada por uma distribuição normal com média µ e desviopadrão σn 2 Se n 30 e a população original tem uma distribuição normal então as médias amostrais têm uma distribuição normal com média µ e desviopadrão σn 3 Se n 30 mas a população original não tem uma distribuição normal então os métodos desta seção não se aplicam Eis os pontoschave que fornecem a fundamentação para os capítulos que seguem O Teorema Limite Central e a Distribuição Amostral de x Dados 1 A variável aleatória x tem uma distribuição que pode ser ou não normal com média µ e desviopadrão σ 2 Selecionamse amostras aleatórias simples de mesmo tamanho n da população As amostras são selecionadas de tal modo que todas as amostras possíveis de tamanho n têm a mesma chance de serem escolhidas Conclusões 1 À medida que o tamanho amostral aumenta a distribuição das médias amostrais x se aproxima de uma distribuição normal 2 A média das médias amostrais é a média populacional µ 3 O desviopadrão de todas as médias amostrais é σn Regras Práticas Comumente Usadas 1 Se a população original não é normalmente distribuída eis uma diretriz comum Para n 30 a distribuição das médias amostrais pode ser aproximada razoavelmente bem por uma distribuição normal Há exceções tais como populações com distribuições muito distantes de serem normais e que exigem tamanhos amostrais muito maiores do que 30 mas tais exceções são relativamente raras 2 A distribuição das médias amostrais se aproxima cada vez mais de uma distribuição normal à medida que o tamanho amostral n aumenta 2 Se a população original é normalmente distribuída então para qualquer tamanho amostral n as médias amostrais serão normalmente distribuídas O teorema limite central envolve duas distribuições diferentes a distribuição da população original e a distribuição das médias amostrais Como nos capítulos anteriores vamos usar os símbolos µ e σ para designar a média e o desviopadrão da população original mas agora precisamos de uma nova notação para a média e o desviopadrão da distribuição das médias amostrais Notação para a Distribuição Amostral de x Se todas as possíveis amostras de tamanho n são selecionadas de uma população com média µ e desviopadrão σ a média das médias amostrais é designada por µx de modo que µx µ Também o desviopadrão das médias amostrais é designado por σx de modo que σx σ n σx é frequentemente chamado erropadrão da média Capítulo 6 Tabela 66 Distribuições Amostrais O Nebuloso Teorema Limite Central Em The Cartoon Guide to Statistics de Gonick e Smith os autores assim descrevem o Nebuloso Teorema Limite Central Dados que são influenciados por muitos efeitos aleatórios pequenos e não relacionados são distribuídos aproximadamente segundo uma normal Isso explica por que a normal aparece em todos os lugares flutuações do mercado de ações pesos de estudantes temperaturas médias anuais escores SAT todos são resultados de muitos efeitos diferentes A altura de pessoas por exemplo é resultado de fatores hereditários fatores ambientais nutrição cuidados com a saúde região geográfica e outras influências que combinadas produzem valores normalmente distribuídos EXEMPLO 1 Distribuições Normais Uniformes e em Forma de U A Tabela 66 ilustra o teorema limite central Os gráficos de pontos no topo da tabela mostram uma distribuição aproximadamente normal uma distribuição uniforme e uma distribuição que lembra a letra U Em cada coluna o segundo gráfico de pontos mostra a distribuição das médias amostrais em que n 10 e os gráficos de pontos na parte inferior mostram a distribuição das médias amostrais em que n 50 À medida que caminhamos para baixo em cada coluna da Tabela 66 podemos ver que a distribuição das médias amostrais se aproxima de uma distribuição normal Tal característica está incluida entre as seguintes observações que podemos fazer relativas à Tabela 66 À medida que o tamanho amostral aumenta a distribuição das médias amostrais tende a se aproximar de uma distribuição normal A média das médias amostrais é a mesma média da população original À medida que o tamanho amostral aumenta os gráficos de pontos se tornam mais estreitos mostrando que o desviopadrão das médias amostrais se torna menor Aplicando o Teorema Limite Central Muitos problemas práticos podem ser resolvidos com o teorema limite central Ao trabalhar com tais problemas lembre que se o tamanho amostral for maior do que 30 ou se a população original for normalmente distribuída a distribuição das médias amostrais pode ser tratada como se fosse uma distribuição normal com média µ e desviopadrão σn No Exemplo 2 a parte a envolve um valor individual mas a parte b envolve a média de uma amostra de 20 homens de modo que devemos usar o teorema limite central ao trabalhar com a variável aleatória x Estude esse exemplo cuidadosamente para entender a diferença fundamental entre os procedimentos nas partes a e b Valores individuais Ao trabalhar com um valor individual de uma população normalmente distribuída use os métodos da Seção 63 Use z x µ σ Distribuição de Probabilidade Normal Amostra de valores Ao trabalhar com uma média para alguma amostra ou grupo certifiquese de usar σn para o desviopadrão das médias amostrais Use z x µ σn SC EXEMPLO 2 Segurança de Táxi Aquático No Problema do Capítulo notamos que alguns passageiros morreram quando um táxi afundou no porto interior de Baltimore Os homens são tipicamente mais pesados do que mulheres e crianças de modo que ao examinarmos a carga de táxi aquático vamos supor o cenário do pior caso no qual todos os passageiros são homens Com base em dados da Pesquisa Nacional do Exame de Saúde e Nutrição suponha que os pesos dos homens sejam normalmente distribuídos com média de 172 libras e desviopadrão de 29 libras Isto é suponha que a população dos pesos dos homens seja normalmente distribuída com µ 172 libras e σ 29 libras a Ache a probabilidade de que para um indivíduo selecionado aleatoriamente seu peso seja superior a 175 793 kg libras b Ache a probabilidade de que 20 homens selecionados aleatoriamente tenham peso médio superior a 175 libras de modo que o peso total dos 20 exceda a capacidade de segurança de 3500 libras SOLUÇÃO a Abordagem Use os métodos apresentados na Seção 63 porque estamos lidando com um valor individual de uma população normalmente distribuída Procuramos a área da região sombreada na Figura 618a Se usarmos a Tabela A2 convertemos o peso de 175 libras para o escore z correspondente z x µ σ 175 172 29 010 Use a Tabela A2 e use z 010 para encontrar a área acumulada à esquerda de 175 libras que é 05398 A área sombreada é portanto 1 05398 04602 A probabilidade de um homem selecionado aleatoriamente pesar mais do que 175 libras é 04602 Se usarmos uma calculadora ou programa em vez da Tabela A2 o resultado mais preciso é 04588 em lugar de 04602 Figura 618 Pesos de Homens a Distribuição dos Pesos Individuais de Homens b Distribuição das Médias Amostrais b Abordagem Use o Teorema Limite Central porque estamos lidando com a média para uma amostra de 20 homens não com um homem individual Embora o tamanho amostral não seja superior a 30 usamos uma distribuição normal porque a população original de pesos de homens tem uma distribuição normal de modo que amostras de qualquer tamanho resultam em médias que são normalmente distribuídas Como estamos agora lidando com uma distribuição de médias amostrais devemos usar os parâmetros μx e σx que são encontrados como segue μx μ 172 σx σn 2920 64845971 Desejamos encontrar a área sombreada na Figura 618b Veja como a distribuição na Figura 618b é mais estreita porque o desviopadrão é menor Usando a Tabela A2 encontramos o escore z relevante que é calculado como segue z x μxσx 175 1722920 364845971 046 Pela Tabela A2 encontramos que z 046 corresponde a uma área acumulada à esquerda de 06772 de modo que a área sombreada é 1 06772 03228 A probabilidade de que 20 homens tenham peso médio superior a 175 libras é 03228 Se usarmos uma calculadora ou programa o resultado é 03218 em vez de 03228 INTERPRETAÇÃO Há uma probabilidade de 04602 de que um homem individual pese mais de 175 libras e há uma probabilidade de 03228 de que 20 homens tenham peso médio de mais de 175 libras Dado que a capacidade de segurança do táxi aquático é 3500 libras há uma boa chance com probabilidade 03228 de que haja uma sobrecarga se o táxi for ocupado por 20 homens selecionados aleatoriamente Dado que 21 já morreram e dada a alta chance de sobrecarga seria aconselhável limitarse o número de passageiros em algum nível abaixo de 20 A capacidade de 20 passageiros não é bastante segura Os cálculos usados aqui são exatamente o tipo de cálculos usados por engenheiros ao projetarem elevadores de esqui elevadores escadas rolantes aviões e outros aparelhos que conduzem pessoas Introdução ao Teste de Hipótese Os dois próximos exemplos ilustram aplicações do teorema limite central mas examine cuidadosamente as conclusões a que se chega Esses exemplos mostram o tipo de raciocínio que é a base para o importante procedimento de teste de hipótese discutido no Capítulo 8 Esses exemplos usam a regra do evento raro para a inferência estatística apresentada pela primeira vez na Seção 41 Regra do Evento Raro para Inferência Estatística Se sob dada hipótese a probabilidade de ocorrência de um evento for excepcionalmente pequena tal como menor do que 005 concluímos que a hipótese é provavelmente incorreta EXEMPLO 3 Enchendo Latas de CocaCola Latas de CocaCola são rotuladas para indicar que contêm 12 onças O Conjunto de Dados 17 no Apêndice B lista as quantidades medidas para uma amostra de latas de Coca As estatísticas amostrais correspondentes são n 36 e x 1219 onças Se as latas de Coca são cheias de modo que μ 1200 onças Capítulo 6 Qual o Comprimento de um Parafuso de 34 de Polegada Não é totalmente impensável que consideremos que parafusos rotulados como tendo 34 polegada de comprimento tenham um comprimento médio próximo de 34 polegada O Conjunto de Dados 19 no Apêndice B inclui os comprimentos de uma amostra de 50 tais parafusos com um comprimento médio de 07468 polegada Suponha que a população de todos tais parafusos tenha um desviopadrão descrito por σ 00123 polegada com base no Conjunto de Dados 19 a Supondo que os parafusos tenham comprimento médio de 075 polegada ou 34 polegada como rotulado ache a probabilidade de que uma amostra de 50 desses parafusos tenha um comprimento médio de 07468 polegada ou menos Veja a Figura 620 b A probabilidade de se obter uma média amostral que seja pelo menos tão extrema quanto a média amostral dada é duas vezes a probabilidade encontrada na parte a Ache essa probabilidade Note que a média amostral de 07468 polegada difere da média rotulada de 075 polegada por 00032 polegada de modo que outra média é tão extrema quanto a média amostral se for inferior a 075 polegada por 00032 polegada ou mais ou se for superior a 075 polegada por 00032 polegada ou mais c Com base no resultado da parte b parece que a média amostral difira da média rotulada de 075 polegada por uma quantidade significante Explique Figura 620 Distribuição do Comprimento Médio de Parafusos para Amostras de Tamanho n 50 SOLUÇÃO a Não nos foi dada a distribuição da população mas como o tamanho amostral n 50 excede 30 usamos o teorema limite central e concluímos que a distribuição das médias amostrais é uma distribuição normal com estes parâmetros μx μ 075 por hipótese σx σn 0012350 0001739 A Figura 620 mostra a área sombreada correspondente à probabilidade de que 50 parafusos tenham média de 07468 polegada ou menos Podemos encontrar a área sombreada usando os mesmos procedimentos desenvolvidos na Seção 63 Para usar a Tabela A2 primeiro encontramos o escore z z x μxσx 07468 0750001739 184 Consultando a Tabela A2 encontramos que z 184 corresponde a uma área acumulada à esquerda de 00329 A probabilidade de se obter uma média amostral de 07468 polegada ou menos é 00329 b A probabilidade de se obter uma média amostral que seja pelo menos tão extrema quanto a média amostral dada é duas vezes a probabilidade encontrada na parte a de modo que é 2 X 00329 00658 como rotulado e o desviopadrão populacional é σ 011 onça com base nos resultados amostrais ache a probabilidade de que uma amostra de 36 latas tenha média de 1219 onças ou mais Esses resultados sugerem que as latas de Coca são cheias com uma quantidade maior do que 1200 onças SOLUÇÃO Não nos é dada a distribuição da população mas como o tamanho amostral n 36 excede 30 aplicamos o teorema limite central e concluímos que a distribuição das médias amostrais é aproximadamente normal com estes parâmetros μx μ 1200 por hipótese σx σn 01136 0018333 A Figura 619 mostra a área sombreada veja a pequena região à direita do gráfico correspondente à probabilidade procurada Tendo já achado os parâmetros que se aplicam à distribuição mostrada na Figura 619 podemos agora encontrar a área sombreada usando os mesmos procedimentos desenvolvidos na Seção 63 Para usar a Tabela A2 primeiro encontramos o escore z z x μxσx 1219 12000018333 1036 Consultando a Tabela A2 vemos que z 1036 está fora da tabela No entanto para valores de z acima de 349 usamos 09999 para a área acumulada à esquerda Assim concluímos que a área da região sombreada na Figura 619 é 00001 Se usarmos a calculadora TI8384 Plus ou um programa a área da região sombreada é muito menor de modo que relatamos com segurança que a probabilidade é muito pequena tal como 00001 Figura 619 Distribuição das Quantidades de CocaCola em onças INTERPRETAÇÃO O resultado mostra que se a quantidade média de Coca nas latas é realmente 1200 onças então há uma probabilidade extremamente pequena de se obter uma média amostral de 1219 onças ou maior ao selecionarmos aleatoriamente 36 latas Como obtivemos realmente tal média amostral há duas explicações possíveis Ou a média populacional é 1200 onças e a amostra representa um evento que é extremamente raro ou a média populacional é realmente maior do que 1200 onças e a amostra é típica Como a probabilidade é tão baixa parece mais razoável concluirmos que a média populacional é maior do que 1200 onças Parece que as latas de Coca estão sendo cheias com mais de 1200 onças No entanto a média amostral de 1219 onças sugere que a quantidade média de excesso é muito pequena Parece que a companhia CocaCola encontrou uma maneira de garantir que muito poucas latas tenham menos de 12 onças e ao mesmo tempo não desperdiçar muito de seu produto c O resultado da parte b mostra que há uma probabilidade de 00658 de se obter uma média amostral que seja pelo menos tão extrema quanto a média amostral dada Usando uma probabilidade de corte de 005 para distinguir entre eventos usuais de não usuais vemos que a probabilidade de 00658 excede 005 de modo que a média amostral não é não usual Consequentemente concluímos que a média amostral dada não difere da média rotulada de 075 polegada por uma quantidade substancial O rótulo de 34 polegada ou 075 polegada parece justificado O raciocínio dos Exempos 3 e 4 é o tipo do raciocínio usado no teste de hipótese a ser introduzido no Capítulo 8 Por enquanto focalizamos o uso do teorema limite central para encontrar probabilidades indicadas mas devemos reconhecer que esse teorema será usado mais tarde no desenvolvimento de importantes conceitos em estatística Correção para uma População Finita Na aplicação do teorema central do limite o uso de σx σ n supõe que a população seja infinitamente grande Quando amostramos com reposição isto é colocamos de volta cada item selecionado antes de fazer a próxima seleção a população é efetivamente infinita No entanto muitas aplicações reais envolvem amostragem sem reposição de modo que as seleções sucessivas dependem dos resultados anteriores Em fábricas inspetores de controle de qualidade comumente amostram itens sem reposição de uma sequência finita de produção Para tal população finita é necessário fazerse um ajuste em σx Eis uma regra empírica comum Quando tirar amostras sem reposição e o tamanho amostral n for maior que 5 do tamanho finito N da população isto é n 005N ajuste o desviopadrão das médias amostrais σx multiplicandoo pelo fator de correção para população finita N n N 1 Com exceção dos Exercícios 22 e 23 os exemplos e exercícios desta seção supõem que o fator de correção para população finita não se aplica porque estamos tirando amostras com reposição ou porque a população é infinita ou porque o tamanho da amostra não excede 5 do tamanho da população O teorema limite central é tão importante porque permite o uso de métodos básicos da distribuição normal em uma grande variedade de circunstâncias diferentes No Capítulo 7 por exemplo aplicaremos o teorema ao usarmos dados amostrais para estimar médias de populações No Capítulo 8 vamos aplicálo ao usar dados amostrais para testar afirmativas feitas sobre médias populacionais A Tabela 67 resume as condições sob as quais podemos e não podemos usar a distribuição normal Tabela 67 Distribuições de Médias Amostrais População com média μ e desviopadrão σ Distribuição das Médias Amostrais Média das Médias Amostrais Desviopadrão das Médias Amostrais Normal Normal para qualquer tamanho amostral n μx μ σx σ n Não normal com n 30 Normal aproximadamente μx μ σx σ n Não normal com n 30 Não normal μx μ σx σ n 65 Habilidades e Conceitos Básicos Letramento Estatístico e Pensamento Crítico 1 ErroPadrão da Média O que é o erropadrão da média 2 Amostra Pequena Quando selecionamos amostras de tamanho n 2 de uma população com média e desviopadrão conhecidos quais exigências devem ser satisfeitas para se poder admitir que a distribuição das médias amostrais seja uma distribuição normal 3 Notação O que significa a notação μx O que significa a notação σx 4 Distribuição de Rendas Suponha que coletemos uma grande amostra aleatória simples grande n 30 de rendas anuais de adultos nos Estados Unidos Como a amostra é grande podemos aproximar a distribuição dessas rendas por uma distribuição normal Por que sim ou por que não Usando o Teorema Limite Central Nos Exercícios 58 suponha que os escores SAT sejam normalmente distribuídos com média μ 1518 e desviopadrão σ 325 com base nos dados do College Board 5 a Se 1 escore SAT é selecionado aleatoriamente ache a probabilidade de que seja menor que 1500 b Se 100 escores SAT são selecionados aleatoriamente ache a probabilidade de que tenham média menor que 1500 6 a Se 1 escore SAT é selecionado aleatoriamente ache a probabilidade de que seja maior que 1600 b Se 64 escores SAT são selecionados aleatoriamente ache a probabilidade de que tenham média maior que 1600 7 a Se 1 escore SAT é selecionado aleatoriamente ache a probabilidade de que esteja entre 1550 e 1575 b Se 25 escores SAT são selecionados aleatoriamente ache a probabilidade de que tenham média entre 1550 e 1575 c Por que o teorema limite central pode ser aplicado na parte b mesmo com tamanho de amostra menor que 30 8 a Se 1 escore SAT é selecionado aleatoriamente ache a probabilidade de que esteja entre 1440 e 1480 b Se 16 escores SAT são selecionados aleatoriamente ache a probabilidade de que tenham média entre 1440 e 1480 c Por que o teorema limite central pode ser aplicado na parte b mesmo com tamanho de amostra menor que 30 9 Segurança em Táxi Aquático Com base em dados da Pesquisa Nacional de Exame de Saúde e Nutrição suponha que os pesos de homens sejam normalmente distribuídos com média de 172 libras e desviopadrão de 29 libras a Ache a probabilidade de que se um homem individual é selecionado aleatoriamente seu peso seja superior a 180 libras b Ache a probabilidade de que 20 homens selecionados aleatoriamente tenham peso médio superior a 180 libras c Se 20 homens têm peso médio superior a 180 libras o peso total excede o limite de carga de segurança de 3500 libras de um táxi aquático particular Com base nos resultados anteriores isso constitui uma preocupação para a segurança Por que sim ou por que não 10 Mensa Associarse à Mensa requer um escore de QI acima de 1315 Nove candidatos fazem testes de QI e seus resultadosresumo indicam que seu QI médio é 133 Os escores de QI são distribuídos normalmente com média 100 e desviopadrão 15 a Se uma pessoa é selecionada aleatoriamente da população geral ache a probabilidade de ser uma pessoa com escore de QI de pelo menos 133 b Se 9 pessoas são selecionadas aleatoriamente ache a probabilidade de que seu escore médio de QI seja de pelo menos 133 c Embora os resultadosresumo estejam disponíveis os escores de QI individuais se perderam Podese concluir que todos os 9 candidatos têm escores de QI acima de 1315 de modo que podem ser admitidos como membros da Mensa 11 Segurança em Góndolas Uma gôndola de esqui em Vail Colorado carrega esquiadores para o topo de uma montanha Ela leva uma placa na qual se diz que a capacidade máxima é de 12 pessoas ou 2004 libras Tal capacidade será excedida se 12 pessoas tiverem pesos com uma média superior a 200412 167 libras Como os homens tendem a pesar mais do que as mulheres a pior situação envolve 12 passageiros que sejam todos homens Os homens têm pesos que são normalmente distribuídos com média de 172 lb e desviopadrão de 29 lb com base em dados da Pesquisa Nacional de Saúde a Ache a probabilidade de que um homem individual selecionado aleatoriamente tenha peso superior a 167 libras b Ache a probabilidade de que 12 homens selecionados aleatoriamente tenham um peso médio superior a 167 libras de modo que o peso total será maior do que a capacidade máxima da gôndola de 2004 lb c A gôndola parece ter o limite de peso correto Por que sim ou por que não 12 Efeito da Dieta sobre Duração da Gravidez A duração da gravidez é normalmente distribuída com média de 268 dias e desviopadrão de 15 dias a Se 1 mulher grávida é selecionada aleatoriamente ache a probabilidade de que a duração de sua gravidez seja inferior a 260 dias b Se 25 mulheres selecionadas aleatoriamente são colocadas sob dieta logo antes de engravidarem ache a probabilidade de que a duração de sua gravidez tenha média inferior a 260 dias supondose que a dieta não tenha nenhum efeito c Se as 25 mulheres realmente têm duração média de gravidez inferior a 260 dias parece que a dieta tem algum efeito sobre a duração da gravidez e os supervisores médicos deveriam ficar preocupados 13 Pressão Sanguínea Para mulheres de 1824 anos a pressão sanguínea sistólica em mmHg é normalmente distribuída com média de 1148 e desviopadrão de 131 com base nos dados da Pesquisa Nacional de Saúde A hipertensão é comumente definida como pressão sanguínea sistólica acima de 140 a Se uma mulher com idade entre 18 e 24 anos é selecionada aleatoriamente ache a probabilidade de sua pressão sanguínea sistólica ser maior do que 140 b Se 4 mulheres nessa mesma faixa etária são selecionadas aleatoriamente ache a probabilidade de sua pressão sanguínea sistólica média ser maior do que 140 c Dado que a parte b envolve uma amostra inferior a 30 por que o teorema limite central ainda pode ser aplicado d Se um médico recebe um relatório afirmando que 4 mulheres apresentaram pressão sanguínea sistólica média inferior a 140 ele pode concluir que nenhuma delas tem hipertensão com pressão sanguínea superior a 140 14 Projetando Capacetes de Motociclistas Os engenheiros têm que considerar a largura da cabeça dos homens ao desenhar capacetes para motociclistas Os homens têm cabeças com larguras normalmente distribuídas com média de 60 polegadas e desviopadrão de 10 polegada com base nos dados de uma pesquisa antropométrica de Gordon Churchill et al a Se um homem é selecionado aleatoriamente ache a probabilidade de que sua cabeça tenha largura inferior a 62 polegadas b A Companhia Capacetes de Segurança planeja uma sequência inicial de produção de 100 capacetes Ache a probabilidade de 100 homens of Diseases of Children Vol 140 Suponha que 36 dessas crianças sejam selecionadas aleatoriamente para um estudo de acompanhamento a Ao se considerar a distribuição das idades médias para grupos de 36 crianças σx deve ser corrigido usandose o fator de correção para população finita Explique b Ache a probabilidade de que a idade média do grupo amostral de acompanhamento seja superior a 100 anos 23 Corrigindo para uma População Finita O Newport Varsity Club tem 210 membros cujos pesos têm uma distribuição aproximadamente normal com média de 163 libras e desviopadrão de 32 libras O projeto para uma nova construção no clube inclui um elevador com capacidade limitada de 12 passageiros a Considerandose a distribuição dos pesos médios de 12 passageiros σx deve ser corrigido usandoo fator de correção para população finita Explique b Se o elevador for projetado para carregar com segurança uma carga de até 2100 libras qual é o peso médio máximo de segurança quando o elevador levar 12 passageiros c Se o elevador leva 12 membros do clube selecionados aleatoriamente qual é a probabilidade de que o peso total ultrapasse o limite de segurança de 2100 libras Essa probabilidade é baixa o bastante d Qual é o número máximo de passageiros que se deve permitir no elevador se desejamos uma probabilidade de 0999 de que o elevador não será sobrecarregado quando levar 12 membros do clube selecionados aleatoriamente 24 Parâmetros Populacionais Três famílias selecionadas aleatoriamente são entrevistadas em um projeto piloto para uma pesquisa maior a ser realizada posteriormente Os números de pessoas nas famílias são 2 3 e 10 com base no Conjunto de Dados 22 no Apêndice B Considere os valores 2 3 e 10 como uma população Suponha que amostras de tamanho n 2 sejam selecionadas aleatoriamente sem reposição a Ache μ e σ b Depois de encontrar todas as possíveis amostras de tamanho n 2 sem reposição ache a população dos valores de x encontrando a média de cada uma das amostras de tamanho n 2 c Ache a média μx e o desviopadrão σx para a população de médias amostrais encontrada na parte b d Verifique que μx μ e σx σn N nN 1 66 A Normal como Aproximação da Binomial Conceitochave Esta seção apresenta um método para se usar uma distribuição normal como uma aproximação da distribuição binomial Se as condições np 5 e nq 5 são ambas satisfeitas então as probabilidades de uma distribuição de probabilidade binomial podem ser aproximadas razoavelmente bem por uma distribuição normal com média μ np e desviopadrão σ npq Como uma distribuição de probabilidade binomial usa tipicamente apenas números inteiros para a variável aleatória x enquanto a aproximação normal é contínua devemos usar uma correção de continuidade com um número inteiro x representado pelo intervalo de x 05 a x 05 Nota Em vez de usar uma distribuição normal como uma aproximação para uma distribuição de probabilidade binomial muitas aplicações práticas da distribuição binomial podem ser tratadas com o uso de programas computacionais ou calculadoras mas esta seção introduz o princípio de que uma distribuição binomial pode ser aproximada por uma distribuição normal e esse princípio será usado em capítulos posteriores Na Seção 53 estabeleceuse que uma distribuição de probabilidade binomial tem 1 um número fixo de tentativas 2 as tentativas são independentes 3 tentativas são classificadas em duas categorias comumente chamadas de sucesso e fracasso 4 as tentativas têm a propriedade de que a probabilidade de sucesso permanece constante Lembrese também desta notação n o número fixo de tentativas x o número específico de sucessos em n tentativas p probabilidade de sucesso em uma de n tentativas q probabilidade de fracasso em uma de n tentativas Considere esta situação O autor recebeu por correio uma pesquisa da Viking River Cruises supostamente enviada a muitas pessoas Suponha que a pesquisa pedisse um endereço de email que tenha sido enviada a 40000 pessoas e que a porcentagem devolvida com endereço de email seja de 3 Suponha que o verdadeiro objetivo da pesquisa fosse obter uma listagem de pelo menos 1150 endereços de email para uma campanha agressiva Para obtermos a probabilidade de se ter pelo menos 1150 respostas com endereços de email podemos usar a distribuição de probabilidade binomial com n 40000 p 003 e q 097 Veja a apresentação do Minitab ao lado que mostra um gráfico da probabilidade para cada número de sucessos de 1100 a 1300 e note que o gráfico parece ser uma distribuição normal embora os pontos grafados sejam de uma distribuição binomial Os outros valores de x têm probabilidades muito próximas de zero Esse gráfico sugere que podemos usar uma distribuição normal para aproximar a distribuição binomial Note que os requisitos incluem verificação de que np 5 e nq 5 O valor mínimo de 5 é comum mas não é absolutamente rígido e alguns livrostexto usam 10 Esse requisito está incluído no procedimento seguinte para uso da normal como aproximação de uma distribuição binomial Distribuição Normal como uma Aproximação para a Distribuição Binomial Requisitos 1 A amostra é uma amostra aleatória simples de tamanho n de uma população na qual a probabilidade de sucessos é p ou a amostra é o resultado da realização de n tentativas independentes de um experimento binomial no qual a probabilidade de sucessos é p 2 np 5 e nq 5 Aproximação Normal Se os requisitos anteriores são satisfeitos então a distribuição de probabilidade da variável aleatória x pode ser aproximada por uma distribuição normal com estes parâmetros μ np σ npq Correção de Continuidade Ao usar a aproximação normal ajuste o número inteiro discreto x usando a correção de continuidade de modo que x seja representado pelo intervalo de x 05 a x 05 Procedimento para o Uso de uma Distribuição Normal como Aproximação de uma Distribuição Binomial 1 Verifique que ambos os requisitos precedentes sejam satisfeitos Se esses requisitos não são ambos satisfeitos então você deve usar um software ou uma calculadora ou a Tabela A1 ou a fórmula da probabilidade binomial 2 Ache os valores dos parâmetros μ e σ calculando μ np e σ npq 3 Identifique o valor discreto x que é relevante para o problema de probabilidade binomial Por exemplo se você estiver tentando encontrar a probabilidade de se obter pelo menos 1150 sucessos entre 40000 tentativas como no Exemplo 1 o número inteiro relevante é x 1150 Primeiro atente para o valor de 1150 e ignore temporariamente se você deseja pelo menos 1150 mais do que 1150 menos do que 1150 no máximo 1150 ou exatamente 1150 4 Esboce uma distribuição normal centrada em torno de μ então desenhe uma faixa vertical acima de x centrada em x Marque o lado esquerdo da faixa como número x 05 e marque o lado direito da faixa com o número x 05 Com x 1150 por exemplo desenhe uma faixa de 11495 a 11505 Considere que toda a área da faixa inteira representa a probabilidade do número inteiro discreto x 5 Agora determine se o próprio valor de x deve ser incluído na probabilidade que você deseja Por exemplo pelo menos x inclui x mas mais do que x não inclui x Em seguida determine se você deseja a probabilidade de pelo menos x no máximo x mais do que x menos do que x ou exatamente x Sombreie a área à direita ou à esquerda da faixa conforme apropriado sombreie também o interior da faixa se e somente se o próprio valor de x deva ser incluído Essa região total sombreada corresponde à probabilidade procurada 6 Usando x 05 ou x 05 no lugar de x ache a área da região sombreada no Passo 5 como segue Primeiro encontre o escore z z x μσ com ou x 05 ou x 05 usado no lugar de x Em segundo lugar use o escore z para achar a área à esquerda do valor ajustado de x Em terceiro lugar essa área acumulada à esquerda pode agora ser usada para identificar a área sombreada correspondente à probabilidade desejada Voltaire Vence a Loteria Em 1729 o filósofo Voltaire tornouse rico ao vislumbrar um esquema para vencer a loteria de Paris O governo patrocinava um jogo para repor bônus municipais que haviam perdido valor A cidade acrescentou grandes quantias de dinheiro de modo que os prêmios totalizavam mais do que o custo de todos os bilhetes Voltaire formou um grupo que comprou todos os bilhetes na loteria mensal e ganhou por mais de um ano Um apostador na Loteria do Estado de Nova York tentou ganhar uma parte de um prêmio excepcionalmente grande que cresceu por falta de ganhadores nos concursos anteriores Ele tentou dar um cheque de 6135756 dólares que cobriria todas as combinações mas o estado recusou alegando que a natureza da loteria teria sido alterada SC EXEMPLO 1 Pesquisa por Correio O autor recebeu pelo correio uma pesquisa da Viking River Cruises e essa pesquisa incluía um pedido de um endereço de email Suponha que a pesquisa tenha sido enviada a 40000 pessoas e que a porcentagem de respostas com endereços de email seja de 3 Se o verdadeiro objetivo era conseguir um banco de pelo menos 1150 endereços de email ache a probabilidade de serem obtidos pelo menos 1150 respostas com endereços de email SOLUÇÃO O problema dado envolve uma distribuição binomial com um número fixo de tentativas n 40000 que são independentes Há duas categorias para cada pesquisa obtémse uma resposta com um endereço de email ou não A probabilidade de sucesso p 003 presumidamente permanece constante de uma para outra tentativa Os cálculos com a fórmula da probabilidade binomial não são práticos porque teríamos de aplicála 38851 vezes uma para cada valor de x de 1150 a 40000 inclusive As calculadoras não podem realizar o primeiro cálculo para a probabilidade de exatamente 1150 sucessos Algumas calculadoras fornecem tal resultado mas usam um método de aproximação em vez de um cálculo exato A melhor estratégia é prosseguir com a abordagem do uso da distribuição normal para aproximar a distribuição binomial Passo 1 Verificação de requisitos Embora se desconheça como os indivíduos da pesquisa foram selecionados prosseguiremos sob a hipótese de que temos uma amostra aleatória simples Devemos verificar se é razoável aproximarmos a distribuição binomial pela distribuição normal por serem np 5 e nq 5 Com n 40000 p 003 e q 1 p 097 verificamos os requisitos como segue np 40000 003 1200 Portanto np 5 nq 40000 097 38800 Portanto nq 5 Passo 2 Prosseguimos agora para encontrar os valores para os parâmetros μ e σ que são necessários para a distribuição normal Obtivemos o seguinte μ np 40000 003 1200 σ npq 40000 003 097 34117444 Passo 3 Desejamos a probabilidade de pelo menos 1150 respostas com endereço de email de modo que x 1150 é o número inteiro relevante para esse exemplo Passo 4 Veja a Figura 621 que mostra uma distribuição normal com média μ 1200 e desviopadrão σ 34117444 A Figura 621 mostra também a faixa vertical de 11495 a 11505 Passo 5 Desejamos encontrar a probabilidade de se obterem pelo menos 1150 respostas com endereço de email de modo que desejamos sombrear a faixa vertical que representa 1150 bem com a área à sua direita A área desejada está sombreada na Figura 621 Passo 6 Desejamos a área à direita de 11495 na Figura 621 de modo que o escore z é encontrado usandose os valores de μ e σ do Passo 2 e o valor de fronteira de 11495 como segue z x μσ 11495 120034117444 148 Usando a Tabela A2 encontramos que z 148 corresponde a uma área de 00694 de modo que a região sombreada na Figura 621 é 1 00694 09306 A área desse intervalo aproxima a probabilidade de exatamente 1150 sucessos Figura 621 Encontrando a Probabilidade para pelo menos 1150 Sucessos entre 40000 Tentativas Há uma probabilidade de 09306 de se obterem pelo menos 1150 respostas com endereço de email entre as 40000 pesquisas enviadas Essa probabilidade é alta o bastante para se concluir que é muito provável que Viking Cruises alcance seu objetivo de pelo menos 1150 respostas com endereço de email Se a Viking River Cruises usa um método de amostragem que não fornece uma amostra aleatória simples então a probabilidade resultante de 09306 pode estar bastante errada Por exemplo se eles pesquisaram apenas clientes anteriores eles provavelmente obterão uma taxa de resposta mais alta de modo que os cálculos anteriores podem estar incorretos Não devemos nunca nos esquecer da importância de um método adequado de amostragem Passo 2 Achamos agora os valores de μ e de σ Obtivemos o seguinte μ 𝑛𝑝 2822 075 21165 Quando usamos a distribuição normal como aproximação da distribuição binomial nosso objetivo final não é simplesmente obter uma probabilidade Frequentemente desejamos fazer algum julgamento baseado no valor da probabilidade O critério que segue da Seção 52 descreve o uso das probabilidades para a distinção de resultados que podem facilmente ocorrer por acaso daqueles que são altamente incomuns Usando Probabilidades para Determinar Quando Resultados São Não Usuais Não usualmente alto x sucessos entre n tentativas é um número de sucessos não usualmente alto se Px ou mais é muito pequena tal como 005 ou menos Não usualmente baixo x sucessos entre n tentativas é um número de sucessos não usualmente baixo se Px ou menos é muito pequena tal como 005 ou menos Quase todas as aplicações práticas da distribuição de probabilidade binomial podem agora ser bem trabalhadas com um programa computacional ou uma calculadora TI8384 Plus Nesta seção apresentamos métodos para o uso da aproximação normal em vez de programas mas mais importante ilustramos o princípio de que sob circunstâncias apropriadas a distribuição de probabilidade binomial pode ser aproximada por uma distribuição normal Capítulos posteriores incluirão procedimentos que se baseiam no uso de uma distribuição normal como aproximação para uma distribuição binomial de modo que esta seção constitui um alicerce para tais importantes procedimentos 15 Com n 8 e p 09 ache Ppelo menos 6 16 Com n 15 e p 04 ache Pmenos de 3 17 Pesquisa por Correio No Exemplo 1 vimos que o autor recebeu pelo correio uma pesquisa da Viking River Cruises que incluía um pedido de envio de endereço de email Como no Exemplo 1 suponha que a pesquisa tenha sido enviada a 40000 pessoas e que a porcentagem de respostas com um endereço de email tenha sido de 3 Se o objetivo da pesquisa era a obtenção de um banco de pelo menos 1300 endereços de email ache a probabilidade de se obterem pelo menos 1300 respostas com endereços de email É provável que o objetivo seja alcançado 18 Pesquisa sobre Penetração da Internet No Exemplo 2 vimos que uma pesquisa recente do Pew Research Center mostrou que entre 2822 adultos selecionados aleatoriamente 2060 ou 73 afirmavam ser usuários da Internet Um especialista em tecnologia afirma que 75 dos adultos são usuários da Internet e os resultados da pesquisa mostram uma porcentagem menor devido à variação aleatória nas pesquisas Supondo que a taxa de 75 seja correta um resultado de 2060 usuários da Internet é um número não usualmente baix o quando 2822 adultos são selecionados aleatoriamente Explique 19 Seleção de Gênero O Genetics IVF Institute desenvolveu seu método XSORT para aumentar a probabilidade de ser concebida uma menina Entre 574 mulheres que usavam esse método 525 tiveram meninas Supondo que o método não tenha qualquer efeito de modo que meninos e meninas são equiprováveis ache a probabilidade de se obterem pelo menos 525 meninas entre 574 bebês Esse resultado sugere que o método XSORT seja eficaz Por que sim ou por que não 20 Seleção de Gênero O Genetics IVF Institute desenvolveu seu método YSORT para aumentar a probabilidade de ser concebido um menino Entre 152 mulheres que usavam esse método 127 tiveram meninos Supondo que o método não tenha qualquer efeito de modo que meninos e meninas são equiprováveis ache a probabilidade de se obterem pelo menos 127 meninos entre 152 bebês Esse resultado sugere que o método YSORT seja eficaz Por que sim ou por que não 21 Experimento de Hibridização de Mendel Quando Mendel realizou seu famoso experimento de hibridização ele usou ervilhas com vagens verdes e ervilhas com vagens amarelas Um dos experimentos consistiu no cruzamento de ervilhas de tal modo que se esperava que 25 ou 145 das 580 ervilhas descendentes tivessem vagens amarelas Em vez de obter 145 ervilhas com vagens amarelas ele obteve 152 Suponha que a taxa de 25 de Mendel esteja correta a Ache a probabilidade de que entre 580 ervilhas descendentes exatamente 152 ervilhas tenham vagens amarelas b Ache a probabilidade de que entre 580 ervilhas descendentes pelo menos 152 ervilhas tenham vagens amarelas c Qual resultado é útil para se determinar se a taxa de 25 afirmada por Mendel é incorreta Parte a ou parte b d Há alguma evidência forte que sugira que a taxa de 25 de Mendel seja incorreta 22 Eleitores Mentem Em uma pesquisa com 1002 pessoas 701 disseram ter votado em recente eleição presidencial com base em dados do Grupo de Pesquisa ICR Os registros de votos mostram que 61 dos eleitores em condições de voto realmente votaram Uma vez que 61 dos eleitores em condições de votar realmente votaram ache a probabilidade de que entre 1002 eleitores em condições de votar selecionados aleatoriamente pelo menos 701 realmente tenham votado O que o resultado sugere 23 Telefones Celulares e Câncer de Cérebro Em um estudo com 420095 usuários de telefone celular na Dinamarca descobriuse que 135 desenvolveram câncer de cérebro ou do sistema nervoso Supondo que os telefones celulares não tenham nenhum efeito sobre o desenvolvimento de tais tipos de câncer há uma probabilidade de 0000340 de uma pessoa desenvolver câncer de cérebro ou do sistema nervoso Esperamos então 143 casos de tais cânceres em um grupo de 420095 pessoas selecionadas aleatoriamente Estime a probabilidade de 135 ou menos casos de tais cânceres em um grupo de 420095 pessoas O que o resultado sugere sobre telefones celulares serem uma causa de câncer de cérebro ou do sistema nervoso 24 Contratação de Empreg ado Há 80 de chance de que um empregador verifique o histórico escolar de um candidato a emprego com base em dados do Birô de Assuntos Nacionais Para 100 candidatos selecionados aleatoriamente ache a probabilidade de que exatamente 85 tenham seus históricos verificados 25 Doadores Universais Seis por cento das pessoas típicas têm sangue do tipo O e Rh Essas pessoas são consideradas doadores universais pois podem doar sangue para qualquer pessoa O Providence Memorial Hospital está realizando uma campanha de doação de sangue pois precisa de sangue de pelo menos 10 doadores universais Se 200 voluntários doam sangue qual é a probabilidade de que o número de doadores universais seja de pelo menos 10 É provável que os 200 doadores sejam suficientes 26 Amostragem de Aceitação Com o procedimento chamado amostragem de aceitação uma amostra de itens é selecionada aleatoriamente e o lote inteiro é ou aceito ou rejeitado dependendo dos resultados A Telektronics Company acabou de fabricar um grande lote de unidades de suprimento de energia para computadores e 75 são defeituosos Se o planejamento da amostragem de aceitação é selecionaremse aleatoriamente 80 unidades e aceitarse o lote inteiro se no máximo 4 unidades forem defeituosas qual é a probabilidade de que o lote inteiro seja aceito Com base nos resultados a Telektronics Company tem problemas de controle da qualidade 27 Balas MM 24 São Azuis De acordo com Mars a fábrica das balas não o planeta 24 de todas as balas simples MM são azuis O Conjunto de Dados 18 do Apêndice B mostra que entre 100 balas MM selecionadas 27 são azuis Supondo que a taxa de 24 de balas azuis esteja correta ache a probabilidade de na seleção aleatória de 100 balas MM serem obtidas 27 ou mais balas azuis Com base no resultado é não usual obteremse 27 ou mais balas azuis quando 100 são selecionadas aleatoriamente 28 Detectando Fraude Quando trabalhava para a Procuradoria do Distrito de Brooklyn o investigador Robert Burton analisou os dígitos iniciais em quantias de cheques de companhias sob suspeita de fraude Entre 784 cheques 479 tinham quantias com 5 como dígito inicial mas esperase que entre os cheques emitidos em transações honestas normais 79 tenham quantias com dígito inicial igual a 5 Há forte evidência que indique que as quantias sejam significativamente diferentes de quantias que normalmente são esperadas Explique 29 Medicamento para Redução do Colesterol A probabilidade de uma pessoa que não esteja recebendo qualquer tratamento apresentar os sintomas de gripe é 0019 Em um experimento clínico com Lipitor atorvastatina um medicamento comum usado para baixar o colesterol um grupo de 863 pacientes recebeu tratamento com comprimidos de 10 mg de atorvastatina e 19 desses pacientes apresentaram sintomas de gripe com base nos dados da Pfizer Inc Supondo que esses comprimidos não tenham qualquer efeito sobre os sintomas de gripe estime a probabilidade de pelo menos 19 pessoas entre 863 apresentarem sintomas de gripe O que esses resultados sugerem sobre os sintomas de gripe como reação adversa ao medicamento 30 Precisão de Polígrafo Experimentos com polígrafo realizados pelos pesquisadores Charles R Honts Boise State University e Gordon H Barland Instituto de Polígrafo do Departamento de Defesa mostraram que entre 57 indicações de mentira dadas por polígrafos a verdade havia sido dita em 15 das vezes de modo que a proporção de resultados falsospositivos entre 57 resultados positivos é 1557 Supondo que o polígrafo faça adivinhações aleatórias determine se 15 é um número não usualmente baixo de resultados falsospositivos entre 57 resultados positivos Parece que o polígrafo está fazendo adivinhações aleatórias Explique 31 Superlotando um Boeing 767300 Um avião Boeing 767300 tem 213 assentos Quando alguém compra uma passagem para um voo há uma probabilidade de 00995 de que ela não compareça ao embarque com base em dados do artigo de pesquisa da IBM de Lawrence Hong e Cherrier Um agente de passagens aceita 236 reservas para um voo que usa um Boeing 767300 Ache a probabilidade de não haver assentos suficientes Essa probabilidade é baixa o bastante para que o excesso de reservas não seja uma preocupação 32 Carga de Passageiros em um Boeing 767300 Um avião Boeing 767300 da American Airlines tem 213 assentos Quando totalmente carregado com passageiros carga e combustível o piloto deve verificar se o peso bruto está abaixo do máximo permitido e se o peso está distribuído adequadamente de modo que o equilíbrio do avião fique dentro de limites aceitáveis de segurança Ao se considerarem os pesos dos passageiros esses devem ser estimados de acordo com as regras da Administração Federal de Aviação Homens têm um peso médio de 172 libras enquanto as mulheres têm peso médio de 143 libras de modo que mais passageiros homens resultam em situação insegura de sobrepeso Suponha que se houver pelo menos 122 homens em uma lista de 213 passageiros a carga deve ser de alguma forma ajustada Suponha que as reservas sejam feitas aleatoriamente e que passageiros homens e mulheres sejam equiprováveis Se o avião está cheio de adultos ache a probabilidade de que um Boeing 767300 com 213 passageiros tenha pelo menos 122 homens Com base no resultado parece que a carga deva ser ajustada com frequência 66 Além do Básico 33 Estratégia de Aposta Marc Taylor planeja fazer 200 apostas de 5 dólares em um jogo no cassino Mirage em Las Vegas a Uma estratégia é apostar no número 7 na roleta O rateio da vitória tem chance de 351 e em qualquer giro há uma probabilidade de 138 de que o 7 seja o número vencedor Entre as 200 apostas qual é o número mínimo de vitórias necessárias para que Marc tenha lucro Ache a probabilidade de que ele tenha lucro b Outra estratégia é apostar no pass line no jogo de dados de craps O rateio da vitória tem chance de 11 e em qualquer jogo há uma probabilidade de 244495 de que ele ganhe Entre as 200 apostas qual é o número mínimo de vitórias necessárias para que Marc tenha lucro Ache a probabilidade de que Marc tenha lucro c Com base nos resultados anteriores qual jogo é o melhor investimento o jogo de roleta da parte a ou o jogo de craps da parte b Por quê 34 Sobrecarga em um Boeing 767300 Um avião Boeing 767300 tem 213 assentos Quando alguém compra uma passagem para um voo há uma probabilidade de 00995 de que ela não compareça ao embarque com base em dados do artigo de pesquisa da IBM de Lawrence Hong e Cherrier Quantas reservas podem ser aceitas para um Boeing 767300 para que haja uma probabilidade de pelo menos 095 de que todas as pessoas com reserva que se apresentem para embarque sejam acomodadas 35 Alcançando Joe Suponha que um jogador de beisebol acerte 0350 de modo que sua probabilidade de acerto é 0350 Ignore as complicações causadas pelas caminhadas Suponha também que suas tentativas de acerto sejam independentes umas das outras a Ache a probabilidade de pelo menos 1 acerto em 4 tentativas em um único jogo b Supondo que esse rebatedor esteja em posição de rebater 4 vezes em cada jogo ache a probabilidade de um total de pelo menos 56 acertos em 56 jogos c Supondo que esse rebatedor esteja em posição de rebater 4 vezes em cada jogo ache a probabilidade de pelo menos 1 acerto em cada um de 56 jogos consecutivos o recorde de Joe DiMaggio de 1941 d Qual o número médio mínimo de rebatimentos necessários para que a probabilidade na parte c seja maior do que 01 36 Necessidade de Aproximação pela Normal Essa seção incluiu a afirmativa de que quase todas as aplicações práticas da distribuição de probabilidade binomial podem ser agora tratadas com programas computacionais ou com uma calculadora TI8384 Plus Usando um pacote computacional específico ou uma calculadora TI8384 Plus identifique um caso no qual a tecnologia falha de modo que a aproximação normal para uma distribuição binomial é necessária

Sua Nova Sala de Aula

Sua Nova Sala de Aula

Empresa

Central de ajuda Contato Blog

Legal

Termos de uso Política de privacidade Política de cookies Código de honra

Baixe o app

4,8
(35.000 avaliações)
© 2025 Meu Guru®