·
Engenharia de Produção ·
Sistemas de Gestão de Qualidade
Send your question to AI and receive an answer instantly
Recommended for you
21
Sustentabilidade ODS SGA e Avaliação Institucional 2024 - Unicuritiba
Sistemas de Gestão de Qualidade
UNA
1
Intervalo de Confianca - Diferenca de Medias - Aco A vs Aco B
Sistemas de Gestão de Qualidade
UNA
73
Estatística Básica - Probabilidade e Fenômenos Aleatórios
Sistemas de Gestão de Qualidade
UNA
23
CEP-Controle Estatistico de Processo-Conceitos e Ferramentas da Qualidade
Sistemas de Gestão de Qualidade
UNA
79
Aula 9 - Sistemas de Gestao da Qualidade ISO 9001 e Auditoria
Sistemas de Gestão de Qualidade
UNA
52
MASP-Metodo-de-Analise-e-Solucao-de-Problemas-Guia-Completo
Sistemas de Gestão de Qualidade
UNA
2
Tabela-Distribuicao-Normal-Padrao-Estatistica
Sistemas de Gestão de Qualidade
UNA
1
Teste de Hipoteses - Intervalo de Confianca para Forca Compressiva do Betão
Sistemas de Gestão de Qualidade
UNA
73
Custos da Qualidade e Nao-Qualidade em Sistemas de Gestao
Sistemas de Gestão de Qualidade
UNA
1
Intervalo de Confianca 95 para Vida Util de Equipamento - Exemplo Resolvido
Sistemas de Gestão de Qualidade
UNA
Preview text
GESTÃO DE QUALIDADE E SUSTENTABILIDADE INFERÊNCIA ESTATÍSTICA E INTERVALOS DE CONFIANÇA AULA 5 2 1 INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Já vimos Análise descritiva gráficos tabelas e distribuições de frequên cias Medidas de tendência central média moda e mediana Medidas de dispersão desvio médio variância desvio padrão coeficiente de variação Medidas de assimetria e de curtose Percentis Probabilidade Modelos probabilísticos para va discretas Bernouli Binomial e Poisson e va contínuas Uniforme Exponencial e Normal A partir de agora Inferência Estatística estuda como fazer afirmações sobre certas características de uma população baseandose em resultados obtidos em uma amostra Vale lembrar que População qualquer conjunto de indivíduos ou objetos que têm pelo menos uma variável comum observável Amostra qualquer subconjunto da população Exemplo 11 Consideremos uma pesquisa feita para estudar o ga nho de peso dos bovinos de corte de um rebanho de 700 animais Selecionamos uma amostra de 40 animais e anotamos os seus pe sos no início e no final do período experimental A partir dessas in formações calculamos o ganho de peso mensal de cada animal Esperamos que a distribuição dos ganhos de peso dos animais da amostra reflita bem a distribuição é simétrica 𝑛𝑜𝑟𝑚𝑎𝑙 e as prin cipais características mesma média mesmo desvio padrão do ganho de peso dos animais de todo o rebanho Interesse 𝑖 Estimar o ganho de peso médio de todas 𝑖𝑖 Testar se o ganho de peso médio desses bovinos neste particu lar mês foi superior a 10 kg Um problema anterior Como selecionar amostras representativas de uma população COMO SELECIONAR UMA AMOSTRA Técnicas de amostragem são formas diferentes de se obter uma amostra representativa da população Amostragem probabilística quando os elementos da população têm probabilidades conhecidas e diferentes de zero de fazer par te da amostra Implica em realizar um sorteio com regras determinadas quan do a população for finita e totalmente acessível As observações colhidas em uma amostra serão mais informa tivas quanto mais conhecermos sobre a população de onde a amostra foi retirada Amostragem não probabilística os elementos da amostra são es colhidos de forma não aleatória porque são mais facilmente aces síveis ou se acredita que sejam representativos da população É bastante utilizada embora exista um grande risco de ser par cial É perigoso usar uma amostra deste tipo para tirar alguma con clusão importante A amostragem não probabilística é necessária quando 1 É difícil identificar a população alvo Exemplo Como estudar o comportamento dos ℎ𝑎𝑐𝑘𝑒𝑟𝑠 durante a pandemia É difícil identificálos 2 A população designada é muito específica e de disponibilidade limitada Exemplo Para estudar o comportamento de executivos de empresas que empregam mais de 10 Engenheiros de Biossistemas podemos ser obrigados a trabalhar somente com os executivos dispostos a participar 3 A amostra é de um estudo piloto inicial que não será usada na pesquisa final e só temos um pequeno grupo de pessoas dispo níveis Nota As principais técnicas de Inferência Estatística pressupõem que as amostras utilizadas no estudo sejam probabilísticas TÉCNICAS DE AMOSTRAGEM PROBABILÍSTICA 𝑖 Amostragem casual simples ou aleatória acs cada elemen to da população tem a mesma probabilidade de ser selecionado ou seja a mesma chance de fazer parte da amostra O sorteio dos elementos para compor a amostra poderá ser feito de duas formas com ou sem reposição Exemplo Sortear uma acs de 𝑛 elementos de uma população finita de tamanho 𝑁 O número de amostras possíveis depende do tipo de sorteio Com reposição Sem reposição 𝑁𝑛 amostras possíveis 𝑁 𝑛 amostras possíveis 𝑖𝑖 Amostragem Sistemática é utilizada quando os elementos da população se apresentam ordenados de forma aleatória A retirada dos elementos da amostra é feita 𝑝𝑒𝑟𝑖𝑜𝑑𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 Exemplo Com o objetivo de estudar a qualidade da refeição ofe recida no Campus vamos usar uma amostra de 𝑛 50 alunos as bendo que são consumidas em média 500 refeições por dia 1 Sorteamos um número 𝑘 de 1 a 10 note que 50050 10 e aplicamos o questionário ao 𝑘ésimo aluno da fila 2 Os demais 49 alunos serão escolhidos sistematicamente de 10 em 10 até que a amostra de 50 alunos esteja completa Exemplo Sorteando o número 5 farão parte da amostra de 50 números o 5º 15º 25º 35º 45º 495º aluno 𝑖𝑖𝑖 Amostragem por Conglomerados é utilizada quando a popu lação apresenta uma subdivisão natural em pequenos grupos ou conglomerados Esperase que esses grupos sejam heterogêneos internamente e reproduzam bem a população Para retirarmos uma amostra sorteamos um número suficiente de conglomerados e os seus elementos constituirão a amostra Exemplo Preciso de uma amostra de 70 bovinos Nelore para realizar uma pesquisa e os 700 animais do rebanho estão distri buídos aleatoriamente em 70 piquetes com 10 animaispiquete Solução Numero os piquetes de 1 a 70 sorteio 7 piquetes e uso os animais desses piquetes sorteados para compor a amostra 𝑖𝑣 Amostragem Estratificada é utilizada quando a população pode ser dividida em diferentes subpopulações classes ou estratos A técnica consiste em especificar quantos elementos da amostra serão retirados de cada estrato Supõese que a variável de interesse apresente um comporta mento diferente de estrato para estrato e um comportamento homogêneo dentro de cada estrato Se o sorteio dos elementos da amostra não considerar tais estra tos pode ocorrer que os diversos estratos não sejam convenien temente representados na amostra A amostra pode ser mais influenciada pelas características da va riável nos estratos mais favorecidos pelo sorteio Exemplo Desejamos saber a opinião dos alunos de Graduação sobre a qualidade da refeição servida no refeitório do Campus Admitindo que a opinião dos alunos sobre a qualidade das refeições pode ser influenciada pelo tempo que eles frequentam o refeitório podemos reagrupálos pelo ano de ingresso formando 5 estratos de tamanhos diferentes A seguir sorteamos certa quantidade de alunos dentro de cada estrato de forma a tornar a amostra repre sentativa da população Se não levarmos este aspecto em conta podemos favorecer subgru pos de alunos que já têm opinião consolidada sobre a qualidade da refeição A amostragem estratificada pode ser de três tipos 𝑖 Uniforme retirase igual número de elementos em cada estra to independente do seu tamanho 𝑖𝑖 Proporcional o número de elementos sorteados em cada es trato é proporcional ao número de elementos existentes no es trato 𝑖𝑖𝑖 Ótima retiramos em cada estrato um número de elementos proporcional ao número de elementos que o compõem e à va riabilidade da variável de interesse no estrato medida por seu desvio padrão TÉCNICAS DE AMOSTRAGEM NÃO PROBABILÍSTICA 𝑖 Amostragem por conveniência Envolve a obtenção de respos tas das pessoas que estão disponíveis e dispostas a participar da pesquisa O problema principal desta abordagem é que a opinião dessas pessoas pode diferir muito da opinião dos que não estão dispostos a participar da pesquisa Exemplo Nos sítios de compra da web os clientes que têm recla mações podem estar mais dispostos a responder um questioná rio do que os que estão satisfeitos com a compra do produto ou do serviço 𝑖𝑖 Amostragem bola de neve SnowBall Algumas pessoas são convidadas a participar da pesquisa e solicitase a elas que convi dem outras pessoas a participar A amostragem continua até que o número exigido de respostas seja obtido Essa técnica é fre quentemente usada quando a população é difícil de ser identifi cada ou acessada pelos pesquisadores Exemplo Admitindo que os hackers de software se conheçam se acharmos um hacker para participar da pesquisa podemos solicitar a ele que indiqueconvide outros possíveis participan tes 𝑖𝑖𝑖 Amostragem por cota é a versão não probabilística da amos tragem aleatória estratificada A população alvo é dividida em estratos apropriados baseados em subgrupos conhecidos sexo grau de instrução 𝑒𝑡𝑐 Cada estrato é amostrado usando amos tragem por conveniência ou bola de neve de forma que o núme ro de respondentes em cada estrato corresponde à sua propor ção na população Exemplo Numa pesquisa de opinião sobre o atendimento em um açougue de supermercado aplicase o questionário até que se obtenha a opinião de 200 clientes sendo 80 solteiros e 120 ca sados INFERÊNCIA Vamos diferenciar algumas medidas utilizadas para descrever ca racterísticas importantes num conjunto de dados Parâmetro é qualquer medida numérica usada para descrever uma característica da população Estatística é qualquer medida usada para descrever uma caracte rística da amostra ou seja 𝑞𝑢𝑎𝑙𝑞𝑢𝑒𝑟 função dos elementos da amostra Notação Geralmente os parâmetros são denotados por letras gre gas ou letras maiúsculas do alfabeto romano Já para as estatísti cas são utilizadas letras minúsculas do alfabeto romano ou letras gregas com sinal circunflexo Exemplos de parâmetros populacionais e estatísticas amostrais Descrição Parâmetro Estatística Número de elementos Média Variância 𝑁 𝜎2 𝑛 𝑥 𝑠2 Desvio padrão 𝜎 𝑠 Proporção 𝑝 𝑝 Coeficiente de correlação 𝜌𝑋 𝑌 𝑟𝑋 𝑌 DISTRIBUIÇÕES AMOSTRAIS A inferência estatística está interessada em tomar decisões sobre algum parâmetro da população com base na informação contida em uma amostra aleatória desta população Nas amostras são calculadas as estatísticas usando expressões ma temáticas chamadas de estimadores Como toda estatística 𝑥 𝑠2 etc é função dos valores de variáveis aleatórias é necessário estudar a distribuição de probabilidades dessas estatísticas A distribuição de probabilidades de uma estatística é chamada dis tribuição amostral daquela estatística Vamos conhecer a distribuição amostral da média e da proporção amostrais A DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Teorema 1 Seja 𝑋 uma população com média 𝜇 e variância 𝜎2 e seja 𝑥1 𝑥2 𝑥𝑛 uma 𝑎 𝑐 𝑠 de tamanho 𝑛 retirada desta popula ção Então a esperança matemática e a variância da média amostral são obtidas como 𝐸𝑥 𝜇 𝑣𝑎𝑟𝑥 𝜎2𝑛 O erro padrão da média é definido como 𝑒𝑝𝑥 𝑣𝑎𝑟𝑥 𝜎𝑛 Dúvida Qual a distribuição probabilística que podemos associar à média amostral 𝑥 1 Se a amostra aleatória de tamanho 𝑛 é retirada de uma distribuição normal 𝑋 𝑁𝜇 𝜎2 a estatística 𝑥 também será uma distribuição normal de média 𝜇 mas com variância 𝜎2𝑛 isto é Se 𝑋 𝑁𝜇 𝜎2 𝑥 𝑁𝜇 𝜎2𝑛 2 Teorema do Limite Central Se a 𝑎 𝑐 𝑠 de tamanho 𝑛 é retirada de qualquer população com média 𝜇 e variância 𝜎2 a distribuição amostral da média 𝑥 aproximase de uma distribuição normal com média 𝜇 e variân cia 𝜎2𝑛 quando o tamanho da amostra 𝑛 tender para infinito Se 𝑋 𝜇 𝜎2 𝑥 𝑁𝜇 𝜎2𝑛 quando 𝑛 A rapidez dessa convergência depende da distribuição da popu lação da qual a amostra é retirada se a distribuição for simétrica e unimodal a convergência é bastante rápida De um modo geral admitimos que para amostras com mais de 30 elementos a aproximação pela distribuição normal já pode ser considerada boa Corolário 1 Se 𝑥1 𝑥2 𝑥𝑛 é uma 𝑎 𝑐 𝑠 de tamanho 𝑛 de uma população X que tem média 𝜇 e variância 𝜎2 então a variável Z 𝑥𝜇 𝜎2𝑛 𝜎 𝑥𝜇𝑛 𝑁0 1 quando 𝑛 Nota Este resultado será usado no cálculo de probabilidades sobre a média amostral DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Seja 𝑝 a proporção frequência relativa de indivíduos que têm uma característica de interesse na amostra Podemos provar que 𝐸𝑝 𝑝 𝑣𝑎𝑟𝑝 𝑝 1𝑝 𝑛 Para amostras grandes 𝑛 utilizamos o Teorema do Limite Central para garantir que 𝑛 𝑝 𝑁 𝑝 𝑝1𝑝 A seguir vamos conhecer mais algumas distribuições de probabili dade que serão úteis quando fizermos inferências sobre a média a variância e a proporção 2 OUTRAS DISTRIBUIÇÕES PROBABILÍSTICAS IMPORTANTES 1 DISTRIBUIÇÃO QUIQUADRADO 𝜒2 É utilizada em tabelas de contingência na construção de intervalos de confiança e testes de hipóteses sobre a variância de uma popula ção normal A distribuição 𝜒2 é assimétri ca à direita e definida somen te para valores positivos Para o cálculo de probabilida des usamos a Tábua II 5 Figura 1 Distribuição 𝜒2 DISTRIBUIÇÃO t DE STUDENT É uma das mais importantes distribuições probabilísticas usadas nas inferências sobre médias de populações normais O gráfico da distribuição 𝑡Stu dent Figura 2 é parecido com o gráfico da distribuição 𝑁01 mas tem as caudas mais pesa das Figura 2 Distribuição 𝑡12 A Tábua III fornece valores críticos 𝑡𝑐 tais que 𝑃𝑇 𝑡𝑐 𝑝 para alguns valores de 𝑝 e de número de graus de liberdade DISTRIBUIÇÃO F DE SNEDECOR É bastante usada nas inferências sobre as variâncias de duas popu lações com distribuição normal e nos testes associados à Análise de Variância ANOVA A distribuição F tem dois parâmetros os números de graus de liberdade do numerador 𝑣1 e do denominador 𝑣2 Os valores críticos 𝑓𝑐tais que 𝑃𝐹 𝑓𝑐 005 para alguns valo res de 𝑣1 e 𝑣2 podem ser encontrados na Tábua IV Os valores críticos 𝑓𝑐 tais que 𝑃𝐹 𝑓𝑐 005 não são obtidos diretamente na Tábua IV Para tanto utilizase a relação 𝐹𝑣1 𝑣2 1 𝐹𝑣2 𝑣1 28 A Figura 3 apresenta o gráfico da distribuição 𝐹10 12 e os valores críticos tais que 𝑃𝐹 0343 005 𝑃𝐹 2753 005 Note que a distribuição 𝐹 é bastante assimétrica à direita assime tria positiva 08 07 06 05 04 03 01 00 02 005 Densidad e 2753 005 0343 29 3 ESTIMAÇÃO Na produção de generalizações sobre a população com base em re sultados obtidos de uma amostra estão envolvidos a estimação de parâmetros e os testes de hipóteses A estimação de parâmetros pode ser feita pontualmente e por in tervalo Para obtenção de bons estimadores pontuais existem al guns métodos como Método dos Mínimos Quadrados MMQ Método da Máxima Verossimilhança MMV Método dos Momentos MM Exemplos de estimadores O estimador de mínimos quadrados da média populacional 𝜇 é a média amostral 𝑛 𝑥 1 𝑛 𝑥 𝑖1 𝑖 Da Álgebra Linear sabemos que os estimadores de mínimos qua drados dos parâmetros do modelo de regressão linear simples 𝑦𝑖 𝑎 𝑏𝑥𝑖 𝜀𝑖 são 𝑏 𝑥𝑖𝑥𝑦𝑖𝑦 𝑛 𝑖 1 𝑥𝑖𝑥2 𝑛 𝑖 1 𝑎 𝑦 𝑏𝑥 CARACTERÍSTICAS DE UM BOM ESTIMADOR PONTUAL Um bom estimador deve ser justo consistente e eficiente 𝑖 T é um estimador justo não viesado ou não tendencioso do pa râmetro 𝜃 se 𝐸T 𝜃 𝑖𝑖 T é um estimador consistente do parâmetro 𝜃 se ele for justo e se 𝑙𝑖𝑚 𝑣𝑎𝑟𝑇 0 𝑛 𝑖𝑖𝑖 Se 𝑇1e 𝑇2são estimadores justos do parâmetro 𝜃 e se 𝑣𝑎𝑟𝑇1 𝑣𝑎𝑟𝑇2 então 𝑇1 é dito ser mais eficiente que o estimador 𝑇2 Queremos comprar um rifle e temos três opções 𝑟1 𝑟2 e 𝑟3 Para avaliar a qualidade de cada arma vamos atirar 30 vezes num alvo e analisar a distribuição das marcas próximas da mosca ponto central 𝑟1 𝑟2 𝑟3 Figura 5 Qualidades de um bom estimador Observamos que 𝑖 As armas 𝑟1e 𝑟2 buscam atingir a mosca A mira de 𝑟3 não está bem calibrada porém se conseguirmos calibrar 𝑟3podemos ter um bom rifle 𝑖𝑖 O rifle 𝑟1é melhor que 𝑟2porque os seus tiros formam uma nu vem de pontos com menor dispersão ao redor da mosca Conclusão O rifle 𝑟1reúne as melhores características Analogia A mosca do alvo é o valor do parâmetro que pretende mos estimar Os rifles são os estimadores que usamos para tem tar acertar o verdadeiro valor do parâmetro Os tiros dos rifles correspondem às estimativas geradas pelos estimadores em amostras diferentes Então podemos dizer que 𝑖 Os estimadores 𝑟1 e 𝑟2 são estimadores justos ou não viesados 𝑖𝑖 O estimador 𝑟3 é um estimador viesado porque em média não acerta o valor do parâmetro 𝑖𝑖𝑖 Dentre os estimadores justos o estimador 𝑟1 é mais eficiente que 𝑟2 pois tem menor variância Exemplos de bons estimadores 𝑛 𝑖1 𝑖 Média amostral 𝑥 1 𝑛 𝑥 Variância amostral 𝑠2 1 𝑛1 𝑥 𝑥2 𝑛 𝑖1 𝑖 GESTÃO DE QUALIDADE E SUSTENTABILIDADE INTERVALOS DE CONFIANÇA AULA 5 ESTIMAÇÃO POR INTERVALO A estimativa pontual de um parâmetro é bastante útil mas não fornece qualquer indicação da precisão a ela associada Precisão é o grau de variação de resultados de uma medição e tem como base o desviopadrão de uma série de repetições da mesma análise É desejável que uma estimativa pontual esteja acompanhada por alguma medida do erro da estimativa Intervalo de Confiança é um estimador que envolve a determinação de um intervalo a respeito da estimativa do parâmetro juntamente com alguma medida de confiança de que o verdadeiro valor do pa râmetro esteja neste intervalo A probabilidade de que o IC contenha o verdadeiro valor do parâmetro é chamada de coeficiente ou nível de confiança sendo denotado pela letra grega 𝛾gama Objetivo Encontrar um IC de pequena amplitude que inclua o ver dadeiro valor do parâmetro com uma confiança 𝛾 alta A amplitude de um IC é sempre calculada como a diferença entreos seus limites 𝐻 𝑙𝑖𝑚𝑠𝑢𝑝 𝑙𝑖𝑚𝑖𝑛𝑓 Intervalo de confiança para a média populacional 𝑰𝑪𝝁 O intervalo de confiança para a média populacional com um coefi ciente de confiança 𝛾 1 𝛼 quando a variância populacional 𝜎2 é conhecida é dado por 𝐼𝐶𝜇 100𝛾 𝑥 𝑧 𝜎 𝑥 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 Onde 𝑧𝑐 é o valor crítico tabelado da distribuição normal padrão tal que 𝛾 𝑃𝑧𝑐 Z 𝑧𝑐 5 Nota 𝑧𝑐também é denotado como 𝑧𝛼2 Por exemplo se queremos construir um 𝐼𝐶𝜇 𝛾 095 o valor 𝑧𝑐talque 095 𝑃𝑧𝑐 Z 𝑧𝑐 é o valor tabelado 𝑧0025 196 tal que 𝑃𝑍 196 𝑃𝑍 196 0025 Prova Sabemos que se tirarmos uma amostra de 𝑛 elementos de uma população 𝑋𝑁𝜇 𝜎2 a média amostral 𝑥 𝑁𝜇 𝜎2𝑛 e que 𝑥 𝜇 𝑍 𝜎𝑛 𝑁01 04 03 02 01 00 Densidade 1960 0025 1960 0025 0 X Gráfico de distribuição N01 6 Seja 𝑧𝑐um valor tal que 𝛾 1 𝛼 𝑃𝑧𝑐 𝑍 𝑧𝑐 Então 𝜎 𝑛 𝑐 𝑐 𝛾 𝑃 𝑧 𝑥𝜇 𝑧 𝑃 𝑧 𝜎 𝑥 𝜇 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 𝑃 𝑥𝑧 𝜎 𝜇 𝑥 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 𝑃 𝑥 𝑧 𝜎 𝜇 𝑥 𝑧 𝑐 𝑛 𝜎 𝑐 𝑛 Podemos admitir que 𝐼𝐶𝜇 100𝛾 𝑥 𝑧 𝜎 𝑥 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 7 Note que 𝛾 080 085 090 095 099 𝑧𝑐 128 144 164 196 258 A amplitude 𝐻 do 𝐼𝐶𝜇 está diretamente relacionada com o nível de confiança 𝛾 se quero uma maior confiança na estimativa da média vou construir um 𝐼𝐶 com maior amplitude Se desejarmos um 𝐼𝐶𝜇 mais curto e que tenha uma confiança adequada precisamos aumentar o tamanho da amostra 𝜀𝑥 𝑛 O tamanho de amostra necessário para termos uma confiança 𝛾 de que o erro na estimação da média populacional seja inferior a 𝜀𝑥 é calculado por 𝑧𝑐𝜎 2 O peso de bovinos Nelore aos 210 dias de idade tem distribuição normal com variância 400𝑘𝑔2 Baseado numa amostra de 30 animais cujo peso médio foi de 186 𝑘𝑔 pedese 𝑎 Construir um IC para o peso médio dos bovinos com uma con fiança 𝛾 095 e outro para 𝛾 099 𝑏 Qual a confiança em afirmar que o verdadeiro peso médio é de 180 192𝑘𝑔 𝑎 Para 𝛾 095 𝑧𝑐 196 𝐼𝐶𝜇 95 186 196 20 186 196 20 30 17884 19316𝑘𝑔 30 amplitude 1432kg Conclusão Este IC contém o verdadeiro valor do peso médio dos bezerros aos 210 dias de idade com 95 de confiança Para 𝛾 099 𝑧𝑐 258 𝐼𝐶𝜇 99 186 258 20 186 258 20 30 30 17658 19542𝑘𝑔 Conclusão Este intervalo de amplitude 1884kg contém o verda deiro valor do peso médio dos bezerros com 99 de confiança Note que a amplitude do 𝐼𝐶𝜇 99 é maior que 𝐼𝐶𝜇 95 ou seja quanto maior a confiança maior a amplitude do 𝐼𝐶 𝑏 Se 𝐻 192 180 12 𝑘𝑔 12 2 𝑧𝑐 20 30 𝑧𝑐 164 𝛾 𝑃 164 𝑍 164 2𝑃0 𝑍 164 204495 08990 ou seja o 𝐼𝐶 contém o ver dadeiro peso médio dos be zerros com 899 de confi ança Utilizando a fórmula 𝑛 𝑧𝑐𝜎 2 𝜀𝑥 podemos calcular o tamanho da amostra a ser usado paraestimar o peso de bovinos Nelore aos 210 dias 𝜎 20 𝑘𝑔 admitindo di ferentes erros na estimativa da média 𝜀𝑥 𝛾 Erros 𝜀𝑥 em 𝑘𝑔 10 8 6 4 2 1 095 16 25 43 97 385 1537 099 27 42 74 167 666 2663 Note que o tamanho da amostra cresce com o aumento do coefici ente de confiança 𝛾 ou com a diminuição da margem de erro Problema Geralmente nós não conhecemos a variânciapopulacional 𝜎2 dos dados Neste caso precisamos estimála com os dadosde uma amostra usando o estimador 𝑠2 Como calcular um 𝐼𝐶𝜇 100𝛾 se desconhecemos 𝜎2 O intervalo de confiança para a média quando a variância popu lacional 𝜎2 é desconhecida é calculado por 𝐼𝐶𝜇 100 𝑥 𝑡 𝑠 𝑥 𝑡 𝑐 𝑛 𝑐 𝑛 𝑠 onde 𝑠 é o desvio padrão amostral e 𝑡𝑐 é obtido da Tabela III 𝑡 Student com 𝑛 1 graus de liberdade tal que 𝛾 𝑃 𝑡𝑐 𝑇 𝑡𝑐 Dez animais foram alimentados com certa ração durante 15 dias e os seus ganhos de peso foram 271 293 310 312 323 376 389 401 416 e 423 kg Construir um IC para o ganho médio de peso com 𝛾 090 Resolução Da amostra temse 𝑥 351 e 𝑠2 03081 Como 𝛾 090 entramos na Tá bua III com 𝑝 1090 005 e 2 9 gl e obtemos 𝑡𝑐 1833 Então 10 𝐼𝐶𝜇 90 351 1833 03081 351 032 𝐼𝐶𝜇 90 319 383 𝑘𝑔 Este 𝐼𝐶 de amplitude 064 kg contém o verdadeiro ganho médio de peso de bovinos alimentados com certa ração durante 15 dias com 90 de confiança Resumo Se queremos calcular um intervalo de confiança para a média populacional 𝜇 e a variância populacional 𝜎2 é conhecidausamos 𝐼𝐶𝜇 100𝛾 𝑥 𝑧 𝜎 𝑥 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 desconhecida usamos 𝑠 𝑠 𝑛 𝐼𝐶𝜇 100 𝑥 𝑡𝑐 𝑥 𝑡𝑐 𝑛 Em que 𝑠2 é a variânciaamostral EXERCÍCIO Um provedor de acesso à internet está monitorando a duração do tempo de conexões de seus clientes com o intuito de di mensionar seus equipamentos Embora não se conheça a média des se tempo sabese que o desviopadrão por analogia a outros servi ços é considerado igual a 178 minutos Uma amostra de 80 cone xões resultou num valor médio 𝑥 252 minutos a Comente sobre o tempo médio de conexão baseandose num in tervalo com confiança de 96 para a média bCalcule o tamanho de amostra necessário para diminuir a ampli tude deste intervalo de confiança pela metade com a mesma con fiança INTERVALO DE CONFIANÇA PARA A PROPORÇÃO O 𝐼𝐶 para a proporção 𝑝 com coeficiente de confiança 𝛾 é definido para situações em que temos grandes ou pequenas amostras Não discutiremos o 𝐼𝐶𝑝 exato baseado na distribuição binomial 𝑎 Para grandes amostras Teorema do Limite Central 𝑐 𝐼𝐶𝑝 100𝛾 𝑝 𝑧 𝑐 𝑝1𝑝 𝑝1𝑝 𝑛 𝑛 𝑝 𝑧 𝑏 Para pequenas amostras Intervalo de Confiança Conservativo 𝑐 𝑐 𝑛 𝑛 𝐼𝐶𝑝 100𝛾 𝑝 𝑧 025 𝑝 𝑧025 Fixando o valor do coeficiente de confiança 𝛾 o erro amostral ou margem de erro da estimativa da proporção 𝑝 é calculada por 𝜀𝑝 𝑐 𝑧 𝑝1𝑝 𝑛 Exemplo 34 Construir um 𝐼𝐶 para a proporção de eleitores favo ráveis ao candidato José da Silva com 99 de confiança sabendose que de uma pesquisa envolvendo uma amostra de 1000 eleitores so mente 248 foram favoráveis à sua eleição Resolução 𝑝 2481000 0248 é a proporção de eleitores favoráveis ao candidato Para 𝛾 099 𝑃𝑧𝑐 𝑍 𝑧𝑐 𝑧𝑐 258 Como o tamanho da amostra 𝑛 1000 é grande temos 𝐼𝐶𝑝 99 0248 258024810248 0248 0035 1000 𝐼𝐶𝑝 99 0213 0283 Conclusão Este intervalo de amplitude 007 contém a verdadeira proporção de eleitores favoráveis à eleição do candidato José da Silva com 99 de confiança Notícia A proporção de eleitores favoráveis à eleição do candidato José da Silva é de 248 com margem de erro de 35 pontos percen tuais para mais ou para menos com 99 de confiança Tamanho de amostra para estimar a proporção 𝒑 2 Fixando a confiança 𝛾 e a margem de erro 𝜀𝑝 podese estimar o tamanho ideal de uma amostra para estudar a proporção 𝑝 utili zando 𝑛 𝑝1 𝑝 𝑧𝑐 se tivermos uma boa estimativa 𝑝 obtida deal 𝜀𝑝 guma pesquisa anterior ou de uma pesquisa piloto 2 𝑛 025𝑧𝑐 se não tivermos qualquer informação 𝑎 𝑝𝑟𝑖𝑜𝑟𝑖 da 𝜀𝑝 proporção Simular o tamanho de amostra para uma pesquisa eleitoral sobre o candidato José usando diferentes coeficientes de confiança e diferentes margens de erro sabendo que de pesquisas anteriores 𝑝 0248 𝜀𝑝 0050 0040 0030 0020 0010 0005 𝛾 090 204 318 565 1270 5078 20310 𝛾 095 287 448 797 1792 7165 28658 Note que Quanto menor a margem de erro que queremos no resultado da pesquisa maior é o tamanho da amostra Quanto maior a confiança que se quer no resultado da pesquisa maior é o tamanho da amostra 323 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA 𝜎2 𝑛1𝑠2 𝑛1𝑠2 𝐼𝐶𝜎2 100𝛾 𝑄2 𝑄1 Onde 𝑠2 é a variância amostral 𝑄1e 𝑄2 são os valores críticos da distribui ção quiquadrado Tábua II com 𝑣 𝑛 1 graus de liberdade tais que 𝛾 𝑃𝑄1 𝑄 𝑄2 com 𝑄𝜒2 𝑛1 Observe que a distribuição quiquadrado não é simétrica e está defi nida somente para os reais positivos Isso dificulta a obtenção dos valores críticos 𝑄1e 𝑄2 010 008 006 004 002 000 Q1 Q2 Confia nça gam a 0 Exemplo Obter os valores críticos 𝑄1 e 𝑄2 para 𝛾 1 𝑝 095 e𝑣 15 gl 𝑄1 6262 é obtido no cruzamen to da linha 𝑣 15 gl com a coluna 𝑝 0975 2 𝑄 2749 é obtido no cruzamen to da linha 𝑣 15 gl com a coluna 𝑝 0025 008 007 006 005 004 003 002 001 Densidade 0025 0025 000 0 6262 2749 Gráfico de Distribuição QuiQuadrado gl15 Construir um 𝐼𝐶90 para a variância dos ganhos de peso de animais alimentados com certa ração por 15 dias Resolução 𝑛 10 e 𝑠2 03081 Da Tábua 2 com 9 gl e 𝛾 090 obtemos 𝑄1 3325 𝑝 095 e 𝑄2 16919 𝑝 005 Então 𝐼𝐶𝜎2 90 9103081 9103081 16919 3325 01639 08340 𝑘𝑔2 Conclusão Este 𝐼𝐶 contém a verdadeira variância dos ganhos de peso dos animais alimentados com a ração por 15 dias com 90 de confiança 010 008 006 004 Densidade 3325 002 005 1692 005 000 0 Gráfico de Distribuição QuiQuadradogl9 INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO 𝜎 Para calcular os limites de confiança basta calcular a raiz quadrada dos limites do intervalo de confiança para a variância 𝑛1𝑠2 𝑛1𝑠2 𝐼𝐶𝜎 100𝛾 𝑄2 𝑄1 No Exemplo 33 um 𝐼𝐶 para o desvio padrão dos ganhos de peso dos animais é dado por 𝐼𝐶𝜎 90 01639 08340 𝑘𝑔 0405 0913𝑘𝑔 Conclusão Este 𝐼𝐶 contém o verdadeiro desvio padrão dos pesos dos animais alimentados com certa ração por 15 dias com 90 de confiança EXERCÍCIOS 1 O tamanho de tilápias em cm aos 3 meses de idade tem distribui ção normal com média e variância desconhecidas Com nos compri mentos cm de 15 tilápias 181 208 173 201 197 186 184 160 190 205 192 218165 218 211 Pedese a Calcular um 𝐼𝐶 para a média com 90 de confiança bCalcular um 𝐼𝐶 para o desvio padrão dos comprimentos com 95 de confiança 2 A eleição para prefeito em certa cidade tem somente dois candidatos sendo um deles o atual prefeito Uma pesquisa foi feita com 500 eleitores e somente 220 disseram que votariam nele Calcule um 𝐼𝐶 para a proporção de eleitores que votarão no atual prefeito e comente sobre o resultado Baseado no 𝐼𝐶𝑝 ele pode se considerar eleito
Send your question to AI and receive an answer instantly
Recommended for you
21
Sustentabilidade ODS SGA e Avaliação Institucional 2024 - Unicuritiba
Sistemas de Gestão de Qualidade
UNA
1
Intervalo de Confianca - Diferenca de Medias - Aco A vs Aco B
Sistemas de Gestão de Qualidade
UNA
73
Estatística Básica - Probabilidade e Fenômenos Aleatórios
Sistemas de Gestão de Qualidade
UNA
23
CEP-Controle Estatistico de Processo-Conceitos e Ferramentas da Qualidade
Sistemas de Gestão de Qualidade
UNA
79
Aula 9 - Sistemas de Gestao da Qualidade ISO 9001 e Auditoria
Sistemas de Gestão de Qualidade
UNA
52
MASP-Metodo-de-Analise-e-Solucao-de-Problemas-Guia-Completo
Sistemas de Gestão de Qualidade
UNA
2
Tabela-Distribuicao-Normal-Padrao-Estatistica
Sistemas de Gestão de Qualidade
UNA
1
Teste de Hipoteses - Intervalo de Confianca para Forca Compressiva do Betão
Sistemas de Gestão de Qualidade
UNA
73
Custos da Qualidade e Nao-Qualidade em Sistemas de Gestao
Sistemas de Gestão de Qualidade
UNA
1
Intervalo de Confianca 95 para Vida Util de Equipamento - Exemplo Resolvido
Sistemas de Gestão de Qualidade
UNA
Preview text
GESTÃO DE QUALIDADE E SUSTENTABILIDADE INFERÊNCIA ESTATÍSTICA E INTERVALOS DE CONFIANÇA AULA 5 2 1 INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Já vimos Análise descritiva gráficos tabelas e distribuições de frequên cias Medidas de tendência central média moda e mediana Medidas de dispersão desvio médio variância desvio padrão coeficiente de variação Medidas de assimetria e de curtose Percentis Probabilidade Modelos probabilísticos para va discretas Bernouli Binomial e Poisson e va contínuas Uniforme Exponencial e Normal A partir de agora Inferência Estatística estuda como fazer afirmações sobre certas características de uma população baseandose em resultados obtidos em uma amostra Vale lembrar que População qualquer conjunto de indivíduos ou objetos que têm pelo menos uma variável comum observável Amostra qualquer subconjunto da população Exemplo 11 Consideremos uma pesquisa feita para estudar o ga nho de peso dos bovinos de corte de um rebanho de 700 animais Selecionamos uma amostra de 40 animais e anotamos os seus pe sos no início e no final do período experimental A partir dessas in formações calculamos o ganho de peso mensal de cada animal Esperamos que a distribuição dos ganhos de peso dos animais da amostra reflita bem a distribuição é simétrica 𝑛𝑜𝑟𝑚𝑎𝑙 e as prin cipais características mesma média mesmo desvio padrão do ganho de peso dos animais de todo o rebanho Interesse 𝑖 Estimar o ganho de peso médio de todas 𝑖𝑖 Testar se o ganho de peso médio desses bovinos neste particu lar mês foi superior a 10 kg Um problema anterior Como selecionar amostras representativas de uma população COMO SELECIONAR UMA AMOSTRA Técnicas de amostragem são formas diferentes de se obter uma amostra representativa da população Amostragem probabilística quando os elementos da população têm probabilidades conhecidas e diferentes de zero de fazer par te da amostra Implica em realizar um sorteio com regras determinadas quan do a população for finita e totalmente acessível As observações colhidas em uma amostra serão mais informa tivas quanto mais conhecermos sobre a população de onde a amostra foi retirada Amostragem não probabilística os elementos da amostra são es colhidos de forma não aleatória porque são mais facilmente aces síveis ou se acredita que sejam representativos da população É bastante utilizada embora exista um grande risco de ser par cial É perigoso usar uma amostra deste tipo para tirar alguma con clusão importante A amostragem não probabilística é necessária quando 1 É difícil identificar a população alvo Exemplo Como estudar o comportamento dos ℎ𝑎𝑐𝑘𝑒𝑟𝑠 durante a pandemia É difícil identificálos 2 A população designada é muito específica e de disponibilidade limitada Exemplo Para estudar o comportamento de executivos de empresas que empregam mais de 10 Engenheiros de Biossistemas podemos ser obrigados a trabalhar somente com os executivos dispostos a participar 3 A amostra é de um estudo piloto inicial que não será usada na pesquisa final e só temos um pequeno grupo de pessoas dispo níveis Nota As principais técnicas de Inferência Estatística pressupõem que as amostras utilizadas no estudo sejam probabilísticas TÉCNICAS DE AMOSTRAGEM PROBABILÍSTICA 𝑖 Amostragem casual simples ou aleatória acs cada elemen to da população tem a mesma probabilidade de ser selecionado ou seja a mesma chance de fazer parte da amostra O sorteio dos elementos para compor a amostra poderá ser feito de duas formas com ou sem reposição Exemplo Sortear uma acs de 𝑛 elementos de uma população finita de tamanho 𝑁 O número de amostras possíveis depende do tipo de sorteio Com reposição Sem reposição 𝑁𝑛 amostras possíveis 𝑁 𝑛 amostras possíveis 𝑖𝑖 Amostragem Sistemática é utilizada quando os elementos da população se apresentam ordenados de forma aleatória A retirada dos elementos da amostra é feita 𝑝𝑒𝑟𝑖𝑜𝑑𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 Exemplo Com o objetivo de estudar a qualidade da refeição ofe recida no Campus vamos usar uma amostra de 𝑛 50 alunos as bendo que são consumidas em média 500 refeições por dia 1 Sorteamos um número 𝑘 de 1 a 10 note que 50050 10 e aplicamos o questionário ao 𝑘ésimo aluno da fila 2 Os demais 49 alunos serão escolhidos sistematicamente de 10 em 10 até que a amostra de 50 alunos esteja completa Exemplo Sorteando o número 5 farão parte da amostra de 50 números o 5º 15º 25º 35º 45º 495º aluno 𝑖𝑖𝑖 Amostragem por Conglomerados é utilizada quando a popu lação apresenta uma subdivisão natural em pequenos grupos ou conglomerados Esperase que esses grupos sejam heterogêneos internamente e reproduzam bem a população Para retirarmos uma amostra sorteamos um número suficiente de conglomerados e os seus elementos constituirão a amostra Exemplo Preciso de uma amostra de 70 bovinos Nelore para realizar uma pesquisa e os 700 animais do rebanho estão distri buídos aleatoriamente em 70 piquetes com 10 animaispiquete Solução Numero os piquetes de 1 a 70 sorteio 7 piquetes e uso os animais desses piquetes sorteados para compor a amostra 𝑖𝑣 Amostragem Estratificada é utilizada quando a população pode ser dividida em diferentes subpopulações classes ou estratos A técnica consiste em especificar quantos elementos da amostra serão retirados de cada estrato Supõese que a variável de interesse apresente um comporta mento diferente de estrato para estrato e um comportamento homogêneo dentro de cada estrato Se o sorteio dos elementos da amostra não considerar tais estra tos pode ocorrer que os diversos estratos não sejam convenien temente representados na amostra A amostra pode ser mais influenciada pelas características da va riável nos estratos mais favorecidos pelo sorteio Exemplo Desejamos saber a opinião dos alunos de Graduação sobre a qualidade da refeição servida no refeitório do Campus Admitindo que a opinião dos alunos sobre a qualidade das refeições pode ser influenciada pelo tempo que eles frequentam o refeitório podemos reagrupálos pelo ano de ingresso formando 5 estratos de tamanhos diferentes A seguir sorteamos certa quantidade de alunos dentro de cada estrato de forma a tornar a amostra repre sentativa da população Se não levarmos este aspecto em conta podemos favorecer subgru pos de alunos que já têm opinião consolidada sobre a qualidade da refeição A amostragem estratificada pode ser de três tipos 𝑖 Uniforme retirase igual número de elementos em cada estra to independente do seu tamanho 𝑖𝑖 Proporcional o número de elementos sorteados em cada es trato é proporcional ao número de elementos existentes no es trato 𝑖𝑖𝑖 Ótima retiramos em cada estrato um número de elementos proporcional ao número de elementos que o compõem e à va riabilidade da variável de interesse no estrato medida por seu desvio padrão TÉCNICAS DE AMOSTRAGEM NÃO PROBABILÍSTICA 𝑖 Amostragem por conveniência Envolve a obtenção de respos tas das pessoas que estão disponíveis e dispostas a participar da pesquisa O problema principal desta abordagem é que a opinião dessas pessoas pode diferir muito da opinião dos que não estão dispostos a participar da pesquisa Exemplo Nos sítios de compra da web os clientes que têm recla mações podem estar mais dispostos a responder um questioná rio do que os que estão satisfeitos com a compra do produto ou do serviço 𝑖𝑖 Amostragem bola de neve SnowBall Algumas pessoas são convidadas a participar da pesquisa e solicitase a elas que convi dem outras pessoas a participar A amostragem continua até que o número exigido de respostas seja obtido Essa técnica é fre quentemente usada quando a população é difícil de ser identifi cada ou acessada pelos pesquisadores Exemplo Admitindo que os hackers de software se conheçam se acharmos um hacker para participar da pesquisa podemos solicitar a ele que indiqueconvide outros possíveis participan tes 𝑖𝑖𝑖 Amostragem por cota é a versão não probabilística da amos tragem aleatória estratificada A população alvo é dividida em estratos apropriados baseados em subgrupos conhecidos sexo grau de instrução 𝑒𝑡𝑐 Cada estrato é amostrado usando amos tragem por conveniência ou bola de neve de forma que o núme ro de respondentes em cada estrato corresponde à sua propor ção na população Exemplo Numa pesquisa de opinião sobre o atendimento em um açougue de supermercado aplicase o questionário até que se obtenha a opinião de 200 clientes sendo 80 solteiros e 120 ca sados INFERÊNCIA Vamos diferenciar algumas medidas utilizadas para descrever ca racterísticas importantes num conjunto de dados Parâmetro é qualquer medida numérica usada para descrever uma característica da população Estatística é qualquer medida usada para descrever uma caracte rística da amostra ou seja 𝑞𝑢𝑎𝑙𝑞𝑢𝑒𝑟 função dos elementos da amostra Notação Geralmente os parâmetros são denotados por letras gre gas ou letras maiúsculas do alfabeto romano Já para as estatísti cas são utilizadas letras minúsculas do alfabeto romano ou letras gregas com sinal circunflexo Exemplos de parâmetros populacionais e estatísticas amostrais Descrição Parâmetro Estatística Número de elementos Média Variância 𝑁 𝜎2 𝑛 𝑥 𝑠2 Desvio padrão 𝜎 𝑠 Proporção 𝑝 𝑝 Coeficiente de correlação 𝜌𝑋 𝑌 𝑟𝑋 𝑌 DISTRIBUIÇÕES AMOSTRAIS A inferência estatística está interessada em tomar decisões sobre algum parâmetro da população com base na informação contida em uma amostra aleatória desta população Nas amostras são calculadas as estatísticas usando expressões ma temáticas chamadas de estimadores Como toda estatística 𝑥 𝑠2 etc é função dos valores de variáveis aleatórias é necessário estudar a distribuição de probabilidades dessas estatísticas A distribuição de probabilidades de uma estatística é chamada dis tribuição amostral daquela estatística Vamos conhecer a distribuição amostral da média e da proporção amostrais A DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Teorema 1 Seja 𝑋 uma população com média 𝜇 e variância 𝜎2 e seja 𝑥1 𝑥2 𝑥𝑛 uma 𝑎 𝑐 𝑠 de tamanho 𝑛 retirada desta popula ção Então a esperança matemática e a variância da média amostral são obtidas como 𝐸𝑥 𝜇 𝑣𝑎𝑟𝑥 𝜎2𝑛 O erro padrão da média é definido como 𝑒𝑝𝑥 𝑣𝑎𝑟𝑥 𝜎𝑛 Dúvida Qual a distribuição probabilística que podemos associar à média amostral 𝑥 1 Se a amostra aleatória de tamanho 𝑛 é retirada de uma distribuição normal 𝑋 𝑁𝜇 𝜎2 a estatística 𝑥 também será uma distribuição normal de média 𝜇 mas com variância 𝜎2𝑛 isto é Se 𝑋 𝑁𝜇 𝜎2 𝑥 𝑁𝜇 𝜎2𝑛 2 Teorema do Limite Central Se a 𝑎 𝑐 𝑠 de tamanho 𝑛 é retirada de qualquer população com média 𝜇 e variância 𝜎2 a distribuição amostral da média 𝑥 aproximase de uma distribuição normal com média 𝜇 e variân cia 𝜎2𝑛 quando o tamanho da amostra 𝑛 tender para infinito Se 𝑋 𝜇 𝜎2 𝑥 𝑁𝜇 𝜎2𝑛 quando 𝑛 A rapidez dessa convergência depende da distribuição da popu lação da qual a amostra é retirada se a distribuição for simétrica e unimodal a convergência é bastante rápida De um modo geral admitimos que para amostras com mais de 30 elementos a aproximação pela distribuição normal já pode ser considerada boa Corolário 1 Se 𝑥1 𝑥2 𝑥𝑛 é uma 𝑎 𝑐 𝑠 de tamanho 𝑛 de uma população X que tem média 𝜇 e variância 𝜎2 então a variável Z 𝑥𝜇 𝜎2𝑛 𝜎 𝑥𝜇𝑛 𝑁0 1 quando 𝑛 Nota Este resultado será usado no cálculo de probabilidades sobre a média amostral DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Seja 𝑝 a proporção frequência relativa de indivíduos que têm uma característica de interesse na amostra Podemos provar que 𝐸𝑝 𝑝 𝑣𝑎𝑟𝑝 𝑝 1𝑝 𝑛 Para amostras grandes 𝑛 utilizamos o Teorema do Limite Central para garantir que 𝑛 𝑝 𝑁 𝑝 𝑝1𝑝 A seguir vamos conhecer mais algumas distribuições de probabili dade que serão úteis quando fizermos inferências sobre a média a variância e a proporção 2 OUTRAS DISTRIBUIÇÕES PROBABILÍSTICAS IMPORTANTES 1 DISTRIBUIÇÃO QUIQUADRADO 𝜒2 É utilizada em tabelas de contingência na construção de intervalos de confiança e testes de hipóteses sobre a variância de uma popula ção normal A distribuição 𝜒2 é assimétri ca à direita e definida somen te para valores positivos Para o cálculo de probabilida des usamos a Tábua II 5 Figura 1 Distribuição 𝜒2 DISTRIBUIÇÃO t DE STUDENT É uma das mais importantes distribuições probabilísticas usadas nas inferências sobre médias de populações normais O gráfico da distribuição 𝑡Stu dent Figura 2 é parecido com o gráfico da distribuição 𝑁01 mas tem as caudas mais pesa das Figura 2 Distribuição 𝑡12 A Tábua III fornece valores críticos 𝑡𝑐 tais que 𝑃𝑇 𝑡𝑐 𝑝 para alguns valores de 𝑝 e de número de graus de liberdade DISTRIBUIÇÃO F DE SNEDECOR É bastante usada nas inferências sobre as variâncias de duas popu lações com distribuição normal e nos testes associados à Análise de Variância ANOVA A distribuição F tem dois parâmetros os números de graus de liberdade do numerador 𝑣1 e do denominador 𝑣2 Os valores críticos 𝑓𝑐tais que 𝑃𝐹 𝑓𝑐 005 para alguns valo res de 𝑣1 e 𝑣2 podem ser encontrados na Tábua IV Os valores críticos 𝑓𝑐 tais que 𝑃𝐹 𝑓𝑐 005 não são obtidos diretamente na Tábua IV Para tanto utilizase a relação 𝐹𝑣1 𝑣2 1 𝐹𝑣2 𝑣1 28 A Figura 3 apresenta o gráfico da distribuição 𝐹10 12 e os valores críticos tais que 𝑃𝐹 0343 005 𝑃𝐹 2753 005 Note que a distribuição 𝐹 é bastante assimétrica à direita assime tria positiva 08 07 06 05 04 03 01 00 02 005 Densidad e 2753 005 0343 29 3 ESTIMAÇÃO Na produção de generalizações sobre a população com base em re sultados obtidos de uma amostra estão envolvidos a estimação de parâmetros e os testes de hipóteses A estimação de parâmetros pode ser feita pontualmente e por in tervalo Para obtenção de bons estimadores pontuais existem al guns métodos como Método dos Mínimos Quadrados MMQ Método da Máxima Verossimilhança MMV Método dos Momentos MM Exemplos de estimadores O estimador de mínimos quadrados da média populacional 𝜇 é a média amostral 𝑛 𝑥 1 𝑛 𝑥 𝑖1 𝑖 Da Álgebra Linear sabemos que os estimadores de mínimos qua drados dos parâmetros do modelo de regressão linear simples 𝑦𝑖 𝑎 𝑏𝑥𝑖 𝜀𝑖 são 𝑏 𝑥𝑖𝑥𝑦𝑖𝑦 𝑛 𝑖 1 𝑥𝑖𝑥2 𝑛 𝑖 1 𝑎 𝑦 𝑏𝑥 CARACTERÍSTICAS DE UM BOM ESTIMADOR PONTUAL Um bom estimador deve ser justo consistente e eficiente 𝑖 T é um estimador justo não viesado ou não tendencioso do pa râmetro 𝜃 se 𝐸T 𝜃 𝑖𝑖 T é um estimador consistente do parâmetro 𝜃 se ele for justo e se 𝑙𝑖𝑚 𝑣𝑎𝑟𝑇 0 𝑛 𝑖𝑖𝑖 Se 𝑇1e 𝑇2são estimadores justos do parâmetro 𝜃 e se 𝑣𝑎𝑟𝑇1 𝑣𝑎𝑟𝑇2 então 𝑇1 é dito ser mais eficiente que o estimador 𝑇2 Queremos comprar um rifle e temos três opções 𝑟1 𝑟2 e 𝑟3 Para avaliar a qualidade de cada arma vamos atirar 30 vezes num alvo e analisar a distribuição das marcas próximas da mosca ponto central 𝑟1 𝑟2 𝑟3 Figura 5 Qualidades de um bom estimador Observamos que 𝑖 As armas 𝑟1e 𝑟2 buscam atingir a mosca A mira de 𝑟3 não está bem calibrada porém se conseguirmos calibrar 𝑟3podemos ter um bom rifle 𝑖𝑖 O rifle 𝑟1é melhor que 𝑟2porque os seus tiros formam uma nu vem de pontos com menor dispersão ao redor da mosca Conclusão O rifle 𝑟1reúne as melhores características Analogia A mosca do alvo é o valor do parâmetro que pretende mos estimar Os rifles são os estimadores que usamos para tem tar acertar o verdadeiro valor do parâmetro Os tiros dos rifles correspondem às estimativas geradas pelos estimadores em amostras diferentes Então podemos dizer que 𝑖 Os estimadores 𝑟1 e 𝑟2 são estimadores justos ou não viesados 𝑖𝑖 O estimador 𝑟3 é um estimador viesado porque em média não acerta o valor do parâmetro 𝑖𝑖𝑖 Dentre os estimadores justos o estimador 𝑟1 é mais eficiente que 𝑟2 pois tem menor variância Exemplos de bons estimadores 𝑛 𝑖1 𝑖 Média amostral 𝑥 1 𝑛 𝑥 Variância amostral 𝑠2 1 𝑛1 𝑥 𝑥2 𝑛 𝑖1 𝑖 GESTÃO DE QUALIDADE E SUSTENTABILIDADE INTERVALOS DE CONFIANÇA AULA 5 ESTIMAÇÃO POR INTERVALO A estimativa pontual de um parâmetro é bastante útil mas não fornece qualquer indicação da precisão a ela associada Precisão é o grau de variação de resultados de uma medição e tem como base o desviopadrão de uma série de repetições da mesma análise É desejável que uma estimativa pontual esteja acompanhada por alguma medida do erro da estimativa Intervalo de Confiança é um estimador que envolve a determinação de um intervalo a respeito da estimativa do parâmetro juntamente com alguma medida de confiança de que o verdadeiro valor do pa râmetro esteja neste intervalo A probabilidade de que o IC contenha o verdadeiro valor do parâmetro é chamada de coeficiente ou nível de confiança sendo denotado pela letra grega 𝛾gama Objetivo Encontrar um IC de pequena amplitude que inclua o ver dadeiro valor do parâmetro com uma confiança 𝛾 alta A amplitude de um IC é sempre calculada como a diferença entreos seus limites 𝐻 𝑙𝑖𝑚𝑠𝑢𝑝 𝑙𝑖𝑚𝑖𝑛𝑓 Intervalo de confiança para a média populacional 𝑰𝑪𝝁 O intervalo de confiança para a média populacional com um coefi ciente de confiança 𝛾 1 𝛼 quando a variância populacional 𝜎2 é conhecida é dado por 𝐼𝐶𝜇 100𝛾 𝑥 𝑧 𝜎 𝑥 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 Onde 𝑧𝑐 é o valor crítico tabelado da distribuição normal padrão tal que 𝛾 𝑃𝑧𝑐 Z 𝑧𝑐 5 Nota 𝑧𝑐também é denotado como 𝑧𝛼2 Por exemplo se queremos construir um 𝐼𝐶𝜇 𝛾 095 o valor 𝑧𝑐talque 095 𝑃𝑧𝑐 Z 𝑧𝑐 é o valor tabelado 𝑧0025 196 tal que 𝑃𝑍 196 𝑃𝑍 196 0025 Prova Sabemos que se tirarmos uma amostra de 𝑛 elementos de uma população 𝑋𝑁𝜇 𝜎2 a média amostral 𝑥 𝑁𝜇 𝜎2𝑛 e que 𝑥 𝜇 𝑍 𝜎𝑛 𝑁01 04 03 02 01 00 Densidade 1960 0025 1960 0025 0 X Gráfico de distribuição N01 6 Seja 𝑧𝑐um valor tal que 𝛾 1 𝛼 𝑃𝑧𝑐 𝑍 𝑧𝑐 Então 𝜎 𝑛 𝑐 𝑐 𝛾 𝑃 𝑧 𝑥𝜇 𝑧 𝑃 𝑧 𝜎 𝑥 𝜇 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 𝑃 𝑥𝑧 𝜎 𝜇 𝑥 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 𝑃 𝑥 𝑧 𝜎 𝜇 𝑥 𝑧 𝑐 𝑛 𝜎 𝑐 𝑛 Podemos admitir que 𝐼𝐶𝜇 100𝛾 𝑥 𝑧 𝜎 𝑥 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 7 Note que 𝛾 080 085 090 095 099 𝑧𝑐 128 144 164 196 258 A amplitude 𝐻 do 𝐼𝐶𝜇 está diretamente relacionada com o nível de confiança 𝛾 se quero uma maior confiança na estimativa da média vou construir um 𝐼𝐶 com maior amplitude Se desejarmos um 𝐼𝐶𝜇 mais curto e que tenha uma confiança adequada precisamos aumentar o tamanho da amostra 𝜀𝑥 𝑛 O tamanho de amostra necessário para termos uma confiança 𝛾 de que o erro na estimação da média populacional seja inferior a 𝜀𝑥 é calculado por 𝑧𝑐𝜎 2 O peso de bovinos Nelore aos 210 dias de idade tem distribuição normal com variância 400𝑘𝑔2 Baseado numa amostra de 30 animais cujo peso médio foi de 186 𝑘𝑔 pedese 𝑎 Construir um IC para o peso médio dos bovinos com uma con fiança 𝛾 095 e outro para 𝛾 099 𝑏 Qual a confiança em afirmar que o verdadeiro peso médio é de 180 192𝑘𝑔 𝑎 Para 𝛾 095 𝑧𝑐 196 𝐼𝐶𝜇 95 186 196 20 186 196 20 30 17884 19316𝑘𝑔 30 amplitude 1432kg Conclusão Este IC contém o verdadeiro valor do peso médio dos bezerros aos 210 dias de idade com 95 de confiança Para 𝛾 099 𝑧𝑐 258 𝐼𝐶𝜇 99 186 258 20 186 258 20 30 30 17658 19542𝑘𝑔 Conclusão Este intervalo de amplitude 1884kg contém o verda deiro valor do peso médio dos bezerros com 99 de confiança Note que a amplitude do 𝐼𝐶𝜇 99 é maior que 𝐼𝐶𝜇 95 ou seja quanto maior a confiança maior a amplitude do 𝐼𝐶 𝑏 Se 𝐻 192 180 12 𝑘𝑔 12 2 𝑧𝑐 20 30 𝑧𝑐 164 𝛾 𝑃 164 𝑍 164 2𝑃0 𝑍 164 204495 08990 ou seja o 𝐼𝐶 contém o ver dadeiro peso médio dos be zerros com 899 de confi ança Utilizando a fórmula 𝑛 𝑧𝑐𝜎 2 𝜀𝑥 podemos calcular o tamanho da amostra a ser usado paraestimar o peso de bovinos Nelore aos 210 dias 𝜎 20 𝑘𝑔 admitindo di ferentes erros na estimativa da média 𝜀𝑥 𝛾 Erros 𝜀𝑥 em 𝑘𝑔 10 8 6 4 2 1 095 16 25 43 97 385 1537 099 27 42 74 167 666 2663 Note que o tamanho da amostra cresce com o aumento do coefici ente de confiança 𝛾 ou com a diminuição da margem de erro Problema Geralmente nós não conhecemos a variânciapopulacional 𝜎2 dos dados Neste caso precisamos estimála com os dadosde uma amostra usando o estimador 𝑠2 Como calcular um 𝐼𝐶𝜇 100𝛾 se desconhecemos 𝜎2 O intervalo de confiança para a média quando a variância popu lacional 𝜎2 é desconhecida é calculado por 𝐼𝐶𝜇 100 𝑥 𝑡 𝑠 𝑥 𝑡 𝑐 𝑛 𝑐 𝑛 𝑠 onde 𝑠 é o desvio padrão amostral e 𝑡𝑐 é obtido da Tabela III 𝑡 Student com 𝑛 1 graus de liberdade tal que 𝛾 𝑃 𝑡𝑐 𝑇 𝑡𝑐 Dez animais foram alimentados com certa ração durante 15 dias e os seus ganhos de peso foram 271 293 310 312 323 376 389 401 416 e 423 kg Construir um IC para o ganho médio de peso com 𝛾 090 Resolução Da amostra temse 𝑥 351 e 𝑠2 03081 Como 𝛾 090 entramos na Tá bua III com 𝑝 1090 005 e 2 9 gl e obtemos 𝑡𝑐 1833 Então 10 𝐼𝐶𝜇 90 351 1833 03081 351 032 𝐼𝐶𝜇 90 319 383 𝑘𝑔 Este 𝐼𝐶 de amplitude 064 kg contém o verdadeiro ganho médio de peso de bovinos alimentados com certa ração durante 15 dias com 90 de confiança Resumo Se queremos calcular um intervalo de confiança para a média populacional 𝜇 e a variância populacional 𝜎2 é conhecidausamos 𝐼𝐶𝜇 100𝛾 𝑥 𝑧 𝜎 𝑥 𝑧 𝑐 𝑛 𝑐 𝑛 𝜎 desconhecida usamos 𝑠 𝑠 𝑛 𝐼𝐶𝜇 100 𝑥 𝑡𝑐 𝑥 𝑡𝑐 𝑛 Em que 𝑠2 é a variânciaamostral EXERCÍCIO Um provedor de acesso à internet está monitorando a duração do tempo de conexões de seus clientes com o intuito de di mensionar seus equipamentos Embora não se conheça a média des se tempo sabese que o desviopadrão por analogia a outros servi ços é considerado igual a 178 minutos Uma amostra de 80 cone xões resultou num valor médio 𝑥 252 minutos a Comente sobre o tempo médio de conexão baseandose num in tervalo com confiança de 96 para a média bCalcule o tamanho de amostra necessário para diminuir a ampli tude deste intervalo de confiança pela metade com a mesma con fiança INTERVALO DE CONFIANÇA PARA A PROPORÇÃO O 𝐼𝐶 para a proporção 𝑝 com coeficiente de confiança 𝛾 é definido para situações em que temos grandes ou pequenas amostras Não discutiremos o 𝐼𝐶𝑝 exato baseado na distribuição binomial 𝑎 Para grandes amostras Teorema do Limite Central 𝑐 𝐼𝐶𝑝 100𝛾 𝑝 𝑧 𝑐 𝑝1𝑝 𝑝1𝑝 𝑛 𝑛 𝑝 𝑧 𝑏 Para pequenas amostras Intervalo de Confiança Conservativo 𝑐 𝑐 𝑛 𝑛 𝐼𝐶𝑝 100𝛾 𝑝 𝑧 025 𝑝 𝑧025 Fixando o valor do coeficiente de confiança 𝛾 o erro amostral ou margem de erro da estimativa da proporção 𝑝 é calculada por 𝜀𝑝 𝑐 𝑧 𝑝1𝑝 𝑛 Exemplo 34 Construir um 𝐼𝐶 para a proporção de eleitores favo ráveis ao candidato José da Silva com 99 de confiança sabendose que de uma pesquisa envolvendo uma amostra de 1000 eleitores so mente 248 foram favoráveis à sua eleição Resolução 𝑝 2481000 0248 é a proporção de eleitores favoráveis ao candidato Para 𝛾 099 𝑃𝑧𝑐 𝑍 𝑧𝑐 𝑧𝑐 258 Como o tamanho da amostra 𝑛 1000 é grande temos 𝐼𝐶𝑝 99 0248 258024810248 0248 0035 1000 𝐼𝐶𝑝 99 0213 0283 Conclusão Este intervalo de amplitude 007 contém a verdadeira proporção de eleitores favoráveis à eleição do candidato José da Silva com 99 de confiança Notícia A proporção de eleitores favoráveis à eleição do candidato José da Silva é de 248 com margem de erro de 35 pontos percen tuais para mais ou para menos com 99 de confiança Tamanho de amostra para estimar a proporção 𝒑 2 Fixando a confiança 𝛾 e a margem de erro 𝜀𝑝 podese estimar o tamanho ideal de uma amostra para estudar a proporção 𝑝 utili zando 𝑛 𝑝1 𝑝 𝑧𝑐 se tivermos uma boa estimativa 𝑝 obtida deal 𝜀𝑝 guma pesquisa anterior ou de uma pesquisa piloto 2 𝑛 025𝑧𝑐 se não tivermos qualquer informação 𝑎 𝑝𝑟𝑖𝑜𝑟𝑖 da 𝜀𝑝 proporção Simular o tamanho de amostra para uma pesquisa eleitoral sobre o candidato José usando diferentes coeficientes de confiança e diferentes margens de erro sabendo que de pesquisas anteriores 𝑝 0248 𝜀𝑝 0050 0040 0030 0020 0010 0005 𝛾 090 204 318 565 1270 5078 20310 𝛾 095 287 448 797 1792 7165 28658 Note que Quanto menor a margem de erro que queremos no resultado da pesquisa maior é o tamanho da amostra Quanto maior a confiança que se quer no resultado da pesquisa maior é o tamanho da amostra 323 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA 𝜎2 𝑛1𝑠2 𝑛1𝑠2 𝐼𝐶𝜎2 100𝛾 𝑄2 𝑄1 Onde 𝑠2 é a variância amostral 𝑄1e 𝑄2 são os valores críticos da distribui ção quiquadrado Tábua II com 𝑣 𝑛 1 graus de liberdade tais que 𝛾 𝑃𝑄1 𝑄 𝑄2 com 𝑄𝜒2 𝑛1 Observe que a distribuição quiquadrado não é simétrica e está defi nida somente para os reais positivos Isso dificulta a obtenção dos valores críticos 𝑄1e 𝑄2 010 008 006 004 002 000 Q1 Q2 Confia nça gam a 0 Exemplo Obter os valores críticos 𝑄1 e 𝑄2 para 𝛾 1 𝑝 095 e𝑣 15 gl 𝑄1 6262 é obtido no cruzamen to da linha 𝑣 15 gl com a coluna 𝑝 0975 2 𝑄 2749 é obtido no cruzamen to da linha 𝑣 15 gl com a coluna 𝑝 0025 008 007 006 005 004 003 002 001 Densidade 0025 0025 000 0 6262 2749 Gráfico de Distribuição QuiQuadrado gl15 Construir um 𝐼𝐶90 para a variância dos ganhos de peso de animais alimentados com certa ração por 15 dias Resolução 𝑛 10 e 𝑠2 03081 Da Tábua 2 com 9 gl e 𝛾 090 obtemos 𝑄1 3325 𝑝 095 e 𝑄2 16919 𝑝 005 Então 𝐼𝐶𝜎2 90 9103081 9103081 16919 3325 01639 08340 𝑘𝑔2 Conclusão Este 𝐼𝐶 contém a verdadeira variância dos ganhos de peso dos animais alimentados com a ração por 15 dias com 90 de confiança 010 008 006 004 Densidade 3325 002 005 1692 005 000 0 Gráfico de Distribuição QuiQuadradogl9 INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO 𝜎 Para calcular os limites de confiança basta calcular a raiz quadrada dos limites do intervalo de confiança para a variância 𝑛1𝑠2 𝑛1𝑠2 𝐼𝐶𝜎 100𝛾 𝑄2 𝑄1 No Exemplo 33 um 𝐼𝐶 para o desvio padrão dos ganhos de peso dos animais é dado por 𝐼𝐶𝜎 90 01639 08340 𝑘𝑔 0405 0913𝑘𝑔 Conclusão Este 𝐼𝐶 contém o verdadeiro desvio padrão dos pesos dos animais alimentados com certa ração por 15 dias com 90 de confiança EXERCÍCIOS 1 O tamanho de tilápias em cm aos 3 meses de idade tem distribui ção normal com média e variância desconhecidas Com nos compri mentos cm de 15 tilápias 181 208 173 201 197 186 184 160 190 205 192 218165 218 211 Pedese a Calcular um 𝐼𝐶 para a média com 90 de confiança bCalcular um 𝐼𝐶 para o desvio padrão dos comprimentos com 95 de confiança 2 A eleição para prefeito em certa cidade tem somente dois candidatos sendo um deles o atual prefeito Uma pesquisa foi feita com 500 eleitores e somente 220 disseram que votariam nele Calcule um 𝐼𝐶 para a proporção de eleitores que votarão no atual prefeito e comente sobre o resultado Baseado no 𝐼𝐶𝑝 ele pode se considerar eleito