·

Educação Física ·

Bioestatística

Send your question to AI and receive an answer instantly

Ask Question

Preview text

TEORIA DA ESTIMAÇÃO E DA DECISÃO INTRODUÇÃO A tomada de decisões sobre a população com base em estudos feitos sobre os dados da amostra constitui o problema central da Inferência Estatística A tais decisões estão sempre associados um grau de incerteza e conseqüentemente uma probabilidade de erro A generalização da amostra para a população é feita com o auxílio de um modelo estatístico para a situação em estudo A descrição populacional pode se dar como tem sido largamente comentado mediante distribuições de freqüência e através de medidas descritoras Estas últimas são chamadas de Parâmetros Populacionais Parâmetro Populacional Constante que descreve uma população em geral desconhecida Em geral os parâmetros são medidas de posição e de dispersão mas pode haver o interesse em alguns outros Algumas situações são exemplificadas a seguir Exemplo 1 Desejase ter uma idéia acerca da proporção desconhecida de produtores de uma região que cultivam milho O parâmetro em questão é a probabilidade de sucesso p Exemplo 2 Há o interesse no tempo médio de vida dos aspersores da marca Agro1000 bem como sua variância Parâmetros μ e σ2 Quando se dispõe apenas de uma parte dos elementos da população uma amostra o máximo que se pode conseguir são valores aproximados para os parâmetros desconhecidos conhecidos como Estimativas Assim definemse os conceitos a seguir Estimativa Valor aproximado calculado a partir de uma amostra de um parâmetro populacional desconhecido Estimação O ato de obter uma estimativa Estimador Corresponde à expressão algébrica que permite obter uma estimativa Exemplificando considere que se tenha calculado uma média amostral tendo sido encontrado o valor 35 Esse valor é uma estimativa ou seja uma aproximação para o parâmetro populacional μ A expressão que permitiu obter essa estimativa x x n i i n x x 1 corresponde ao estimador da média populacional É bastante usual como comentado no Capítulo 2 representar o estimador de um parâmetro através do símbolo desse parâmetro com um chapéu No exemplo do estimador da média populacional ele poderia além da notação ser representado por A inferência estatística lida essencialmente com a estimação de parâmetros e com a realização de testes de hipóteses referentes a esses parâmetros A Estimação por ponto e por intervalo Existem dois tipos de estimação por ponto e por intervalo Quando simplesmente se obtém uma estimativa para um parâmetro dizse que se trata de uma estimação por ponto ou pontual No entanto quase sempre a estimação por ponto sozinha é pouco informativa porque ela não fornece uma idéia do grau de erro que se comete ao assumir o valor da estimativa como sendo igual ao do parâmetro desconhecido Nesse caso melhor seria usar a estimação por intervalo pois tem maior confiabilidade ESTIMAÇÃO POR INTERVALO PARA μ Variância conhecida Agora será abordada a estimação por intervalo para μ quando a amostra é do tipo aleatória simples Para a construção de um intervalo de confiança para μ é conveniente estudar distribuições de amostragem associadas a seu estimador pontual Para tanto existem alguns teoremas para casos onde a população pode ser descrita por uma distribuição normal que são úteis Teorema Seja uma população infinita descrita por uma variável X com distribuição normal Nμ σ2 Se infinitas amostras de tamanho n são coletadas nessa população então a média dessas amostras terá distribuição normal com média μ e variância σ2n Se a variância populacional σ2 for conhecida então podese utilizar diretamente este teorema para calcular probabilidades associadas a pois se n N x 2 então sabese que a variável n x Z tem distribuição normal com média 0 e variância 1 Dessa maneira podese fazer n z x n z x P 2 2 Em que Z é o valor encontrado na tabela Z ˠ é o grau de confiança do teste α é o valor da área da tabela que Z ou seja α1ˠ Podese escrever a fómula acima como n Z e e x IC 2 ESTIMAÇÃO POR INTERVALO PARA μ Variância desconhecida Entretanto é muito pouco provável que em uma situação real σ2 seja conhecida Assim fazse necessário o uso do próximo teorema Teorema Seja uma população infinita descrita por uma variável X com distribuição normal Nμ σ2 E sejam infinitas amostras de tamanho n coletadas nessa população a partir das quais são calculadas e s2 Então a variável n s x t tem uma distribuição conhecida como t de Student e que tem como único parâmetro a constante v n 1 graus de liberdade A distribuição t mencionada no Teorema é uma função densidade de probabilidade indexada por um único parâmetro v que nada mais é do que o número de graus de liberdade das amostras em questão v n 1 Essa distribuição possui as seguintes propriedades i A média da variável t ou seja a esperança Et é igual a zero da mesma forma que a variável Z ii É semelhante à distribuição normal pois é simétrica em relação à média e tem forma campanular iii Quando o tamanho da amostra tende para o infinito as distribuições de Z e de t são iguais iv A distribuição t é definida a partir de um único parâmetro o número de graus de liberdade A Tabela 2 do Apêndice apresenta os valores tabelados para a distribuição t para valores fixos de probabilidade simbolizados por α e de maneira que Pt tα α onde tα corresponde a valores tabelados Devese notar que da mesma maneira que a variável Z a distribuição de t é simétrica e assim Pt tα Pt tα α o que facilita sobremaneira o cálculo de probabilidades Finalmente tendo definido a distribuição t é possível agora construir um intervalo de confiança para o parâmetro μ Como visto a tais intervalos é associado um coeficiente de confiança γ tal que Pa μ b γ n s t x n s t x P 2 2 Rescrevendo temse n s t e e x IC 2 Exemplos 1 O diâmetro médio de Biomphalaria taenagophila espécie de caramujo examinada uma amostra de 35 animais foi de 0871 mm com desvio padrão de 0057 mm Dê a estimativa por intervalo do verdadeiro parâmetro médio utilizando um nível de confiança de 95 Temse n35 mm x 0 871 s0057 mm e t2032 35 2 032 0 057 0 871 95 IC 0 0196 0 871 0 8510891 95 IC 2 A distribuição dos pesos de pacotes de sementes de milho enchidos automaticamente por uma máquina é noraml com desvio padrão conhecido e igual a 020 kg Uma amostra de 15 pacotes retirada ao acaso apresentou média de 2002 kg Construir um intervalo de 95 para o peso médio dos pacotes n15 média2002kg σ020 z196 15 196 0 20 2002 95 IC 196 0 0516 2002 01332 2002 19892015 95 IC ESTIMAÇÃO DA DIFERENÇA ENTRE AS MÉDIAS DE 2 POPULAÇÕES Muito freqüentemente na pesquisa científica ou em levantamentos em geral há o interesse na comparação entre as médias de diferentes populações Tal é o caso por exemplo quando se compara diversas procedências de eucalipto para se saber qual é a mais produtiva em volume de madeira Na comparação entre uma população 1 e uma população 2 com médias μ1 e μ2 respectivamente a estimação de interesse é a da diferença μ1 μ2 INTERVALO DE CONFIANÇA PARA DUAS MÉDIAS QUANDO AS VARIÂNCIAS POPULACIONAIS SÃO CONSIDERADAS ESTATISTICAMENTE IGUAS σ12σ22 Um intervalo de confiança para a diferença entre as 2 médias poderia ser construído através de e x x IC 2 1 2 1 Em que 2 1 2 1 2 2 2 1 2 1 2 1 1 2 1 1 n n n n n s n s t e Com graus de liberdade dado como 2 2 1 n n v Exemplo Em um experimento com animais da raça Gir e Nelore foi realizado um confinamento onde todos os animais receberam a mesma ração Após o período experimental anotouse o ganho de peso diário em kg RAÇA n MÉDIA DESVIO PADRÃO GIR 30 081 0056 NELORE 32 079 0071 Encontre o intervalo de confiança com α 95 para a diferença entre o ganho médio das duas raças µ1 µ2 Podese afirmar que a raça Gir é superior à raça Nelore Considere variâncias populacionais iguais N G N G N N G G N G n n n n n s n s t x x 1 1 2 1 1 IC 2 2 2 95 32 1 30 1 2 32 30 0 071 31 0 056 29 02 0 79 0 81 2 2 95 IC 0033 002 IC95 0053 μ μ 0013 N G 95 IC Não se pode afirmar que a raça Gir é superior a Nelore pois quando o intervalo de confiança envolve o zero não há superioridade de um elemento sobre o outro INTERVALO DE CONFIANÇA PARA DUAS MÉDIAS QUANDO AS VARIÂNCIAS POPULACIONAIS SÃO CONSIDERADAS ESTATISTICAMENTES DIFERENTES σ12 σ22 Por outro lado se as variâncias das duas populações são diferentes simbolizadas por σ12 e σ22 então o erro padrão da diferença entre as médias de 2 populações é estimado por e x x IC 2 1 2 1 2 2 2 1 2 1 α2 n s n s t e mas com a diferença de que o número de graus de liberdade para a consulta da tabela de t não pode ser mais n1 n2 2 mas agora é obtido por 1 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 n n s n n s n s n s v Essa expressão é conhecida como fórmula de Satterthwaite Exemplo Para comparar dois sistemas de plantio de arroz cultivaramse 7 parcelas de 8 m2 anotandose os seguintes resultados para o rendimento em tonha Arroz de sequeiro 21 20 24 22 23 25 19 Arroz irrigado por inundação 31 40 38 29 33 28 36 Determine IC95 para a diferença entre as médias de rendimento de dois sistemas de plantio supondo que σ12 σ22 e interprete Como as variâncias populacionais são diferentes utilizaremos uma formula específica para calcular os graus de liberdade GL 9 GL 56 8 1 7 7 21 0 1 7 7 047 0 7 21 0 7 047 0 1 n n s 1 n n s n s n s v 2 2 2 I 2 I 2 I S 2 S 2 S 2 I 2 I S 2 S I 2 I S 2 S α2 I S 95 n s n s t x x IC 7 21 0 7 0 047 2 262 3 36 22 95 IC 0 43 116 95 IC 073 μ μ 159 I S 95 IC De acordo com intervalo podese afirmar com 95 de confiança que a produtividade do arroz irrigado é superior a do arroz sequeiro Pois μ1 μ2 0 μ1 μ2 ESTIMAÇÃO DE PROPORÇÕES Um parâmetro do qual freqüentemente temse muito interesse é a proporção p dos indivíduos de uma população que guardam alguma característica de interesse Como exemplos temse a proporção de eleitores simpatizantes de um candidato proporção de agricultores que comprariam um novo insumo agrícola de árvores doentes em um povoamento etc Consiste na probabilidade de sucesso associada à distribuição binomial Naquela ocasião foi considerado que p fosse conhecido Na realidade a menos que se conheça toda a população em geral ele não é Nesse caso uma amostra aleatória simples AAS poderia ser coletada de maneira a possibilitar a estimação de p Supondo que dos n indivíduos amostrados x deles apresentam a característica de sucesso então o estimador por ponto de p é igual a n p x ˆ E a estimação por intervalo Existem duas maneiras de ser feita Uma delas consiste na construção de um intervalo de confiança aproximado utilizando a aproximação da distribuição binomial à distribuição normal Entretanto esse procedimento não é recomendado quando 5 5 ou ˆ ˆ nq p n Quando for este o caso a maneira mais apropriada é utilizar o intervalo exato Intervalo de Confiança Aproximado Admitindo que a aproximação normal é satisfatória intervalos de confiança aproximados podem ser construídos mediante a distribuição de Z P p z pq n p p z pq n 1 2 1 2 onde z1γ2 é um valor da Tabela de Z tal que PZ z1γ2 1γ2 Considerado um exemplo de um administrador rural que tinha que selecionar mãodeobra para a safra de uma cultura cultivada em sua empresa rural e para tanto ele iria avaliar 60 candidatos na região Naquela ocasião o parâmetro p foi admitido conhecido No entanto numa situação prática ele terá que ser estimado Suponhase que ele tenha dentre os 60 candidatos encontrado 38 aptos A estimativa por ponto de p é 0 63 60 38 ˆ n x p e assim q 1 p 1 063 037 O erro padrão da proporção é estimado como 0 06 60 0 37 0 63 ˆ ˆ n pq e E assim um intervalo de confiança com 95 de confiança é dado por P z p z 0 63 0 06 0 63 0 06 1 2 1 2 095 O valor de z correspondente é igual a z0025 1960 valor de z correspondente à probabilidade 0475 na Tabela 11 do Apêndice E assim P p 0 63 0 12 0 63 0 12 095 P p 0 51 0 75 095 Ou seja a proporção de candidatos na região aptos ao serviço está entre 051 e 075 com 95 de confiança Podese facilmente demonstrar utilizando o conceito de derivada que o produto pq atinge o valor máximo quando p q 05 Nesse caso a margem de erro será máxima Em pesquisas eleitorais por exemplo é freqüente a necessidade do conhecimento do tamanho da amostra n que deve ser utilizado para que a margem de erro seja de por exemplo 2 pontos percentuais Para tanto basta considerar a pior situação possível quando p q 05 Por exemplo utilizando um coeficiente de confiança de 95 o valor de z0025 é igual 196 Estipulando a margem de erro como sendo 2 então 002 196 002 Resolvendo esta equação temse 1962 0022 E assim n 2401 Ou seja seria necessário entrevistar 2401 eleitores para uma pesquisa eleitoral com margem de erro igual a 2 Em geral na divulgação dessas pesquisas não se fala nada a respeito do coeficiente de confiança o que deveria ser feito DIMENSIONAMENTO DE AMOSTRAS No tópico acima apresentouse uma maneira de se determinar o tamanho da amostra adequado para estimar p fixando uma margem de erro Essa idéia pode ser generalizada para a estimação de outros parâmetros se houver alguma estimativa preliminar por exemplo usando uma amostrapiloto do erro padrão correspondente Supondo que essa estimativa preliminar seja em que θ seja o parâmetro de interesse então o dimensionamento da amostra fixando uma margem de erro igual a d é feito pela relação d t ˆ 2 a qual é resolvida em relação a n pois geralmente é uma função do tamanho da amostra Por exemplo seja considerado o caso de estimação por intervalo mais simples que é a do parâmetro μ utilizando uma AAS em uma população infinita Dessa forma P x t s n x t s n 1 2 2 1 2 2 O termo n s t 2 2 confere a margem de erro da amostragem Se uma estimativa preliminar s2 for disponível por exemplo utilizando uma amostrapiloto então o dimensionamento da amostra seria dado por 2 2 2 2 d s t n A título de ilustração considere o exemplo do engenheiro agrícola que deseja estimar a VIB de um solo de várzea Suponhase que ele deseja uma margem de erro igual a d 007 Tendo ele composto uma amostrapiloto com 5 elementos obteve uma estimativa preliminar da variância igual a s2 002 O tamanho de amostra adequado com γ 95 de não se ter uma margem de erro maior que 007 é dado por 2 2 0 07 0 02 t n O valor de t consultado deve ser aquele correspondente à amostrapiloto ou seja com 51 4 graus de liberdade e assim obtémse t0025 2776 Com isso 32 elementos 0 07 776 0 02 2 2 n E assim essa idéia pode ser generalizada para qualquer outro parâmetro de interesse θ TESTES DE HIPÓTESES Quando colhese uma amostra de uma determinada população o objetivo é tirar conclusões sobre os parâmetros dessa população Assim a partir das informações amostrais estimamos os parâmetros da população Entretanto se existe algum referencial sobre valores que os parâmetros de uma população devem assumir podese testar hipóteses formuladas sobre esses parâmetros de conformidade com as informações obtidas da amostra Igualmente podese testar a hipótese de que uma amostra pertence a uma população de parâmetros dados ou ainda se duas populações têm parâmetros iguais Para testarmos parâmetros de uma população formulase hipóteses a respeito desses parâmetros Essas hipóteses são denominadas H0 Hipótese nula Ha Hipótese alternativa Testar hipóteses formuladas consiste em decidir se aceita ou se rejeita a hipótese nula H0 Quando se rejeita a hipótese nula automaticamente está sendo aceita a hipótese alternativa Ha Teste de Hipóteses Verificação de hipóteses sobre a população mediante critérios estatísticos Teoria da Decisão Corresponde à teoria de testes de hipóteses pois a aceitação ou a rejeição de hipóteses freqüentemente implica em alguma decisão acerca da população Os testes de hipóteses podem se referir ao modelo utilizado para descrever a população de interesse ou ainda admitindo que o modelo seja satisfatório podem se referir aos parâmetros do modelo Na prática a aceitação ou rejeição de H0 e conseqüentemente a aceitação de H1 são feitas mediante uma amostra pela qual estimativas apropriadas são calculadas Se a distribuição de amostragem dos estimadores correspondentes for conhecida então podese calcular a probabilidade da estimativa observada ter ocorrido admitindo a hipótese de nulidade H0 como verdadeira Se esta probabilidade for baixa então existem bons motivos para rejeitar essa hipótese e aceitar H1 Dessa forma podese estipular um valor para o estimador de tal maneira que se a estimativa calculada na amostra for por exemplo maior que determinado valor então rejeitase H0 Por exemplo suponha que o nível de controle para a broca do café seja de p0 5 de frutos brocados Assim o teste acima seria dado por H0 p 5 H1 p 5 Uma amostra de n frutos é coletada onde são contados o número x de frutos brocados Em seguida é então calculado o estimador da proporção p x n p x n Com base no conhecimento da distribuição de amostragem pelo uso da aproximação normal por exemplo suponha que se descobre que existe apenas 1 de probabilidade do valor observado em uma amostra ao acaso ser acima de 12 se o nível de infestação na população é igual a p0 ou seja H0 verdadeira Assim esse fato é utilizado para aceitar ou não H0 Essa regra é chamada de Regra de Decisão ou Critério de Decisão Regra de Decisão Procedimento pelo qual optase por rejeitar ou aceitar a hipótese de nulidade No exemplo da broca do café a regra de decisão seria REGRA DE DECISÃO Aceitar H0 se for menor que 12 ERROS ASSOCIADOS Outros elementos importantes de um teste de hipóteses são os possíveis erros que se pode cometer ao se utilizar determinada regra de decisão São eles Erro Tipo I consiste no erro que se comete ao rejeitar H0 sendo que ela é verdadeira Erro Tipo II consiste no erro que se comete ao aceitar H0 sendo que ela é falsa A probabilidade de se cometer o erro tipo I é em geral representada pela letra grega α e comumente também é chamada de nível de significância do teste A probabilidade de ocorrência do erro tipo II é representada pela letra β Quando se rejeita H0 e ela de fato é falsa isto consiste em uma decisão correta Isto ocorre com probabilidade 1β valor esse que por sua vez recebe o nome de Poder do Teste Nível de Significância Consiste no valor da probabilidade de se cometer um Erro Tipo I Poder do Teste Consiste na probabilidade de rejeição de H0 quando de fato ela é falsa Já a probabilidade de se aceitar H0 quando ela é verdadeira corresponde ao valor 1α que por sua vez não recebe um nome especial Estes aspectos podem ser sumarizados como na Tabela 61 Tabela 61 Resultados possíveis em um teste de hipóteses e suas probabilidades de ocorrência A verdade na população Decisão tomada H0 é verdadeira H0 é falsa H0 é aceita Decisão correta Probabilidade 1α Decisão errada Erro Tipo II Probabilidade β H0 é rejeitada Decisão errada Erro Tipo I Probabilidade α Decisão correta Probabilidade 1β PROBABILIDADE TOTAL 1α α 1 1β β 1 TESTES SOBRE PARÂMETROS DA POPULAÇÃO A seguir serão discutidos testes de cotizes referentes a parâmetros da população tais como μ μ1 μ2 p etc Se a população for infinita o modelo probabilístico que a descreve é admitido conhecido ou pressuposto TESTE SOBRE μ POPULAÇÕES INFINITAS Em certas situações decisões precisam ser tomadas a respeito de uma população com base no valor de sua média μ Por exemplo suponhase que não se deseje uma marca de aspersor que não ofereça um tempo de vida médio mínimo Para verificar isso uma pesquisa poderia ser feita Nela o objetivo principal não seria tanto estimar esse tempo médio μ mas antes tomar uma decisão a marca de aspersor em questão pode ou não pode ser utilizada Suponhase que se a marca não oferecer pelo menos 500 horas de vida útil em média ela não deve ser empregada Em outras palavras se μ 500 então a marca será refutada Assim existe interesse no seguinte teste de hipóteses H0 μ 500 H1 μ 500 Como a população é desconhecida e não há viabilidade de se conhecêla toda uma amostra será coletada e o julgamento de H0 será feito baseado na amostra Uma possibilidade consiste em observar a média amostral e baseandose em sua distribuição de amostragem estabelecer uma regra de decisão para o teste Notase que o ponto crítico a partir do qual a decisão sobre aceitar ou não a marca é mudada é o ponto μ 500 Dessa forma uma maneira de otimizar o teste acima consiste em reformulálo da seguinte maneira H0 μ 500 H1 μ 500 A razão de se proceder dessa forma é a de que admitindo que μ seja igual a 500 podese prever o comportamento de segundo o Teorema 62 pressupondo que a população tenha distribuição normal Por exemplo suponha que uma amostra de 12 aspersores tenha sido observada na qual encontrouse média 410 horas e s2 1600 horas2 Admitindo que H0 seja verdadeira então sabese que a variável n s x t 500 tem uma distribuição de t com 11 graus de liberdade Consultando a Tabela 12 do Apêndice verificase com um valor de α de 0050 por exemplo existe 95 de probabilidade de que a variável acima seja maior que 2201 pois t0025 2201 conforme observase na Figura 62 Em outras palavras sendo H0 verdadeira é muito pouco provável que a partir de uma amostra o valor de t acima seja menor que 2201 Se isso acontecer existem boas razões para crer que H0 seja falsa com 5 de chance de se estar cometendo um erro o Erro Tipo I ao se fazer isso É comum designar a variável acima por tc para diferenciála do valor tabelado tα No exemplo dado temse 12 1600 410 500 ct tc 7794 Então como 7794 2201 existem boas razões para se admitir que H0 seja falsa Quanto à natureza dos testes de hipóteses unilateral ou bilateral podem ser generalizadas para qualquer parâmetro θ que se esteja interessado UNILATERAL TESTE DE HIPÓTESES BILATERAL A seguir são apresentadas as regras de decisão que devem ser tomadas em testes de hipóteses sobre o parâmetro μ admitindo que a população tenha distribuição normal com base em uma amostra na qual e s2 são calculadas e fixado um nível de significância probabilidade de Erro Tipo I igual a α a Teste Unilateral do Tipo H0 μ μ0 H1 μ μ0 REGRA DE DECISÃO rejeitar H0 se tc tα onde tc b Teste Unilateral do Tipo H0 μ μ0 H1 μ μ0 REGRA DE DECISÃO rejeitar H0 se tc tα onde tc c Teste Bilateral do Tipo H0 μ μ0 H1 μ μ0 REGRA DE DECISÃO rejeitar H0 se tc tα2 ou tc tα2 onde tc Neste último teste o valor de t tabelado deve ser procurado com probabilidade α2 pois a soma das duas caudas da distribuição corresponderão ao nível de significância do teste Figura 63 A figura Ilustra o de critério de decisão para teste bilateral Para exemplificar o teste bilateral considere uma máquina ensacadora para enchimento de sacos de café sobre a qual desejase fazer o seguinte teste de hipóteses H0 μ 60 Kg H1 μ 60 Kg Para tanto uma amostra de 25 sacos foi observada tendose encontrado uma média amostral igual a 59 Kg e uma variância de 9 Kg2 Assim 667 1 25 3 60 59 n s x tc Adotando um nível de significância de α 005 e consultando a Tabela de t com 24 graus de liberdade encontrase tα2 t0025 2064 Como 1667 2064 e além disso 1667 2064 então não há razões para se rejeitar H0 com 5 de significância TESTES SOBRE μ1 μ2 EM POPULAÇÕES INFINITAS Freqüentemente desejase comparar duas populações com relação às suas médias para verificar simplesmente se são diferentes sendo que a estimação dessa diferença é importante mas secundária Nesse caso é interessante perfazer um teste de hipóteses sobre μ1 μ2 Para a construção de intervalos de confiança a diferença também relacionase com a distribuição t o que permite compor critérios de decisão para testes de hipóteses Admitindo que as variâncias de ambas as populações sejam iguais então a variável tc tem distribuição t com n1 n2 2 graus de liberdade O leitor deve se lembrar que 2 1 1 2 2 1 2 2 2 2 1 1 2 1 2 1 2 2 2 1 1 2 1 1 2 n n S n S n n n x x x x s n j j n j j Este tipo de teste é empregado por exemplo quando uma empresa de reflorestamento que tradicionalmente cultiva um clone A de eucalipto adquire numa instituição de pesquisa um novo clone B Assim há interesse no conhecimento se no plantio de novos talhões é justificável plantar o novo clone B ou seja se ele é mais produtivo Se μ1 μ2 0 então não se justifica trocar o clone cultivado na empresa Se por outro lado μ1 μ2 0 então o clone B é mais produtivo e justificase utilizálo Assim um teste de hipóteses de interesse seria H0 μ1 μ2 0 H1 μ1 μ2 0 Suponhase que para a realização de tal teste um experimento tenha sido conduzido com 25 parcelas de cada clone nas quais avaliouse o DAP médio das árvores tendose encontrado μ1 18 cm μ2 15 e s2 18 Assim tc 7906 Utilizando um nível de significância de α 5 temse que o valor tabelado de t com 48 graus de liberdade deve ser obtido por interpolação Com 40 e 60 graus de liberdade temse respectivamente 1684 e 1671 para os valores de t005 ou seja uma diminuição de 0013 ao se aumentar 20 graus de liberdade Assim 20 0013 8 x x 0005 E portanto o valor de t com 48 graus de liberdade é 1684 0005 1679 Como 7906 1679 aceitase H0 com nível de significância de 5 Quando as variâncias populacionais são consideradas estatisticamente diferentes a estatística de teste é a seguinte 2 2 2 1 2 1 2 1 2 1 n s n s x x tc Com graus de liberdade dado como 1 1 2 2 2 2 2 1 2 1 2 1 2 2 2 1 2 1 n n s n n s n s n s v Exemplo As seguintes medidas de Cytochrome oxidase complexo de proteína transmembrana foram determinadaas em machos de peixes Periplaneta em mm3 por 10 minutos por miligrama em um estudo para comparar dois tratamentos quais sejam 124 horas após a injeção de methoxyclor e 2 controle ou seja sem injeção de methoxyclor Tratamentos amostra média desvio padrão 24 horas após a injeção 5 248 09 Controle 3 197 28 Verifique se existe efeito significativo da aplicação de methoxyclor quanto às médias de Cytochrome oxidase Suponha variâncias populacionais diferentes Hipóteses H0 μT μC H1 μT μC 06 3 3 84 7 5 81 0 19 7 24 8 ct Com graus de liberdade 2 25 2 2 3 84 7 4 5 81 0 3 84 7 5 81 0 2 2 2 v Para um nível de 5 de significância temse tα2 t0025 4303 Como t calculado é menor que t tabela ou seja 306 4303 aceitase H0 Não houve diferença entre os dois procedimentos TESTES SOBRE PROPORÇÕES Para testar hipóteses sobre proporções é necessário que se disponha de uma amostra com n elementos a partir dos quais é calculada uma proporção amostral Exemplo 1 Numa amostra de 100 peças produzidas por uma máquina foram encontradas 4 defeituosas Testar ao nível de significância de 5 a hipótese de que a proporção de peças defeituosas é p 003 ou é maior Solução Hipóteses H0 p 003 Ha p 003 curva unilateral à direita Para um nível de significância de 5 temos da Tabela da distribuição Normal Padrão que o z que fornece a área cinza de 005 representada na figura é z 164 Fórmula para obter o z observado na amostra Conclusão do Teste de Hipóteses Como zobs 05103 z 164 não conseguimos rejeitar H0 isto é aceitase a hipótese de que a proporção de peças defeituosas é igual a 003 UNIVERSIDADE FEDERAL DE UBERLÂNDIA UFU ESTATISTICA PROFª FABRÍCIA 1 A gerente de uma empresa quer estimar a proporção p de clientes que gostaram da última exposição de arte apresentada pela empresa Numa amostra de 300 clientes 270 afirmaram que gostaram da exposição Qual seria a estimativa pontual de p 2 Numa eleição de segundo turno um instituto de pesquisa de opinião obteve num levantamento de boca de urna que 40 p 040 dos entrevistados votaram no candidato A a Construa intervalos de confiança para a verdadeira proporção p de eleitores que votaram no candidato A com coeficientes de confiança de 90 95 e 99 Compare os intervalos Comente Admita aqui que o tamanho da amostra seja n 150 b Construa intervalos de confiança para p admitindo que a estimativa pˆ 040 foi obtida de amostras de tamanho n 100 n 150 e n 200 Compare os intervalos Comente Considere aqui um coeficiente de confiança de 90 3 Não se conhece o consumo médio de combustível de automóveis da marca T Sabese no entanto que o desvio padrão do consumo de combustível de automóveis dessa marca é 10 kml Na análise de 100 automóveis da marca T obtevese consumo médio de combustível de 8 kml Encontre um intervalo de confiança para o consumo médio de combustível dessa marca de carro Adote um nível de confiança igual a 95 4 Desejase estimar o tempo médio de estudo em anos da população adulta de um município Sabese que o tempo de estudo tem distribuição normal com desvio padrão σ 26 anos Foram entrevistados n 25 indivíduos obtendose para essa amostra um tempo médio de estudo igual há 105 anos Obter um intervalo de 90 de confiança para o tempo médio de estudo populacional 5 Estabeleça um intervalo de confiança para a média populacional sendo que o desvio padrão populacional é 4 o tamanho amostral é n 36 e a média amostral igual a 30 Utilize um nível de confiança de 95 para a média 6 Uma amostra de n 64 elementos de uma variável normalmente distribuída forneceu média 254 sendo que o desvio padrão populacional é 52 Determine o intervalo de confiança de 90 para a média 7 Uma amostra de 50 funcionários é tomada de uma linha de produção A média de horas extras trabalhadas por semana é de cinco horas com desvio padrão populacional de uma hora Construa intervalos com 92 e 99 de confiança para a média de horas extras trabalhadas por toda a linha de produção 8 Em uma fábrica colhida uma amostr a aleatória de certa peça foram obtidas as seguintes medidas em cm para os diâmetros 14 14 14 15 15 15 16 16 16 Sabendo que a amostra foi extraída de uma população com distribuição normal construa um intervalo de confiança para o diâmetro médio ao nível de 96 e outro para um nível de confiança de 98 9 Numa pesquisa sobre a opinião dos moradores de duas cidades A e B com relação a um determinado projeto obtevese a tabela abaixo Utilize o Intervalo confiança de 95 para avaliar a diferença entre os percentuais de favoráveis nas duas cidades Cidade A B Num entrevistados 400 600 Num favoráveis 180 350 10 Os dados abaixo referemse ao efeito da adaptação de Phlorizin em ruminantes em relação ao controle sem aplicação medido pela glucose arterial cem mm Item Controle Phlorizin Média 321 311 Variância 085 080 Tamanho da amostra 10 14 Estime o intervalo de confiança 95 para a diferença do teor médio de glucose arterial entre o controle e o phlorizin Considere as variâncias populacionais iguais Tire as conclusões de interesse Adaptado de Bauer et al 1995 11 Diferencie estimador estimativa e parâmetros Dê exemplos 12 Uma amostra de 100 trabalhadores de uma fábrica grande demora em média 12 minutos para completar uma tarefa com um desvio padrão de dois minutos Uma amostra de 50 trabalhadores de uma outra fábrica demora em média 11 minutos para completar a mesma tarefa com desvio padrão igual a três minutos Considere variâncias diferentes Construa um IC de 95 para a diferença a entre as duas médias populacionais 13 Para investigar a influência da opção profissional sobre o salário inicial de recémformados investigaramse dois grupos de profissionais um de liberais em geral e outro de formandos em Administração de Empresas Com os resultados abaixo expressos em salários mínimos quais seriam suas conclusões Suponha variâncias diferentes Liberais 66 103 108 129 92 123 70 Administradores 81 98 87 100 102 82 87 101