·

Administração ·

Estatística Aplicada para Finanças

Send your question to AI and receive an answer instantly

Ask Question

Preview text

MANA6510 Métodos de Pesquisa e Previsão Teste de uma média vinda de amostra Comparação de duas médias vindas de duas amostras Testes de Hipótese para proporções Comparação de três ou mais médias vindas de amostras 6 ciclo Curso de Administração da FEI Comparação de Médias e de Proporções Fábio Gerab MANA6510 Nível de significância ERROS NA CONCLUSÃO TIPO I Rejeitamos a hipótese nula sendo ela verdadeira É chamado de nível de significância do teste TIPO II Não rejeitamos a hipótese nula sendo ela falsa 1 é chamado de Poder do teste 1 O Poder do teste é a probabilidade de acerto quando H0 é falsa Poder do teste O Nível de Significância mais utilizado é 005 ou 5 Fábio Gerab MANA6510 Valor p p value O pvalue denotado como nível descritivo do teste é a probabilidade de que a estatística do teste como variável aleatória tenha valor extremo em relação ao valor observado estatística quando a hipótese H0 é verdadeira O Valor p é a probabilidade de uma diferença seja maior que a diferença encontrada pela amostra devido a um simples acaso estatístico Para exemplificar a lembremos que no caso da comparação de performance dentre João e José tivemos Zres d d 100042426 2357 Pela tabela da normal reduzida temos que Pz 236 00094 094 Logo temos que o valor p 094 Como p foi menor que o nível de significância definido 5 rejeitamos a hipótese H0 de igualdade de performance Obs Os softwares fornecem o pvalue para um teste Ecxel DISPNORMP2357 0009212 092 Fábio Gerab Agosto de 2016 MANA6410 Teste de uma média vinda de amostra Fábio Gerab agosto de 2016 Não significante ao nível de 005 p Um médico está preocupado com a possível influência de um novo medicamento sobre o nível de colesterol das pessoas por ele medicadas Uma amostra aleatória de 15 pacientes submetidos a esta nova droga apontou um nível de colesterol de 203mgdl com desvio padrão nesta amostra de 4594mgdl Supondo que o valor normal para o colesterol seja de 180mgdl podese a um nível de significância de 005 concluir que estes pacientes estão com seu nível de colesterol alterado 005 Significância Teste Bicaudal 2 0025 Ecxel DISTTxgrausliberdadecaudas Logos DISTT194142 0072796 X é o valor numérico em que se avalia a distribuição Grausliberdade é um número inteiro indicando o número de graus de liberdade Caudas especifica o número de caudas da distribuição a ser retornado MANA6410 Comparação de duas médias vindas de duas amostras Fábio Gerab agosto de 2016 MANA6410 Comparação de duas médias vindas de amostras Fábio Gerab agosto de 2016 MANA6410 Comparação de duas médias vindas de amostras Fábio Gerab agosto de 2016 Assim a desconfiança do engenheiro não foi confirmada pelo experimento MANA5410 Testes de Hipótese para proporções Fábio Gerab agosto de 2016 Quando o tamanho n da amostra é suficientemente grande Testes de Hipótese para a proporção podem ser efetuados da mesma forma que para a média aproximandose a distribuição amostral da proporção para uma distribuição normal Teorema do Limite Central e utilizando a distribuição normal reduzida Z Seja p é a proporção de ocorrências na amostra vinda de uma população cuja a proporção na população é p Então EPP p1pn TH para proporções em grandes amostras seguem o mesmo raciocínio que para as médias p031 é a proporção de ocorrências na amostra vinda de uma população cuja a proporção na população é p035 Então EPP p1pn 0350651500 001235 d p p 035 031 004 Zres dEPM 004001235 32389 Z0022054 Como Z002 é menor que 32389 rejeitase a afirmação do candidato De outra forma Pz 32389 1 DISTNORMP32389 1 09994 00006 Como 00006 002 rejeitase a afirmação do candidato Testes de Hipótese para proporções Um candidato a um pleito majoritário afirma ter 35 das intenções de voto Uma pesquisa eleitoral com 1500 eleitores apontou este canditado com 31 das intenções de voto Baseado nesta pesquisa é possível aceitar a um nível de significância de 2 em um teste unicaudal a afirmação do candidato Distribuição F e Aplicações Distribuição F distribuição de razão de variâncias Valores Críticos para a Distribuição F Teste F para duas amostras Fábio Gerab 6 ciclo Curso de Administração da FEI MANA6510 Métodos de Pesquisa e Previsão MANA6510 Distribuição F distribuição de razão de variâncias A Distribuição F também é chamada de F de Fisher Ou F de Snedecor Ou F de Fisher Snedecor Sejam representantes das variâncias amostrais de duas populações diferentes Se ambas populações são normais e as variâncias populacionais são iguais então a distribuição amostral de é chamada de distribuição F 2 1 2 2 s F s MANA6510 Distribuição F distribuição de razão de variâncias Fábio Gerab A Distribuição F também é chamada de F de Fisher Ou F de Snedecor Ou F de Fisher Snedecor Sir Ronald Aylmer Fisher Inglês 18901962 Estatístico Biólogo Geneticista George W Snedecor Americano 18811974 Matemático Estatístico MANA6510 Distribuição F distribuição de razão de variâncias Propriedades da distribuição F 1 A distribuição F é uma família de curvas determinadas por dois tipos de graus de liberdade Os graus de liberdade correspondentes à variância no numerador denotado por glN Os graus de liberdade correspondentes à variância no denominador denotado por glD 2 As distribuições F são representadas graficamente de forma positiva 3 Área total sob cada curva de uma distribuição F é igual a 1 Como a Distribuição F é proveniente da razão de duas variâncias amostrais ela é função de dois tipos de graus de liberdade MANA6510 Valores Críticos para a Distribuição F Valores críticos para a distribuição F 1 Especifique o nível de significância 2 Determine os graus de liberdade para o numerador glN 3 Determine os graus de liberdade para o denominador glD 4 Use a tabela da distribuição F para encontrar o valor crítico Se o teste de hipótese é a Unicaudal use b Bicaudal use ½ MANA6510 Valores Críticos para a Distribuição F Exemplo encontando valores F críticos Encontre o valor F crítico para um teste unicaudal à direita quando α 005 glN 6 e glD 29 O valor F0 crítico é 243 Isto é PF629 F0 005 Solução MANA6510 Valores Críticos para a Distribuição F Encontre o valor F crítico para um teste bicaudal quando α 005 glN 4 e glD 8 Solução Colocar a maior variância no numerador Quando realizando um teste de hipótese bicaudal usando a distribuição F você só precisa encontrar o valor da cauda à direita lembrando de usar a tabela ½α 1 005 0025 2 1 2 MANA6510 Valores Críticos para a Distribuição F ½α 0025 glN 4 e glD 8 O valor F0 crítico é igual a 505 Isto é PF48 F0 0025 MANA6510 Variabilidade dentro das amostras e entre as amostras Tomemos k amostras de uma população cada uma pertencente a um distinto subgrupo desta população tratamento Desta forma cada uma destas amostra fornecerá uma estimativa para a média populacional ANOVA Teste simultâneo da igualdade de VÁRIAS médias MANA6510 Variabilidade dentro das amostras e entre as amostras Suposição Medidas de uma mesma variável vindas de três grupos tratamentos distintos Um sentido para a ANOVA com o teste F H0 1 2 3 k Todas as médias das populações são equivalentes Não há tratamento Ha nem todos i são semelhantes Ao menos 2 médias de populações são diferentes entre si X fX 1 2 3 1 2 3 X fX MANA6510 Variabilidade dentro das amostras e entre as amostras 2 2 2 11 21 kj SS Total X X X X X X X Grupo 1 Grupo 2 Grupo 3 Resposta X Suposição Medidas de uma mesma variável vindas de três grupos tratamentos distintos Calculase a soma dos desvios quadráticos em relação à média total Soma dos Quadrados Totais Variância total SQT MANA6510 Variabilidade dentro das amostras e entre as amostras Suposição Medidas de uma mesma variável vindas de três grupos tratamentos distintos Calculase as médias dos grupos e a soma dos desvios quadráticos de cada média multiplicada pelo tamanho da amostra em relação à média total Soma dos Quadrados Entre Tratamento da variância 2 2 2 2 2 1 1 X n X X n X X n X SST k k X X3 X2 X1 Grupo 1 Grupo 2 Grupo 3 Resposta X SQE MANA6510 Variabilidade dentro das amostras e entre as amostras Suposição Medidas de uma mesma variável vindas de três grupos tratamentos distintos Variância erro aletória 2 2 2 11 1 21 2 kj k SSE X X X X X X X2 X1 X3 Grupo 1 Grupo 2 Grupo 3 Resposta X Calculase as a soma dos desvios quadráticos em relação à média de seu respectivo grupo Soma dos Quadrados Dentro SQD MANA6510 Variabilidade dentro das amostras e entre as amostras A Soma dos Quadrados Totais é a Soma dos Quadrados Dentro Mais a Soma dos Quadrados Entre Isto é SQT SQD SQE Se o Efeito dos tratamentos não é relevante então as variâncias associadas à SQD e a SQE são semelhantes isto é S2 Entre S2 Dentro Assim Verificar se existe algum efeito no tratamento significa rejeitar Hipótese Nula H0 S2 Entre S2 Dentro As somas dos quadrados são proporcionais as variâncias Logo testar H0 é testar utilizando a distribuição F a razão entre as variâncias Entre e Dentro MANA6510 Análise de Variância simples ANOVA Testar H0 é testar a razão entre as variâncias Entre Dentro Quanto Maior a Razão S2 Entre S2 Dentro Menor a probabilidade de H0 Variâncias S2 Total SQT N1 S2 Entre SQE k1 S2 Dentro SQD Nk Graus de Liberdade Total N1 Entre k1 Dentro Nk Estatística a ser testada F S2 Entre S2 Dentro Amostras k amostras nk dados por amostra N n1 n2 nk MANA6410 Análise de Variância simples ANOVA Fonte de variância Graus de liberdade Soma de quadrados Média quadrada variância F Tratamento k 1 SQE MQE SQEk 1 MQE MQD Erro N k SQD MQD SQDN k Total N 1 SQT SQESQD Tabela ANOVA da Análise de Variância Construída a tabela da ANOVA basta testar o valor de F obtido com o valor crítico de F proveniente da tabela da Distribuição F MANA6410 Análise de Variância simples ANOVA Se significa que são semelhantes F MQE MQD 1 Só rejeite o F grande Sempre uma cauda Fα k 1 N k 0 Rejeitado H0 Não Rejeitado H0 F Slide 27 MANA6410 Comparação de várias médias usando ANOVA Aplicação da ANOVA Exercício 1 Como diretor de produção você quer ver se 3 máquinas preenchedoras têm diferença média entre si no tempo de preenchimento Para isso designou 15 empregados treinados e experientes 5 por máquina obtendo os resultados ao lado No nível 005 de significância há alguma diferença na média do tempo de preenchimento Máq1 Máq2 Máq3 2540 2340 2000 2631 2180 2220 2410 2350 1975 2374 2275 2060 2510 2160 2040 MANA6410 Comparação de várias médias usando ANOVA H0 H1 1 2 Valores críticos Estatística de teste Decisão Conclusão F212005 389 0 389 005 1 2 3 nem todos são semelhantes 005 2 12 MANA6410 Comparação de várias médias usando ANOVA F212005 389 MANA6410 Comparação de várias médias usando ANOVA Maq1 Maq1 2 Maq2 Maq2 2 Maq3 Maq3 2 254 64516 234 54756 20 400 2631 69222 218 47524 222 4928 241 58081 235 55225 1975 3901 2374 56359 2275 51756 206 4244 251 63001 216 46656 204 4162 Soma 12465 31118 11305 25592 10295 2123 ANOVA Fácil de Calcular n1 n2 n3 5 N n1 n2 n3 15 Para o cálculo de qualquer Somas dos Quadrados basta lembrar que SQ xi x2 xi 2 xi2N onde x xin MANA6410 Comparação de várias médias usando ANOVA Tratamento Maq1 Maq1 2 Maq2 Maq2 2 Maq3 Maq3 2 254 64516 234 54756 20 400 2631 69222 218 47524 222 4928 241 58081 235 55225 1975 3901 2374 56359 2275 51756 206 4244 251 63001 216 46656 204 4162 Soma 12465 31118 11305 25592 10295 2123 ANOVA Fácil de Calcular n1 n2 n3 5 N n1 n2 n3 15 SQT xi 2 xi2N SQT 31118 25592 2123 12465 11305 10295215 SQT 779438 34065 2 15 582172 Cálculo da Soma dos Quadrados Totais SQT MANA6410 Comparação de várias médias usando ANOVA SQD xij 2 xij2nj SQD 311181246525 255921130525 21231029525 SQD 110532 Cálculo da Soma dos Quadrados Dentro SQD n1 n2 n3 5 N n1 n2 n3 15 Tratamento Maq1 Maq1 2 Maq2 Maq2 2 Maq3 Maq3 2 254 64516 234 54756 20 400 2631 69222 218 47524 222 4928 241 58081 235 55225 1975 3901 2374 56359 2275 51756 206 4244 251 63001 216 46656 204 4162 Soma 12465 31118 11305 25592 10295 2123 ANOVA Fácil de Calcular MANA6410 Comparação de várias médias usando ANOVA SQE SQT SQD SQE 582172110532 SQE 471640 Cálculo da Soma dos Quadrados Entre SQE n1 n2 n3 5 N n1 n2 n3 15 Tratamento Maq1 Maq1 2 Maq2 Maq2 2 Maq3 Maq3 2 254 64516 234 54756 20 400 2631 69222 218 47524 222 4928 241 58081 235 55225 1975 3901 2374 56359 2275 51756 206 4244 251 63001 216 46656 204 4162 Soma 12465 31118 11305 25592 10295 2123 ANOVA Fácil de Calcular MANA6410 Análise de Variância simples ANOVA Fonte de variância Graus de liberdade Soma de quadrados Média quadrada variância F Tratamento k 1 SQE MQE SQEk 1 MSE MSD Erro N k SQD MSD SQDN k Total N 1 SQT SQESQD Lembrando da Tabela ANOVA Com a soma dos quadrados SDE e SQD podemos calcular os Quadrados Médios MQESQE k1 MQDSQDNk MANA6410 Comparação de várias médias usando ANOVA Sumário da Solução Tabela ANOVA Tratamento máquinas 3 1 2 471640 235820 2560 Erro 15 3 12 110532 09211 Total 15 1 14 582172 Fonte de variação Graus de liberadade Soma dos quadrados Média quadrada variância F MANA6410 Comparação de várias médias usando ANOVA Solução H0 1 2 3 H1 Nem todos são semelhantes 005 1 2 2 12 Valores críticos Estátistica de teste Decisão Conclusão Rejeitar em 005 Há evidencias que as médias da população são diferentes F 0 389 005 F MQE MQD 235820 09211 256 F212005 389 MANA6410 Comparação de várias médias usando ANOVA Exercício 2 Você é um instrutor da Microsoft Corp Há uma diferença na média do tempo de aprendizado de 12 pessoas usando 4 métodos de ensino diferentes 005 M1 M2 M3 M4 10 11 13 18 9 16 8 23 5 9 9 25 Use a tabela a seguir 19841994 TMaker Co Aplicação da ANOVA MANA6410 Comparação de várias médias usando ANOVA Erro Total F Fonte de variação Graus de liberadade Soma dos quadrados Média quadrada variância Tratamento máquinas Sumário Tabela ANOVA Faça as contas manualmente lembrando que para o caso geral SQ xi x2 xi 2 xi2n onde x xin MANA6410 Comparação de várias médias usando ANOVA Método M1 M12 M2 M22 M3 M32 M4 M42 10 100 11 121 13 169 18 324 9 81 16 256 8 64 23 529 5 25 9 81 9 81 25 625 Soma 24 206 36 458 30 314 66 1478 SQT xi 2 xi2N SQT 2064583141478 24363066212 428 n1 n2 n3 n4 3 e N n1 n2 n3 n4 12 SQD xij 2 xij2nj SQD 2062423 4583623 3143023 14786623 80 SQE SQT SQD 428 80 348 MANA6410 Comparação de várias médias usando ANOVA solução F38005 407 0 407 005 H0 1 2 3 4 Ha Não são totalmente similares 005 1 3 2 8 Valores críticos MANA6410 Comparação de várias médias usando ANOVA F38005 407 MANA6410 Comparação de várias médias usando ANOVA Sumário Tabela ANOVA Tratamento métodos 4 1 3 348 116 116 Erro 12 4 8 80 10 Total 12 1 11 428 F Fonte de variação Graus de liberadade Soma dos quadrados Média quadrada variância MANA6410 Comparação de várias médias usando ANOVA Estatística de teste Decisão Conclusão Rejeitado em 005 Há evidencias que as médias da população são diferentes F MQE MQD 116 10 11 6 H0 1 2 3 4 H1 Não são totalmente similares 005 1 3 2 8 Valores críticos 005 F 0 407 MANA6410 Análise de Variância Análise de Variância simples ANOVA Tabela ANOVA Comparação de várias médias Testes posteriores Fábio Gerab OITAVO TÓPICO 6 ciclo Curso de Administração da FEI MANA6410 Comparação de várias médias ANOVA Teste Posteriores Os métodos posteriores de Análise Post hoc tentam resolver esta questão X fX 1 2 3 2 agrupamentos ANOVA fala qual população tem médias significamente diferentes Exemplo μ1 μ 2 μ 3 Procedimento Post hoc Feito depois da rejeição das médias semelhantes em ANOVA Saída de muitos programas estatísticos do computador A ANOVA só diz que existe alguma média diferente das demais mas não esclarece quais são delas iguais e quais delas são diferentes entre si MANA6410 Comparação de várias médias ANOVA Teste Posteriores Por que são necessários os Testes Posteriores O Procedimento ANOVA não consegue controlar a probabilidade do erro tipo I para cada uma das médias só para o conjunto delas Assim em sucessivas comparações entre médias duas a duas usando o teste t de Student a probabilidade de se apontar erradamente uma diferença entre médias pode ser bem maior que o utilizado na ANOVA A probabilidade de se apontar erradamente uma diferença cresce na medida em que o número de comparações cresce Os testes posteriores visam corrigir a probabilidade de erro tipo I e apontar quais médias ou grupos de médias diferem entre si Os testes posteriores mais utilizados suas melhores aplicações e suas maiores limitações são dados abaixo TESTE IDEIA APLICAÇÃO LIMITAÇÃO Bonferroni Calcula intervalos de confiança corrigindo o nível de significância de para n onde n é o número de intercomparações possíveis Bom quando o número de tratamentos é pequeno Perde poder de discriminação quando usado para muitos tratamentos Tukey Calcula um novo valor crítico para avaliar quando diferenças entre dois pares são significantes Bastante aceito pois para muitos tratamentos ele tem maior poder que outros testes Só deve ser utilizado quando todas as amostras tem mesmo tamanho n1n2nk Scheffe Calcula um novo valor critico para o teste F quando dois grupos provenientes de uma ANOVA maior são comparados Pode ser aplicado quando tamanho das amostras difere de uma para outra Tem menor poder de discriminação quando comparado ao teste de Tukey Obs Existem vários outros testes posteriores Seu cálculo é feito com o auxílio computacional em softwares específicos Exercício 2 Você é um instrutor da Microsoft Corp Há uma diferença na média do tempo de aprendizado de 12 pessoas usando 4 métodos de ensino diferentes 005 M1 M2 M3 M4 10 11 13 18 9 16 8 23 5 9 9 25 Exemplos de Testes Posteriores para a ANOVA Tabela ANOVA software SPSS Statistical Package for Social Sciences A diferença entre as médias é significativa quando o intervalo de confiança da diferença não incluir o zero Bonferroni O Método 4 é distinto dos demais métodos Exemplos de Testes Posteriores para a ANOVA A diferença entre as médias é significativa quando o intervalo de confiança da diferença não incluir o zero Tukey O Método 4 é distinto dos demais métodos Exemplos de Testes Posteriores para a ANOVA A diferença entre as médias é significativa quando o intervalo de confiança da diferença não incluir o zero Scheffe O Método 4 é distinto dos demais métodos Exemplos de Testes Posteriores para a ANOVA Exemplos de Testes Posteriores para a ANOVA Com os intervalos de confiança é possível montar os subgrupos homogêneos O SPSS monta estes subgrupos automaticamente para os testes de Tukey Scheffe e outros mas não para o Bonferroni que é muito conservador O Método 4 é distinto dos demais métodos A diferença entre as médias é significativa quando o intervalo de confiança da diferença não incluir o zero Exemplos de Testes Posteriores para a ANOVA Exercício 1 Como diretor de produção você quer ver se 3 máquinas preenchedoras têm diferença média entre si no tempo de preenchimento Para isso designou 15 empregados treinados e experientes 5 por máquina obtendo os resultados ao lado No nível 005 de significância há alguma diferença na média do tempo de preenchimento Máq1 Máq2 Máq3 2540 2340 2000 2631 2180 2220 2410 2350 1975 2374 2275 2060 2510 2160 2040 Tabela ANOVA software SPSS Statistical Package for Social Sciences A diferença entre as médias é significativa quando o intervalo de confiança da diferença não incluir o zero Exemplos de Testes Posteriores para a ANOVA Bonferroni Todas as máquinas preenchedoras tem desempenhos diferentes das demais Exemplos de Testes Posteriores para a ANOVA Com os intervalos de confiança é possível montar os subgrupos homogêneos O SPSS monta estes subgrupos automaticamente para os testes de Tukey Scheffe e outros mas não para o Bonferrone que é muito conservador Tukey e Scheffe Todas as máquinas preenchedoras tem desempenhos diferentes das demais Obrigado Fábio Gerab