1
Métodos Quantitativos Aplicados
MACKENZIE
4
Métodos Quantitativos Aplicados
MACKENZIE
76
Métodos Quantitativos Aplicados
MACKENZIE
4
Métodos Quantitativos Aplicados
MACKENZIE
83
Métodos Quantitativos Aplicados
MACKENZIE
3
Métodos Quantitativos Aplicados
MACKENZIE
10
Métodos Quantitativos Aplicados
MACKENZIE
1
Métodos Quantitativos Aplicados
MACKENZIE
9
Métodos Quantitativos Aplicados
MACKENZIE
1
Métodos Quantitativos Aplicados
MACKENZIE
Texto de pré-visualização
Chapter 3 31 Basic Business Statistics 10e 2006 Prentice Hall Inc MÉTODOS QUANTITATIVOS EM PROCESSOS DECISÓRIOS Análise de Correlação e Regressão Prof Dr André Wakamatsu UNIVERSIDADE PRESBITERIANA MACKENZIE CCSA Centro de Ciências Sociais e Aplicadas A COVARIÂNCIA A covariância mede a força da relação linear entre duas variáveis numéricas X e Y A covariância amostral Somente referente a força do relacionamento Nenhum efeito causal 1 n Y XY X XY cov n 1 i i i 2 1 2 Chapter 3 32 Basic Business Statistics 10e 2006 Prentice Hall Inc INTERPRETANDO A COVARIÂNCIA Covariância entre duas variáveis covXY 0 X e Y tendem a mover na mesma direção covXY 0 X e Y tendem a mover em direções opostas covXY 0 X e Y são independentes A covariância tem uma grande falha Não é possível determinar a força relativa do relacionamento a partir do tamanho da covariância 3 COEFICIENTE DE CORRELAÇÃO Mede a força relativa do relacionamento linear entre duas variáveis numéricas Coeficiente de correlação amostral em que XSY S covXY r 1 n X X S n 1 i 2 i X 1 n Y XY X XY cov n 1 i i i 1 n Y Y S n 1 i 2 i Y 4 3 4 Chapter 3 33 Basic Business Statistics 10e 2006 Prentice Hall Inc CARACTERÍSTICAS DO COEFICIENTE DE CORRELAÇÃO O coeficiente de correlação populacional é chamado de ρ O coeficiente de correlação amostral é chamado de r Tanto ρ como r tem as seguintes características Livre de unidade Intervalo entre 1 e 1 Mais próximo de 1 mais forte a relação linear negativa Mais próximo de 1 mais forte a relação linear positiva Mais próximo de 0 mais fraca a relação linear 5 0 a 03 correlação muito fraca 03 a 05 correlação fraca 05 a 07 correlação moderada 07 a 09 correlação forte 09 a 1 correlação muito forte VISUALIZANDO DUAS VARIÁVEIS NUMÉRICAS O GRÁFICO DE PONTOS Gráficos de pontos são usados para dados numéricos consistindo de pares de observações tomadas de duas variáveis numéricas Uma variável é medida no eixo vertical e a outra variável é medida no eixo horizontal Gráficos de pontos são udados para examinar para examinar possíveis relações entre duas variáveis numéricas 6 5 6 Chapter 3 34 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE GRÁFICO DE PONTO Volume por dia Custo por dia 23 125 26 140 29 146 33 160 38 167 42 170 50 188 55 195 60 200 7 GRÁFICO DE PONTO NO SPSS 8 GraphsChart Builder 7 8 Chapter 3 35 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE GRÁFICO DE PONTO NO SPSS 9 Duplo clique Adicionar linha de tendência 10 GRÁFICO DE PONTO NO SPSS r2 é o coeficiente de determinação da variação de Y que é explicada pela variação de X quanto maior melhor o ajuste r2 0967 9 10 Chapter 3 36 Basic Business Statistics 10e 2006 Prentice Hall Inc GRÁFICOS DE PONTOS DE DADOS AMOSTRAIS COM VÁRIOS COEFICIENTES DE CORRELAÇÃO Y X Y X Y X Y X r 1 r 06 r 03 r 1 Y X r 0 O COEFICIENTE DE CORRELAÇÃO USANDO A FUNÇÃO DO SPSS 12 AnalyzeCorrelateBivariate Kendall e Spearman usados quando os dados são fortemente não normais ou quando é usada uma escala ordinal Será existe correlação entre as notas de dois testes 11 12 Chapter 3 37 Basic Business Statistics 10e 2006 Prentice Hall Inc O COEFICIENTE DE CORRELAÇÃO USANDO A FUNÇÃO DO SPSS AnalyzeCorrelateBivariate Ho o coeficiente de correlação da população é zero ρ 0 letra grega rô Tabela simétrica Valor da correlação entre a Nota do Teste 1 e a Nota do Teste 2 Valor da significância da correlação entre a Nota do Teste 1 e a Nota do Teste 2 Se Sig não rejeito H0 Se Sig rejeito H0 Avaliar Sig Sinal Valor Sig Prática r2 13 INTERPRETANDO O COEFICIENTE DE CORRELAÇÃO r 0733 r2 0537 Há uma força relativa linear positiva da relação entre as notas do teste 1 e do teste 2 Estudantes cuja nota foi alta no primeiro teste tendem a ter uma nota alta no segundo teste 314 13 14 Chapter 3 38 Basic Business Statistics 10e 2006 Prentice Hall Inc Correlação espúria é o nome que se dá para a existência de relação estatística entre duas ou mais variáveis mas sem significado teórico Por este motivo é comum afirmar que a correlação não significa causa Pode ser uma coincidência No de afogamentos X Consumo de sorvete No de igrejas X No de assassinatos Existe uma terceira variável que explica a correlação entre as duas primeiras Pode ser uma causa ou fator comum Correlação espúria 15 1 2 5 10 20 50 100 200 1 2 5 10 20 50 100 200 Number of churches per city Number of murders per year per city Lnmurders0009099Lnchurches Número de igrejas Número de assassinatos Tamanho da População Novo contexto causal Número de igrejas Número de assassinatos Tamanho da População Correlação espúria 16 15 16 Chapter 3 39 Basic Business Statistics 10e 2006 Prentice Hall Inc Butter in Bangladesh Predicts the Stock Market httpwwwfoolcominvestinggeneral20070920butterin bangladeshpredictsthestockmarketaspx Estudos estatísticos realizados na Holanda têm mostrado que tanto o número de nascimentos como o número de cegonhas tem decaído httpwwwhumornacienciacombrmiscelaneacegonhtm Correlação espúria 17 CORRELAÇÃO X REGRESSÃO Um gráfico de pontos pode ser usado para mostrar a relação entre duas variáveis Uma Análise de Correlação é usada para medir a força da associação relação linear entre duas variáveis Correlação somente trata da força da relação Nenhum efeito causal está implícito na correlação Uma Análise de Regressão é usada para Prever o valor de uma variável dependente baseado no valor de pelo menos uma variável independente Explica o impacto nas mudanças em uma variável independente na variação da variável dependente Variável dependente a variável que desejamos prever ou explicar a variação Variável independente a variável usada para prever ou explicar a variação da variável dependente 18 17 18 Chapter 3 310 Basic Business Statistics 10e 2006 Prentice Hall Inc MODELO DE REGRESSÃO LINEAR SIMPLES Somente uma variável independente X Relação entre X e Y é descrita como por uma função linear Mudanças em Y são assumidas que são relacionadas a mudanças em X 19 TIPOS DE RELAÇÕES Y X Y X Y Y X X Relação Linear Relação Curvilinear 20 19 20 Chapter 3 311 Basic Business Statistics 10e 2006 Prentice Hall Inc TIPOS DE RELAÇÕES Y X Y X Y Y X X Relações Fortes Relações Fracas 21 TIPOS DE RELAÇÕES Y X Y X Sem Relação 22 21 22 Chapter 3 312 Basic Business Statistics 10e 2006 Prentice Hall Inc i i 1 0 i ε β X β Y Componente Linear MODELO DE REGRESSÃO LINEAR SIMPLES Intercepto Populacional de Y Coeficiente angular populacional Termo do erro aleatório Variável Dependente Variável Independente Componente do erro aleatório 23 Erro aleatório para esse valor de Xi Y X Valor Observado de Y para Xi Valor Previsto de Y para Xi i i 1 0 i ε β X β Y Xi Inclinação β1 Intercepto β0 εi 24 MODELO DE REGRESSÃO LINEAR SIMPLES 23 24 Chapter 3 313 Basic Business Statistics 10e 2006 Prentice Hall Inc i 1 0 i b X b Yˆ A equação de regressão linear simples provém uma estimativa da linha de regressão populacional EQUAÇÃO DA REGRESSÃO LINEAR SIMPLES LINHA DE PREVISÃO Estimativa do intercepto da regressão Estimativa da inclinação da regressão Y estimado ou previsto para a observação i Valor de X para a observação i 25 INTERPRETAÇÃO DA INCLINAÇÃO E DO INTERCEPTO b0 é o valor médio estimado de Y quando o valor de X é zero b1 é a estimativa da mudança no valor médio de Y como um resultado do aumento de uma unidade em X 26 25 26 Chapter 3 314 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO DA LINEAR SIMPLES Um agente imobiliário deseja examinar a relação entre o preço de venda e o tamanho da casa medida em metros quadrados Uma amostra aleatória de 10 casas é selecionada Variável Dependente Y Preço da casa em milhares Variável Independente X Metros quadrados 27 EXEMPLO DE REGRESSÃO DA LINEAR SIMPLES DADOS Preço da casa em milhares Y Metros quadrados X 245 13006 312 14864 279 15794 308 17419 199 10219 219 14400 405 21832 324 22761 319 13239 255 15794 28 27 28 Chapter 3 315 Basic Business Statistics 10e 2006 Prentice Hall Inc 29 EXEMPLO DE REGRESSÃO DA LINEAR SIMPLES 5810 da variação do preço da casa em milhares é explicada pela variação da área da casa em metros quadrados O Sig 0010 005 portanto a correlação é diferente de zero A correlação é igual a r0762 positiva indica que quanto maior a área maior o preço da casa EXEMPLO DE REGRESSÃO LINEAR SIMPLES USANDO O SPSS 30 AnalyzeRegressionLinear Variável dependente Variável independente 29 30 Chapter 3 316 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES SAÍDA DO SPSS 31 Estimativa Inicial Média do preço da casa 28650 Erro cometido ao usar a média 60185 A ideia da regressão linear é ao usar uma variável independente melhorar a previsão do valor do preço da casa Ao usar o modelo de regressão linear simples o erro de estimativa cai para 41331 Ou seja houve uma melhora na previsão do preço médio cobrada pela casa ao se considerar a área em metros quadrados Ao usar o modelo de regressão linear simples percebese que há uma boa associação da variável dependente com a variável independente Além disso sabemos que a associação é positiva r0762 e que a variável independente consegue explicar 5810 da variação da variável dependente EXEMPLO DE REGRESSÃO LINEAR SIMPLES SAÍDA DO SPSS 32 ANOVA H0 Todos os coeficientes do modelo são iguais a zero Ha Pelo menos um dos coeficientes do modelo é diferente de zero Análise Como o Sig0010005 rejeitase a H0 e pelo menos um dos coeficientes do modelo é diferente de zero intercepto eou inclinação Tabela de coeficientes H0 O coeficiente é igual a zero Ha O coeficiente é diferente de zero e tem valor B Ao analisar a tabela de coeficientes percebese que a constante intercepto é igual a zero porque o Sig0129005 Já a inclinação associada à área é diferente de zero porque o Sig0010005 A equação de regressão é 1182 metros quadrados 0 Preço da casa 31 32 Chapter 3 317 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES INTERPRETAÇÃO DE BO b0 é a o valor médio estimado de Y quando o valor de X é zero se X 0 é está no intervalo dos valores observados de X Sendo assim supondo que uma casa pudesse ter 0 metros quadrados o Preço da casa seria igual a zero 33 1182 metros quadrados 0 Preço da casa b1 estima a mudança no valor médio de Y como um resultado do aumento de uma unidade em X Aqui b1 1182 nos diz que o valor médio de uma cass aumenta 11821000 1182 em média para cada metro quadrado adicional na área 34 1182 metros quadrados 0 Preço da casa EXEMPLO DE REGRESSÃO LINEAR SIMPLES INTERPRETAÇÃO DE B1 33 34 Chapter 3 318 Basic Business Statistics 10e 2006 Prentice Hall Inc 21867 1182185 0 1182 MQ 0 da casa Preço Prediga o preço de uma casa com 185 metros quadrados O preço predito para uma casa com 185 metros quadrados é 218671000 218670 EXEMPLO DE REGRESSÃO LINEAR SIMPLES FAZENDO PREVISÕES 35 EXEMPLO DE REGRESSÃO LINEAR SIMPLES FAZENDO PREVISÕES Quando usar um modelo de regressão para previsão somente preveja dentro do intervalo relevante dos dados Interpolação do intervalo relevante Não tente extrapolar além do intervalo dos Xs observados 36 35 36 Chapter 3 319 Basic Business Statistics 10e 2006 Prentice Hall Inc PRESSUPOSTOS DA REGRESSÃO LINI Linearidade A relação entre X e Y é linear Independência dos Erros Valores dos erros são estatisticamente independentes Normalidade dos Erro Valores dos erros são normalmente distribuídos para qualquer valor de X dado Igualdade da Variância também chamada de homoscedasticidade A distribuição de probabilidade dos erros tem variância constante 37 ANÁLISE DOS RESÍDUOS Os resíduos para a observação i ei é a diferença entre seu valor observado e seu valor previsto Cheque os pressupostos da regressão examinando os resíduos Examine o pressupostos de linearidade Avalie o pressuposto de independência Avalie o pressuposto de distribuição Normal Examine para a variância constante para todos os níveis de X homoscedasticidade Análise gráfica dos resíduos Gráfico dos resíduos versus X i i i Yˆ Y e 38 37 38 Chapter 3 320 Basic Business Statistics 10e 2006 Prentice Hall Inc ANÁLISE DOS RESÍDUOS PARA LINEARIDADE Não Linear Linear x resíduos x Y x Y x resíduos 39 Análise dos resíduos para independência Não Independente Independente X X resíduos resíduos X resíduos 1340 40 39 40 Chapter 3 321 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES ANÁLISE DE LINEARIDADE E INDEPENDÊNCIA 41 CHECANDO A NORMALIDADE Examine o gráfico de ramos e folhas dos resíduos Examine o Boxplot dos resíduos Examine o histograma dos resíduos Construa um gráfico de Probabilidade Normal dos resíduos Verifique os testes de normalidade de Kolmogorov Smirnov e ShapiroWilk 42 41 42 Chapter 3 322 Basic Business Statistics 10e 2006 Prentice Hall Inc ANÁLISE DOS RESÍDUOS PARA NORMALIDADE Porcento Resíduos Quando usar um gráfico de probabilidade normal erros normais irão se aproximar de uma reta 3 2 1 0 1 2 3 0 100 43 EXEMPLO DE REGRESSÃO LINEAR SIMPLES CHECANDO NORMALIDADE 44 43 44 Chapter 3 323 Basic Business Statistics 10e 2006 Prentice Hall Inc ANÁLISE DOS RESÍDUOS PARA IGUALDADE DE VARIÂNCIA Variância nãoconstante Variância constante x x Y x x Y resíduos resíduos 45 EXEMPLO DE REGRESSÃO LINEAR SIMPLES IGUALDADE DE VARIÂNCIA 46 45 46 Chapter 3 324 Basic Business Statistics 10e 2006 Prentice Hall Inc O MODELO DE REGRESSÃO MULTÍPLA Ideia Examine a relação linear entre 1 dependente Y e 2 ou mais variáveis independentes Xi i ki k 2i 2 1i 1 0 i ε β X β X β X β Y Modelo de Regressão Múltipla com k variáveis Independentes Intercepto de Y Inclinação Populacional Erro aleatório 47 EQUAÇÃO DE REGRESSÃO MÚLTIPLA Os coeficiente do modelo de regressão múltipla são estimados usando dados amostrais ki k 2i 2 1i 1 0 i b X b X b X b Y ˆ Valor de Y estimado ou predito Inclinações estimadas Equação de regressão múltipla com k variáveis independentes Intercepto estimado 48 47 48 Chapter 3 325 Basic Business Statistics 10e 2006 Prentice Hall Inc Modelo de duas variáveis Y X1 X2 2 2 1 1 0 b X b X b Yˆ EQUAÇÃO DE REGRESSÃO MÚLTIPLA 49 EXEMPLO 2 VARIÁVEIS INDEPENDENTES A distribuidora de tortas de sobremesa congelada quer avaliar os fatores que estão relacionados com a demanda Variável Dependente Vendas de tortas unidades por semana Variáveis Independentes Preço in Publicidade 100 Dados foram coletados para 15 semanas 50 49 50 Chapter 3 326 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DAS VENDAS DE TORTAS Vendas b0 b1 Preço b2 Publicidade Semana Vendas de tortas Preço Publicidade 100 1 350 550 33 2 460 750 33 3 350 800 30 4 430 800 45 5 350 680 30 6 380 750 40 7 430 450 30 8 470 640 37 9 450 700 35 10 490 500 40 11 340 720 35 12 300 790 32 13 440 590 40 14 450 500 35 15 300 700 27 Equação de regressão múltipla 51 52 EXEMPLO DE REGRESSÃO DA LINEAR MÚLTIPLA O Sig 0031 005 portanto a correlação é diferente de zero A correlação é igual a r0556 positiva indica que quanto maior o gasto com publicidade maior a quantidade vendida O Sig 0098 010 portanto a correlação é diferente de zero A correlação é igual a r0443 negativa indica que quanto maior o preço menor a quantidade vendida 51 52 Chapter 3 327 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR MÚLTIPLA USANDO O SPSS 53 AnalyzeRegressionLinear Variável dependente Variáveis independentes EXEMPLO DE REGRESSÃO LINEAR MÚLTIPLA SAÍDA DO SPSS 54 Estimativa Inicial Média de venda 39933 Erro cometido ao usar a média 63524 A ideia da regressão linear múltipla é ao usar várias variáveis independentes melhorar a previsão de venda de tortas Ao usar o modelo de regressão linear múltiplo o erro de estimativa cai para 47463 Ou seja houve uma melhora na previsão de venda de tortas ao se considerar o preço e os gastos com publicidade Ao usar o modelo de regressão linear múltipla percebese que há uma boa associação da variável dependente com as variáveis independentes Além disso sabemos que a associação é positiva r0722 e que as variáveis independentes conseguem explicar 5210 da variação da variável dependente 53 54 Chapter 3 328 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES SAÍDA DO SPSS 55 ANOVA H0 Todos os coeficientes do modelo são iguais a zero Ha Pelo menos um dos coeficientes do modelo é diferente de zero Análise Como o Sig0012005 rejeitase a H0 e pelo menos um dos coeficientes do modelo é diferente de zero intercepto eou inclinação Tabela de coeficientes H0 O coeficiente é igual a zero Ha O coeficiente é diferente de zero e tem valor B Ao analisar a tabela de coeficientes percebese que a constante intercepto é diferente de zero porque o Sig0020 005 Já a inclinação associada à área é diferente de zero porque o Sig0014005 Já a inclinação associada à área é diferente de zero porque o Sig0040005 A equação de regressão é Publicidade Vendas 306526 24975Preço 74131 A EQUAÇÃO DE REGRESSÃO MÚLTIPLA b1 24975 as vendas irão diminuir em média em 24975 tortas por semana para cada aumento de 1 no preço de venda sem considerar os efeitos das mudanças devido à publicidade b2 74131 as vendas irão aumentar em média em 74131 tortas por semana para cada aumento de 100 na publicidade sem considerar os efeitos das mudanças devido ao preço em que Vendas em número de tortas por semana Preço em Publicidade em 100 Publicidade Vendas 306526 24975Preço 74131 55 56 Chapter 3 329 Basic Business Statistics 10e 2006 Prentice Hall Inc USANDO A EQUAÇÃO PARA FAZER PREVISÕES Preveja as vendas para uma semana no qual o preço de venda foi de 550 e gasto com publicidade de 350 Vendas previstas de 42862 tortas 42862 35 306526 24975 550 74131 306526 24975Preço 74131Publicidade Vendas Note que a publicidade está na ordem de 100 então 350 significa que X2 35 R2 AJUSTADO r2 nunca diminui quando uma nova variável X é adicionada ao modelo Isso pode ser uma desvantagem quando se compara modelos Qual o efeito de se adicionar uma nova variável Perdese um grau de liberdade quando um nova variável X é adicionada A nova variável X adiciona poder explicatório suficiente para compensar a perda de um grau de liberdade 58 57 58 Chapter 3 330 Basic Business Statistics 10e 2006 Prentice Hall Inc Mostra a proporção de variação em Y explicada por todas as variáveis X ajustada para o número de variáveis X usadas em que n tamanho amostral k número de variáveis independentes Penalizar o uso excessivo de variáveis independentes sem importância Menor do que o r2 Útil na comparação entre os modelos 1 1 1 1 2 2 k n n r raj 59 R2 AJUSTADO 0442 r2 adj 442 da variação nas vendas das tortas é explicada pela variação no preço e publicidade tendo em conta o tamanho da amostra e do número de variáveis independentes R2 AJUSTADO NO SPSS 60 59 60 Chapter 3 331 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES ANÁLISE DE LINEARIDADE E INDEPENDÊNCIA 61 EXEMPLO DE REGRESSÃO LINEAR SIMPLES CHECANDO NORMALIDADE 62 61 62 Chapter 3 332 Basic Business Statistics 10e 2006 Prentice Hall Inc USANDO VARIÁVEIS DUMMY Uma variável dummy é uma variável independente com dois níveis Sim ou não masculino ou feminino Codificada como 0 ou 1 Aassumese que as inclinações associadas com variáveis independentes numéricas não mudam com o valor da variável categórica Se houver mais do que dois níveis o número de variáveis dummy necessárias é número de níveis 1 63 EXEMPLO DE VARIÁVEL DUMMY COM 2 NÍVEIS Seja Y vendas de tortas X1 preço X2 feriado X2 1 se um feriado ocorre durante a semana X2 0 se não há feriado na semana 2 1 0 b X b X b Yˆ 2 1 64 63 64 Chapter 3 333 Basic Business Statistics 10e 2006 Prentice Hall Inc Mesma inclinação EXEMPLO COM VARIÁVEL DUMMY COM 2 NÍVEIS X1 Preço Y vendas b0 b2 b0 1 0 1 0 1 2 0 1 0 b 0 b b X b X b Yˆ b X b b b 1 b X b Yˆ 1 2 1 1 2 1 feriado Sem feriado Intercepto diferente Se H0 β2 0 é rejeitado então Feriado tem um efeito significativo nas vendas de tortas Vendas número de tortas vendidas por semana Preço preço da torta em Feriado INTERPRETANDO O COEFICIENTE DA VARIÁVEL DUMMY COM 2 NÍVEIS Exemplo 1 Se há feriado na semana 0 se não há feriado b2 15 em média as vendas são 15 tortas maiores em semanas com feriado do que em semanas sem feriado dado o mesmo preço 15Feriado Vendas 300 30Preço 66 65 66 Chapter 3 334 Basic Business Statistics 10e 2006 Prentice Hall Inc MODELOS DE VARIÁVEIS DUMMY MAIS DO QUE 2 NÍVEIS O número de variáveis dummy é o número de níveis menos 1 Exemplo Y Preço da casa X1 metros quadrados Se o estilo da casa também é considerado Estilo rancho sobrado colonial Três níveis então duas variáveis dummy são necessárias 67 MODELOS DE VARIÁVEL DUMMY MAIS DO QUE 2 NÍVEIS Exemplo seja colonial a categoria padrão e seja X2 e X3 usada como outra das duas categorias Y preço da casa X1 metro quadrado X2 1 se rancho 0 caso contrário X3 1 se sobrado 0 caso contrário A equação de regressão múltipla é 3 3 2 2 1 1 0 b X b X b X b Yˆ 68 67 68 Chapter 3 335 Basic Business Statistics 10e 2006 Prentice Hall Inc 1884 2043 0045X Y 1 ˆ 2353 0045X 2043 Y 1 ˆ INTERPRETANDO OS COEFICIENTES DA VARIÁVEL DUMMY COM 3 NÍVEIS Com o mesmo metro quadrado um rancho terá um preço médio estimado de 2353 mil reais maior do que uma colonial Com o mesmo metro quadrado um sobrado terá um preço médio estimado de 1884 mil reais maior do que uma colonial Considere a equação de regressão 3 2 1 1884X 2353X 2043 0045X Y ˆ 2043 0045X1 Y ˆ Para a colonial X2 X3 0 Para o rancho X2 1 X3 0 Para o sobrado X2 0 X3 1 69
1
Métodos Quantitativos Aplicados
MACKENZIE
4
Métodos Quantitativos Aplicados
MACKENZIE
76
Métodos Quantitativos Aplicados
MACKENZIE
4
Métodos Quantitativos Aplicados
MACKENZIE
83
Métodos Quantitativos Aplicados
MACKENZIE
3
Métodos Quantitativos Aplicados
MACKENZIE
10
Métodos Quantitativos Aplicados
MACKENZIE
1
Métodos Quantitativos Aplicados
MACKENZIE
9
Métodos Quantitativos Aplicados
MACKENZIE
1
Métodos Quantitativos Aplicados
MACKENZIE
Texto de pré-visualização
Chapter 3 31 Basic Business Statistics 10e 2006 Prentice Hall Inc MÉTODOS QUANTITATIVOS EM PROCESSOS DECISÓRIOS Análise de Correlação e Regressão Prof Dr André Wakamatsu UNIVERSIDADE PRESBITERIANA MACKENZIE CCSA Centro de Ciências Sociais e Aplicadas A COVARIÂNCIA A covariância mede a força da relação linear entre duas variáveis numéricas X e Y A covariância amostral Somente referente a força do relacionamento Nenhum efeito causal 1 n Y XY X XY cov n 1 i i i 2 1 2 Chapter 3 32 Basic Business Statistics 10e 2006 Prentice Hall Inc INTERPRETANDO A COVARIÂNCIA Covariância entre duas variáveis covXY 0 X e Y tendem a mover na mesma direção covXY 0 X e Y tendem a mover em direções opostas covXY 0 X e Y são independentes A covariância tem uma grande falha Não é possível determinar a força relativa do relacionamento a partir do tamanho da covariância 3 COEFICIENTE DE CORRELAÇÃO Mede a força relativa do relacionamento linear entre duas variáveis numéricas Coeficiente de correlação amostral em que XSY S covXY r 1 n X X S n 1 i 2 i X 1 n Y XY X XY cov n 1 i i i 1 n Y Y S n 1 i 2 i Y 4 3 4 Chapter 3 33 Basic Business Statistics 10e 2006 Prentice Hall Inc CARACTERÍSTICAS DO COEFICIENTE DE CORRELAÇÃO O coeficiente de correlação populacional é chamado de ρ O coeficiente de correlação amostral é chamado de r Tanto ρ como r tem as seguintes características Livre de unidade Intervalo entre 1 e 1 Mais próximo de 1 mais forte a relação linear negativa Mais próximo de 1 mais forte a relação linear positiva Mais próximo de 0 mais fraca a relação linear 5 0 a 03 correlação muito fraca 03 a 05 correlação fraca 05 a 07 correlação moderada 07 a 09 correlação forte 09 a 1 correlação muito forte VISUALIZANDO DUAS VARIÁVEIS NUMÉRICAS O GRÁFICO DE PONTOS Gráficos de pontos são usados para dados numéricos consistindo de pares de observações tomadas de duas variáveis numéricas Uma variável é medida no eixo vertical e a outra variável é medida no eixo horizontal Gráficos de pontos são udados para examinar para examinar possíveis relações entre duas variáveis numéricas 6 5 6 Chapter 3 34 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE GRÁFICO DE PONTO Volume por dia Custo por dia 23 125 26 140 29 146 33 160 38 167 42 170 50 188 55 195 60 200 7 GRÁFICO DE PONTO NO SPSS 8 GraphsChart Builder 7 8 Chapter 3 35 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE GRÁFICO DE PONTO NO SPSS 9 Duplo clique Adicionar linha de tendência 10 GRÁFICO DE PONTO NO SPSS r2 é o coeficiente de determinação da variação de Y que é explicada pela variação de X quanto maior melhor o ajuste r2 0967 9 10 Chapter 3 36 Basic Business Statistics 10e 2006 Prentice Hall Inc GRÁFICOS DE PONTOS DE DADOS AMOSTRAIS COM VÁRIOS COEFICIENTES DE CORRELAÇÃO Y X Y X Y X Y X r 1 r 06 r 03 r 1 Y X r 0 O COEFICIENTE DE CORRELAÇÃO USANDO A FUNÇÃO DO SPSS 12 AnalyzeCorrelateBivariate Kendall e Spearman usados quando os dados são fortemente não normais ou quando é usada uma escala ordinal Será existe correlação entre as notas de dois testes 11 12 Chapter 3 37 Basic Business Statistics 10e 2006 Prentice Hall Inc O COEFICIENTE DE CORRELAÇÃO USANDO A FUNÇÃO DO SPSS AnalyzeCorrelateBivariate Ho o coeficiente de correlação da população é zero ρ 0 letra grega rô Tabela simétrica Valor da correlação entre a Nota do Teste 1 e a Nota do Teste 2 Valor da significância da correlação entre a Nota do Teste 1 e a Nota do Teste 2 Se Sig não rejeito H0 Se Sig rejeito H0 Avaliar Sig Sinal Valor Sig Prática r2 13 INTERPRETANDO O COEFICIENTE DE CORRELAÇÃO r 0733 r2 0537 Há uma força relativa linear positiva da relação entre as notas do teste 1 e do teste 2 Estudantes cuja nota foi alta no primeiro teste tendem a ter uma nota alta no segundo teste 314 13 14 Chapter 3 38 Basic Business Statistics 10e 2006 Prentice Hall Inc Correlação espúria é o nome que se dá para a existência de relação estatística entre duas ou mais variáveis mas sem significado teórico Por este motivo é comum afirmar que a correlação não significa causa Pode ser uma coincidência No de afogamentos X Consumo de sorvete No de igrejas X No de assassinatos Existe uma terceira variável que explica a correlação entre as duas primeiras Pode ser uma causa ou fator comum Correlação espúria 15 1 2 5 10 20 50 100 200 1 2 5 10 20 50 100 200 Number of churches per city Number of murders per year per city Lnmurders0009099Lnchurches Número de igrejas Número de assassinatos Tamanho da População Novo contexto causal Número de igrejas Número de assassinatos Tamanho da População Correlação espúria 16 15 16 Chapter 3 39 Basic Business Statistics 10e 2006 Prentice Hall Inc Butter in Bangladesh Predicts the Stock Market httpwwwfoolcominvestinggeneral20070920butterin bangladeshpredictsthestockmarketaspx Estudos estatísticos realizados na Holanda têm mostrado que tanto o número de nascimentos como o número de cegonhas tem decaído httpwwwhumornacienciacombrmiscelaneacegonhtm Correlação espúria 17 CORRELAÇÃO X REGRESSÃO Um gráfico de pontos pode ser usado para mostrar a relação entre duas variáveis Uma Análise de Correlação é usada para medir a força da associação relação linear entre duas variáveis Correlação somente trata da força da relação Nenhum efeito causal está implícito na correlação Uma Análise de Regressão é usada para Prever o valor de uma variável dependente baseado no valor de pelo menos uma variável independente Explica o impacto nas mudanças em uma variável independente na variação da variável dependente Variável dependente a variável que desejamos prever ou explicar a variação Variável independente a variável usada para prever ou explicar a variação da variável dependente 18 17 18 Chapter 3 310 Basic Business Statistics 10e 2006 Prentice Hall Inc MODELO DE REGRESSÃO LINEAR SIMPLES Somente uma variável independente X Relação entre X e Y é descrita como por uma função linear Mudanças em Y são assumidas que são relacionadas a mudanças em X 19 TIPOS DE RELAÇÕES Y X Y X Y Y X X Relação Linear Relação Curvilinear 20 19 20 Chapter 3 311 Basic Business Statistics 10e 2006 Prentice Hall Inc TIPOS DE RELAÇÕES Y X Y X Y Y X X Relações Fortes Relações Fracas 21 TIPOS DE RELAÇÕES Y X Y X Sem Relação 22 21 22 Chapter 3 312 Basic Business Statistics 10e 2006 Prentice Hall Inc i i 1 0 i ε β X β Y Componente Linear MODELO DE REGRESSÃO LINEAR SIMPLES Intercepto Populacional de Y Coeficiente angular populacional Termo do erro aleatório Variável Dependente Variável Independente Componente do erro aleatório 23 Erro aleatório para esse valor de Xi Y X Valor Observado de Y para Xi Valor Previsto de Y para Xi i i 1 0 i ε β X β Y Xi Inclinação β1 Intercepto β0 εi 24 MODELO DE REGRESSÃO LINEAR SIMPLES 23 24 Chapter 3 313 Basic Business Statistics 10e 2006 Prentice Hall Inc i 1 0 i b X b Yˆ A equação de regressão linear simples provém uma estimativa da linha de regressão populacional EQUAÇÃO DA REGRESSÃO LINEAR SIMPLES LINHA DE PREVISÃO Estimativa do intercepto da regressão Estimativa da inclinação da regressão Y estimado ou previsto para a observação i Valor de X para a observação i 25 INTERPRETAÇÃO DA INCLINAÇÃO E DO INTERCEPTO b0 é o valor médio estimado de Y quando o valor de X é zero b1 é a estimativa da mudança no valor médio de Y como um resultado do aumento de uma unidade em X 26 25 26 Chapter 3 314 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO DA LINEAR SIMPLES Um agente imobiliário deseja examinar a relação entre o preço de venda e o tamanho da casa medida em metros quadrados Uma amostra aleatória de 10 casas é selecionada Variável Dependente Y Preço da casa em milhares Variável Independente X Metros quadrados 27 EXEMPLO DE REGRESSÃO DA LINEAR SIMPLES DADOS Preço da casa em milhares Y Metros quadrados X 245 13006 312 14864 279 15794 308 17419 199 10219 219 14400 405 21832 324 22761 319 13239 255 15794 28 27 28 Chapter 3 315 Basic Business Statistics 10e 2006 Prentice Hall Inc 29 EXEMPLO DE REGRESSÃO DA LINEAR SIMPLES 5810 da variação do preço da casa em milhares é explicada pela variação da área da casa em metros quadrados O Sig 0010 005 portanto a correlação é diferente de zero A correlação é igual a r0762 positiva indica que quanto maior a área maior o preço da casa EXEMPLO DE REGRESSÃO LINEAR SIMPLES USANDO O SPSS 30 AnalyzeRegressionLinear Variável dependente Variável independente 29 30 Chapter 3 316 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES SAÍDA DO SPSS 31 Estimativa Inicial Média do preço da casa 28650 Erro cometido ao usar a média 60185 A ideia da regressão linear é ao usar uma variável independente melhorar a previsão do valor do preço da casa Ao usar o modelo de regressão linear simples o erro de estimativa cai para 41331 Ou seja houve uma melhora na previsão do preço médio cobrada pela casa ao se considerar a área em metros quadrados Ao usar o modelo de regressão linear simples percebese que há uma boa associação da variável dependente com a variável independente Além disso sabemos que a associação é positiva r0762 e que a variável independente consegue explicar 5810 da variação da variável dependente EXEMPLO DE REGRESSÃO LINEAR SIMPLES SAÍDA DO SPSS 32 ANOVA H0 Todos os coeficientes do modelo são iguais a zero Ha Pelo menos um dos coeficientes do modelo é diferente de zero Análise Como o Sig0010005 rejeitase a H0 e pelo menos um dos coeficientes do modelo é diferente de zero intercepto eou inclinação Tabela de coeficientes H0 O coeficiente é igual a zero Ha O coeficiente é diferente de zero e tem valor B Ao analisar a tabela de coeficientes percebese que a constante intercepto é igual a zero porque o Sig0129005 Já a inclinação associada à área é diferente de zero porque o Sig0010005 A equação de regressão é 1182 metros quadrados 0 Preço da casa 31 32 Chapter 3 317 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES INTERPRETAÇÃO DE BO b0 é a o valor médio estimado de Y quando o valor de X é zero se X 0 é está no intervalo dos valores observados de X Sendo assim supondo que uma casa pudesse ter 0 metros quadrados o Preço da casa seria igual a zero 33 1182 metros quadrados 0 Preço da casa b1 estima a mudança no valor médio de Y como um resultado do aumento de uma unidade em X Aqui b1 1182 nos diz que o valor médio de uma cass aumenta 11821000 1182 em média para cada metro quadrado adicional na área 34 1182 metros quadrados 0 Preço da casa EXEMPLO DE REGRESSÃO LINEAR SIMPLES INTERPRETAÇÃO DE B1 33 34 Chapter 3 318 Basic Business Statistics 10e 2006 Prentice Hall Inc 21867 1182185 0 1182 MQ 0 da casa Preço Prediga o preço de uma casa com 185 metros quadrados O preço predito para uma casa com 185 metros quadrados é 218671000 218670 EXEMPLO DE REGRESSÃO LINEAR SIMPLES FAZENDO PREVISÕES 35 EXEMPLO DE REGRESSÃO LINEAR SIMPLES FAZENDO PREVISÕES Quando usar um modelo de regressão para previsão somente preveja dentro do intervalo relevante dos dados Interpolação do intervalo relevante Não tente extrapolar além do intervalo dos Xs observados 36 35 36 Chapter 3 319 Basic Business Statistics 10e 2006 Prentice Hall Inc PRESSUPOSTOS DA REGRESSÃO LINI Linearidade A relação entre X e Y é linear Independência dos Erros Valores dos erros são estatisticamente independentes Normalidade dos Erro Valores dos erros são normalmente distribuídos para qualquer valor de X dado Igualdade da Variância também chamada de homoscedasticidade A distribuição de probabilidade dos erros tem variância constante 37 ANÁLISE DOS RESÍDUOS Os resíduos para a observação i ei é a diferença entre seu valor observado e seu valor previsto Cheque os pressupostos da regressão examinando os resíduos Examine o pressupostos de linearidade Avalie o pressuposto de independência Avalie o pressuposto de distribuição Normal Examine para a variância constante para todos os níveis de X homoscedasticidade Análise gráfica dos resíduos Gráfico dos resíduos versus X i i i Yˆ Y e 38 37 38 Chapter 3 320 Basic Business Statistics 10e 2006 Prentice Hall Inc ANÁLISE DOS RESÍDUOS PARA LINEARIDADE Não Linear Linear x resíduos x Y x Y x resíduos 39 Análise dos resíduos para independência Não Independente Independente X X resíduos resíduos X resíduos 1340 40 39 40 Chapter 3 321 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES ANÁLISE DE LINEARIDADE E INDEPENDÊNCIA 41 CHECANDO A NORMALIDADE Examine o gráfico de ramos e folhas dos resíduos Examine o Boxplot dos resíduos Examine o histograma dos resíduos Construa um gráfico de Probabilidade Normal dos resíduos Verifique os testes de normalidade de Kolmogorov Smirnov e ShapiroWilk 42 41 42 Chapter 3 322 Basic Business Statistics 10e 2006 Prentice Hall Inc ANÁLISE DOS RESÍDUOS PARA NORMALIDADE Porcento Resíduos Quando usar um gráfico de probabilidade normal erros normais irão se aproximar de uma reta 3 2 1 0 1 2 3 0 100 43 EXEMPLO DE REGRESSÃO LINEAR SIMPLES CHECANDO NORMALIDADE 44 43 44 Chapter 3 323 Basic Business Statistics 10e 2006 Prentice Hall Inc ANÁLISE DOS RESÍDUOS PARA IGUALDADE DE VARIÂNCIA Variância nãoconstante Variância constante x x Y x x Y resíduos resíduos 45 EXEMPLO DE REGRESSÃO LINEAR SIMPLES IGUALDADE DE VARIÂNCIA 46 45 46 Chapter 3 324 Basic Business Statistics 10e 2006 Prentice Hall Inc O MODELO DE REGRESSÃO MULTÍPLA Ideia Examine a relação linear entre 1 dependente Y e 2 ou mais variáveis independentes Xi i ki k 2i 2 1i 1 0 i ε β X β X β X β Y Modelo de Regressão Múltipla com k variáveis Independentes Intercepto de Y Inclinação Populacional Erro aleatório 47 EQUAÇÃO DE REGRESSÃO MÚLTIPLA Os coeficiente do modelo de regressão múltipla são estimados usando dados amostrais ki k 2i 2 1i 1 0 i b X b X b X b Y ˆ Valor de Y estimado ou predito Inclinações estimadas Equação de regressão múltipla com k variáveis independentes Intercepto estimado 48 47 48 Chapter 3 325 Basic Business Statistics 10e 2006 Prentice Hall Inc Modelo de duas variáveis Y X1 X2 2 2 1 1 0 b X b X b Yˆ EQUAÇÃO DE REGRESSÃO MÚLTIPLA 49 EXEMPLO 2 VARIÁVEIS INDEPENDENTES A distribuidora de tortas de sobremesa congelada quer avaliar os fatores que estão relacionados com a demanda Variável Dependente Vendas de tortas unidades por semana Variáveis Independentes Preço in Publicidade 100 Dados foram coletados para 15 semanas 50 49 50 Chapter 3 326 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DAS VENDAS DE TORTAS Vendas b0 b1 Preço b2 Publicidade Semana Vendas de tortas Preço Publicidade 100 1 350 550 33 2 460 750 33 3 350 800 30 4 430 800 45 5 350 680 30 6 380 750 40 7 430 450 30 8 470 640 37 9 450 700 35 10 490 500 40 11 340 720 35 12 300 790 32 13 440 590 40 14 450 500 35 15 300 700 27 Equação de regressão múltipla 51 52 EXEMPLO DE REGRESSÃO DA LINEAR MÚLTIPLA O Sig 0031 005 portanto a correlação é diferente de zero A correlação é igual a r0556 positiva indica que quanto maior o gasto com publicidade maior a quantidade vendida O Sig 0098 010 portanto a correlação é diferente de zero A correlação é igual a r0443 negativa indica que quanto maior o preço menor a quantidade vendida 51 52 Chapter 3 327 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR MÚLTIPLA USANDO O SPSS 53 AnalyzeRegressionLinear Variável dependente Variáveis independentes EXEMPLO DE REGRESSÃO LINEAR MÚLTIPLA SAÍDA DO SPSS 54 Estimativa Inicial Média de venda 39933 Erro cometido ao usar a média 63524 A ideia da regressão linear múltipla é ao usar várias variáveis independentes melhorar a previsão de venda de tortas Ao usar o modelo de regressão linear múltiplo o erro de estimativa cai para 47463 Ou seja houve uma melhora na previsão de venda de tortas ao se considerar o preço e os gastos com publicidade Ao usar o modelo de regressão linear múltipla percebese que há uma boa associação da variável dependente com as variáveis independentes Além disso sabemos que a associação é positiva r0722 e que as variáveis independentes conseguem explicar 5210 da variação da variável dependente 53 54 Chapter 3 328 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES SAÍDA DO SPSS 55 ANOVA H0 Todos os coeficientes do modelo são iguais a zero Ha Pelo menos um dos coeficientes do modelo é diferente de zero Análise Como o Sig0012005 rejeitase a H0 e pelo menos um dos coeficientes do modelo é diferente de zero intercepto eou inclinação Tabela de coeficientes H0 O coeficiente é igual a zero Ha O coeficiente é diferente de zero e tem valor B Ao analisar a tabela de coeficientes percebese que a constante intercepto é diferente de zero porque o Sig0020 005 Já a inclinação associada à área é diferente de zero porque o Sig0014005 Já a inclinação associada à área é diferente de zero porque o Sig0040005 A equação de regressão é Publicidade Vendas 306526 24975Preço 74131 A EQUAÇÃO DE REGRESSÃO MÚLTIPLA b1 24975 as vendas irão diminuir em média em 24975 tortas por semana para cada aumento de 1 no preço de venda sem considerar os efeitos das mudanças devido à publicidade b2 74131 as vendas irão aumentar em média em 74131 tortas por semana para cada aumento de 100 na publicidade sem considerar os efeitos das mudanças devido ao preço em que Vendas em número de tortas por semana Preço em Publicidade em 100 Publicidade Vendas 306526 24975Preço 74131 55 56 Chapter 3 329 Basic Business Statistics 10e 2006 Prentice Hall Inc USANDO A EQUAÇÃO PARA FAZER PREVISÕES Preveja as vendas para uma semana no qual o preço de venda foi de 550 e gasto com publicidade de 350 Vendas previstas de 42862 tortas 42862 35 306526 24975 550 74131 306526 24975Preço 74131Publicidade Vendas Note que a publicidade está na ordem de 100 então 350 significa que X2 35 R2 AJUSTADO r2 nunca diminui quando uma nova variável X é adicionada ao modelo Isso pode ser uma desvantagem quando se compara modelos Qual o efeito de se adicionar uma nova variável Perdese um grau de liberdade quando um nova variável X é adicionada A nova variável X adiciona poder explicatório suficiente para compensar a perda de um grau de liberdade 58 57 58 Chapter 3 330 Basic Business Statistics 10e 2006 Prentice Hall Inc Mostra a proporção de variação em Y explicada por todas as variáveis X ajustada para o número de variáveis X usadas em que n tamanho amostral k número de variáveis independentes Penalizar o uso excessivo de variáveis independentes sem importância Menor do que o r2 Útil na comparação entre os modelos 1 1 1 1 2 2 k n n r raj 59 R2 AJUSTADO 0442 r2 adj 442 da variação nas vendas das tortas é explicada pela variação no preço e publicidade tendo em conta o tamanho da amostra e do número de variáveis independentes R2 AJUSTADO NO SPSS 60 59 60 Chapter 3 331 Basic Business Statistics 10e 2006 Prentice Hall Inc EXEMPLO DE REGRESSÃO LINEAR SIMPLES ANÁLISE DE LINEARIDADE E INDEPENDÊNCIA 61 EXEMPLO DE REGRESSÃO LINEAR SIMPLES CHECANDO NORMALIDADE 62 61 62 Chapter 3 332 Basic Business Statistics 10e 2006 Prentice Hall Inc USANDO VARIÁVEIS DUMMY Uma variável dummy é uma variável independente com dois níveis Sim ou não masculino ou feminino Codificada como 0 ou 1 Aassumese que as inclinações associadas com variáveis independentes numéricas não mudam com o valor da variável categórica Se houver mais do que dois níveis o número de variáveis dummy necessárias é número de níveis 1 63 EXEMPLO DE VARIÁVEL DUMMY COM 2 NÍVEIS Seja Y vendas de tortas X1 preço X2 feriado X2 1 se um feriado ocorre durante a semana X2 0 se não há feriado na semana 2 1 0 b X b X b Yˆ 2 1 64 63 64 Chapter 3 333 Basic Business Statistics 10e 2006 Prentice Hall Inc Mesma inclinação EXEMPLO COM VARIÁVEL DUMMY COM 2 NÍVEIS X1 Preço Y vendas b0 b2 b0 1 0 1 0 1 2 0 1 0 b 0 b b X b X b Yˆ b X b b b 1 b X b Yˆ 1 2 1 1 2 1 feriado Sem feriado Intercepto diferente Se H0 β2 0 é rejeitado então Feriado tem um efeito significativo nas vendas de tortas Vendas número de tortas vendidas por semana Preço preço da torta em Feriado INTERPRETANDO O COEFICIENTE DA VARIÁVEL DUMMY COM 2 NÍVEIS Exemplo 1 Se há feriado na semana 0 se não há feriado b2 15 em média as vendas são 15 tortas maiores em semanas com feriado do que em semanas sem feriado dado o mesmo preço 15Feriado Vendas 300 30Preço 66 65 66 Chapter 3 334 Basic Business Statistics 10e 2006 Prentice Hall Inc MODELOS DE VARIÁVEIS DUMMY MAIS DO QUE 2 NÍVEIS O número de variáveis dummy é o número de níveis menos 1 Exemplo Y Preço da casa X1 metros quadrados Se o estilo da casa também é considerado Estilo rancho sobrado colonial Três níveis então duas variáveis dummy são necessárias 67 MODELOS DE VARIÁVEL DUMMY MAIS DO QUE 2 NÍVEIS Exemplo seja colonial a categoria padrão e seja X2 e X3 usada como outra das duas categorias Y preço da casa X1 metro quadrado X2 1 se rancho 0 caso contrário X3 1 se sobrado 0 caso contrário A equação de regressão múltipla é 3 3 2 2 1 1 0 b X b X b X b Yˆ 68 67 68 Chapter 3 335 Basic Business Statistics 10e 2006 Prentice Hall Inc 1884 2043 0045X Y 1 ˆ 2353 0045X 2043 Y 1 ˆ INTERPRETANDO OS COEFICIENTES DA VARIÁVEL DUMMY COM 3 NÍVEIS Com o mesmo metro quadrado um rancho terá um preço médio estimado de 2353 mil reais maior do que uma colonial Com o mesmo metro quadrado um sobrado terá um preço médio estimado de 1884 mil reais maior do que uma colonial Considere a equação de regressão 3 2 1 1884X 2353X 2043 0045X Y ˆ 2043 0045X1 Y ˆ Para a colonial X2 X3 0 Para o rancho X2 1 X3 0 Para o sobrado X2 0 X3 1 69