·
Ciências Contábeis ·
Métodos Quantitativos Aplicados
Send your question to AI and receive an answer instantly
Recommended for you
178
Regressao Linear Multipla - Metodos Quantitativos Aplicados
Métodos Quantitativos Aplicados
UNIFESP
51
Métodos Quantitativos Aplicados - Comparações Envolvendo Médias
Métodos Quantitativos Aplicados
UNIFESP
9
Analise de Regressao Gastos por Aluno vs Desempenho NAEP
Métodos Quantitativos Aplicados
UNIFESP
1
Artigo Cientifico Contabilidade-Governanca-Financas-Metodologia e Resultados
Métodos Quantitativos Aplicados
UNIFESP
56
Teste de Hipótese para a Média - Métodos Quantitativos Aplicados
Métodos Quantitativos Aplicados
UNIFESP
84
Métodos Quantitativos Aplicados: Regressão Linear Simples
Métodos Quantitativos Aplicados
UNIFESP
13
Métodos Quantitativos: Introdução à Regressão Linear Simples
Métodos Quantitativos Aplicados
UMG
1
Analise Estatistica Descritiva Renda Filhos e Valor dos Bens
Métodos Quantitativos Aplicados
UFPI
20
Plano de Aula - Regressão Linear Múltipla e Ajustamento Polinomial - UFMA
Métodos Quantitativos Aplicados
UFMA
67
Regressao Linear-Analise-e-Aplicacoes-em-Metodos-Quantitativos
Métodos Quantitativos Aplicados
UFC
Preview text
EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Métodos Quantitativos Aplicados Regressão Linear Múltipla Prof Dr José Marcos Carrera Junior São Paulo Setembro 2023 1 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mini Currículo do Professor Prof Dr José Marcos Carrera Junior Forte experiência em Finanças Corporativas MA Valuation e Controladoria adquirida durante a vida acadêmica e profissional em consultorias boutique de investimento e em grandes multinacionais tendo participado de diversas transações nacionais e internacionais Atualmente é Assessor Financeiro e Professor de Finanças Corporativas Doutor pela Fundação Getulio Vargas FGVEAESP com estágio doutoral na Universidade de Columbia em Nova York Mestre em Administração de Empresas pela Fundação Getulio Vargas FGVEAESP e Mestre em Finanças pela Universidade de São Paulo FEAUSP formado em Administração de Empresas pela Universidade de São Paulo FEAUSP Professor de Métodos Quantitativos Aplicados ao Mercado Financeiro na UNIFESP Universidade Federal de São Paulo FIA FECAP In Company FGV In Company Ibmec In Company MBA EACHUSP e Saint Paul Escola de Negócios e Financial Advisor na Plata Capital Partners e na Pezco Economic Business Intelligence Sócio fundador do Finanças 101 canal no YouTube com vídeos e aulas de finanças e economia Contato josemarcoscjgmailcom 2 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Fonte ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística Aplicada à Administração e Economia 3 WOOLDRIDGE Jeffrey M Introdução à econometria uma abordagem moderna Cengage EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Gastos com ciência espaço e tecnologia vs Suicícios por enforcamento e estrangulamento 4 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Número de pessoas que se afogaram ao cair em piscinas vs Filmes estrelados por Nicolas Cage 5 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Consumo per capita de queijo vs Número de pessoas que morreram enrroladas em seus lençóis 6 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Divórcios em Maine vs Consumo per capita de margarina 7 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Idade da Miss América vs Assassinatos por vapores e objetos quentes 8 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Receita total gerada por videogames vs Doutorados finalizados em ciências da computação nos EUA 9 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Lançamentos aeroespaciais não comerciais no mundo vs Doutorados finalizados em sociologia nos EUA 10 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comsumo per capita de mozzarella vs Doutorados finalizados em engenharia civil nos EUA 11 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Pessoas que se afogaram ao cair de um barco de pesca vs Taxa de Matrimônio em Kentucky 12 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Importações norteamericanas de petróleo da Noruega vs Motoristas mortos em colisões com trens 13 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Consumo per capita de frango vs Importações norteamericanas totais de petróleo 14 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Número de pessoas que se afogaram em piscinas vs Energia gerada em usinas nucleares nos EUA 15 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Carros japoneses de passageiros vendidos nos EUA vs Suicídios por batidas de veículos automotores 16 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Letras da palavra vencedora do concurso norteamericano de soletração vs número de pessoas mortas por aranhas venenosas 17 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Doutorados finalizados em matemática nos EUA vs Urânio estocado nas usinas nucleares norteamericanas 18 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Relação Espúria Relação estatística existente entre duas variáveis mas onde não existe nenhuma relação causaefeito entre elas Essa relação estatística pode ocorrer por pura coincidência ou por causa de uma terceira variável Ou seja neste último caso pode ocorrer que as variáveis A e B sejam correlacionadas porque ambas são causadas por uma terceira variável C É muito difícil explicar fenômenos apenas com duas variáveis CORRELAÇÃO NÃO É CAUSALIDADE 19 Variável A Variável B Variável C Relação Espúria entre A e B EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Vendas de Sorvetes vs Ataques de Tubarões 20 Consumo de sorvete Banhistas mais saborosos Mais atrativos para ataques de tubarões Maior consumo de sorvete com bom tempo Mais pessoas nas praias pelo bom tempo Tanto o consumo de sorvete como os ataques de tubarões crescem quando o tempo é ensolarado mas eles não tem relação de causa e efeito entre si O bom tempo faz com que as pessoas consumam mais sorvete e também frequentem mais as praias levando a mais ataques de tubarões EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Simultaneidade Relação Espúria O gato subiu no telhado Causalidade 21 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Introdução Enquanto a regressão linear simples baseiase no desenvolvimento de uma equação de regressão estimada para descrever a relação entre duas variáveis A desvantagem principal de usar a análise de regressão simples em trabalhos empíricos é o fato de ser muito difícil obter conclusões certeris paribus sobre como 𝑥 afeta 𝑦 o A hipótese fundamental que todos os outros fatores que afetam 𝑦 não são correlacionados com 𝑥 é frequentemente irreal na regressão linear simples A regressão múltipla considera situações que envolvem duas ou mais variáveis independentes o Possibilita considerar mais fatores e geralmente produzem melhores estimativas do que a regressão linear simples A análise de regressão múltipla é mais receptiva à análise certeris paribus pois ela nos permite controlar explicitamente muitos outros fatores que de maneira simultânea afetam a variável dependente 𝒚 o Em razão de os modelos de regressão múltipla acomodarem muitas variáveis explicativas que podem estar correlacionadas esperamos inferir causalidade nos casos em que a análise de regressão simples seria enganosa Naturalmente se adicionarmos mais fatores que são úteis para explicar 𝑦 então mais da variação de 𝑦 poderá ser explicada Assim a análise de regressão múltipla pode ser usada para construir melhores modelos para prever a variável dependente 𝒚 O modelo de regressão múltipla ainda é o veículo mais extensamente usado da análise empírica em economia administração contabilidade e em outras ciências sociais aplicadas Os conceitos de modelo de regressão e equação de regressão linear simples são aplicáveis no caso da regressão múltipla 22 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variável Dependente e Independentes 23 Variável Dependente y Variável Independentes x Variável Explicada Variável de Resposta Variável Prevista Regressando Variável que está sendo prevista Variável aleatória de interesse Comportamento se deseja explicar Depende de outras variáveis Variáveis Explicativas Variáveis de Controle Variáveis Previsoras Regressores Variáveis que utilizadas para prever outra Independentes de outras variáveis Variáveis Aleatórias e Observáveis Modelo de Regressao Multipla FRP Funcao de Regressao Populacional X4X2 X Variaveis independentes Erro 1 Variavel aleatoria nao be ee CL oie ae ODP ie ot Oe a ee TF observavel que corresponde ao que explicaa variabilidade em y que nao Variavel dependente pode ser explicada pela relacdo linear entre as variaveis independentes Parametros do modelo X4X2 0 Xpey 69 Constante 1 Bo By Coeficientes que descrevem a relacdo linear de cada variavel independente com a variavel dependente y Y Utilizando a analise de regressdo podemos desenvolver uma equacdo mostrando como a variavel y esta relacionada as variaveis independentes X1 Xo Xz v Existe um valor observado de y para cada valor observado de X1X2 Xz UNIFESP a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 54 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Equacao de Regressao Multipla FRP Funcao de Regressao Populacional X4X2X Variaveis EyX41X92Xz B4X1 Boxo Bx CUR ates k Bo Bix1 B2x2 ea independentes Valor esperado da Variavel dependente y dado X41 X2Xz Pardametros do modelo 6 Constante 64 Bo By Coeficientes que descrevem a relacdo linear de cada variavel independente com a variavel dependente y Y Seo intercepto By esta incluso na equacao nada se perde ao assumir que o valor médio e esperado do erro na populacdo é zero Eu 0 Y Qualquer valor constante que tenha valor esperado diferente de zero é absorvido pela constante Y Cada distribuicdo de valores de y tem seu proprio valor médio ou esperado Ey Y Amédia ou valor esperado do erroresiduo p é zero UNIFESP ne a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 35 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Equacao de Regressao Multipla Estimada FRA Funcao de Regressao Amostral Com Base em Dados Amostrais X41 X2 X Variaveis Y Bot BiX1 B2X2 BuXE independentes y Estimador pontual de Ey dado X1X2 Xx Parametros do modelo 6 o Constante 1 B2 By Coeficientes estimados que descrevem a relacdo linear de cada variavel independente com a variavel dependente y certeris paribus tudo mais constante v Se os valores dos parametros da populacao Bo By Bo Bx fossem conhecidos poderiamos utilizar a equacdo Eyx1X2X Bo Bix Box2 Bex para calcular o valor médio de y para um dado valor de X1X2Xx Y Na pratica os valores dos parametros geralmente nao sao conhecidos e devem ser estimados a partir de dados amostrais Vv Uma variavel aleatoria simples é usada para calcular as estatisticas amostrais de Bo By Bz By que Sao utilizadas como estimativas dos parametros da populacao Bo B41 Bo Bx Y éo valor médio de y para um dado valor de x1 Xz Xz UNIFESP a on a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 36 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior O processo de estimacao na Regressao Multipla Modelo de Regressao Dados Amostrais Y Bot B1xX1 Box2 PRX H Equacao de Regressao a ae ad Ey Bo Bix1 B2x2 BRXE Parametros Desconhecidos ov on oy need f Equacao de Regressao Ex toe te wo Br Estimada fornecem estimativas de Y Bo t BixX1 Box Bux RY eae we eiae lc Ee a Pannen Ea toe Bo oe OF UNIFESP owaeane EPPEN Escola Paulista de Politica Economia e Negdécios Curso de Ciéncias Contabeis 57 Oe RE Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Atenção Importante 28 A análise de regressão NÃO pode ser interpretada como um procedimento para estabelecer uma relação de causa e efeito entre as variáveis Ela só pode indicar como ou em que medida as variáveis estão relacionadasassociadas umas as outras EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior MQO Mínimos Quadrados Ordinários OLS Ordinary Least Squares É um procedimento para o uso de dados amostrais com a finalidade de encontrar a equação de regressão estimada O método dos mínimos quadrados fornece uma equação de regressão estimada que minimiza a soma dos desvios quadrados entre os valores observados da variável dependente e os valores previstos da variável dependente denotados por Este critério dos mínimos quadrados é utilizado para escolher a equação que proporciona o melhor ajuste Na prática o método dos mínimos quadrados é o mais utilizado 29 𝒊 𝒊 𝟐 Regressao Multipla Interpretacao dos Coeficientes Y Bot BixX1 BoxX2 BuxK impacto marginal ou parcial esperado em y correspondente a alteragcdo em x quando Xp X estao constantes CERTERIS PARIBUS TUDO MAIS CONSTANTE o Estimativa da alteracao em y correspondente a alteragao de uma unidade em x CERTERIS PARIBUS quando todas as outras variaveis independentes se mantém constantes 0869 00611x 0923x y Tempo estimado a ax Numero de de viagens em horas x Milhas entregas delivery percorridas Bo 0869 Constante ou intercepto valor estimado de y quando as demais variaveis independentes sao Iguais a zero Bi 00611 Estimativa do aumento esperado no tempo de viagem correspondente ao aumento de 1 milha na distancia percorrida quando 0 numero de entregas é mantido constante Bo 0923 Estimativa do aumento esperado no tempo de viagem correspondente ao aumento de 1 entrega quando o numero de milhas percorrida é mantido constante UNIFESP a ce a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 30 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Múltipla Interpretação dos Coeficientes 𝟎 𝟏 𝟐 Em que representa anos de educação formal e representa anos de experiência no mercado de trabalho Assim salário por hora é determinado por duas variáveis independentes educação e experiência e por outros fatores não observáveis contidos em Basicamente estamos interessados em saber o efeito do grau de educação sobre o salário mantendo fixos todos os outros fatores que afetam o salário por hora isto é estamos interessados no parâmetro 𝟏 Comparada com uma análise de regressão simples que relaciona com a regressão apresentada remove efetivamente a do termo de erro e a coloca explicitamente na equação queremos ver o efeito de educação no salário por hora CONTROLANDO para a experiência Seremos capazes de analisar o efeito da educação no salário por hora mantendo o nível de experiência fixo ou constante somos capazes de CONTROLAR os efeitos da experiência sobre o salário por hora o Na análise de regressão simples teríamos que assumir que experiência é não correlacionada com educação 31 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Linear no Excel 32 Regressao Linear no Excel Colocar série de dados da variavel dependente Inputs P y Assinalar se vocé Regression x selecionou os Colocar série de titulos das colunas Input eG nos inputs Dc dados das variaveis Input Range independentes x Cancel Input X Range Assinalar se quiser Assinalar para mudar Help fazer a regressdo sem O Grau de Confianca Labels Constant is Zero a constante f0 Padrdao Excel 95 Tl teetraere eae 95 oy Alterar o Grau Assinalar para i p Output options de Confianga mudar o local de saida de dados Qutput Range Indicar onde quer New Worksheet Ply a saida de dados Assinalar se quiser OC i New Workbook que a saida de Assinalar se quiser dados apareca em Residuals visualizar o grafico de nova planilha Residuals Residual Plots distribuigdo dos Assinalar se quiser Standardized Residuals Line Fit Plots residuos visualizar os residuos ieee eichekiney Assinalar se quiser Normal Probability Plots visualizar o grafico dos Assinalar se quiser on pontos estimados pela visualizar os residuos 6s reta de regressdo e os padronizados UNIFESP residuos owaeane EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 33 Oe RE Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressao Linear no Excel Saida de Dados SUMMARY OUTPUT Regression Statistics Multiple R 0553554369 coeficiente de determinacdo R7 R Square 030682244 coeficiente de determinacdo ajustado R ajustado Adjusted R Square 0302436362 Desvio padrao do modelo a Standard Error 3084475615 Observations 526 Numero de observag6es n TX Estatistica do Teste F ANOVA 4 df SS MS F Significance F Tabela ANOVA Teste F Regression 3 2194111624 7313705413 7687316837 340586E41 Ho Todos os coeficientes Residual 522 4966302686 9513989821 By B2 Bn 0 Total 525 716041431 zero Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 2872734887 0728964293 3940844447 922474E05 4304799048 1440670725 Escolaridade 059896507 0051283549 1167947779 368135E28 0498217566 0699712573 Experiéncia 002233952 0012056848 1852849079 0064468176 0001346387 0046025426 mpoCargo 0169268652 0021644607 7820361491 293453E14 0126747411 0211789893 Constante R Erro Padrao sz ist Bo anaes Bn Estatisticade p valor dos a valo de Confianca Coeficientes f desvio pa rao Teste t dos coeficientes dos coeficientes dos coeficientes coeficientes UNIFESP a a cn a wane EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis a 34 Lie ee Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados supGPA 129 0453emGPA 00094ACT o supGPA nota média em um curso superior o emGPA nota média do ensino médio o ACT nota do teste de avaliagao de conhecimentos para ingresso em curso superior Ointercepto de 129 é o valor previsto da nota média de um curso superior swpGPA se tanto a nota média do ensino médio emGPA como a nota média na avaliagdo de conhecimentos para ingresso em curso superior ACT forem iguais a zero o Como nao é possivel encontrar ninguém que esteja no ensino superior com nota média no ensino médio e no exame de avaliacdo de conhecimentos para ingresso ambas iguais a zero a interpretacgdo do intercepto nessa equacdo é pouco significativa Como esperado ha uma relacao parcial positiva entre supGPA e emGPA Mantendo ACT fixo um ponto adicional em emGPA esta associado a 0453 de incremento em supGPA o Em outras palavras se escolhermos dois estudantes A e B e esses estudantes tiverem a mesma nota ACT mas emGPA do estudante A e um ponto maior que a supGPA do estudante B prevemos que o estudante A tem supGPA 0453 maior que supGPA do estudante B isso nao quer dizer nada sobre quaisquer duas pessoas reais mas é a nossa melhor previsao Ocoeficiente ACT implica mantendo emGPA fixo uma variado de 1 ponto na nota em ACT esteja associada a uma variacdo de 00094 pontos em supGPA Esse um efeito pequeno e sugere que uma vez considerado o emGPA a nota do ACT nao é um forte previsor de supGPA UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 35 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados o nota média em um curso superior o nota média do ensino médio o nota do teste de avaliação de conhecimentos para ingresso em curso superior Qual é o impacto na nota média em um curso superior ao se aumentar a nota média do ensino médio em 1 ponto e a nota do teste de avaliação de conhecimentos para ingresso em um curso superior em 1 ponto o o o 4 o 36 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados o nota média em um curso superior o nota média do ensino médio o nota do teste de avaliação de conhecimentos para ingresso em curso superior Qual é o impacto na nota média em um curso superior ao se aumentar a nota média do ensino médio em 2 pontos e a nota do teste de avaliação de conhecimentos para ingresso em um curso superior em 10 pontos o o o o 37 Interpretando os resultados Insalariohora 0284 0092educacao 00041experiéncia 0022permanéncia o salariohora salario por hora em dolares o educacao anos de educacao formal o experiéncia anos de experiéncia no mercado de trabalho permanéncia anos com o empregador atual O coeficiente 0092 SP que mantendo a experiénciae permanencia fixos controladosconstantes umano a mais de educaao ormal aumenta o valor esperado de insacar tohora em 0092 o que se traduz em um aumento aproximado de 92 0092 100 no salario por hora o Alternativamente se considerarmos duas pessoas com os mesmos niveis de experiéncia e permanéncia no emprego o coeficiente de educaao a diferena proporcional no salario por hora previsto quando seus niveis de educacao diferem UNIFESP a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 38 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidado com a interpretação variação vs variação em pontos percentuais Margem de lucro passou de 10 para 9 o 10 de redução 910 1 ou 10 910 o 1 ponto percentual de redução 10 9 Neste caso o coeficiente 086 indica que para 1 ponto percentual de crescimento no Market Share de 20 para 21 por exemplo o ROE sobe em média 086 pontos percentuais de 15 para 1586 por exemplo Neste caso o coeficiente 18501 indica que para 1 ponto percentual de crescimento ROE de 20 para 21 por exemplo o salário do CEO em 1990 sobe em média 18501 mil dólares 39 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Usando a Equação de Regressão Estimada para Estimação e Previsão Os procedimentos para estimar o valor médio de e para prever um valor individual de na regressão múltipla são similares aos da análise de regressão linear simples Para fazer previsão pontuais substituímos valores dados na equação de regressão estimada o e obtemos o o 40 e e e ow 2 Coeficiente de Determinacao R WA as A cw SST yiy fy SSR iy Fy SSE yi Vi SSR 0 y R Xya ty3 5 Erros 4 SST 100 SSR is Na regressao linear simples mostramos que a soma total dos quadrados SST pode ser dividida em dois componentes a soma dos quadrados da regressdo SSR e a soma dos quadrados dos erros SSE O mesmo procedimento se aplica para a regressao multipla o Varia de zero a um sendo 1 100 o ajuste perfeito 100 da variabilidade na variavel dependente em y explicada pela regressao o da variabilidade na variavel dependente y explicada pela variacao das variaveis independentes x4 Xp X o Porcentagem da soma dos quadrados totais SST que pode ser explicada utilizandose a equacdo de regressdo multipla estimada SSR o Quanto da variabilidade da variavel dependente pode ser explicada pela relacdo linear com as variaveis independentes UNIFESP a L cn a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis a1 aoe Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Coeficiente de Determinacdo Ajustado R ajustado ay2 a a wA iw sst 5 i9 FY SSR Giy FM SSE OiD SSR y R Xya ty3 5 Erros SST 4 100 SSR R Ajustado 1 1 R y nk1 n Numero de observacdes k Numero de variaveis independentes Um fato importante sobre o R é que ele nunca diminui e geralmente aumenta quando outra variavel independente é adicionada a regressao Desta forma geralmente os analistas preferem ajustar o R ao numero de variaveis independentes a fim de evitar uma superestimacao do impacto de se adicionar uma variavel independente a quantidade de variabilidade explicada pela equacdao de regressdao estimada O fato de que R nunca diminuir quando qualquer variavel for adicionada em uma regressdo faz dele um instrumento fraco para decidir se uma variavel ou diversas variaveis deveriam ser adicionadas ao modelo O fator que deve determinar se uma variavel explicativa pertence a um modelo é se a variavel explicativa tem na populacao um efeito marginalparcial sobre y diferente de zero seu coeficiente deve ser estatisticamente diferente de zero UNIFESP a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 42 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados npre8g6 0712 0150pcond 0034ptemp86 0104empr86 n 2725 R 00413 R2 ajustado 00403 o npre8sg6 numero de vezes que determinado homem foi preso em 1986 pcond a proporgcao de prisdes anteriores a 1986 que levaram a condenacdo proxy da probabilidade de um homem ser condenado por um crime O ptemp86 duracdo média da sentena cumprida por condenacao previa efeito do confinamento do crime se um Individuo esta na prisdo ele nado pode ser preso por um crime fora da prisdo o empr86 numero de trimestres durante o qual determinado homem ficou empregado em 1986 oportunidades no mercado de trabalho Cada um dos coeficientes de inclinagao tem o sinal esperado Um aumento na proporcao de condenacgoes pcond diminui o numero previsto de prisdes Se aumentarmos pcond em 05 um aumento grande na probabilidade de condenacao entao mantendo os outros fatores fixos Anpre86 0150 05 0075 o Isso pode parecer pouco usual pois uma prisdo ndo pode ser uma fracdo No entanto podemos usar esse valor para obter a variagao prevista das prisOes esperadas de um grande numero de homens Por exemplo entre cem homens a queda esperada de prisdes quando pcondaumenta em 05 é 75 Semelhantemente um periodo mais longo de prisdo leva a um numero previsto menor de prisdes De fato se premps86 aumenta de 0 para 12 as prisdes previstas para um determinado homem diminuem em 003412 4 Um trimestre a mais no qual o emprego legal é informado diminui as prisdes esperadas em 0104 0 que significaria 104 prisOes entre cem homens UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 43 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados npres6 0712 0150pcond 0 034ptemp86 0104emprs6 n 2725 R 00413 R2 ajustado 00403 npresg6 0707 0151pcond 00074sentmed 0037ptemp86 0 103empr8s6 n 2725 R 00422 R2 ajustado 00408 o npre8sg6 numero de vezes que determinado homem foi preso em 1986 pcond a proporcao de prisdes anteriores a 1986 que levaram a condenacdo proxy da probabilidade de um homem ser condenado por um crime o sentmed duracdo média da sentenca cumprida por condenacado prévia O ptemp86 duracdo média da sentena cumprida por condenacao previa efeito do confinamento do crime se um Individuo esta na prisdo ele nado pode ser preso por um crime fora da prisdo o empr86 numero de trimestres durante o qual determinado homem ficou empregado em 1986 oportunidades no mercado de trabalho Se sentmed for adicionado ao modelo sabemos que 0 R aumentara o Osinal de sentmed também é inesperado ele diz que uma duracgdo mais longa na sentenca média aumenta a atividade crimina UNIFESP ne a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis AA sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados 𝒏 𝟐 𝟕𝟐𝟓 𝑹𝟐 𝟎 𝟎𝟒𝟐𝟐 𝟐 o 𝒏𝒑𝒓𝒆𝟖𝟔 número de vezes que determinado homem foi preso em 1986 o 𝒑𝒄𝒐𝒏𝒅 a proporção de prisões anteriores a 1986 que levaram à condenação proxy da probabilidade de um homem ser condenado por um crime o 𝒔𝒆𝒏𝒕𝒎𝒆𝒅 duração média da sentença cumprida por condenação prévia o 𝒑𝒕𝒆𝒎𝒑𝟖𝟔 duração média da sentença cumprida por condenação prévia efeito do confinamento do crime se um indivíduo está na prisão ele não pode ser preso por um crime fora da prisão o 𝒆𝒎𝒑𝒓𝟖𝟔 número de trimestres durante o qual determinado homem ficou empregado em 1986 oportunidades no mercado de trabalho O fato de as quatro variáveis explicativas explicarem somente pouco mais de 4 da variação em npre86 não necessariamente significa que a equação é inútil Ainda que coletivamente essas variáveis não expliquem muito da variação nas prisões é possível que as estimativas sejam confiáveis dos efeitos certeris paribus de cada variável independente sobre Em geral um 𝟐 baixo indica que é difícil prever resultados individuais sobre com muita precisão 45 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Coeficiente de Determinação 𝟐 NÃO SE ASSUSTE COM 𝟐 BAIXOS 46 Nas ciências sociais aplicadas não são incomuns 𝑹𝟐 baixos nas equações de regressão 𝑹𝟐 aparentemente baixo não significa necessariamente que uma equação de regressão é inútil Ainda é possível que a equação forneça uma boa estimativa da relação certeris paribus entre as variáveis se isso é verdade ou não não depende diretamente da magnitude do 𝑹𝟐 Estudantes que estão se defrontando com regressões pela 1ª vez tendem a pôr muito peso na magnitude do 𝑹𝟐 Por enquanto conscientizese de que usar o 𝑹𝟐 como o principal padrão de medida de sucesso de uma análise econométrica pode levar a confusões e wa e Premissas do Modelo de Minimos Quadrados Y Bot BixX1 Box Bx HM Amostras aleatorias As variaveis independentes Xj X X nao podem ser constantes constantes sao capturados em fo Colinearidade nao perfeita entre as variaveis independentes Xj X X Avariavel dependente y esta relacionada as variaveis independentes x1 X2 X e ao erro wt de forma linear Implicagdo a reta de regressdo representada por fp ByX1 B2ox2 Bex wea base para a relagdo entre as variaveis Otermo de erro yu é uma variavel aleatoria com uma média ou valor esperado igual a zero ou seja Eu 0 o Implicacgdo Bo 1 2 Bx S40 constantes por conseguinte Ef 6 desse modo dados xy X2 Xz 0 valor esperado de y é dado por Ey Bo Bix Box2 Bexx Homocedasticidade A variancia de wu designada por 02 6 a mesma para todos os valores de X4 Xz Xz Var pX1X2X Varw a o Implicacdo A variancia de y nas proximidades da reta de regressdo é igual a 0 e 6a mesma para todos os valores de x1 X2 Xz o Heterocedasticidade implica que as estimativas do modelo MQO n4o sejam as mais eficientesprecisas Média Condicional Zero Exogeneidade Os valores de pz sdo independentes de x1 X2 Xx EpxX1X2X Eu 0 o Implicagao o valor de para um conjunto de valores em particular de x1 X2 Xp nao esta relacionado ao valor de uu para qualquer outro conjunto de valores de x1 X2 Xz assim 0 valor de y para um conjuntos de valores em particular de x1 Xz X ndo esta relacionado com o valor de y para qualquer outro conjunto de valores de X41 X2 Xx Otermo de erro pu é uma variavel aleatoria e normalmente distribuida o Implicagdo Uma vez que fo f1 B2 Pe sao constantes para determinados valores de x1 X2 Xx y uma funcao linear de yu a variavel dependente y também é uma variavel aleatoria normalmente distribuida UNIFESP a a a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis a7 Tae Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade A variancia de p designada por 07 6 a mesma para todos os valores de X1 X2 Xx Distribuigao de Distribuigao de yemx 30 yemx 20 y Ovalor esperado de y Ey se Distribuiggo de modifica de acordo com os yemx 10 af valores especificos considerados Ely quando am de X4 1X2 0 XK a i a ae x Ey quando a ye x 0 4 L on Pa Entretanto by f 2 ya independentemente do valor we de x4X2Xadistribuigao 0 fo a sho de probabilidade do erro 11 e x10 a a gabe oe oo d Ey Ath portanto as distribuicgdes de x 20 L tir Y wy Es d probabilidade de y em qualquer x 30 oe ponto em particular depende de o valor real de y ser maior oe Nota As distribuicdes de y tem a ou menor que Oo seu valor mesma forma em cada valor de x x esperado Ey UNIFESP as cn a TT EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 48 oan peer Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade vs Heterocedasticidade 49 Homocedasticidade Heterocedasticidade 𝑽𝒂𝒓 𝝁 𝒙𝟏 𝒙𝟐 𝒙𝒌 𝑽𝒂𝒓 𝝁 𝝈𝟐 𝑽𝒂𝒓 𝝁 𝒙𝟏 𝒙𝟐 𝒙𝒌 𝒇𝒙𝟏 𝒙𝟐 𝒙𝒌 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade Exemplo 50 Plotagem residual em relagao a x Os residuos y fornecem a melhor informagdo sobre o termo de erro u Portanto uma analise dos residuos é um passo importante para determinar se as suposicdes referentes a 1 sdo apropriadas o Eux4X2X Eu 0 Exogeneidade 2 ee o Varpux1X2X Varp o Homocedasticidade Grande parte da analise residual baseiase em um exame das plotagens graficas Uma plotagem residual em relacao a cada variavel independente x é um grafico no qual os valores da variavel independente x sdo representados pelo eixo horizontal e os valores residuais correspondentes sao representados pelo eixo vertical Para cada residuo e marcadoum ponte no grafico A primeira coordenada de cada ponto e dada pelo valor de x e a segunda coordenada é daaa pelo correspondente valor do residuo iVi Se a suposicao de que a varidncia do erro pw é idéntica para todos os valores de x1 Xp X ese o Modelo de regressao constituir uma representacdo adequada da relacao entre as variaveis a plotagem residual devera das a impressao geral de uma faixa horizontal de pontos y ye y9 Painel A Painel B Painel C e ye e e e e e 7 f 4 i Re ea ee 8 es g paver 3 2 ae Se eae pet 7 pet teensy 6 oto ig ayers TAY x x x UNIFESP a a a wae EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 51 ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior e we aN Plotagem residual em relacao a y Os residuos yY fornecem a melhor informagdo sobre o termo de erro uw Portanto uma analise dos residuos é um passo importante para determinar se as suposicdes referentes a Sado apropriadas Grande parte da andlise residual baseiase em um exame das plotagens graficas Uma plotagem residual em relacao a variavel dependente y é um grafico no qual os valores da variavel dependente ysdo representados pelo eixo horizontal e os valores residuais correspondentes sao representados pelo eixo vertical Para cada residuo é marcado um ponto no grafico A primeira coordenada de cada ponto ée dada pelo valor de j e a segunda coordenada é dada pelo correspondente valor do residuo yJ Opadrdo dessa plotagem residual é idéntico ao da plotagem residual em relacdo a variavel independente y para uma regressdo linear simples Paraa repressdo multipla multivariada a plotagem residual em relacdo a variavel dependente y é mais amplamente usada em virtude da presenca de mais uma variavel independente roy 20 e e 10 e g BO pon nn concn ncn ccna e e e 10 e e 20 e 60 80 100 120 140 160 180 9 UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 52 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade causa viés NÃO Heterocedasticidade o Afetará os errosdesviospadrão das estimativas o Os erros padrão reportados por programas estatísticos assumem homocedasticidade o Se os erros são heterocedásticos as inferências estatísticas sobre estes erros padrão podem estar incorretas e subestimadas EXOGENEIDADE o ENDOGENEIDADE A violação da hipótese de média condicional zero dos erros é que causa viés nos estimadores o Precisamos respeitar a hipótese de média condicional zero para obter estimadores consistentes o A hipótese de media condicional zero é diferente de homocedasticidade o ENDOGENEIDADE CAUSA VIÉS NOS COEFICIENTES 53 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero EXOGENEIDADE CMI Conditional Mean Independence O erro é independente da média de Se e são não correlacionados logo como variáveis aleatórias não são linearmente relacionados Mas isso não é suficiente pois a correlação mede somente a dependência linear entre e É preciso que não tenha relação com qualquer função de 54 𝟏 𝟐 𝒌 Hipótese de Média Condicional Zero EXOGENEIDADE EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Implicações CMI Conditional Mean Independence Lembrese que o erro captura todos os fatores que afetam além de É MUITA COISA Imagine esse problema em estudos de finanças e economia por exemplo oEndividamento ftamanho da empresa Empresas pequenas talvez tenham mais restrições financeiras e portanto menos opções de endividamento oPoupança frenda Pessoas que ganham mais têm mais opções entre gastar ou poupar oInvestimento ffluxo de caixa Empresas com mais fluxo de caixa podem ter mais propensão a investir mesmo que esses investimentos não criem valor 55 Causalidade so ocorre se Eux Et e a hipotese da média condicional zero for respeitada Eyx Bo 21x causal e os coeficientes ndo estado viesados se descreve uma relagao media em y causada por mudanas em x o Aumentos em x de a para b é igual a o Eyx b Eyx a o Isso so sera verdadeiro se Eux Ew Eylx a fo fiat Eulx a Eylx b Bo Bib Eulx Db EQ x bEQx a 6ba Elulx b Eulx a Oefeito causal de x em y so ira ocorrer se Eux b Eux a 0 ouse Eux b Eulx a Eu Ou Sela a hipdtese da média condicional zero deve ser respeitada para afirmarmos Causaliaade Por construao a media do residuo da regressao e igual a zero e nao correlacionado com xe nao podemos provar matematicamente que Eux E se sustenta UNIFESP a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 56 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipdotese de Média Condicional Zero Exemplo SalarioHora CMI Conditional Mean Independence 7 a an salariohora By Beducacao Bexperiéncia wu j outros fatores nado observados que afetam o salariohora além de educacao e experiéncia Ainda estamos interessados no efeito de educacao sobre o salariohora mantendo fixos todos os outros fatores que afetam salariohora experiéncia neste caso Isto 6 estamos interessados no pardmetro B Como a experiéncia é apresentada de modo explicito seremos capazes de mensurar o efeito da educacdo sobre salariohora mantendo a experiéncia fixa o Na analise de regressdo simples salariohora By Byeducacao mu que coloca experiéncia no termo de erro p terfiamos que assumir que experiéncia é ndo correlacionada com educacao uma hipdtese ténue Epuleducacao experiéncia 0 o Isso implica outros fatores que afetam salario por hora e nao estao em média relacionados aos anos de educaao formal e aos anos de experiéncia o Portanto se entendermos que aptidao inata é parte de wu entdo sera necessario que os niveis médios de aptiddo sejam os mesmos em todas as combinacdes de educado e experiéncia na populacdo que trabalha Aanalise de regressao multipla permite que muitos fatores observados afetem y o Poderiamos também incluir semanas de treinamento de trabalho anos de permanéncia com o empregador atual medidas de aptiddo e mesmo variaveis demograficas como o numero de irmdos e a educacgdo da mde UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 57 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo CMI Conditional Mean Independence Se as quantidades de fertilizantes são escolhidas independentemente de outras características das áreas então é verdadeiro e então a qualidade média da terra que estaria no termo de erro não dependeria da quantidade de fertilizantes Entretanto se mais fertilizantes forem usados em áreas de terra de melhor qualidade então o valor esperado do erro varia com o nível de fertilizantes e não se sustenta 58 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Estrutura de Capital CMI Conditional Mean Independence 𝒊 𝟎 𝟏 𝒊 Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Lucratividade o Lucratividade e o termo de erro são independentes e não correlacionados o O termo de erro poderia incluir vários fatores como distância da falência Z de Altman Tamanho MB entre outros É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas pouco lucrativas tendem a ter maior risco de crédito o que resultaria pela teoria do tradeoff de estrutura de capital em um menor endividamento risco de crédito que está capturado no termo de erro está relacionado com a lucratividade o Firmas pouco lucrativas tendem a ter menos caixa e liquidez o que resultaria pela teoria do pecking order de estrutura de capital em um menor endividamento liquidez que está capturado no termo de erro está correlacionado com a lucratividade 59 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Investimento CMI Conditional Mean Independence Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Q de Tobin o Q de Tobin e o termo de erro são independentes e não correlacionados É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas com baixo Q de Tobin podem estar em estresse financeiro e por este motivo investem menos estresse financeiro que está capturado no termo de erro está relacionado com o Q de Tobin o Firmas com alto Q de Tobin podem ser menores mais jovens e apresentarem maiores dificuldades de obtenção de fundos para investimento tamanho ou maturidade que estão capturados no termo de erro estão correlacionado com o Q de Tobin 60 Razoes para Endogeneidade ou Violacao da Hipdtese de Média Condicional Zero Raz6es para o erro estar correlacionado com a variavel independente x Uma variavel x endogena é quando seu valor depende da variavel y o Uma variavel x é endogena quando esta relacionada com yu por alguma razao E possivel testar a hipdtese de média condicional zero Eux4 X2X Eu 0 o NAO Por construcdo os residuos tem média zero Eu 0 e nao sao correlacionados com as variaveis independentes x RazOes veremos nas proximas aulas em detalhes o Variaveis Omitidas o Erros de MensuracaoMedida o Simultaneidade EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 61 sao Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Multicolinearidade Otermo variavel independente nao significa que as varidveis sejam em si mesmas independentes no sentido estatistico A maioria das variaveis independentes de uma regressdo multipla estao até certo ponto correlacionadas Poderiamos calcular o coeficiente de correlacdo da amostra para determinar o grau em que as variaveis estado relacionadas Na analise de regressdo multipla o termo multicolinearidade referese a correlacgao entre as variaveis independentes REET observar au as variaveis OMBINACAOTL Rene ser correlacionadas ELAS APENAS NAO PODEM SER Os estatisticos desenvolveram diversos testes para determinar se a multicolinearidade é suficientemente elevada para causar problemas De acordo com teste pratico a multicolinearidade constitui um problema potencial se o valor absoluto do coeficiente de correlacao ultrapassar 07 em qualquer par de variaveis independentes Tempo de Viagem em Horas B BMilhas Percorridas BLitros de Combustivel Consumidos Obviamente Milhas Percorridas e Litros de Combustivel Consumidos estado altamente correlacionados Suponhamos que a partir do teste tem f ndo consigamos rejeitar Hy B 0 Esse resultado significa que o tempo de viagem nao esta relacionado com as milhas percorridas Nao necessariamente O que provavelmente significa que com litros de combustivel consumidos ja estando no modelo as milhas percorridas nado contribuiram significativamente para determinar o tempo de viagem Neste exemplo se soubermos a quantidade de gasolina consumida nao obtemos muita informacao adicional util para prever o tempo de viagem ao sabermos as milhas percorridas UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 62 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Multicolinearidade Perfeita Quando Ocorre Quando uma variável é um múltiplo constante da outra o Um pesquisador inadvertidamente coloca a mesma variável medida em unidades diferentes dentro da equação de regressão Mesma variável com diferentes unidades de medida Quando uma variável independente pode ser expressa como uma função linear exata de duas ou mais outras variáveis independentes o Suponha que queremos estimar o efeito dos gastos de campanha sobre os resultados da campanha Por simplicidade suponha que cada eleição tenha dois candidatos Seja a percentagem de votos do Candidato A seja os gastos de campanha do Candidato A seja a percentagem de votos do Candidato B seja os gastos de campanha do Candidato B seja os gastos totais de campanha o A multicolinearidade perfeita ocorre porque o Não é possível manter a interpretação certeris paribus pois um aumento em ou gera simultaneamente um aumento em A solução para a colinearidade perfeita é simples retire uma das variáveis do modelo 63 Estimativa da Variancia do Modelo 02 Do modelo de regressdo e de sua suposiao podemos concluir que o a variancia do residuo ou erro também representa a variancia dos valores de y nas proximidades da reta de regressao Assim a SSE Soma dos Quadrados dos Residuos SSE Sum of Squares due to Errors uma medida de variabilidade das observacoes reais em torno da reta de regressao estimada O erro médio quadratico MSE Mean Squared Error fornece a estimativa de a7 Toda soma de quadrados esta associada a um grau de liberdade Os estatisticos denotam que SSE tem nk 1 graus de liberdade porque p parametros coeficientes das variaveis independentes devem ser estimados para que se possa calcular SSE Desta forma a média quadratica é calculada dividindose SSE por nk 1 graus de liberdade Erro Médio Quadratico Estimativa de o7 iW a CY DG se 7D nk1 nk1 Erro Padrao do Modelo SSE XQi i nk1 nk1 UNIFESP a a a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 6A ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variancia Amostral e Erro Padrao de B Variadncia da Estimativa ecu z VarB lepB an oC ea SD Erro Padrdo da Estimativa Desvio Padrado oO ST n ay y Nala a Car isp R Rquadrado da regressao de x com todas as outras variaveis independentes incluindo o intercepto sendo x a variavel dependente Quanto maior for o erro padrao do coeficiente estimado epB menor sera a estatistica de teste t e mais dificil 6 rejeitar a hipdtese nula H para demonstrar significancia estatistica da variavel EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 65 one Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variancia Amostral de B variancias altas estimadores menos precisos Objetivo minimizar a variancia pata aumentar a probabilidade de rejeitar Ho Variancia da Estimativa 5 o Variancia do erro oO Tae EE Quanto mais ruido na x X 1 R7 equacdo maior o Visto omo melhorar Hae F 7 j 2 rg we que 0 uma caracteristica Aumentando a quantidade de variaveis da populacdo ela nado tem diminui o erro mas aumenta 2 YP xy x Soma dos nadaa ver com o tamanho multicolinearidade Quadrados Totais SQT de a amostra Quanto menor melhor cada variavel dependente Mede a variado total em xj Como melhorar Quanto maior melhor eee 2 1 Suprimir variaveis independentes 1 Rj Rquadrado da regressdo de x com o risco de viés com todas as outras variaveis sae Como melhorar j 2 Processar analise fatorial se a independentes incluindo o intercepto Aumentando o sendo x a variavel dependente apropriado tamanho da amostra J oe a Controvérsia multicolinearidade Multicolinearidade pode nado ser um Quanto menor melhor problema dependendo da variancia do erro e do SQT de x UNIFESP a vor I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 66 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variáveis IndependentesExplicativas Irrelevantes O que acontece se incluirmos no modelo uma variável independente que não deveria estar no modelo oNós estimamos oMas o modelo real deveria ser estimamos Resposta oAinda teremos estimadores consistentes para todos os coeficientes e onde oMas os erros padrão poderão estar sobrestimados mais altos tornando mais difícil de rejeitar a hipótese nula de que o coeficiente é igual a zero tornado mais difícil assim encontrar significância estatística 67 Multicolinearidade Quanto menor melhor pois menor Variaveis IndependentesExplicativas Irrelevantes serd o erro padrao sp J Se R 1 entdo temos Erro Padrdo Desvio Padrdo multicolinearidade perfeita e o denominador da fracao é zero alee significa que x uma combinaao y n aw 2 linear perfeita de algumas das area w x 1 7 R outras variaveis independentes da regressdo O que acontece se incluirmos no modelo uma variavel independente x que nao deveria estar no modelo o Nos estimamos y Bo f1X1 B2oxX2 U o Mas o modelo real deveria ser estimamos y fy Bx p Ou seja Bz 0 Adicionar mais variaveis pode nao ser uma boa ideia se as variaveis tiverem alta correlagao com as demais E dificil segregar efeitos em y de variaveis com alta correlacdo entre si Por isso temos que evitar adicionar variaveis ao modelos se elas sao irrelevantes para explicar y e com alta correlagao com as demais EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 68 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mais sobre Multicolinearidade Nas ciéncias sociais em que somos geralmente coletores passivos de dados nao ha uma boa maneira de reduzir as variancias dos estimadores nao viesados que nao seja coletar mais dados Para um determinado conjunto de dados podemos tentar num esforeo para reduzir a multicolinearidade suprimir outras variaveis independentes do modelo Infelizmente suprimir uma variavel que pertence ao modelo podo levar a viés no estimador o Variavel omitida fara com que 0 erro p esteja relacionado com alguma variavel independente violando a hipdotese da média condicional zero Um elevado grau de correlacao entre certas variaveis independentes pode ser irrelevante no que diz respeito a quao bem podemos estimar outros parametros do modelo Y Bo B1X1 B2x2 P3x3M Em que x2 e X3 sao altamente correlacionados Entao VarB2 e VarBs podem ser randes mas o valor da correlacao entre x e X23 nao tem efeito direto sobre Var 2 x3 1 hn a 2 Sex é nao correlacionado com x e x3 entdo R 0e VarB oT xy x Se 0 parametro de interesse realmente ndo devemos nos preocupar com o valor da correlacao entre Xx e X3 UNIFESP a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 69 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mais sobre Multicolinearidade Fator de Inflagao de Variancia FIV VIF Variance Inflation Factor NAO PODEMOS ESPECIFICAR QUANTA CORRELACAO ENTRE AS VARIAVEIS EXPLICATIVAS E DEMASIADA o Alguns diagnosticos de multicolinearidade sao estatisticas abrangentes para detectar um forte relacionamento linear entre quaisquer subconjuntos de variaveis explicativas o Pelas razdes que acabamos de ver tais estatisticas sao de valor questionavel porque elas podem mostrar um problema simplesmente porque duas variaveis de controle cujos coeficientes ndo nos importam sao altamente correlacionadas Um pouco mais uteis mais ainda propensas a serem mal empregadas sao as estatisticas de coeficientes individuais A mais comum delas e o Fator de Inflacgdo de Variaveis FIV o OFIVdo B é simplesmente 11 R5 ou seja precisamente o termo em VarB que é determinado pela correlagao entre x e as outras variaveis explicativas o O FIV 0 fator pelo qual VarB é mais alto porque x é correlacionado com todas as outras variaveis explicativas o Se pudéssemos escolher gostariamos que FIV fosse menor mas raramente temos escolha o Adeterminagao de um valor de corte para o FIV acima do qual concluiremos que a multicolinearidade 6 um problema é arbitraria e nado é de grande ajuda Algumas vezes o valor 10 é escolhido Se FIV for maior do que 10 significa que R sera maior do que 09 o Mas um FIV acima de 10 nao significa que o desviopadrao de Bsera grande demais para ser util pois o desviopadrao Z x n 714 também depende de oa desviopadrao do modelo e de haley x soma dos quadrados totais e esta ultima pode ser aumentada com o aumento do tamanho da amostra o Senosso interesse é no efeito causal de x em y entao devemos ignorar inteiramente os FIVs de outros coeficientes UNIFESP ne a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 70 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Multicolinearidade Key Takeaways MULTICOLINEARIDADE NAO CAUSA VIES NOS ESTIMADORES Nao inclua controlesvariaveis independentes que possuem alta correlacao com outras variaveis independentes se elas nao forem necessarias Eux1X2X Eu 0 sem elas o Sera mais dificil rejeitar a hipotese nula Hy de que o coeficiente é igual a zero dado o maior erro padrao e portanto mais dificil sera demonstrar a significancia estatistica da variavel Apenas inclua variaveis de controleindependentes mesmo com alta correlacao com as demais variaveis independentes se Eux1X2X Ew 0 nao for verdadeiro o Uma amostra maior pode ajudar a reduzir 0 erro padrao EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 1 ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Inferéncia Estatistica De forma geral nos estudos em financas queremos testar se Ho B 0 Hy B x 0 Porem outras hipoteses nulas sao possiveis ex f 1 Se Hg for rejeitada concluiremos que B 0 e que existe uma relacao estatisticamente significativa entre as duas variaveis Entretanto se Hy nao puder ser rejeitada teremos evidéncias insuficientes para concluir que existe uma relacao significativa Portanto temos que torcer para que a hipotese nula seja rejeitada o Para mostrar que ha relacao entre a variavel independente x ea dependente y EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 7 ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste de Hipotese teste t para B Teste Bicaudal Teste Unicaudal Superior Teste Unicaudal Inferior Ho B Batvo Ho B Bato Ho Bj Bato Hipo poteses Ha B a Batvo Le Pay erie 1 Pre oF a are n de B é igual a um valor B menor ou igual a um B é maior ou igualaum observagoes hipotético valor hipotético valor hipotético k n de var Regido Critica tw is oe independentes Rejeiczo de Ho Regiao Critica Regiao Critica A Rejeicao de Ho Rejeicao de Hy nk1 an a herded f liberdade Nao Rejeita Hy So Rejeita H No Rejeita H EE A i B Batvo B Batvo B Batvo B Batvo t a2n2 t a2n2 t Can2 t Ca n2 Estatistica de Teste t Bj Bato Bj Batwo a ae a Bi Bato SLC FG 2CD 2 Regra de Rejeido Rejeitar Hy se Rejeitar Hg se Rejeitar Ho se Critério do pvalor pvalor a pvalor a pvalor a Regra de Rejeido Rejeitar Ho se Rejeitar Hg se Rejeitar Ho se Critério do Valor Critico t 2n2 Ut S te2n2 t tan2 Valor t tyn2 Regra de Rejeiao Rejeitar Ho se Batvo estiver Rejeitar Hy se B ayo estiver Rejeitar Ho se Bayo estiver intervalo de Confianga fora do Intervalo de Confianga fora do Intervalo de Confiana fora do Intervalo de Confianga a EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 73 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste de Hipotese teste t para B Teste Bicaudal Teste Unicaudal upeor Ete Anicaudal Inferior Ho B Batvo Ho B mr ol Bawo Hipoteses H i sWwo sbservarbes Bj é aie m valor Syne Pe rom ck cM oler Ue Tg iguagrum ben de var P mais restritivo que o independentes unicaudal ou seja 6 mais n k 1 dificil rejeitar Hy no teste graus de bicaudal pelo fato da area liberdade Nao Rejeita Hy de rejeicao nas I extremidades da curva ser a metade do tamanho Estatistica de Teste t Oe heheheh t unicaudal a na pratica o ncara de Reieicd mt teste unicaudal é mais ie Critério do pvalor evalor at p MeL a if i Regra de Rejeicdo Rejeitar Hy se Rejeita s rHo Critério do Valor Critico t te2n2 0Ut te2n2 t v y an IN or ten2 Regra de Rejeido Rejeitar Ho se Baivo estiver Rejeitar Ho se B ap esti jeitaNH 9 se Bayo estiver inter valo de Confiana fora do Intervalo de Confianca fora do Intervalo de Confiafica ford do Intervalo de Confiana TT EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 7 en heer Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior e wT e e Teste de Hipoteses dos Coeficientes e e e n e wa e n e Significancia Estatistica e Econdmica Ocoeficiente 6 é estatisticamente significante ou significativo o Geralmente usamos este termo estatisticamente significante ou estatisticamente significante para dizer que com um nivel de significancia a o coeficiente f 6 diferente de zero o Significancia estatistica depende do tamanho de eB o Colocar muita énfase sobre a significancia estatistica pode levar a conclusdo falsa de que uma variavel é importante para explicar y embora seu efeito estimado seja moderadopequeno Os coeficientes podem ser estatisticamente significantes mas podem ser economicamente pequenos baixo impacto econdémico o Sempre verifique a significancia econdmica tamanho e sinal dos coeficientes estimados B Qual o tamanho da variacdo em y por mudangas em x IMPORTANTE Esta magnitude é plausivel Se ndo for vocé deve ter tido algum problema de especificagdo no modelo o Pode ocorrer baixa significancia econémica com significancia estatistica em grandes amostras 0 erro padrdo diminui ou em casos de muita variancia em x Os coeficientes podem ser economicamente significantes mas estatisticamente nado significantes o Nao podemos afirmar que sdo diferentes de zero o Pode ocorrer com amostras pequenas e com pouca variacdo em x o Cuidado Erropadrdo alto que diminui a significancia estatistica também pode ser devido a multicolinearidade o Seumavariavel nao é estatisticamente significante nos niveis usuais 10 5 ou 1 vocé poderia perguntar ainda se a variavel tem o efeito esperado sobre y e se tal efeito é economicamente significante Se ele é grande voce deve calcular um pvalor para a estatistica t UNIFESP ne a a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 75 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Significancia Estatistica e Econdmica Exemplo 1 Queremos estimar o efeito de uma taxa de contribuiao para um plano taxcont sobre a taxa de participacao taxap dos trabalhadores nos planos de pensdo de contribuicao definida existentes nos Estados Unidos A taxa de contribuiao é a quantidade com a qua a firma contribui para um fundo de trabalhadores para cada dolar de contribuido do trabalhador até certo limite assim taxcont 075 significa que a firma contribui com USS 075 para cada dolar contribuido pelo trabalhador A taxa de participaao é a percentagem de trabalhadores habilitados a ter uma conta no plano de pensao totemp e uma medida de tamanho da empresa medida pelo numero de empregados taxap Bo Btaxcont Bidade B3totemp taxap 8029 5 44taxcont 0269idade 000013totemp Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 8029428539 0777695208 1032464706 0 7876882403 8181974675 taxacont 5441432564 0524408596 1037632222 200817E24 4412796873 6470068255 idade 0269407284 004514857 5967127681 299497E09 0180847655 0357966913 totemp 00012978D 000129781 367184E05 3534503198 0000420703 0000201805 577576E05 Todas as variaveis sdo estatisticamente significantes pvalor a de 1 Qual o tamanho em um sentido econdmico do coeficiente de totemp Mantendo fixo taxcont e idade se uma firma cresce em 10000 empregados a taxa de participagdao cai em 13 pontos percentuais 10000000013 Isso um crescimento enorme no numero de empregados com um efeito somente modestobaixo na taxa de participacdo Assim embora o tamanho da firma afete de fato a taxa de participadao o efeito econdmico nado é grande UNIFESP a a ce a TT EPPEN Escola Paulista de Politica Economia e Negdcios Curso de Ciéncias Contabeis 76 oan peer Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comparagao entre dois coeficientes 6 Em aplicagoes praticas devemos frequentemente testar hipoteses que comparam os coeficientes f Para ilustrar consideraremos um modelo simples para comparar os retornos da educacao de cursos superiores profissionalizantes de dois anos cP junior colleges e de cursos superiores de quatro anos fouryear colleges univ por simplicidade vamos nos referir ao ultimo como universidades A populacdo inclui as pessoas com ensino médio completo que trabalham Insalariohora By Bycp B2univ B3exper oO cp éonumero de anos frequentados em um curso superior profissionalizante de dois anos o univ éo numero de anos frequentados em um curso superior de quatro anos O exper sao os meses na fora de trabalho o Note que qualquer combinacao de curso profissionalizante e curso universitario de quatro anos é permitida incluindo cp O e univ 0 A hipotese de interesse é se o impacto no salariohora de um ano adicional de curso profissionalizante é equivalente ao impacto no salariohora a um ano adicional na universidade Ho By Bo Ha Bi B2 UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 77 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comparagao entre dois coeficientes 6 Insalariohora By Bycp B2univ B3exper A estatistica t baseada em se a diferenca estimada 6 fz suficientemente menor ou maior que zero para assegurar a rejeicao da hipotese nula Ho Ba B Para considerar o erro de nossos estimadores padronizamos essa diferenca ao dividi a pelo erro padrao bend n de var a n de LO independentes a Bi B2 observacdes kK1 epB B2 graus de liberdade Aestatistica t é baseada em se a diferenca estimada P 2 é suficientemente menor ou maior que zero para assegurar a rejeicdo da hipdtese nula Hp 6 fz Para considerar o erro de nossos estimadores padronizamos essa diferenca ao dividila pelo erro padrdo epf fz Uma vez que temos a estatistica t o teste segue 0 mesmo procedimento que vimos Escolhemos um nivel de significancia para o teste com base nos graus de liberdade obtemos um valor critico Se a estatistica de teste estiver dentro da area de rejeicdo rejeitamos a hipdtese nula Ho 6 Bz Ou entao calculamos o pvalor a partir da estatistica t e o comparamos com o nivel de significdancia a Se pvalor for inferior ao nivel de significancia a rejeitamos a hipdotese nula Ho 6 fo UNIFESP a ca a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 73 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior ww e e e eT be Comparacao entre dois coeficientes B t epBi B2 7 a a Insalariohora Bo Bicp B2univ B3exper Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 0 1431040848 1513610255 cp 0066696724 0006828794 9766984279 219304E22 0053310137 0080083312 univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 cpeuniv tem ambos os efeitos econdmico e estatistico significantes sobre o salario por hora Mas estamos mais interessados em testar se a diferenca estimada dos coeficientes 6 fz é estatisticamente significante Bx B2 00102 De modo que o retorno de um ano em um curso profissionalizante 6 cerca de um ponto percentual menor que um ano na universidade Infelizmente os resultados da regressdo nao contém informacoes suficientes para obter o erropadrao epB Be Como calcular CovB 1 Bz a Alguns programas estatisticos CTA CE B2 CTA ED VarB2 2CovB4 ee fazem esta conta Aqui iremos epx Varx usar uma abordagem alternativa a a x 2 m v2 mais simples porém eficaz para CaO EN wy B2 BaCn lepB2 wy ZCovB B2 tentar estimas a significancia estatistica da diferenca UNIFESP A ce a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 79 sao Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comparacao entre dois coeficientes B Insalariohora Bo By p B2univ B3exper Definiremos um novo parametro 6 como sendo a diferenca entre 8 B 0 61 B2 Desta forma nossas hipoteses nula e alternativa e a estatistica de teste t serdo hy 0 0 a A Pe ep0 Como 0 8B B2 podemos também escrever By 0 Br Substituindo B na equacdo temos Insalariohora Bo 0 Bocp Buniv B3exper Insalariohora Bo 0cp B2cp univ B3exper A ideia fundamental é que o parametro 04 cuja hipdtese estamos interessados em testar multiplica agora a variavel cp Mais importante ha uma nova variavel multiplicando 62 que é a soma de cp univ Assim se quisermos estimar diretamente entao devemos construir a nova variavel cp univ e incluila no modelo de regressao no lugar de univ UNIFESP a L cn a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 80 ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior RI e e e H 0 Comparacao entre dois coeficientes B 7 Pe 0 a Insalariohora By 6cp B2cp univ B3exper Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 O 1431040848 1513610255 cp 0066696724 0006828794 9766984279 219304E22 0053310137 0080083312 univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 O 1431040848 1513610255 cp univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 Note que 0 00102 exatamente a diferencga entre 6 Bz calculada anteriormente Bo Bz e Bz permanecem os mesmos assim como seus errospadrdo e assim deve ser Essa é uma maneira de checar se a equacao transformada foi apropriadamente estimada Como pvalor 01422 ou 1422 da estatistica t da estimativa 8 maior do que o nivel de significancia nado podemds rejeitar Hp8 0 ou seja nao podemos concluir que ha diferenca estatistica entre B e Bz Ou seja nado podemos concluir que ha diferena no impacto no salariohora entre um ano adicional de educacao profissionalizante e universitaria neste caso UNIFESP a a a a TT EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 21 aoe Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restricdes Lineares Gerais e Na regressao linear simples o teste te o teste F produzemamesma conclusdo ou seja se a hipotese nula for rejeitada concluiremos que 6 0 e Na regressao multipla o teste t e o teste F tem propositos diferentes 1 Oteste Fe utilizado para determinar se existe uma relaao significativa entre a variavel dependente e o conjunto de todas as variaveis independentes Referimo nos ao teste F como teste de significancia global 2 Seo teste F exibir uma significancia global o teste t e usado para determinar se cada uma das variaveis independentes individuais e significativa Um teste t e realizado para cada uma das variaveis independentes do modelo Referimonos a cada um desses testes t como teste de significancia individual Ho By B2 B 9 HUm ou mais parametros nao sao iguais a zero Se Ho for rejeitada o teste nos da suficientes evidéncias estatisticas para concluirmos que um Ou Mais dos parametros nado sao iguais a zero e que a relacao global entre y e o conjunto de variaveis independentes x1 X2 X significativa Entretanto se Hy nao puder ser rejeitada nao teremos evidéncias suficientes para concluir que uma relacado significativa esta presente EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 32 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restricdes Lineares Gerais Tabela Fonte Soma dos Quadrados Graus de Liberdade Quadrado Médio a k SSR YO 5 ssR y MSR 2t Regressao iW n varidveis Independentes k k Erros 2 SSE XO i SSE i i k1 MSE Residuos Mi Mi nk1 nk1 Total SST 0 y n1 Estatistica de Teste MSR R2 i an a MSE 1 R k EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 33 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restrições Lineares Gerais Distribuição Amostral de MSRMSE F 84 Não Rejeitar H0 Não Rejeitar H0 Rejeitar H0 Rejeitar H0 F a 𝑭𝜶 Valor Crítico no Excel Distribuição F INVF1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Português FINV1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Inglês k graus de liberdade no numerador n k 1 graus de liberdade no denominador Rejeitar 𝑯𝟎 quando p valor 𝜶 ou quando a estatística de teste F é superior ao F crítico Valor Crítico dado uma Distribuição F Valor Crítico dado uma Distribuição F pvalor da Estatística F no Excel DISTFEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Português FDISTEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Inglês EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restrições Lineares Gerais Teste F no Excel 85 Tabela ANOVA Teste 𝑭 Ho Todos os coeficientes 𝜷𝟏 𝜷𝟐 𝜷𝒏 𝟎 zero Estatística do Teste 𝑭 pvalor da Estatística do Teste 𝑭 𝑯𝟎 𝜷𝟏 𝜷𝟐 𝜷𝒌 𝟎 𝑯𝒂 𝑼𝒎 𝒐𝒖 𝒎𝒂𝒊𝒔 𝒑𝒂𝒓â𝒎𝒆𝒕𝒓𝒐𝒔 𝒏ã𝒐 𝒔ã𝒐 𝒊𝒈𝒖𝒂𝒊𝒔 𝒂 𝒛𝒆𝒓𝒐 Rejeitar 𝑯𝟎 quando pvalor 𝜶 ou quando a estatística de teste F é superior ao F crítico SUMMARY OUTPUT Regression Statistics Multiple R 0879095465 R Square 0772808837 Adjusted R Square 0761859865 Standard Error 0148142268 Observations 88 ANOVA df SS MS F Significance F Regression 4 6196075706 1549018926 7058277758 645207E26 Residual 83 1821528924 0021946132 Total 87 8017604629 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 0263743402 0569664802 0462979986 0644590344 0869296977 1396783781 lnavaliação 1043065443 0151446069 6887372164 10115E09 0741845302 1344285584 quartos 0033839208 0022098313 1531302791 0129497317 0010113447 0077791864 lnterreno 0007437885 0038561495 0192883735 0847521219 0069259378 0084135148 lnárea 0103238445 0138430473 0745778318 0457908275 0378571088 0172094198 Teste de Restricoes de Exlusao Agora queremos testar se um grupo de variaveis tem efeito sobre a variavel dependente Mais precisamente a hipdtese nula é que um conjunto de variaveis nao tem efeito sobre y ja que outro conjunto de variaveis foi controlado o possivel construir um modelo que explica os salarios dos jogadores da principal liga de beisebol dos Estados Unidos Sendo salario o salario total do jogador em 1993 anos corresponde aos anos do jogador na liga jogosano é a média de partidas jogadas por ano rebmed é a média de rebatidas na carreira do jogador runano corresponde a rebatidas para fora do campo mais conhecidas como homeruns que resultaram em pontos por ano e rebrunano corresponde a rebatidas que resultaram em corrida até a proxima base por ano Suponha que queiramos testar a hipotese nula de que uma vez tendo sido controlados anos na liga e jogos por ano as estatisticas que medem o desempenho rebmed hrunano e rebrunano nao tém efeito sobre o salario Essencialmente a hipdtese nula expressa que a produtividade medida pelas estatisticas do beisebol nao tem efeito sobre o salario Insalario Bo Banos Bzjogosano B3rebmed Bhrunano Bsrebrunano A hipotese nula constitui trés restrides de exclusdo conjunto de restricoes multiplas pois estamos colocando mais de uma restricdo sobre os parametros o Se Ho é verdadeira entdo rebmed hrunano e rebrunano nao tem efeito sobre salario Ho B3 Ba Bs 0 Teste de hipdteses multiplas H B3 eou fp eou fp sadoiguaisa zero MUNeeaal eles UNIFESP a a a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 86 sao Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste de Restricoes de Exclusao Exemplo Modelo Irrestrito Conhecer a soma dos quadrados dos residuos ndonosdiz fF tentadortestara hipdtese SUMMARY OUTPUT nada sobre a decisdo quanto a hipotese nula Hy O que nos nula usando as estatisticas f dira algo é saber quanto aumenta a soma dos quadrados e os pvalores das variaveis a dos residuos quando retiramos as variaveis rebmed rebmed Regression Statistics hrunano e rebrunano do modelo Lembrese que a hrunano e rebrunano Multiple R 07923401 soma dos quadrados dos residuos sempre aumenta quando para determinar se cada variavel é R Square retiramos variaveis do modelo esse é um fato algébrico A INDIVIDUALMENTE Adjusted RSquare 0622439762 questdo é saber se esse aumento é significativamente SIGNIFICANTE Standard Error 0726577245 grande relativamente a soma dos quadrados dos residuos oe Observations 353 do modelo com todas as variaveis para garantir arejeicio EssaopcaoNAOE da hipotese nula Ho OE ER PCS ES SOBRE COLOCA RESTRICOES SOBRE ANOVA OS OUTROS PARAMETROS df SS M F Significance F Regression 5 3089891778 6179783555 1170603127 293806E72 Beale indviducie pace t Residual 347 0527914492 testar uma hipotese multipla Total 352 4921755066 pode ser muito enganoso rcfficients StandardError tStat Pvalue lower 95 Upper 95 4 Com base nas estatisticas oefficients Standard Error t Stat Pvalue Lower 95 Upper 95 individuais nenhuma das Intercept 111924183 0288822858 387518439 41873E128 1062435457 1176048203 variaveis de desempenho se anos 0068862639 0012114544 5684294871 278758E08 0045035463 0092689814 mostrou estatisticamente iogosans 00 0002646763 4742439902 302263F06 000734639 00 Q hrunano 0014429484 0016056979 0898642502 0369466246 0017151768 0046010736 erradaC rebrunano 0010765731 0007174961 1500458332 013440503 0003346156 0024877617 UNIFESP I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 87 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior SUMMARY OUTPUT Regression Statistics Multiple R 0772704088 R Square 0597071608 Adjusted R Square 059476916 Standard Error 075273119 Observations 353 ANOVA df SS MS F Significance F Regression 2 293864021 1469320105 2593203491 822011E70 Residual 350 1983114856 0566604245 Total 352 4921755066 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1122380399 0108312003 103624748 99657E265 1101077974 1143682825 anos 0071317976 001250501 5703152077 25042E08 0046723559 0095912392 jogosano 0020174478 000134287 1502340873 101913E39 0017533369 0022815587 Teste de Restrições de Exclusão Exemplo Modelo Restrito 88 𝑭 𝑺𝑸𝑹𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝑺𝑸𝑹𝒊𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝑺𝑸𝑹𝒊𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝒏 𝒌 𝟏 𝒒 𝒏 𝒅𝒆 𝒓𝒆𝒔𝒕𝒓𝒊çõ𝒆𝒔 Estatística ou Razão Aumento relativo na soma dos quadrados dos resíduos SQR quando nos movemos do modelo irrestrito para o restrito 𝑘 número de variáveis independentes do modelo irrestrito com todas as variáveis 𝑭 𝟏𝟗𝟖 𝟑𝟏 𝟏𝟖𝟑 𝟏𝟗 𝟏𝟖𝟑 𝟏𝟗 𝟑𝟓𝟑 𝟓 𝟏 𝟑 𝑭 𝟗 𝟓𝟓 Teste de Restricoes de Exclusao k numero de varidveis Exemplo Modelo Restrito independentes do modelo irrestrito com todas as variaveis SUMMARY OUTPUT Estatistica F ou RazGo F Regression Statistics Multiple R 0772704088 rae Carer a Sao nk1 R Square 1 R oe strito q nde restricées Adjusted RSquare 059476916 iene Standard Error 075273119 Observations 353 ANOVA df SS MS F Significance F F 0 6278 05971 6278 0 5971 35351 7571 Regression 2 293864021 1469320105 2593203491 822011E70 1 0 6278 3 Residual 350 i9g3114856 Jos66604245 Total 352 4921755066 F955 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1122380399 0108312003 103624748 99657E265 1101077974 1143682825 anos 0071317976 001250501 5703152077 25042E08 0046723559 0095912392 jogosano 0020174478 000134287 1502340873 101913E39 0017533369 0022815587 Podemos calcular a estatistica F usando os coeficientes de determinacado R dos modelos uma vez que os mesmos sempre estardo entre zero e um enquanto a soma dos quadrados dos residuos podem ser muito grandes dependendo da unidade de medida de y torando os calculos maiores UNIFESP TT EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 39 aoe Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior ANOVA Distribuição Amostral de MSRMSE 90 Não Rejeitar H0 Não Rejeitar H0 Rejeitar H0 Rejeitar H0 F Valor Crítico dado uma Distribuição F Valor Crítico dado uma Distribuição F a 1 𝑭𝜶 Valor Crítico no Excel Distribuição F INVF1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Português FINV1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Inglês q n de restrições graus de liberdade no numerador n k 1 graus de liberdade no denominador 4 Rejeitar 𝑯𝟎 quando p valor 𝜶 ou quando a estatística de teste F é superior ao F crítico pvalor da Estatística F do Excel DISTFEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Português FDISTEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Inglês EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Variável Dependente claramente identificada titulada Variáveis Independentes claramente identificadas tituladas Coeficientes e seus respectivos errospadrão estatística t e estrelas indicando seu nível de significância estatística o significante com α 001 1 o significante com α 005 5 o significante com α 01 10 o Não colocar estrelas quando não há significância estatística Número de observações em cada regressão 91 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Explicando Resultados de Regressões FOCO NO QUE É O PRINCIPAL Foque nas variáveis de interesse oIndique seu sinal magnitude significância estatística e econômica interpretação etc oNão perca tempo com outros coeficientes a menos que eles tenham dado um resultado estranho fora do esperado sinal oposto ao esperado magnitude enorme etc Não reporte resultados e regressões em tabelas que você não irá discutir eou mencionar oSe não é importante o suficiente para mencionar ou discutir não é importante suficiente para estar em uma tabela 92 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Exemplo 93 Fonte Gubbi S R Aulakh P S Ray S Sarkar M B Chittoor R 2010 Do international acquisitions by emergingeconomy firms create shareholder value The case of Indian firms Journal of International Business Studies 413 397418 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior josecarreraunifespbr 94 Obrigado Dúvidas
Send your question to AI and receive an answer instantly
Recommended for you
178
Regressao Linear Multipla - Metodos Quantitativos Aplicados
Métodos Quantitativos Aplicados
UNIFESP
51
Métodos Quantitativos Aplicados - Comparações Envolvendo Médias
Métodos Quantitativos Aplicados
UNIFESP
9
Analise de Regressao Gastos por Aluno vs Desempenho NAEP
Métodos Quantitativos Aplicados
UNIFESP
1
Artigo Cientifico Contabilidade-Governanca-Financas-Metodologia e Resultados
Métodos Quantitativos Aplicados
UNIFESP
56
Teste de Hipótese para a Média - Métodos Quantitativos Aplicados
Métodos Quantitativos Aplicados
UNIFESP
84
Métodos Quantitativos Aplicados: Regressão Linear Simples
Métodos Quantitativos Aplicados
UNIFESP
13
Métodos Quantitativos: Introdução à Regressão Linear Simples
Métodos Quantitativos Aplicados
UMG
1
Analise Estatistica Descritiva Renda Filhos e Valor dos Bens
Métodos Quantitativos Aplicados
UFPI
20
Plano de Aula - Regressão Linear Múltipla e Ajustamento Polinomial - UFMA
Métodos Quantitativos Aplicados
UFMA
67
Regressao Linear-Analise-e-Aplicacoes-em-Metodos-Quantitativos
Métodos Quantitativos Aplicados
UFC
Preview text
EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Métodos Quantitativos Aplicados Regressão Linear Múltipla Prof Dr José Marcos Carrera Junior São Paulo Setembro 2023 1 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mini Currículo do Professor Prof Dr José Marcos Carrera Junior Forte experiência em Finanças Corporativas MA Valuation e Controladoria adquirida durante a vida acadêmica e profissional em consultorias boutique de investimento e em grandes multinacionais tendo participado de diversas transações nacionais e internacionais Atualmente é Assessor Financeiro e Professor de Finanças Corporativas Doutor pela Fundação Getulio Vargas FGVEAESP com estágio doutoral na Universidade de Columbia em Nova York Mestre em Administração de Empresas pela Fundação Getulio Vargas FGVEAESP e Mestre em Finanças pela Universidade de São Paulo FEAUSP formado em Administração de Empresas pela Universidade de São Paulo FEAUSP Professor de Métodos Quantitativos Aplicados ao Mercado Financeiro na UNIFESP Universidade Federal de São Paulo FIA FECAP In Company FGV In Company Ibmec In Company MBA EACHUSP e Saint Paul Escola de Negócios e Financial Advisor na Plata Capital Partners e na Pezco Economic Business Intelligence Sócio fundador do Finanças 101 canal no YouTube com vídeos e aulas de finanças e economia Contato josemarcoscjgmailcom 2 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Fonte ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística Aplicada à Administração e Economia 3 WOOLDRIDGE Jeffrey M Introdução à econometria uma abordagem moderna Cengage EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Gastos com ciência espaço e tecnologia vs Suicícios por enforcamento e estrangulamento 4 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Número de pessoas que se afogaram ao cair em piscinas vs Filmes estrelados por Nicolas Cage 5 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Consumo per capita de queijo vs Número de pessoas que morreram enrroladas em seus lençóis 6 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Divórcios em Maine vs Consumo per capita de margarina 7 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Idade da Miss América vs Assassinatos por vapores e objetos quentes 8 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Receita total gerada por videogames vs Doutorados finalizados em ciências da computação nos EUA 9 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Lançamentos aeroespaciais não comerciais no mundo vs Doutorados finalizados em sociologia nos EUA 10 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comsumo per capita de mozzarella vs Doutorados finalizados em engenharia civil nos EUA 11 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Pessoas que se afogaram ao cair de um barco de pesca vs Taxa de Matrimônio em Kentucky 12 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Importações norteamericanas de petróleo da Noruega vs Motoristas mortos em colisões com trens 13 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Consumo per capita de frango vs Importações norteamericanas totais de petróleo 14 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Número de pessoas que se afogaram em piscinas vs Energia gerada em usinas nucleares nos EUA 15 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Carros japoneses de passageiros vendidos nos EUA vs Suicídios por batidas de veículos automotores 16 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Letras da palavra vencedora do concurso norteamericano de soletração vs número de pessoas mortas por aranhas venenosas 17 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Doutorados finalizados em matemática nos EUA vs Urânio estocado nas usinas nucleares norteamericanas 18 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Relação Espúria Relação estatística existente entre duas variáveis mas onde não existe nenhuma relação causaefeito entre elas Essa relação estatística pode ocorrer por pura coincidência ou por causa de uma terceira variável Ou seja neste último caso pode ocorrer que as variáveis A e B sejam correlacionadas porque ambas são causadas por uma terceira variável C É muito difícil explicar fenômenos apenas com duas variáveis CORRELAÇÃO NÃO É CAUSALIDADE 19 Variável A Variável B Variável C Relação Espúria entre A e B EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Vendas de Sorvetes vs Ataques de Tubarões 20 Consumo de sorvete Banhistas mais saborosos Mais atrativos para ataques de tubarões Maior consumo de sorvete com bom tempo Mais pessoas nas praias pelo bom tempo Tanto o consumo de sorvete como os ataques de tubarões crescem quando o tempo é ensolarado mas eles não tem relação de causa e efeito entre si O bom tempo faz com que as pessoas consumam mais sorvete e também frequentem mais as praias levando a mais ataques de tubarões EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Simultaneidade Relação Espúria O gato subiu no telhado Causalidade 21 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Introdução Enquanto a regressão linear simples baseiase no desenvolvimento de uma equação de regressão estimada para descrever a relação entre duas variáveis A desvantagem principal de usar a análise de regressão simples em trabalhos empíricos é o fato de ser muito difícil obter conclusões certeris paribus sobre como 𝑥 afeta 𝑦 o A hipótese fundamental que todos os outros fatores que afetam 𝑦 não são correlacionados com 𝑥 é frequentemente irreal na regressão linear simples A regressão múltipla considera situações que envolvem duas ou mais variáveis independentes o Possibilita considerar mais fatores e geralmente produzem melhores estimativas do que a regressão linear simples A análise de regressão múltipla é mais receptiva à análise certeris paribus pois ela nos permite controlar explicitamente muitos outros fatores que de maneira simultânea afetam a variável dependente 𝒚 o Em razão de os modelos de regressão múltipla acomodarem muitas variáveis explicativas que podem estar correlacionadas esperamos inferir causalidade nos casos em que a análise de regressão simples seria enganosa Naturalmente se adicionarmos mais fatores que são úteis para explicar 𝑦 então mais da variação de 𝑦 poderá ser explicada Assim a análise de regressão múltipla pode ser usada para construir melhores modelos para prever a variável dependente 𝒚 O modelo de regressão múltipla ainda é o veículo mais extensamente usado da análise empírica em economia administração contabilidade e em outras ciências sociais aplicadas Os conceitos de modelo de regressão e equação de regressão linear simples são aplicáveis no caso da regressão múltipla 22 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variável Dependente e Independentes 23 Variável Dependente y Variável Independentes x Variável Explicada Variável de Resposta Variável Prevista Regressando Variável que está sendo prevista Variável aleatória de interesse Comportamento se deseja explicar Depende de outras variáveis Variáveis Explicativas Variáveis de Controle Variáveis Previsoras Regressores Variáveis que utilizadas para prever outra Independentes de outras variáveis Variáveis Aleatórias e Observáveis Modelo de Regressao Multipla FRP Funcao de Regressao Populacional X4X2 X Variaveis independentes Erro 1 Variavel aleatoria nao be ee CL oie ae ODP ie ot Oe a ee TF observavel que corresponde ao que explicaa variabilidade em y que nao Variavel dependente pode ser explicada pela relacdo linear entre as variaveis independentes Parametros do modelo X4X2 0 Xpey 69 Constante 1 Bo By Coeficientes que descrevem a relacdo linear de cada variavel independente com a variavel dependente y Y Utilizando a analise de regressdo podemos desenvolver uma equacdo mostrando como a variavel y esta relacionada as variaveis independentes X1 Xo Xz v Existe um valor observado de y para cada valor observado de X1X2 Xz UNIFESP a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 54 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Equacao de Regressao Multipla FRP Funcao de Regressao Populacional X4X2X Variaveis EyX41X92Xz B4X1 Boxo Bx CUR ates k Bo Bix1 B2x2 ea independentes Valor esperado da Variavel dependente y dado X41 X2Xz Pardametros do modelo 6 Constante 64 Bo By Coeficientes que descrevem a relacdo linear de cada variavel independente com a variavel dependente y Y Seo intercepto By esta incluso na equacao nada se perde ao assumir que o valor médio e esperado do erro na populacdo é zero Eu 0 Y Qualquer valor constante que tenha valor esperado diferente de zero é absorvido pela constante Y Cada distribuicdo de valores de y tem seu proprio valor médio ou esperado Ey Y Amédia ou valor esperado do erroresiduo p é zero UNIFESP ne a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 35 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Equacao de Regressao Multipla Estimada FRA Funcao de Regressao Amostral Com Base em Dados Amostrais X41 X2 X Variaveis Y Bot BiX1 B2X2 BuXE independentes y Estimador pontual de Ey dado X1X2 Xx Parametros do modelo 6 o Constante 1 B2 By Coeficientes estimados que descrevem a relacdo linear de cada variavel independente com a variavel dependente y certeris paribus tudo mais constante v Se os valores dos parametros da populacao Bo By Bo Bx fossem conhecidos poderiamos utilizar a equacdo Eyx1X2X Bo Bix Box2 Bex para calcular o valor médio de y para um dado valor de X1X2Xx Y Na pratica os valores dos parametros geralmente nao sao conhecidos e devem ser estimados a partir de dados amostrais Vv Uma variavel aleatoria simples é usada para calcular as estatisticas amostrais de Bo By Bz By que Sao utilizadas como estimativas dos parametros da populacao Bo B41 Bo Bx Y éo valor médio de y para um dado valor de x1 Xz Xz UNIFESP a on a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 36 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior O processo de estimacao na Regressao Multipla Modelo de Regressao Dados Amostrais Y Bot B1xX1 Box2 PRX H Equacao de Regressao a ae ad Ey Bo Bix1 B2x2 BRXE Parametros Desconhecidos ov on oy need f Equacao de Regressao Ex toe te wo Br Estimada fornecem estimativas de Y Bo t BixX1 Box Bux RY eae we eiae lc Ee a Pannen Ea toe Bo oe OF UNIFESP owaeane EPPEN Escola Paulista de Politica Economia e Negdécios Curso de Ciéncias Contabeis 57 Oe RE Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Atenção Importante 28 A análise de regressão NÃO pode ser interpretada como um procedimento para estabelecer uma relação de causa e efeito entre as variáveis Ela só pode indicar como ou em que medida as variáveis estão relacionadasassociadas umas as outras EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior MQO Mínimos Quadrados Ordinários OLS Ordinary Least Squares É um procedimento para o uso de dados amostrais com a finalidade de encontrar a equação de regressão estimada O método dos mínimos quadrados fornece uma equação de regressão estimada que minimiza a soma dos desvios quadrados entre os valores observados da variável dependente e os valores previstos da variável dependente denotados por Este critério dos mínimos quadrados é utilizado para escolher a equação que proporciona o melhor ajuste Na prática o método dos mínimos quadrados é o mais utilizado 29 𝒊 𝒊 𝟐 Regressao Multipla Interpretacao dos Coeficientes Y Bot BixX1 BoxX2 BuxK impacto marginal ou parcial esperado em y correspondente a alteragcdo em x quando Xp X estao constantes CERTERIS PARIBUS TUDO MAIS CONSTANTE o Estimativa da alteracao em y correspondente a alteragao de uma unidade em x CERTERIS PARIBUS quando todas as outras variaveis independentes se mantém constantes 0869 00611x 0923x y Tempo estimado a ax Numero de de viagens em horas x Milhas entregas delivery percorridas Bo 0869 Constante ou intercepto valor estimado de y quando as demais variaveis independentes sao Iguais a zero Bi 00611 Estimativa do aumento esperado no tempo de viagem correspondente ao aumento de 1 milha na distancia percorrida quando 0 numero de entregas é mantido constante Bo 0923 Estimativa do aumento esperado no tempo de viagem correspondente ao aumento de 1 entrega quando o numero de milhas percorrida é mantido constante UNIFESP a ce a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 30 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Múltipla Interpretação dos Coeficientes 𝟎 𝟏 𝟐 Em que representa anos de educação formal e representa anos de experiência no mercado de trabalho Assim salário por hora é determinado por duas variáveis independentes educação e experiência e por outros fatores não observáveis contidos em Basicamente estamos interessados em saber o efeito do grau de educação sobre o salário mantendo fixos todos os outros fatores que afetam o salário por hora isto é estamos interessados no parâmetro 𝟏 Comparada com uma análise de regressão simples que relaciona com a regressão apresentada remove efetivamente a do termo de erro e a coloca explicitamente na equação queremos ver o efeito de educação no salário por hora CONTROLANDO para a experiência Seremos capazes de analisar o efeito da educação no salário por hora mantendo o nível de experiência fixo ou constante somos capazes de CONTROLAR os efeitos da experiência sobre o salário por hora o Na análise de regressão simples teríamos que assumir que experiência é não correlacionada com educação 31 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Linear no Excel 32 Regressao Linear no Excel Colocar série de dados da variavel dependente Inputs P y Assinalar se vocé Regression x selecionou os Colocar série de titulos das colunas Input eG nos inputs Dc dados das variaveis Input Range independentes x Cancel Input X Range Assinalar se quiser Assinalar para mudar Help fazer a regressdo sem O Grau de Confianca Labels Constant is Zero a constante f0 Padrdao Excel 95 Tl teetraere eae 95 oy Alterar o Grau Assinalar para i p Output options de Confianga mudar o local de saida de dados Qutput Range Indicar onde quer New Worksheet Ply a saida de dados Assinalar se quiser OC i New Workbook que a saida de Assinalar se quiser dados apareca em Residuals visualizar o grafico de nova planilha Residuals Residual Plots distribuigdo dos Assinalar se quiser Standardized Residuals Line Fit Plots residuos visualizar os residuos ieee eichekiney Assinalar se quiser Normal Probability Plots visualizar o grafico dos Assinalar se quiser on pontos estimados pela visualizar os residuos 6s reta de regressdo e os padronizados UNIFESP residuos owaeane EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 33 Oe RE Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressao Linear no Excel Saida de Dados SUMMARY OUTPUT Regression Statistics Multiple R 0553554369 coeficiente de determinacdo R7 R Square 030682244 coeficiente de determinacdo ajustado R ajustado Adjusted R Square 0302436362 Desvio padrao do modelo a Standard Error 3084475615 Observations 526 Numero de observag6es n TX Estatistica do Teste F ANOVA 4 df SS MS F Significance F Tabela ANOVA Teste F Regression 3 2194111624 7313705413 7687316837 340586E41 Ho Todos os coeficientes Residual 522 4966302686 9513989821 By B2 Bn 0 Total 525 716041431 zero Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 2872734887 0728964293 3940844447 922474E05 4304799048 1440670725 Escolaridade 059896507 0051283549 1167947779 368135E28 0498217566 0699712573 Experiéncia 002233952 0012056848 1852849079 0064468176 0001346387 0046025426 mpoCargo 0169268652 0021644607 7820361491 293453E14 0126747411 0211789893 Constante R Erro Padrao sz ist Bo anaes Bn Estatisticade p valor dos a valo de Confianca Coeficientes f desvio pa rao Teste t dos coeficientes dos coeficientes dos coeficientes coeficientes UNIFESP a a cn a wane EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis a 34 Lie ee Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados supGPA 129 0453emGPA 00094ACT o supGPA nota média em um curso superior o emGPA nota média do ensino médio o ACT nota do teste de avaliagao de conhecimentos para ingresso em curso superior Ointercepto de 129 é o valor previsto da nota média de um curso superior swpGPA se tanto a nota média do ensino médio emGPA como a nota média na avaliagdo de conhecimentos para ingresso em curso superior ACT forem iguais a zero o Como nao é possivel encontrar ninguém que esteja no ensino superior com nota média no ensino médio e no exame de avaliacdo de conhecimentos para ingresso ambas iguais a zero a interpretacgdo do intercepto nessa equacdo é pouco significativa Como esperado ha uma relacao parcial positiva entre supGPA e emGPA Mantendo ACT fixo um ponto adicional em emGPA esta associado a 0453 de incremento em supGPA o Em outras palavras se escolhermos dois estudantes A e B e esses estudantes tiverem a mesma nota ACT mas emGPA do estudante A e um ponto maior que a supGPA do estudante B prevemos que o estudante A tem supGPA 0453 maior que supGPA do estudante B isso nao quer dizer nada sobre quaisquer duas pessoas reais mas é a nossa melhor previsao Ocoeficiente ACT implica mantendo emGPA fixo uma variado de 1 ponto na nota em ACT esteja associada a uma variacdo de 00094 pontos em supGPA Esse um efeito pequeno e sugere que uma vez considerado o emGPA a nota do ACT nao é um forte previsor de supGPA UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 35 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados o nota média em um curso superior o nota média do ensino médio o nota do teste de avaliação de conhecimentos para ingresso em curso superior Qual é o impacto na nota média em um curso superior ao se aumentar a nota média do ensino médio em 1 ponto e a nota do teste de avaliação de conhecimentos para ingresso em um curso superior em 1 ponto o o o 4 o 36 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados o nota média em um curso superior o nota média do ensino médio o nota do teste de avaliação de conhecimentos para ingresso em curso superior Qual é o impacto na nota média em um curso superior ao se aumentar a nota média do ensino médio em 2 pontos e a nota do teste de avaliação de conhecimentos para ingresso em um curso superior em 10 pontos o o o o 37 Interpretando os resultados Insalariohora 0284 0092educacao 00041experiéncia 0022permanéncia o salariohora salario por hora em dolares o educacao anos de educacao formal o experiéncia anos de experiéncia no mercado de trabalho permanéncia anos com o empregador atual O coeficiente 0092 SP que mantendo a experiénciae permanencia fixos controladosconstantes umano a mais de educaao ormal aumenta o valor esperado de insacar tohora em 0092 o que se traduz em um aumento aproximado de 92 0092 100 no salario por hora o Alternativamente se considerarmos duas pessoas com os mesmos niveis de experiéncia e permanéncia no emprego o coeficiente de educaao a diferena proporcional no salario por hora previsto quando seus niveis de educacao diferem UNIFESP a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 38 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidado com a interpretação variação vs variação em pontos percentuais Margem de lucro passou de 10 para 9 o 10 de redução 910 1 ou 10 910 o 1 ponto percentual de redução 10 9 Neste caso o coeficiente 086 indica que para 1 ponto percentual de crescimento no Market Share de 20 para 21 por exemplo o ROE sobe em média 086 pontos percentuais de 15 para 1586 por exemplo Neste caso o coeficiente 18501 indica que para 1 ponto percentual de crescimento ROE de 20 para 21 por exemplo o salário do CEO em 1990 sobe em média 18501 mil dólares 39 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Usando a Equação de Regressão Estimada para Estimação e Previsão Os procedimentos para estimar o valor médio de e para prever um valor individual de na regressão múltipla são similares aos da análise de regressão linear simples Para fazer previsão pontuais substituímos valores dados na equação de regressão estimada o e obtemos o o 40 e e e ow 2 Coeficiente de Determinacao R WA as A cw SST yiy fy SSR iy Fy SSE yi Vi SSR 0 y R Xya ty3 5 Erros 4 SST 100 SSR is Na regressao linear simples mostramos que a soma total dos quadrados SST pode ser dividida em dois componentes a soma dos quadrados da regressdo SSR e a soma dos quadrados dos erros SSE O mesmo procedimento se aplica para a regressao multipla o Varia de zero a um sendo 1 100 o ajuste perfeito 100 da variabilidade na variavel dependente em y explicada pela regressao o da variabilidade na variavel dependente y explicada pela variacao das variaveis independentes x4 Xp X o Porcentagem da soma dos quadrados totais SST que pode ser explicada utilizandose a equacdo de regressdo multipla estimada SSR o Quanto da variabilidade da variavel dependente pode ser explicada pela relacdo linear com as variaveis independentes UNIFESP a L cn a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis a1 aoe Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Coeficiente de Determinacdo Ajustado R ajustado ay2 a a wA iw sst 5 i9 FY SSR Giy FM SSE OiD SSR y R Xya ty3 5 Erros SST 4 100 SSR R Ajustado 1 1 R y nk1 n Numero de observacdes k Numero de variaveis independentes Um fato importante sobre o R é que ele nunca diminui e geralmente aumenta quando outra variavel independente é adicionada a regressao Desta forma geralmente os analistas preferem ajustar o R ao numero de variaveis independentes a fim de evitar uma superestimacao do impacto de se adicionar uma variavel independente a quantidade de variabilidade explicada pela equacdao de regressdao estimada O fato de que R nunca diminuir quando qualquer variavel for adicionada em uma regressdo faz dele um instrumento fraco para decidir se uma variavel ou diversas variaveis deveriam ser adicionadas ao modelo O fator que deve determinar se uma variavel explicativa pertence a um modelo é se a variavel explicativa tem na populacao um efeito marginalparcial sobre y diferente de zero seu coeficiente deve ser estatisticamente diferente de zero UNIFESP a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 42 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados npre8g6 0712 0150pcond 0034ptemp86 0104empr86 n 2725 R 00413 R2 ajustado 00403 o npre8sg6 numero de vezes que determinado homem foi preso em 1986 pcond a proporgcao de prisdes anteriores a 1986 que levaram a condenacdo proxy da probabilidade de um homem ser condenado por um crime O ptemp86 duracdo média da sentena cumprida por condenacao previa efeito do confinamento do crime se um Individuo esta na prisdo ele nado pode ser preso por um crime fora da prisdo o empr86 numero de trimestres durante o qual determinado homem ficou empregado em 1986 oportunidades no mercado de trabalho Cada um dos coeficientes de inclinagao tem o sinal esperado Um aumento na proporcao de condenacgoes pcond diminui o numero previsto de prisdes Se aumentarmos pcond em 05 um aumento grande na probabilidade de condenacao entao mantendo os outros fatores fixos Anpre86 0150 05 0075 o Isso pode parecer pouco usual pois uma prisdo ndo pode ser uma fracdo No entanto podemos usar esse valor para obter a variagao prevista das prisOes esperadas de um grande numero de homens Por exemplo entre cem homens a queda esperada de prisdes quando pcondaumenta em 05 é 75 Semelhantemente um periodo mais longo de prisdo leva a um numero previsto menor de prisdes De fato se premps86 aumenta de 0 para 12 as prisdes previstas para um determinado homem diminuem em 003412 4 Um trimestre a mais no qual o emprego legal é informado diminui as prisdes esperadas em 0104 0 que significaria 104 prisOes entre cem homens UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 43 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados npres6 0712 0150pcond 0 034ptemp86 0104emprs6 n 2725 R 00413 R2 ajustado 00403 npresg6 0707 0151pcond 00074sentmed 0037ptemp86 0 103empr8s6 n 2725 R 00422 R2 ajustado 00408 o npre8sg6 numero de vezes que determinado homem foi preso em 1986 pcond a proporcao de prisdes anteriores a 1986 que levaram a condenacdo proxy da probabilidade de um homem ser condenado por um crime o sentmed duracdo média da sentenca cumprida por condenacado prévia O ptemp86 duracdo média da sentena cumprida por condenacao previa efeito do confinamento do crime se um Individuo esta na prisdo ele nado pode ser preso por um crime fora da prisdo o empr86 numero de trimestres durante o qual determinado homem ficou empregado em 1986 oportunidades no mercado de trabalho Se sentmed for adicionado ao modelo sabemos que 0 R aumentara o Osinal de sentmed também é inesperado ele diz que uma duracgdo mais longa na sentenca média aumenta a atividade crimina UNIFESP ne a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis AA sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados 𝒏 𝟐 𝟕𝟐𝟓 𝑹𝟐 𝟎 𝟎𝟒𝟐𝟐 𝟐 o 𝒏𝒑𝒓𝒆𝟖𝟔 número de vezes que determinado homem foi preso em 1986 o 𝒑𝒄𝒐𝒏𝒅 a proporção de prisões anteriores a 1986 que levaram à condenação proxy da probabilidade de um homem ser condenado por um crime o 𝒔𝒆𝒏𝒕𝒎𝒆𝒅 duração média da sentença cumprida por condenação prévia o 𝒑𝒕𝒆𝒎𝒑𝟖𝟔 duração média da sentença cumprida por condenação prévia efeito do confinamento do crime se um indivíduo está na prisão ele não pode ser preso por um crime fora da prisão o 𝒆𝒎𝒑𝒓𝟖𝟔 número de trimestres durante o qual determinado homem ficou empregado em 1986 oportunidades no mercado de trabalho O fato de as quatro variáveis explicativas explicarem somente pouco mais de 4 da variação em npre86 não necessariamente significa que a equação é inútil Ainda que coletivamente essas variáveis não expliquem muito da variação nas prisões é possível que as estimativas sejam confiáveis dos efeitos certeris paribus de cada variável independente sobre Em geral um 𝟐 baixo indica que é difícil prever resultados individuais sobre com muita precisão 45 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Coeficiente de Determinação 𝟐 NÃO SE ASSUSTE COM 𝟐 BAIXOS 46 Nas ciências sociais aplicadas não são incomuns 𝑹𝟐 baixos nas equações de regressão 𝑹𝟐 aparentemente baixo não significa necessariamente que uma equação de regressão é inútil Ainda é possível que a equação forneça uma boa estimativa da relação certeris paribus entre as variáveis se isso é verdade ou não não depende diretamente da magnitude do 𝑹𝟐 Estudantes que estão se defrontando com regressões pela 1ª vez tendem a pôr muito peso na magnitude do 𝑹𝟐 Por enquanto conscientizese de que usar o 𝑹𝟐 como o principal padrão de medida de sucesso de uma análise econométrica pode levar a confusões e wa e Premissas do Modelo de Minimos Quadrados Y Bot BixX1 Box Bx HM Amostras aleatorias As variaveis independentes Xj X X nao podem ser constantes constantes sao capturados em fo Colinearidade nao perfeita entre as variaveis independentes Xj X X Avariavel dependente y esta relacionada as variaveis independentes x1 X2 X e ao erro wt de forma linear Implicagdo a reta de regressdo representada por fp ByX1 B2ox2 Bex wea base para a relagdo entre as variaveis Otermo de erro yu é uma variavel aleatoria com uma média ou valor esperado igual a zero ou seja Eu 0 o Implicacgdo Bo 1 2 Bx S40 constantes por conseguinte Ef 6 desse modo dados xy X2 Xz 0 valor esperado de y é dado por Ey Bo Bix Box2 Bexx Homocedasticidade A variancia de wu designada por 02 6 a mesma para todos os valores de X4 Xz Xz Var pX1X2X Varw a o Implicacdo A variancia de y nas proximidades da reta de regressdo é igual a 0 e 6a mesma para todos os valores de x1 X2 Xz o Heterocedasticidade implica que as estimativas do modelo MQO n4o sejam as mais eficientesprecisas Média Condicional Zero Exogeneidade Os valores de pz sdo independentes de x1 X2 Xx EpxX1X2X Eu 0 o Implicagao o valor de para um conjunto de valores em particular de x1 X2 Xp nao esta relacionado ao valor de uu para qualquer outro conjunto de valores de x1 X2 Xz assim 0 valor de y para um conjuntos de valores em particular de x1 Xz X ndo esta relacionado com o valor de y para qualquer outro conjunto de valores de X41 X2 Xx Otermo de erro pu é uma variavel aleatoria e normalmente distribuida o Implicagdo Uma vez que fo f1 B2 Pe sao constantes para determinados valores de x1 X2 Xx y uma funcao linear de yu a variavel dependente y também é uma variavel aleatoria normalmente distribuida UNIFESP a a a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis a7 Tae Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade A variancia de p designada por 07 6 a mesma para todos os valores de X1 X2 Xx Distribuigao de Distribuigao de yemx 30 yemx 20 y Ovalor esperado de y Ey se Distribuiggo de modifica de acordo com os yemx 10 af valores especificos considerados Ely quando am de X4 1X2 0 XK a i a ae x Ey quando a ye x 0 4 L on Pa Entretanto by f 2 ya independentemente do valor we de x4X2Xadistribuigao 0 fo a sho de probabilidade do erro 11 e x10 a a gabe oe oo d Ey Ath portanto as distribuicgdes de x 20 L tir Y wy Es d probabilidade de y em qualquer x 30 oe ponto em particular depende de o valor real de y ser maior oe Nota As distribuicdes de y tem a ou menor que Oo seu valor mesma forma em cada valor de x x esperado Ey UNIFESP as cn a TT EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 48 oan peer Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade vs Heterocedasticidade 49 Homocedasticidade Heterocedasticidade 𝑽𝒂𝒓 𝝁 𝒙𝟏 𝒙𝟐 𝒙𝒌 𝑽𝒂𝒓 𝝁 𝝈𝟐 𝑽𝒂𝒓 𝝁 𝒙𝟏 𝒙𝟐 𝒙𝒌 𝒇𝒙𝟏 𝒙𝟐 𝒙𝒌 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade Exemplo 50 Plotagem residual em relagao a x Os residuos y fornecem a melhor informagdo sobre o termo de erro u Portanto uma analise dos residuos é um passo importante para determinar se as suposicdes referentes a 1 sdo apropriadas o Eux4X2X Eu 0 Exogeneidade 2 ee o Varpux1X2X Varp o Homocedasticidade Grande parte da analise residual baseiase em um exame das plotagens graficas Uma plotagem residual em relacao a cada variavel independente x é um grafico no qual os valores da variavel independente x sdo representados pelo eixo horizontal e os valores residuais correspondentes sao representados pelo eixo vertical Para cada residuo e marcadoum ponte no grafico A primeira coordenada de cada ponto e dada pelo valor de x e a segunda coordenada é daaa pelo correspondente valor do residuo iVi Se a suposicao de que a varidncia do erro pw é idéntica para todos os valores de x1 Xp X ese o Modelo de regressao constituir uma representacdo adequada da relacao entre as variaveis a plotagem residual devera das a impressao geral de uma faixa horizontal de pontos y ye y9 Painel A Painel B Painel C e ye e e e e e 7 f 4 i Re ea ee 8 es g paver 3 2 ae Se eae pet 7 pet teensy 6 oto ig ayers TAY x x x UNIFESP a a a wae EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 51 ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior e we aN Plotagem residual em relacao a y Os residuos yY fornecem a melhor informagdo sobre o termo de erro uw Portanto uma analise dos residuos é um passo importante para determinar se as suposicdes referentes a Sado apropriadas Grande parte da andlise residual baseiase em um exame das plotagens graficas Uma plotagem residual em relacao a variavel dependente y é um grafico no qual os valores da variavel dependente ysdo representados pelo eixo horizontal e os valores residuais correspondentes sao representados pelo eixo vertical Para cada residuo é marcado um ponto no grafico A primeira coordenada de cada ponto ée dada pelo valor de j e a segunda coordenada é dada pelo correspondente valor do residuo yJ Opadrdo dessa plotagem residual é idéntico ao da plotagem residual em relacdo a variavel independente y para uma regressdo linear simples Paraa repressdo multipla multivariada a plotagem residual em relacdo a variavel dependente y é mais amplamente usada em virtude da presenca de mais uma variavel independente roy 20 e e 10 e g BO pon nn concn ncn ccna e e e 10 e e 20 e 60 80 100 120 140 160 180 9 UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 52 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade causa viés NÃO Heterocedasticidade o Afetará os errosdesviospadrão das estimativas o Os erros padrão reportados por programas estatísticos assumem homocedasticidade o Se os erros são heterocedásticos as inferências estatísticas sobre estes erros padrão podem estar incorretas e subestimadas EXOGENEIDADE o ENDOGENEIDADE A violação da hipótese de média condicional zero dos erros é que causa viés nos estimadores o Precisamos respeitar a hipótese de média condicional zero para obter estimadores consistentes o A hipótese de media condicional zero é diferente de homocedasticidade o ENDOGENEIDADE CAUSA VIÉS NOS COEFICIENTES 53 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero EXOGENEIDADE CMI Conditional Mean Independence O erro é independente da média de Se e são não correlacionados logo como variáveis aleatórias não são linearmente relacionados Mas isso não é suficiente pois a correlação mede somente a dependência linear entre e É preciso que não tenha relação com qualquer função de 54 𝟏 𝟐 𝒌 Hipótese de Média Condicional Zero EXOGENEIDADE EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Implicações CMI Conditional Mean Independence Lembrese que o erro captura todos os fatores que afetam além de É MUITA COISA Imagine esse problema em estudos de finanças e economia por exemplo oEndividamento ftamanho da empresa Empresas pequenas talvez tenham mais restrições financeiras e portanto menos opções de endividamento oPoupança frenda Pessoas que ganham mais têm mais opções entre gastar ou poupar oInvestimento ffluxo de caixa Empresas com mais fluxo de caixa podem ter mais propensão a investir mesmo que esses investimentos não criem valor 55 Causalidade so ocorre se Eux Et e a hipotese da média condicional zero for respeitada Eyx Bo 21x causal e os coeficientes ndo estado viesados se descreve uma relagao media em y causada por mudanas em x o Aumentos em x de a para b é igual a o Eyx b Eyx a o Isso so sera verdadeiro se Eux Ew Eylx a fo fiat Eulx a Eylx b Bo Bib Eulx Db EQ x bEQx a 6ba Elulx b Eulx a Oefeito causal de x em y so ira ocorrer se Eux b Eux a 0 ouse Eux b Eulx a Eu Ou Sela a hipdtese da média condicional zero deve ser respeitada para afirmarmos Causaliaade Por construao a media do residuo da regressao e igual a zero e nao correlacionado com xe nao podemos provar matematicamente que Eux E se sustenta UNIFESP a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 56 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipdotese de Média Condicional Zero Exemplo SalarioHora CMI Conditional Mean Independence 7 a an salariohora By Beducacao Bexperiéncia wu j outros fatores nado observados que afetam o salariohora além de educacao e experiéncia Ainda estamos interessados no efeito de educacao sobre o salariohora mantendo fixos todos os outros fatores que afetam salariohora experiéncia neste caso Isto 6 estamos interessados no pardmetro B Como a experiéncia é apresentada de modo explicito seremos capazes de mensurar o efeito da educacdo sobre salariohora mantendo a experiéncia fixa o Na analise de regressdo simples salariohora By Byeducacao mu que coloca experiéncia no termo de erro p terfiamos que assumir que experiéncia é ndo correlacionada com educacao uma hipdtese ténue Epuleducacao experiéncia 0 o Isso implica outros fatores que afetam salario por hora e nao estao em média relacionados aos anos de educaao formal e aos anos de experiéncia o Portanto se entendermos que aptidao inata é parte de wu entdo sera necessario que os niveis médios de aptiddo sejam os mesmos em todas as combinacdes de educado e experiéncia na populacdo que trabalha Aanalise de regressao multipla permite que muitos fatores observados afetem y o Poderiamos também incluir semanas de treinamento de trabalho anos de permanéncia com o empregador atual medidas de aptiddo e mesmo variaveis demograficas como o numero de irmdos e a educacgdo da mde UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 57 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo CMI Conditional Mean Independence Se as quantidades de fertilizantes são escolhidas independentemente de outras características das áreas então é verdadeiro e então a qualidade média da terra que estaria no termo de erro não dependeria da quantidade de fertilizantes Entretanto se mais fertilizantes forem usados em áreas de terra de melhor qualidade então o valor esperado do erro varia com o nível de fertilizantes e não se sustenta 58 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Estrutura de Capital CMI Conditional Mean Independence 𝒊 𝟎 𝟏 𝒊 Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Lucratividade o Lucratividade e o termo de erro são independentes e não correlacionados o O termo de erro poderia incluir vários fatores como distância da falência Z de Altman Tamanho MB entre outros É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas pouco lucrativas tendem a ter maior risco de crédito o que resultaria pela teoria do tradeoff de estrutura de capital em um menor endividamento risco de crédito que está capturado no termo de erro está relacionado com a lucratividade o Firmas pouco lucrativas tendem a ter menos caixa e liquidez o que resultaria pela teoria do pecking order de estrutura de capital em um menor endividamento liquidez que está capturado no termo de erro está correlacionado com a lucratividade 59 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Investimento CMI Conditional Mean Independence Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Q de Tobin o Q de Tobin e o termo de erro são independentes e não correlacionados É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas com baixo Q de Tobin podem estar em estresse financeiro e por este motivo investem menos estresse financeiro que está capturado no termo de erro está relacionado com o Q de Tobin o Firmas com alto Q de Tobin podem ser menores mais jovens e apresentarem maiores dificuldades de obtenção de fundos para investimento tamanho ou maturidade que estão capturados no termo de erro estão correlacionado com o Q de Tobin 60 Razoes para Endogeneidade ou Violacao da Hipdtese de Média Condicional Zero Raz6es para o erro estar correlacionado com a variavel independente x Uma variavel x endogena é quando seu valor depende da variavel y o Uma variavel x é endogena quando esta relacionada com yu por alguma razao E possivel testar a hipdtese de média condicional zero Eux4 X2X Eu 0 o NAO Por construcdo os residuos tem média zero Eu 0 e nao sao correlacionados com as variaveis independentes x RazOes veremos nas proximas aulas em detalhes o Variaveis Omitidas o Erros de MensuracaoMedida o Simultaneidade EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 61 sao Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Multicolinearidade Otermo variavel independente nao significa que as varidveis sejam em si mesmas independentes no sentido estatistico A maioria das variaveis independentes de uma regressdo multipla estao até certo ponto correlacionadas Poderiamos calcular o coeficiente de correlacdo da amostra para determinar o grau em que as variaveis estado relacionadas Na analise de regressdo multipla o termo multicolinearidade referese a correlacgao entre as variaveis independentes REET observar au as variaveis OMBINACAOTL Rene ser correlacionadas ELAS APENAS NAO PODEM SER Os estatisticos desenvolveram diversos testes para determinar se a multicolinearidade é suficientemente elevada para causar problemas De acordo com teste pratico a multicolinearidade constitui um problema potencial se o valor absoluto do coeficiente de correlacao ultrapassar 07 em qualquer par de variaveis independentes Tempo de Viagem em Horas B BMilhas Percorridas BLitros de Combustivel Consumidos Obviamente Milhas Percorridas e Litros de Combustivel Consumidos estado altamente correlacionados Suponhamos que a partir do teste tem f ndo consigamos rejeitar Hy B 0 Esse resultado significa que o tempo de viagem nao esta relacionado com as milhas percorridas Nao necessariamente O que provavelmente significa que com litros de combustivel consumidos ja estando no modelo as milhas percorridas nado contribuiram significativamente para determinar o tempo de viagem Neste exemplo se soubermos a quantidade de gasolina consumida nao obtemos muita informacao adicional util para prever o tempo de viagem ao sabermos as milhas percorridas UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 62 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Multicolinearidade Perfeita Quando Ocorre Quando uma variável é um múltiplo constante da outra o Um pesquisador inadvertidamente coloca a mesma variável medida em unidades diferentes dentro da equação de regressão Mesma variável com diferentes unidades de medida Quando uma variável independente pode ser expressa como uma função linear exata de duas ou mais outras variáveis independentes o Suponha que queremos estimar o efeito dos gastos de campanha sobre os resultados da campanha Por simplicidade suponha que cada eleição tenha dois candidatos Seja a percentagem de votos do Candidato A seja os gastos de campanha do Candidato A seja a percentagem de votos do Candidato B seja os gastos de campanha do Candidato B seja os gastos totais de campanha o A multicolinearidade perfeita ocorre porque o Não é possível manter a interpretação certeris paribus pois um aumento em ou gera simultaneamente um aumento em A solução para a colinearidade perfeita é simples retire uma das variáveis do modelo 63 Estimativa da Variancia do Modelo 02 Do modelo de regressdo e de sua suposiao podemos concluir que o a variancia do residuo ou erro também representa a variancia dos valores de y nas proximidades da reta de regressao Assim a SSE Soma dos Quadrados dos Residuos SSE Sum of Squares due to Errors uma medida de variabilidade das observacoes reais em torno da reta de regressao estimada O erro médio quadratico MSE Mean Squared Error fornece a estimativa de a7 Toda soma de quadrados esta associada a um grau de liberdade Os estatisticos denotam que SSE tem nk 1 graus de liberdade porque p parametros coeficientes das variaveis independentes devem ser estimados para que se possa calcular SSE Desta forma a média quadratica é calculada dividindose SSE por nk 1 graus de liberdade Erro Médio Quadratico Estimativa de o7 iW a CY DG se 7D nk1 nk1 Erro Padrao do Modelo SSE XQi i nk1 nk1 UNIFESP a a a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 6A ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variancia Amostral e Erro Padrao de B Variadncia da Estimativa ecu z VarB lepB an oC ea SD Erro Padrdo da Estimativa Desvio Padrado oO ST n ay y Nala a Car isp R Rquadrado da regressao de x com todas as outras variaveis independentes incluindo o intercepto sendo x a variavel dependente Quanto maior for o erro padrao do coeficiente estimado epB menor sera a estatistica de teste t e mais dificil 6 rejeitar a hipdtese nula H para demonstrar significancia estatistica da variavel EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 65 one Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variancia Amostral de B variancias altas estimadores menos precisos Objetivo minimizar a variancia pata aumentar a probabilidade de rejeitar Ho Variancia da Estimativa 5 o Variancia do erro oO Tae EE Quanto mais ruido na x X 1 R7 equacdo maior o Visto omo melhorar Hae F 7 j 2 rg we que 0 uma caracteristica Aumentando a quantidade de variaveis da populacdo ela nado tem diminui o erro mas aumenta 2 YP xy x Soma dos nadaa ver com o tamanho multicolinearidade Quadrados Totais SQT de a amostra Quanto menor melhor cada variavel dependente Mede a variado total em xj Como melhorar Quanto maior melhor eee 2 1 Suprimir variaveis independentes 1 Rj Rquadrado da regressdo de x com o risco de viés com todas as outras variaveis sae Como melhorar j 2 Processar analise fatorial se a independentes incluindo o intercepto Aumentando o sendo x a variavel dependente apropriado tamanho da amostra J oe a Controvérsia multicolinearidade Multicolinearidade pode nado ser um Quanto menor melhor problema dependendo da variancia do erro e do SQT de x UNIFESP a vor I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 66 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variáveis IndependentesExplicativas Irrelevantes O que acontece se incluirmos no modelo uma variável independente que não deveria estar no modelo oNós estimamos oMas o modelo real deveria ser estimamos Resposta oAinda teremos estimadores consistentes para todos os coeficientes e onde oMas os erros padrão poderão estar sobrestimados mais altos tornando mais difícil de rejeitar a hipótese nula de que o coeficiente é igual a zero tornado mais difícil assim encontrar significância estatística 67 Multicolinearidade Quanto menor melhor pois menor Variaveis IndependentesExplicativas Irrelevantes serd o erro padrao sp J Se R 1 entdo temos Erro Padrdo Desvio Padrdo multicolinearidade perfeita e o denominador da fracao é zero alee significa que x uma combinaao y n aw 2 linear perfeita de algumas das area w x 1 7 R outras variaveis independentes da regressdo O que acontece se incluirmos no modelo uma variavel independente x que nao deveria estar no modelo o Nos estimamos y Bo f1X1 B2oxX2 U o Mas o modelo real deveria ser estimamos y fy Bx p Ou seja Bz 0 Adicionar mais variaveis pode nao ser uma boa ideia se as variaveis tiverem alta correlagao com as demais E dificil segregar efeitos em y de variaveis com alta correlacdo entre si Por isso temos que evitar adicionar variaveis ao modelos se elas sao irrelevantes para explicar y e com alta correlagao com as demais EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 68 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mais sobre Multicolinearidade Nas ciéncias sociais em que somos geralmente coletores passivos de dados nao ha uma boa maneira de reduzir as variancias dos estimadores nao viesados que nao seja coletar mais dados Para um determinado conjunto de dados podemos tentar num esforeo para reduzir a multicolinearidade suprimir outras variaveis independentes do modelo Infelizmente suprimir uma variavel que pertence ao modelo podo levar a viés no estimador o Variavel omitida fara com que 0 erro p esteja relacionado com alguma variavel independente violando a hipdotese da média condicional zero Um elevado grau de correlacao entre certas variaveis independentes pode ser irrelevante no que diz respeito a quao bem podemos estimar outros parametros do modelo Y Bo B1X1 B2x2 P3x3M Em que x2 e X3 sao altamente correlacionados Entao VarB2 e VarBs podem ser randes mas o valor da correlacao entre x e X23 nao tem efeito direto sobre Var 2 x3 1 hn a 2 Sex é nao correlacionado com x e x3 entdo R 0e VarB oT xy x Se 0 parametro de interesse realmente ndo devemos nos preocupar com o valor da correlacao entre Xx e X3 UNIFESP a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 69 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mais sobre Multicolinearidade Fator de Inflagao de Variancia FIV VIF Variance Inflation Factor NAO PODEMOS ESPECIFICAR QUANTA CORRELACAO ENTRE AS VARIAVEIS EXPLICATIVAS E DEMASIADA o Alguns diagnosticos de multicolinearidade sao estatisticas abrangentes para detectar um forte relacionamento linear entre quaisquer subconjuntos de variaveis explicativas o Pelas razdes que acabamos de ver tais estatisticas sao de valor questionavel porque elas podem mostrar um problema simplesmente porque duas variaveis de controle cujos coeficientes ndo nos importam sao altamente correlacionadas Um pouco mais uteis mais ainda propensas a serem mal empregadas sao as estatisticas de coeficientes individuais A mais comum delas e o Fator de Inflacgdo de Variaveis FIV o OFIVdo B é simplesmente 11 R5 ou seja precisamente o termo em VarB que é determinado pela correlagao entre x e as outras variaveis explicativas o O FIV 0 fator pelo qual VarB é mais alto porque x é correlacionado com todas as outras variaveis explicativas o Se pudéssemos escolher gostariamos que FIV fosse menor mas raramente temos escolha o Adeterminagao de um valor de corte para o FIV acima do qual concluiremos que a multicolinearidade 6 um problema é arbitraria e nado é de grande ajuda Algumas vezes o valor 10 é escolhido Se FIV for maior do que 10 significa que R sera maior do que 09 o Mas um FIV acima de 10 nao significa que o desviopadrao de Bsera grande demais para ser util pois o desviopadrao Z x n 714 também depende de oa desviopadrao do modelo e de haley x soma dos quadrados totais e esta ultima pode ser aumentada com o aumento do tamanho da amostra o Senosso interesse é no efeito causal de x em y entao devemos ignorar inteiramente os FIVs de outros coeficientes UNIFESP ne a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 70 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Multicolinearidade Key Takeaways MULTICOLINEARIDADE NAO CAUSA VIES NOS ESTIMADORES Nao inclua controlesvariaveis independentes que possuem alta correlacao com outras variaveis independentes se elas nao forem necessarias Eux1X2X Eu 0 sem elas o Sera mais dificil rejeitar a hipotese nula Hy de que o coeficiente é igual a zero dado o maior erro padrao e portanto mais dificil sera demonstrar a significancia estatistica da variavel Apenas inclua variaveis de controleindependentes mesmo com alta correlacao com as demais variaveis independentes se Eux1X2X Ew 0 nao for verdadeiro o Uma amostra maior pode ajudar a reduzir 0 erro padrao EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 1 ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Inferéncia Estatistica De forma geral nos estudos em financas queremos testar se Ho B 0 Hy B x 0 Porem outras hipoteses nulas sao possiveis ex f 1 Se Hg for rejeitada concluiremos que B 0 e que existe uma relacao estatisticamente significativa entre as duas variaveis Entretanto se Hy nao puder ser rejeitada teremos evidéncias insuficientes para concluir que existe uma relacao significativa Portanto temos que torcer para que a hipotese nula seja rejeitada o Para mostrar que ha relacao entre a variavel independente x ea dependente y EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 7 ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste de Hipotese teste t para B Teste Bicaudal Teste Unicaudal Superior Teste Unicaudal Inferior Ho B Batvo Ho B Bato Ho Bj Bato Hipo poteses Ha B a Batvo Le Pay erie 1 Pre oF a are n de B é igual a um valor B menor ou igual a um B é maior ou igualaum observagoes hipotético valor hipotético valor hipotético k n de var Regido Critica tw is oe independentes Rejeiczo de Ho Regiao Critica Regiao Critica A Rejeicao de Ho Rejeicao de Hy nk1 an a herded f liberdade Nao Rejeita Hy So Rejeita H No Rejeita H EE A i B Batvo B Batvo B Batvo B Batvo t a2n2 t a2n2 t Can2 t Ca n2 Estatistica de Teste t Bj Bato Bj Batwo a ae a Bi Bato SLC FG 2CD 2 Regra de Rejeido Rejeitar Hy se Rejeitar Hg se Rejeitar Ho se Critério do pvalor pvalor a pvalor a pvalor a Regra de Rejeido Rejeitar Ho se Rejeitar Hg se Rejeitar Ho se Critério do Valor Critico t 2n2 Ut S te2n2 t tan2 Valor t tyn2 Regra de Rejeiao Rejeitar Ho se Batvo estiver Rejeitar Hy se B ayo estiver Rejeitar Ho se Bayo estiver intervalo de Confianga fora do Intervalo de Confianga fora do Intervalo de Confiana fora do Intervalo de Confianga a EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 73 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste de Hipotese teste t para B Teste Bicaudal Teste Unicaudal upeor Ete Anicaudal Inferior Ho B Batvo Ho B mr ol Bawo Hipoteses H i sWwo sbservarbes Bj é aie m valor Syne Pe rom ck cM oler Ue Tg iguagrum ben de var P mais restritivo que o independentes unicaudal ou seja 6 mais n k 1 dificil rejeitar Hy no teste graus de bicaudal pelo fato da area liberdade Nao Rejeita Hy de rejeicao nas I extremidades da curva ser a metade do tamanho Estatistica de Teste t Oe heheheh t unicaudal a na pratica o ncara de Reieicd mt teste unicaudal é mais ie Critério do pvalor evalor at p MeL a if i Regra de Rejeicdo Rejeitar Hy se Rejeita s rHo Critério do Valor Critico t te2n2 0Ut te2n2 t v y an IN or ten2 Regra de Rejeido Rejeitar Ho se Baivo estiver Rejeitar Ho se B ap esti jeitaNH 9 se Bayo estiver inter valo de Confiana fora do Intervalo de Confianca fora do Intervalo de Confiafica ford do Intervalo de Confiana TT EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 7 en heer Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior e wT e e Teste de Hipoteses dos Coeficientes e e e n e wa e n e Significancia Estatistica e Econdmica Ocoeficiente 6 é estatisticamente significante ou significativo o Geralmente usamos este termo estatisticamente significante ou estatisticamente significante para dizer que com um nivel de significancia a o coeficiente f 6 diferente de zero o Significancia estatistica depende do tamanho de eB o Colocar muita énfase sobre a significancia estatistica pode levar a conclusdo falsa de que uma variavel é importante para explicar y embora seu efeito estimado seja moderadopequeno Os coeficientes podem ser estatisticamente significantes mas podem ser economicamente pequenos baixo impacto econdémico o Sempre verifique a significancia econdmica tamanho e sinal dos coeficientes estimados B Qual o tamanho da variacdo em y por mudangas em x IMPORTANTE Esta magnitude é plausivel Se ndo for vocé deve ter tido algum problema de especificagdo no modelo o Pode ocorrer baixa significancia econémica com significancia estatistica em grandes amostras 0 erro padrdo diminui ou em casos de muita variancia em x Os coeficientes podem ser economicamente significantes mas estatisticamente nado significantes o Nao podemos afirmar que sdo diferentes de zero o Pode ocorrer com amostras pequenas e com pouca variacdo em x o Cuidado Erropadrdo alto que diminui a significancia estatistica também pode ser devido a multicolinearidade o Seumavariavel nao é estatisticamente significante nos niveis usuais 10 5 ou 1 vocé poderia perguntar ainda se a variavel tem o efeito esperado sobre y e se tal efeito é economicamente significante Se ele é grande voce deve calcular um pvalor para a estatistica t UNIFESP ne a a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 75 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Significancia Estatistica e Econdmica Exemplo 1 Queremos estimar o efeito de uma taxa de contribuiao para um plano taxcont sobre a taxa de participacao taxap dos trabalhadores nos planos de pensdo de contribuicao definida existentes nos Estados Unidos A taxa de contribuiao é a quantidade com a qua a firma contribui para um fundo de trabalhadores para cada dolar de contribuido do trabalhador até certo limite assim taxcont 075 significa que a firma contribui com USS 075 para cada dolar contribuido pelo trabalhador A taxa de participaao é a percentagem de trabalhadores habilitados a ter uma conta no plano de pensao totemp e uma medida de tamanho da empresa medida pelo numero de empregados taxap Bo Btaxcont Bidade B3totemp taxap 8029 5 44taxcont 0269idade 000013totemp Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 8029428539 0777695208 1032464706 0 7876882403 8181974675 taxacont 5441432564 0524408596 1037632222 200817E24 4412796873 6470068255 idade 0269407284 004514857 5967127681 299497E09 0180847655 0357966913 totemp 00012978D 000129781 367184E05 3534503198 0000420703 0000201805 577576E05 Todas as variaveis sdo estatisticamente significantes pvalor a de 1 Qual o tamanho em um sentido econdmico do coeficiente de totemp Mantendo fixo taxcont e idade se uma firma cresce em 10000 empregados a taxa de participagdao cai em 13 pontos percentuais 10000000013 Isso um crescimento enorme no numero de empregados com um efeito somente modestobaixo na taxa de participacdo Assim embora o tamanho da firma afete de fato a taxa de participadao o efeito econdmico nado é grande UNIFESP a a ce a TT EPPEN Escola Paulista de Politica Economia e Negdcios Curso de Ciéncias Contabeis 76 oan peer Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comparagao entre dois coeficientes 6 Em aplicagoes praticas devemos frequentemente testar hipoteses que comparam os coeficientes f Para ilustrar consideraremos um modelo simples para comparar os retornos da educacao de cursos superiores profissionalizantes de dois anos cP junior colleges e de cursos superiores de quatro anos fouryear colleges univ por simplicidade vamos nos referir ao ultimo como universidades A populacdo inclui as pessoas com ensino médio completo que trabalham Insalariohora By Bycp B2univ B3exper oO cp éonumero de anos frequentados em um curso superior profissionalizante de dois anos o univ éo numero de anos frequentados em um curso superior de quatro anos O exper sao os meses na fora de trabalho o Note que qualquer combinacao de curso profissionalizante e curso universitario de quatro anos é permitida incluindo cp O e univ 0 A hipotese de interesse é se o impacto no salariohora de um ano adicional de curso profissionalizante é equivalente ao impacto no salariohora a um ano adicional na universidade Ho By Bo Ha Bi B2 UNIFESP a a a a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 77 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comparagao entre dois coeficientes 6 Insalariohora By Bycp B2univ B3exper A estatistica t baseada em se a diferenca estimada 6 fz suficientemente menor ou maior que zero para assegurar a rejeicao da hipotese nula Ho Ba B Para considerar o erro de nossos estimadores padronizamos essa diferenca ao dividi a pelo erro padrao bend n de var a n de LO independentes a Bi B2 observacdes kK1 epB B2 graus de liberdade Aestatistica t é baseada em se a diferenca estimada P 2 é suficientemente menor ou maior que zero para assegurar a rejeicdo da hipdtese nula Hp 6 fz Para considerar o erro de nossos estimadores padronizamos essa diferenca ao dividila pelo erro padrdo epf fz Uma vez que temos a estatistica t o teste segue 0 mesmo procedimento que vimos Escolhemos um nivel de significancia para o teste com base nos graus de liberdade obtemos um valor critico Se a estatistica de teste estiver dentro da area de rejeicdo rejeitamos a hipdtese nula Ho 6 Bz Ou entao calculamos o pvalor a partir da estatistica t e o comparamos com o nivel de significdancia a Se pvalor for inferior ao nivel de significancia a rejeitamos a hipdotese nula Ho 6 fo UNIFESP a ca a I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 73 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior ww e e e eT be Comparacao entre dois coeficientes B t epBi B2 7 a a Insalariohora Bo Bicp B2univ B3exper Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 0 1431040848 1513610255 cp 0066696724 0006828794 9766984279 219304E22 0053310137 0080083312 univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 cpeuniv tem ambos os efeitos econdmico e estatistico significantes sobre o salario por hora Mas estamos mais interessados em testar se a diferenca estimada dos coeficientes 6 fz é estatisticamente significante Bx B2 00102 De modo que o retorno de um ano em um curso profissionalizante 6 cerca de um ponto percentual menor que um ano na universidade Infelizmente os resultados da regressdo nao contém informacoes suficientes para obter o erropadrao epB Be Como calcular CovB 1 Bz a Alguns programas estatisticos CTA CE B2 CTA ED VarB2 2CovB4 ee fazem esta conta Aqui iremos epx Varx usar uma abordagem alternativa a a x 2 m v2 mais simples porém eficaz para CaO EN wy B2 BaCn lepB2 wy ZCovB B2 tentar estimas a significancia estatistica da diferenca UNIFESP A ce a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 79 sao Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comparacao entre dois coeficientes B Insalariohora Bo By p B2univ B3exper Definiremos um novo parametro 6 como sendo a diferenca entre 8 B 0 61 B2 Desta forma nossas hipoteses nula e alternativa e a estatistica de teste t serdo hy 0 0 a A Pe ep0 Como 0 8B B2 podemos também escrever By 0 Br Substituindo B na equacdo temos Insalariohora Bo 0 Bocp Buniv B3exper Insalariohora Bo 0cp B2cp univ B3exper A ideia fundamental é que o parametro 04 cuja hipdtese estamos interessados em testar multiplica agora a variavel cp Mais importante ha uma nova variavel multiplicando 62 que é a soma de cp univ Assim se quisermos estimar diretamente entao devemos construir a nova variavel cp univ e incluila no modelo de regressao no lugar de univ UNIFESP a L cn a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 80 ee Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior RI e e e H 0 Comparacao entre dois coeficientes B 7 Pe 0 a Insalariohora By 6cp B2cp univ B3exper Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 O 1431040848 1513610255 cp 0066696724 0006828794 9766984279 219304E22 0053310137 0080083312 univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 O 1431040848 1513610255 cp univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 Note que 0 00102 exatamente a diferencga entre 6 Bz calculada anteriormente Bo Bz e Bz permanecem os mesmos assim como seus errospadrdo e assim deve ser Essa é uma maneira de checar se a equacao transformada foi apropriadamente estimada Como pvalor 01422 ou 1422 da estatistica t da estimativa 8 maior do que o nivel de significancia nado podemds rejeitar Hp8 0 ou seja nao podemos concluir que ha diferenca estatistica entre B e Bz Ou seja nado podemos concluir que ha diferena no impacto no salariohora entre um ano adicional de educacao profissionalizante e universitaria neste caso UNIFESP a a a a TT EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 21 aoe Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restricdes Lineares Gerais e Na regressao linear simples o teste te o teste F produzemamesma conclusdo ou seja se a hipotese nula for rejeitada concluiremos que 6 0 e Na regressao multipla o teste t e o teste F tem propositos diferentes 1 Oteste Fe utilizado para determinar se existe uma relaao significativa entre a variavel dependente e o conjunto de todas as variaveis independentes Referimo nos ao teste F como teste de significancia global 2 Seo teste F exibir uma significancia global o teste t e usado para determinar se cada uma das variaveis independentes individuais e significativa Um teste t e realizado para cada uma das variaveis independentes do modelo Referimonos a cada um desses testes t como teste de significancia individual Ho By B2 B 9 HUm ou mais parametros nao sao iguais a zero Se Ho for rejeitada o teste nos da suficientes evidéncias estatisticas para concluirmos que um Ou Mais dos parametros nado sao iguais a zero e que a relacao global entre y e o conjunto de variaveis independentes x1 X2 X significativa Entretanto se Hy nao puder ser rejeitada nao teremos evidéncias suficientes para concluir que uma relacado significativa esta presente EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 32 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restricdes Lineares Gerais Tabela Fonte Soma dos Quadrados Graus de Liberdade Quadrado Médio a k SSR YO 5 ssR y MSR 2t Regressao iW n varidveis Independentes k k Erros 2 SSE XO i SSE i i k1 MSE Residuos Mi Mi nk1 nk1 Total SST 0 y n1 Estatistica de Teste MSR R2 i an a MSE 1 R k EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 33 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restrições Lineares Gerais Distribuição Amostral de MSRMSE F 84 Não Rejeitar H0 Não Rejeitar H0 Rejeitar H0 Rejeitar H0 F a 𝑭𝜶 Valor Crítico no Excel Distribuição F INVF1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Português FINV1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Inglês k graus de liberdade no numerador n k 1 graus de liberdade no denominador Rejeitar 𝑯𝟎 quando p valor 𝜶 ou quando a estatística de teste F é superior ao F crítico Valor Crítico dado uma Distribuição F Valor Crítico dado uma Distribuição F pvalor da Estatística F no Excel DISTFEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Português FDISTEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Inglês EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restrições Lineares Gerais Teste F no Excel 85 Tabela ANOVA Teste 𝑭 Ho Todos os coeficientes 𝜷𝟏 𝜷𝟐 𝜷𝒏 𝟎 zero Estatística do Teste 𝑭 pvalor da Estatística do Teste 𝑭 𝑯𝟎 𝜷𝟏 𝜷𝟐 𝜷𝒌 𝟎 𝑯𝒂 𝑼𝒎 𝒐𝒖 𝒎𝒂𝒊𝒔 𝒑𝒂𝒓â𝒎𝒆𝒕𝒓𝒐𝒔 𝒏ã𝒐 𝒔ã𝒐 𝒊𝒈𝒖𝒂𝒊𝒔 𝒂 𝒛𝒆𝒓𝒐 Rejeitar 𝑯𝟎 quando pvalor 𝜶 ou quando a estatística de teste F é superior ao F crítico SUMMARY OUTPUT Regression Statistics Multiple R 0879095465 R Square 0772808837 Adjusted R Square 0761859865 Standard Error 0148142268 Observations 88 ANOVA df SS MS F Significance F Regression 4 6196075706 1549018926 7058277758 645207E26 Residual 83 1821528924 0021946132 Total 87 8017604629 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 0263743402 0569664802 0462979986 0644590344 0869296977 1396783781 lnavaliação 1043065443 0151446069 6887372164 10115E09 0741845302 1344285584 quartos 0033839208 0022098313 1531302791 0129497317 0010113447 0077791864 lnterreno 0007437885 0038561495 0192883735 0847521219 0069259378 0084135148 lnárea 0103238445 0138430473 0745778318 0457908275 0378571088 0172094198 Teste de Restricoes de Exlusao Agora queremos testar se um grupo de variaveis tem efeito sobre a variavel dependente Mais precisamente a hipdtese nula é que um conjunto de variaveis nao tem efeito sobre y ja que outro conjunto de variaveis foi controlado o possivel construir um modelo que explica os salarios dos jogadores da principal liga de beisebol dos Estados Unidos Sendo salario o salario total do jogador em 1993 anos corresponde aos anos do jogador na liga jogosano é a média de partidas jogadas por ano rebmed é a média de rebatidas na carreira do jogador runano corresponde a rebatidas para fora do campo mais conhecidas como homeruns que resultaram em pontos por ano e rebrunano corresponde a rebatidas que resultaram em corrida até a proxima base por ano Suponha que queiramos testar a hipotese nula de que uma vez tendo sido controlados anos na liga e jogos por ano as estatisticas que medem o desempenho rebmed hrunano e rebrunano nao tém efeito sobre o salario Essencialmente a hipdtese nula expressa que a produtividade medida pelas estatisticas do beisebol nao tem efeito sobre o salario Insalario Bo Banos Bzjogosano B3rebmed Bhrunano Bsrebrunano A hipotese nula constitui trés restrides de exclusdo conjunto de restricoes multiplas pois estamos colocando mais de uma restricdo sobre os parametros o Se Ho é verdadeira entdo rebmed hrunano e rebrunano nao tem efeito sobre salario Ho B3 Ba Bs 0 Teste de hipdteses multiplas H B3 eou fp eou fp sadoiguaisa zero MUNeeaal eles UNIFESP a a a wath EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 86 sao Meétodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste de Restricoes de Exclusao Exemplo Modelo Irrestrito Conhecer a soma dos quadrados dos residuos ndonosdiz fF tentadortestara hipdtese SUMMARY OUTPUT nada sobre a decisdo quanto a hipotese nula Hy O que nos nula usando as estatisticas f dira algo é saber quanto aumenta a soma dos quadrados e os pvalores das variaveis a dos residuos quando retiramos as variaveis rebmed rebmed Regression Statistics hrunano e rebrunano do modelo Lembrese que a hrunano e rebrunano Multiple R 07923401 soma dos quadrados dos residuos sempre aumenta quando para determinar se cada variavel é R Square retiramos variaveis do modelo esse é um fato algébrico A INDIVIDUALMENTE Adjusted RSquare 0622439762 questdo é saber se esse aumento é significativamente SIGNIFICANTE Standard Error 0726577245 grande relativamente a soma dos quadrados dos residuos oe Observations 353 do modelo com todas as variaveis para garantir arejeicio EssaopcaoNAOE da hipotese nula Ho OE ER PCS ES SOBRE COLOCA RESTRICOES SOBRE ANOVA OS OUTROS PARAMETROS df SS M F Significance F Regression 5 3089891778 6179783555 1170603127 293806E72 Beale indviducie pace t Residual 347 0527914492 testar uma hipotese multipla Total 352 4921755066 pode ser muito enganoso rcfficients StandardError tStat Pvalue lower 95 Upper 95 4 Com base nas estatisticas oefficients Standard Error t Stat Pvalue Lower 95 Upper 95 individuais nenhuma das Intercept 111924183 0288822858 387518439 41873E128 1062435457 1176048203 variaveis de desempenho se anos 0068862639 0012114544 5684294871 278758E08 0045035463 0092689814 mostrou estatisticamente iogosans 00 0002646763 4742439902 302263F06 000734639 00 Q hrunano 0014429484 0016056979 0898642502 0369466246 0017151768 0046010736 erradaC rebrunano 0010765731 0007174961 1500458332 013440503 0003346156 0024877617 UNIFESP I os EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 87 sao Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior SUMMARY OUTPUT Regression Statistics Multiple R 0772704088 R Square 0597071608 Adjusted R Square 059476916 Standard Error 075273119 Observations 353 ANOVA df SS MS F Significance F Regression 2 293864021 1469320105 2593203491 822011E70 Residual 350 1983114856 0566604245 Total 352 4921755066 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1122380399 0108312003 103624748 99657E265 1101077974 1143682825 anos 0071317976 001250501 5703152077 25042E08 0046723559 0095912392 jogosano 0020174478 000134287 1502340873 101913E39 0017533369 0022815587 Teste de Restrições de Exclusão Exemplo Modelo Restrito 88 𝑭 𝑺𝑸𝑹𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝑺𝑸𝑹𝒊𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝑺𝑸𝑹𝒊𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝒏 𝒌 𝟏 𝒒 𝒏 𝒅𝒆 𝒓𝒆𝒔𝒕𝒓𝒊çõ𝒆𝒔 Estatística ou Razão Aumento relativo na soma dos quadrados dos resíduos SQR quando nos movemos do modelo irrestrito para o restrito 𝑘 número de variáveis independentes do modelo irrestrito com todas as variáveis 𝑭 𝟏𝟗𝟖 𝟑𝟏 𝟏𝟖𝟑 𝟏𝟗 𝟏𝟖𝟑 𝟏𝟗 𝟑𝟓𝟑 𝟓 𝟏 𝟑 𝑭 𝟗 𝟓𝟓 Teste de Restricoes de Exclusao k numero de varidveis Exemplo Modelo Restrito independentes do modelo irrestrito com todas as variaveis SUMMARY OUTPUT Estatistica F ou RazGo F Regression Statistics Multiple R 0772704088 rae Carer a Sao nk1 R Square 1 R oe strito q nde restricées Adjusted RSquare 059476916 iene Standard Error 075273119 Observations 353 ANOVA df SS MS F Significance F F 0 6278 05971 6278 0 5971 35351 7571 Regression 2 293864021 1469320105 2593203491 822011E70 1 0 6278 3 Residual 350 i9g3114856 Jos66604245 Total 352 4921755066 F955 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1122380399 0108312003 103624748 99657E265 1101077974 1143682825 anos 0071317976 001250501 5703152077 25042E08 0046723559 0095912392 jogosano 0020174478 000134287 1502340873 101913E39 0017533369 0022815587 Podemos calcular a estatistica F usando os coeficientes de determinacado R dos modelos uma vez que os mesmos sempre estardo entre zero e um enquanto a soma dos quadrados dos residuos podem ser muito grandes dependendo da unidade de medida de y torando os calculos maiores UNIFESP TT EPPEN Escola Paulista de Politica Economia e Negocios Curso de Ciéncias Contabeis 39 aoe Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior ANOVA Distribuição Amostral de MSRMSE 90 Não Rejeitar H0 Não Rejeitar H0 Rejeitar H0 Rejeitar H0 F Valor Crítico dado uma Distribuição F Valor Crítico dado uma Distribuição F a 1 𝑭𝜶 Valor Crítico no Excel Distribuição F INVF1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Português FINV1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Inglês q n de restrições graus de liberdade no numerador n k 1 graus de liberdade no denominador 4 Rejeitar 𝑯𝟎 quando p valor 𝜶 ou quando a estatística de teste F é superior ao F crítico pvalor da Estatística F do Excel DISTFEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Português FDISTEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Inglês EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Variável Dependente claramente identificada titulada Variáveis Independentes claramente identificadas tituladas Coeficientes e seus respectivos errospadrão estatística t e estrelas indicando seu nível de significância estatística o significante com α 001 1 o significante com α 005 5 o significante com α 01 10 o Não colocar estrelas quando não há significância estatística Número de observações em cada regressão 91 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Explicando Resultados de Regressões FOCO NO QUE É O PRINCIPAL Foque nas variáveis de interesse oIndique seu sinal magnitude significância estatística e econômica interpretação etc oNão perca tempo com outros coeficientes a menos que eles tenham dado um resultado estranho fora do esperado sinal oposto ao esperado magnitude enorme etc Não reporte resultados e regressões em tabelas que você não irá discutir eou mencionar oSe não é importante o suficiente para mencionar ou discutir não é importante suficiente para estar em uma tabela 92 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Exemplo 93 Fonte Gubbi S R Aulakh P S Ray S Sarkar M B Chittoor R 2010 Do international acquisitions by emergingeconomy firms create shareholder value The case of Indian firms Journal of International Business Studies 413 397418 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior josecarreraunifespbr 94 Obrigado Dúvidas