·
Ciências Contábeis ·
Métodos Quantitativos Aplicados
Send your question to AI and receive an answer instantly
Recommended for you
51
Métodos Quantitativos Aplicados - Comparações Envolvendo Médias
Métodos Quantitativos Aplicados
UNIFESP
9
Analise de Regressao Gastos por Aluno vs Desempenho NAEP
Métodos Quantitativos Aplicados
UNIFESP
1
Artigo Cientifico Contabilidade-Governanca-Financas-Metodologia e Resultados
Métodos Quantitativos Aplicados
UNIFESP
56
Teste de Hipótese para a Média - Métodos Quantitativos Aplicados
Métodos Quantitativos Aplicados
UNIFESP
94
Métodos Quantitativos Aplicados: Regressão Linear Múltipla
Métodos Quantitativos Aplicados
UNIFESP
84
Métodos Quantitativos Aplicados: Regressão Linear Simples
Métodos Quantitativos Aplicados
UNIFESP
20
Plano de Aula - Regressão Linear Múltipla e Ajustamento Polinomial - UFMA
Métodos Quantitativos Aplicados
UFMA
13
Lista de Exercícios - Distribuição Normal, Teorema Central do Limite e Intervalos de Confiança
Métodos Quantitativos Aplicados
FUCAPE
4
uma Questao Só
Métodos Quantitativos Aplicados
FIPECAFI
1
Análise de Correspondência e Cluster: Questões e Alternativas
Métodos Quantitativos Aplicados
UMG
Preview text
EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Métodos Quantitativos Aplicados Regressão Linear Múltipla Prof Dr José Marcos Carrera Junior São Paulo Setembro 2023 1 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mini Currículo do Professor Prof Dr José Marcos Carrera Junior Forte experiência em Finanças Corporativas MA Valuation e Controladoria adquirida durante a vida acadêmica e profissional em consultorias boutique de investimento e em grandes multinacionais tendo participado de diversas transações nacionais e internacionais Atualmente é Assessor Financeiro e Professor de Finanças Corporativas Doutor pela Fundação Getulio Vargas FGVEAESP com estágio doutoral na Universidade de Columbia em Nova York Mestre em Administração de Empresas pela Fundação Getulio Vargas FGVEAESP e Mestre em Finanças pela Universidade de São Paulo FEAUSP formado em Administração de Empresas pela Universidade de São Paulo FEAUSP Professor de Métodos Quantitativos Aplicados ao Mercado Financeiro na UNIFESP Universidade Federal de São Paulo FIA FECAP In Company FGV In Company Ibmec In Company MBA EACHUSP e Saint Paul Escola de Negócios e Financial Advisor na Plata Capital Partners e na Pezco Economic Business Intelligence Sócio fundador do Finanças 101 canal no YouTube com vídeos e aulas de finanças e economia Contato josemarcoscjgmailcom 2 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Fonte ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística Aplicada à Administração e Economia 3 WOOLDRIDGE Jeffrey M Introdução à econometria uma abordagem moderna Cengage EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Gastos com ciência espaço e tecnologia vs Suicícios por enforcamento e estrangulamento 4 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Número de pessoas que se afogaram ao cair em piscinas vs Filmes estrelados por Nicolas Cage 5 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Consumo per capita de queijo vs Número de pessoas que morreram enrroladas em seus lençóis 6 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Divórcios em Maine vs Consumo per capita de margarina 7 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Idade da Miss América vs Assassinatos por vapores e objetos quentes 8 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Receita total gerada por videogames vs Doutorados finalizados em ciências da computação nos EUA 9 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Lançamentos aeroespaciais não comerciais no mundo vs Doutorados finalizados em sociologia nos EUA 10 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comsumo per capita de mozzarella vs Doutorados finalizados em engenharia civil nos EUA 11 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Pessoas que se afogaram ao cair de um barco de pesca vs Taxa de Matrimônio em Kentucky 12 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Importações norteamericanas de petróleo da Noruega vs Motoristas mortos em colisões com trens 13 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Consumo per capita de frango vs Importações norteamericanas totais de petróleo 14 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Número de pessoas que se afogaram em piscinas vs Energia gerada em usinas nucleares nos EUA 15 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Carros japoneses de passageiros vendidos nos EUA vs Suicídios por batidas de veículos automotores 16 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Letras da palavra vencedora do concurso norteamericano de soletração vs número de pessoas mortas por aranhas venenosas 17 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Doutorados finalizados em matemática nos EUA vs Urânio estocado nas usinas nucleares norteamericanas 18 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Relação Espúria Relação estatística existente entre duas variáveis mas onde não existe nenhuma relação causaefeito entre elas Essa relação estatística pode ocorrer por pura coincidência ou por causa de uma terceira variável Ou seja neste último caso pode ocorrer que as variáveis A e B sejam correlacionadas porque ambas são causadas por uma terceira variável C É muito difícil explicar fenômenos apenas com duas variáveis CORRELAÇÃO NÃO É CAUSALIDADE 19 Variável A Variável B Variável C Relação Espúria entre A e B EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Vendas de Sorvetes vs Ataques de Tubarões 20 Consumo de sorvete Banhistas mais saborosos Mais atrativos para ataques de tubarões Maior consumo de sorvete com bom tempo Mais pessoas nas praias pelo bom tempo Tanto o consumo de sorvete como os ataques de tubarões crescem quando o tempo é ensolarado mas eles não tem relação de causa e efeito entre si O bom tempo faz com que as pessoas consumam mais sorvete e também frequentem mais as praias levando a mais ataques de tubarões EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Simultaneidade Relação Espúria O gato subiu no telhado Causalidade 21 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Introdução Enquanto a regressão linear simples baseiase no desenvolvimento de uma equação de regressão estimada para descrever a relação entre duas variáveis A desvantagem principal de usar a análise de regressão simples em trabalhos empíricos é o fato de ser muito difícil obter conclusões certeris paribus sobre como 𝑥 afeta 𝑦 o A hipótese fundamental que todos os outros fatores que afetam 𝑦 não são correlacionados com 𝑥 é frequentemente irreal na regressão linear simples A regressão múltipla considera situações que envolvem duas ou mais variáveis independentes o Possibilita considerar mais fatores e geralmente produzem melhores estimativas do que a regressão linear simples A análise de regressão múltipla é mais receptiva à análise certeris paribus pois ela nos permite controlar explicitamente muitos outros fatores que de maneira simultânea afetam a variável dependente 𝒚 o Em razão de os modelos de regressão múltipla acomodarem muitas variáveis explicativas que podem estar correlacionadas esperamos inferir causalidade nos casos em que a análise de regressão simples seria enganosa Naturalmente se adicionarmos mais fatores que são úteis para explicar 𝑦 então mais da variação de 𝑦 poderá ser explicada Assim a análise de regressão múltipla pode ser usada para construir melhores modelos para prever a variável dependente 𝒚 O modelo de regressão múltipla ainda é o veículo mais extensamente usado da análise empírica em economia administração contabilidade e em outras ciências sociais aplicadas Os conceitos de modelo de regressão e equação de regressão linear simples são aplicáveis no caso da regressão múltipla 22 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variável Dependente e Independentes 23 Variável Dependente y Variável Independentes x Variável Explicada Variável de Resposta Variável Prevista Regressando Variável que está sendo prevista Variável aleatória de interesse Comportamento se deseja explicar Depende de outras variáveis Variáveis Explicativas Variáveis de Controle Variáveis Previsoras Regressores Variáveis que utilizadas para prever outra Independentes de outras variáveis Variáveis Aleatórias e Observáveis Modelo de Regressão Múltipla FRP Função de Regressão Populacional x₁ x₂ xₖ Variáveis independentes y β₀ β₁x₁ β₂x₂ βₖxₖ μ Variável dependente Parâmetros do modelo β₀ Constante β₁ β₂ βₖ Coeficientes que descrevem a relação linear de cada variável independente com a variável dependente y Erro μ Variável aleatória não observável que corresponde ao que explica a variabilidade em y que não pode ser explicada pela relação linear entre as variáveis independentes x₁ x₂ xₖ e y Utilizando a análise de regressão podemos desenvolver uma equação mostrando como a variável y está relacionada as variáveis independentes x₁ x₂ xₖ Existe um valor observado de y para cada valor observado de x₁ x₂ xₖ Equação de Regressão Múltipla FRP Função de Regressão Populacional Eyx₁ x₂ xₖ β₀ β₁x₁ β₂x₂ βₖxₖ Valor esperado da Variável dependente y dado x₁ x₂ xₖ Parâmetros do modelo β₀ Constante β₁ β₂ βₖ Coeficientes que descrevem a relação linear de cada variável independente com a variável dependente y x₁ x₂ xₖ Variáveis independentes Se o intercepto β₀ está incluso na equação nada se perde ao assumir que o valor médio e esperado do erro na população é zero Eμ 0 Qualquer valor constante que tenha valor esperado diferente de zero é absorvido pela constante Cada distribuição de valores de y tem seu próprio valor médio ou esperado Ey A média ou valor esperado do erroresíduo μ é zero Equação de Regressão Múltipla Estimada FRA Função de Regressão Amostral Com Base em Dados Amostrais ŷ β₀ β₁x₁ β₂x₂ βₖxₖ ŷ Estimador pontual de Ey dado x₁ x₂ xₖ Parâmetros do modelo β₀ Constante β₁ β₂ βₖ Coeficientes estimados que descrevem a relação linear de cada variável independente com a variável dependente y certeris paribus tudo mais constante x₁ x₂ xₖ Variáveis independentes Se os valores dos parâmetros da população β₀ β₁ β₂ βₖ fossem conhecidos poderíamos utilizar a equação Eyx₁ x₂ xₖ β₀ β₁x₁ β₂x₂ βₖxₖ para calcular o valor médio de y para um dado valor de x₁ x₂ xₖ Na prática os valores dos parâmetros geralmente não são conhecidos e devem ser estimados a partir de dados amostrais Uma variável aleatória simples é usada para calcular as estatísticas amostrais de β₀ β₁ β₂ βₖ que são utilizadas como estimativas dos parâmetros da população β₀ β₁ β₂ βₖ ŷ é o valor médio de y para um dado valor de x₁ x₂ xₖ EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Atenção Importante 28 A análise de regressão NÃO pode ser interpretada como um procedimento para estabelecer uma relação de causa e efeito entre as variáveis Ela só pode indicar como ou em que medida as variáveis estão relacionadasassociadas umas as outras EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior MQO Mínimos Quadrados Ordinários OLS Ordinary Least Squares É um procedimento para o uso de dados amostrais com a finalidade de encontrar a equação de regressão estimada O método dos mínimos quadrados fornece uma equação de regressão estimada que minimiza a soma dos desvios quadrados entre os valores observados da variável dependente e os valores previstos da variável dependente denotados por Este critério dos mínimos quadrados é utilizado para escolher a equação que proporciona o melhor ajuste Na prática o método dos mínimos quadrados é o mais utilizado 29 𝒊 𝒊 𝟐 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Múltipla Interpretação dos Coeficientes 𝟎 𝟏 𝟐 Em que representa anos de educação formal e representa anos de experiência no mercado de trabalho Assim salário por hora é determinado por duas variáveis independentes educação e experiência e por outros fatores não observáveis contidos em Basicamente estamos interessados em saber o efeito do grau de educação sobre o salário mantendo fixos todos os outros fatores que afetam o salário por hora isto é estamos interessados no parâmetro 𝟏 Comparada com uma análise de regressão simples que relaciona com a regressão apresentada remove efetivamente a do termo de erro e a coloca explicitamente na equação queremos ver o efeito de educação no salário por hora CONTROLANDO para a experiência Seremos capazes de analisar o efeito da educação no salário por hora mantendo o nível de experiência fixo ou constante somos capazes de CONTROLAR os efeitos da experiência sobre o salário por hora o Na análise de regressão simples teríamos que assumir que experiência é não correlacionada com educação 31 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Linear no Excel 32 Interpretando os resultados supGPA 129 0453emGPA 00094ACT supGPA nota média em um curso superior emGPA nota média do ensino médio ACT nota do teste de avaliação de conhecimentos para ingresso em curso superior O intercepto de 129 é o valor previsto da nota média de um curso superior supGPA se tanto a nota média do ensino médio emGPA como a nota média na avaliação de conhecimentos para ingresso em curso superior ACT forem iguais a zero Como não é possível encontrar ninguém que esteja no ensino superior com nota média no ensino médio e no exame de avaliação de conhecimentos para ingresso ambas iguais a zero a interpretação do intercepto nessa equação é pouco significativa Como esperado há uma relação parcial positiva entre supGPA e emGPA Mantendo ACT fixo um ponto adicional em emGPA está associado a 0453 de incremento em supGPA Em outras palavras se escolhermos dois estudantes A e B e esses estudantes tiverem a mesma nota ACT mas emGPA do estudante A é um ponto maior que a supGPA do estudante B prevemos que o estudante A tem supGPA 0453 maior que supGPA do estudante B isso não quer dizer nada sobre quaisquer duas pessoas reais mas é a nossa melhor previsão O coeficiente ACT implica mantendo emGPA fixo uma variação de 1 ponto na nota em ACT esteja associada a uma variação de 00094 pontos em supGPA Esse é um efeito pequeno e sugere que uma vez considerado o emGPA a nota do ACT não é um forte previsor de supGPA EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 35 Regressão Linear no Excel Saída de Dados SUMMARY OUTPUT Regression Statistics Multiple R 0553554369 R Square 030642244 Adjusted R Square 0302436362 Standard Error 3084475615 Observations 526 coeficiente de determinação R² coeficiente de determinação ajustado R²ajustado Desvio padrão do modelo σ Número de observações n Estatística do Teste F ANOVA df SS MS F Significance F Regression 3 2194111624 7313705413 7687316837 340586E41 Residual 522 4966302686 9513989821 Total 525 716041431 Tabela ANOVA Teste F Ho Todos os coeficientes β₁ β₂ βₙ 0 zero Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 2872734887 0728964293 3940844447 922474E05 4304799048 1440670725 Escolaridade 059896507 0051283549 1167947779 368135E28 0498217566 0699712573 Experiência 002233952 0012056848 1852849079 0064468176 0001346387 0046025426 TempoCargo 0169268652 0021644607 7820361491 293453E14 0126747411 0211789893 Constante β₀ Coeficientes βₙ Erro Padrão sβₙ desvio padrão dos coeficientes Estatística de Teste t dos coeficientes pvalor dos coeficientes Intervalo de Confiança dos coeficientes EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 34 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados o nota média em um curso superior o nota média do ensino médio o nota do teste de avaliação de conhecimentos para ingresso em curso superior Qual é o impacto na nota média em um curso superior ao se aumentar a nota média do ensino médio em 1 ponto e a nota do teste de avaliação de conhecimentos para ingresso em um curso superior em 1 ponto o o o 4 o 36 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados o nota média em um curso superior o nota média do ensino médio o nota do teste de avaliação de conhecimentos para ingresso em curso superior Qual é o impacto na nota média em um curso superior ao se aumentar a nota média do ensino médio em 2 pontos e a nota do teste de avaliação de conhecimentos para ingresso em um curso superior em 10 pontos o o o o 37 Interpretando os resultados lnsaláriohora 0284 0092educação 00041experiência 0022permanência saláriohora salário por hora em dólares educação anos de educação formal experiência anos de experiência no mercado de trabalho permanência anos com o empregador atual O coeficiente 0092 significa que mantendo a experiência e permanência fixoscontroladosconstantes um ano a mais de educação formal aumenta o valor esperado de lnsaláriohora em 0092 o que se traduz em um aumento aproximado de 92 0092 100 no salário por hora Alternativamente se considerarmos duas pessoas com os mesmos níveis de experiência e permanência no emprego o coeficiente de educação é a diferença proporcional no salário por hora previsto quando seus níveis de educação diferem EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 38 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidado com a interpretação variação vs variação em pontos percentuais Margem de lucro passou de 10 para 9 o 10 de redução 910 1 ou 10 910 o 1 ponto percentual de redução 10 9 Neste caso o coeficiente 086 indica que para 1 ponto percentual de crescimento no Market Share de 20 para 21 por exemplo o ROE sobe em média 086 pontos percentuais de 15 para 1586 por exemplo Neste caso o coeficiente 18501 indica que para 1 ponto percentual de crescimento ROE de 20 para 21 por exemplo o salário do CEO em 1990 sobe em média 18501 mil dólares 39 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Usando a Equação de Regressão Estimada para Estimação e Previsão Os procedimentos para estimar o valor médio de e para prever um valor individual de na regressão múltipla são similares aos da análise de regressão linear simples Para fazer previsão pontuais substituímos valores dados na equação de regressão estimada o e obtemos o o 40 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados 𝒏 𝟐 𝟕𝟐𝟓 𝑹𝟐 𝟎 𝟎𝟒𝟐𝟐 𝟐 o 𝒏𝒑𝒓𝒆𝟖𝟔 número de vezes que determinado homem foi preso em 1986 o 𝒑𝒄𝒐𝒏𝒅 a proporção de prisões anteriores a 1986 que levaram à condenação proxy da probabilidade de um homem ser condenado por um crime o 𝒔𝒆𝒏𝒕𝒎𝒆𝒅 duração média da sentença cumprida por condenação prévia o 𝒑𝒕𝒆𝒎𝒑𝟖𝟔 duração média da sentença cumprida por condenação prévia efeito do confinamento do crime se um indivíduo está na prisão ele não pode ser preso por um crime fora da prisão o 𝒆𝒎𝒑𝒓𝟖𝟔 número de trimestres durante o qual determinado homem ficou empregado em 1986 oportunidades no mercado de trabalho O fato de as quatro variáveis explicativas explicarem somente pouco mais de 4 da variação em npre86 não necessariamente significa que a equação é inútil Ainda que coletivamente essas variáveis não expliquem muito da variação nas prisões é possível que as estimativas sejam confiáveis dos efeitos certeris paribus de cada variável independente sobre Em geral um 𝟐 baixo indica que é difícil prever resultados individuais sobre com muita precisão 45 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Coeficiente de Determinação 𝟐 NÃO SE ASSUSTE COM 𝟐 BAIXOS 46 Nas ciências sociais aplicadas não são incomuns 𝑹𝟐 baixos nas equações de regressão 𝑹𝟐 aparentemente baixo não significa necessariamente que uma equação de regressão é inútil Ainda é possível que a equação forneça uma boa estimativa da relação certeris paribus entre as variáveis se isso é verdade ou não não depende diretamente da magnitude do 𝑹𝟐 Estudantes que estão se defrontando com regressões pela 1ª vez tendem a pôr muito peso na magnitude do 𝑹𝟐 Por enquanto conscientizese de que usar o 𝑹𝟐 como o principal padrão de medida de sucesso de uma análise econométrica pode levar a confusões EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade vs Heterocedasticidade 49 Homocedasticidade Heterocedasticidade 𝑽𝒂𝒓 𝝁 𝒙𝟏 𝒙𝟐 𝒙𝒌 𝑽𝒂𝒓 𝝁 𝝈𝟐 𝑽𝒂𝒓 𝝁 𝒙𝟏 𝒙𝟐 𝒙𝒌 𝒇𝒙𝟏 𝒙𝟐 𝒙𝒌 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade Exemplo 50 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade causa viés NÃO Heterocedasticidade o Afetará os errosdesviospadrão das estimativas o Os erros padrão reportados por programas estatísticos assumem homocedasticidade o Se os erros são heterocedásticos as inferências estatísticas sobre estes erros padrão podem estar incorretas e subestimadas EXOGENEIDADE o ENDOGENEIDADE A violação da hipótese de média condicional zero dos erros é que causa viés nos estimadores o Precisamos respeitar a hipótese de média condicional zero para obter estimadores consistentes o A hipótese de media condicional zero é diferente de homocedasticidade o ENDOGENEIDADE CAUSA VIÉS NOS COEFICIENTES 53 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero EXOGENEIDADE CMI Conditional Mean Independence O erro é independente da média de Se e são não correlacionados logo como variáveis aleatórias não são linearmente relacionados Mas isso não é suficiente pois a correlação mede somente a dependência linear entre e É preciso que não tenha relação com qualquer função de 54 𝟏 𝟐 𝒌 Hipótese de Média Condicional Zero EXOGENEIDADE EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Implicações CMI Conditional Mean Independence Lembrese que o erro captura todos os fatores que afetam além de É MUITA COISA Imagine esse problema em estudos de finanças e economia por exemplo oEndividamento ftamanho da empresa Empresas pequenas talvez tenham mais restrições financeiras e portanto menos opções de endividamento oPoupança frenda Pessoas que ganham mais têm mais opções entre gastar ou poupar oInvestimento ffluxo de caixa Empresas com mais fluxo de caixa podem ter mais propensão a investir mesmo que esses investimentos não criem valor 55 Hipótese de Média Condicional Zero Exemplo SalárioHora CMI Conditional Mean Independence saláriohora B0 B1educação B2experiência μ μ outros fatores não observados que afetam o saláriohora além de educação e experiência Ainda estamos interessados no efeito de educação sobre o saláriohora mantendo fixos todos os outros fatores que afetam saláriohora experiência neste caso Isto é estamos interessados no parâmetro B1 Como a experiência é apresentada de modo explícito seremos capazes de mensurar o efeito da educação sobre saláriohora mantendo a experiência fixa Na análise de regressão simples saláriohora B0 B1educação μ que coloca experiência no termo de erro μ teríamos que assumir que experiência é não correlacionada com educação uma hipótese tênue E μeducação experiência 0 Isso implica outros fatores que afetam salário por hora e não estão em média relacionados aos anos de educação formal e aos anos de experiência Portanto se entendermos que aptidão inata é parte de μ então será necessário que os níveis médios de aptidão sejam os mesmos em todas as combinações de educação e experiência na população que trabalha A análise de regressão múltipla permite que muitos fatores observados afetem y Poderíamos também incluir semanas de treinamento de trabalho anos de permanência com o empregador atual medidas de aptidão e mesmo variáveis demográficas como o número de irmãos e a educação da mãe EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 57 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo CMI Conditional Mean Independence Se as quantidades de fertilizantes são escolhidas independentemente de outras características das áreas então é verdadeiro e então a qualidade média da terra que estaria no termo de erro não dependeria da quantidade de fertilizantes Entretanto se mais fertilizantes forem usados em áreas de terra de melhor qualidade então o valor esperado do erro varia com o nível de fertilizantes e não se sustenta 58 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Estrutura de Capital CMI Conditional Mean Independence 𝒊 𝟎 𝟏 𝒊 Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Lucratividade o Lucratividade e o termo de erro são independentes e não correlacionados o O termo de erro poderia incluir vários fatores como distância da falência Z de Altman Tamanho MB entre outros É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas pouco lucrativas tendem a ter maior risco de crédito o que resultaria pela teoria do tradeoff de estrutura de capital em um menor endividamento risco de crédito que está capturado no termo de erro está relacionado com a lucratividade o Firmas pouco lucrativas tendem a ter menos caixa e liquidez o que resultaria pela teoria do pecking order de estrutura de capital em um menor endividamento liquidez que está capturado no termo de erro está correlacionado com a lucratividade 59 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Investimento CMI Conditional Mean Independence Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Q de Tobin o Q de Tobin e o termo de erro são independentes e não correlacionados É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas com baixo Q de Tobin podem estar em estresse financeiro e por este motivo investem menos estresse financeiro que está capturado no termo de erro está relacionado com o Q de Tobin o Firmas com alto Q de Tobin podem ser menores mais jovens e apresentarem maiores dificuldades de obtenção de fundos para investimento tamanho ou maturidade que estão capturados no termo de erro estão correlacionado com o Q de Tobin 60 Multicolinearidade O termo variável independente não significa que as variáveis sejam em si mesmas independentes no sentido estatístico A maioria das variáveis independentes de uma regressão múltipla estão até certo ponto correlacionadas Poderíamos calcular o coeficiente de correlação da amostra para determinar o grau em que as variáveis estão relacionadas Na análise de regressão múltipla o termo multicolinearidade referese à correlação entre as variáveis independentes É importante observar que as variáveis independentes podem ser correlacionadas ELAS APENAS NÃO PODEM SER PERFEITAMENTE CORRELACIONADAS COMBINAÇÃO LINEAR EXATA Os estatísticos desenvolveram diversos testes para determinar se a multicolinearidade é suficientemente elevada para causar problemas De acordo com teste prático a multicolinearidade constitui um problema potencial se o valor absoluto do coeficiente de correlação ultrapassar 07 em qualquer par de variáveis independentes Tempo de Viagem em Horas β0 β1Milhas Percorridas β2Litros de Combustível Consumidos Obviamente Milhas Percorridas e Litros de Combustível Consumidos estão altamente correlacionados Suponhamos que a partir do teste t em β1 não consigamos rejeitar H0 β1 0 Esse resultado significa que o tempo de viagem não está relacionado com as milhas percorridas Não necessariamente O que provavelmente significa é que com litros de combustível consumidos já estando no modelo as milhas percorridas não contribuíram significativamente para determinar o tempo de viagen Neste exemplo se soubermos a quantidade de gasolina consumida não obtemos muita informação adicional útil para prever o tempo de viagem ao sabermos as milhas percorridas EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 62 Razões para Endogeneidade ou Violação da Hipótese de Média Condicional Zero Razões para o erro estar correlacionado com a variável independente x Uma variável x endógena é quando seu valor depende da variável y Uma variável x é endógena quando está relacionada com μ por alguma razão É possível testar a hipótese de média condicional zero Eμx1 x2 xk Eμ 0 NÃO Por construção os resíduos tem média zero Eμ 0 e não são correlacionados com as variáveis independentes xp Razões veremos nas próximas aulas em detalhes Variáveis Omitidas Erros de MensuraçãoMedida Simultaneidade EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 61 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Multicolinearidade Perfeita Quando Ocorre Quando uma variável é um múltiplo constante da outra o Um pesquisador inadvertidamente coloca a mesma variável medida em unidades diferentes dentro da equação de regressão Mesma variável com diferentes unidades de medida Quando uma variável independente pode ser expressa como uma função linear exata de duas ou mais outras variáveis independentes o Suponha que queremos estimar o efeito dos gastos de campanha sobre os resultados da campanha Por simplicidade suponha que cada eleição tenha dois candidatos Seja a percentagem de votos do Candidato A seja os gastos de campanha do Candidato A seja a percentagem de votos do Candidato B seja os gastos de campanha do Candidato B seja os gastos totais de campanha o A multicolinearidade perfeita ocorre porque o Não é possível manter a interpretação certeris paribus pois um aumento em ou gera simultaneamente um aumento em A solução para a colinearidade perfeita é simples retire uma das variáveis do modelo 63 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variáveis IndependentesExplicativas Irrelevantes O que acontece se incluirmos no modelo uma variável independente que não deveria estar no modelo oNós estimamos oMas o modelo real deveria ser estimamos Resposta oAinda teremos estimadores consistentes para todos os coeficientes e onde oMas os erros padrão poderão estar sobrestimados mais altos tornando mais difícil de rejeitar a hipótese nula de que o coeficiente é igual a zero tornado mais difícil assim encontrar significância estatística 67 Variáveis IndependentesExplicativas Irrelevantes O que acontece se incluirmos no modelo uma variável independente que não deveria estar no modelo Nós estimamos y β0 β1 x1 β2 x2 μ Mas o modelo real deveria ser estimamos y β0 β1 x1 μ Ou seja β2 0 Adicionar mais variáveis pode não ser uma boa ideia se as variáveis tiverem alta correlação com as demais É difícil segregar efeitos em y de variáveis com alta correlação entre si Por isso temos que evitar adicionar variáveis ao modelos se elas são irrelevantes para explicar y e com alta correlação com as demais Multicolinearidade Quanto menor melhor pois menor será o erro padrão Se Rj2 1 então temos multicolinearidade perfeita e o denominador da fração é zero significa que xj é uma combinação linear perfeita de algumas das outras variáveis independentes da regressão Mais sobre Multicolinearidade Nas ciências sociais em que somos geralmente coletores passivos de dados não há uma boa maneira de reduzir as variâncias dos estimadores não viesados que não seja coletar mais dados Para um determinado conjunto de dados podemos tentar num esforço para reduzir a multicolinearidade suprimir outras variáveis independentes do modelo Infelizmente suprimir uma variável que pertence ao modelo podo levar a viés no estimador Variável omitida fará com que o erro μ esteja relacionado com alguma variável independente violando a hipótese da média condicional zero Um elevado grau de correlação entre certas variáveis independentes pode ser irrelevante no que diz respeito a quão bem podemos estimar outros parâmetros do modelo y β0 β1 x1 β2 x2 β3 x3 μ Em que x2 e x3 são altamente correlacionados Então Varβ2 e Varβ3 podem ser grandes mas o valor da correlação entre x2 e x3 não tem efeito direto sobre Varβ1 Se x1 é não correlacionado com x2 e x3 então R12 0 e Varβ1 σ2 Σi1n xij xj2 Se β1 é o parâmetro de interesse realmente não devemos nos preocupar com o valor da correlação entre x2 e x3 Mais sobre Multicolinearidade Fator de Inflação de Variância FIV VIF Variance Inflation Factor NÃO PODEMOS ESPECIFICAR QUANTA CORRELAÇÃO ENTRE AS VARIÁVEIS EXPLICATIVAS É DEMASIADA Alguns diagnósticos de multicolinearidade são estatísticas abrangentes para detectar um forte relacionamento linear entre quaisquer subconjuntos de variáveis explicativas Pelas razões que acabamos de ver tais estatísticas são de valor questionável porque elas podem mostrar um problema simplesmente porque duas variáveis de controle cujos coeficientes não nos importam são altamente correlacionadas Um pouco mais úteis mais ainda propensas a serem mal empregadas são as estatísticas de coeficientes individuais A mais comum delas é o Fator de Inflação de Variáveis FIV O FIV do βj é simplesmente 11 Rj2 ou seja precisamente o termo em Varβj que é determinado pela correlação entre xj e as outras variáveis explicativas O FIVj é o fator pelo qual Varβj é mais alto porque xj é correlacionado com todas as outras variáveis explicativas Se pudéssemos escolher gostaríamos que FIVj fosse menor mas raramente temos escolha A determinação de um valor de corte para o FIV acima do qual concluirermos que a multicolinearidade é um problema é arbitrária e não é de grande ajuda Algumas vezes o valor 10 é escolhido Se FIVj for maior do que 10 significa que Rj2 será maior do que 09 Mas um FIVj acima de 10 não significa que o desviopadrão de βj será grande demais para ser útil pois o desviopadrão também depende de σ desviopadrão do modelo e de Σi1n xij xj2 soma dos quadrados totais e esta última pode ser aumentada com o aumento do tamanho da amostra Se nosso interesse é no efeito causal de x1 em y então devemos ignorar inteiramente os FIVs de outros coeficientes Teste de Hipótese teste t para βj Pelo teste bicaudal ser mais restritivo que o unicaudal ou seja é mais difícil rejeitar H0 no teste bicaudal pelo fato da área de rejeição nas extremidades da curva ser a metade do tamanho α2 da do teste unicaudal α na prática o teste unicaudal é mais utilizado Teste de Hipóteses dos Coeficientes Significância Estatística e Econômica O coeficiente βn é estatisticamente significante ou significativo Geralmente usamos este termo estatisticamente significante ou estatisticamente significante para dizer que com um nível de significância α o coeficiente βn é diferente de zero Significância estatística depende do tamanho de tβ𝑗 Colocar muita ênfase sobre a significância estatística pode levar à conclusão falsa de que uma variável é importante para explicar y embora seu efeito estimado seja moderadopequeno Os coeficientes podem ser estatisticamente significantes mas podem ser economicamente pequenos baixo impacto económico Sempre verifique a significância econômica tamanho e sinal dos coeficientes estimados βj Qual o tamanho da variação em y por mudanças em x IMPORTANTE Esta magnitude é plausível Se não for você deve ter tido algum problema de especificação no modelo Pode ocorrer baixa significância econômica com significância estatística em grandes amostras o erro padrão diminui ou em casos de muita variância em x Os coeficientes podem ser economicamente significantes mas estatisticamente não significantes Não podemos afirmar que são diferentes de zero Pode ocorrer com amostras pequenas e com pouca variação em x Cuidado Erropadrão alto que diminui a significância estatística também pode ser devido a multicolinearidade Se uma variável não é estatisticamente significante nos níveis usuais 10 5 ou 1 você poderia perguntar ainda se a variável tem o efeito esperado sobre y e se tal efeito é economicamente significante Se ele é grande você deve calcular um pvalor para a estatística t Significância Estatística e Econômica Exemplo 1 Queremos estimar o efeito de uma taxa de contribuição para um plano taxcont sobre a taxa de participação taxap dos trabalhadores nos planos de pensão de contribuição definida existentes nos Estados Unidos A taxa de contribuição é a quantidade com a qual a firma contribui para um fundo de trabalhadores para cada dólar de contribuição do trabalhador até certo limite assim taxcont 075 significa que a firma contribui com US 075 para cada dólar contribuído pelo trabalhador A taxa de participação é a percentagem de trabalhadores habilitados a ter uma conta no plano de pensão totemp é uma medida de tamanho da empresa medida pelo número de empregados Todas as variáveis são estatisticamente significantes pvalor α de 1 Qual o tamanho em um sentido econômico do coeficiente de totemp Mantendo fixo taxcont e idade se uma firma cresce em 10000 empregados a taxa de participação cai em 13 pontos percentuais 10000000013 Isso é um crescimento enorme no número de empregados com um efeito somente modestobaixo na taxa de participação Assim embora o tamanho da firma afete de fato a taxa de participação o efeito econômico não é grande Comparação entre dois coeficientes βj lnsaláriohora β0 β1 cp β2 univ β3 exper Definiremos um novo parâmetro θ1 como sendo a diferença entre β1 β2 θ1 β1 β2 Desta forma nossas hipóteses nula e alternativa e a estatística de teste t serão H0 θ1 0 Ha θ1 0 t θ1 epθ1 Como θ1 β1 β2 podemos também escrever β1 θ1 β2 Substituindo β1 na equação temos lnsaláriohora β0 θ1 β2 cp β2 univ β3 exper lnsaláriohora β0 θ1 cp β2 cp univ β3 exper A ideia fundamental é que o parâmetro θ1 cuja hipótese estamos interessados em testar multiplicia agora a variável cp Mais importante há uma nova variável multiplicando β2 que é a soma de cp univ Assim se quisermos estimar diretamente θ1 então devemos construir a nova variável cp univ e incluíla no modelo de regressão no lugar de univ EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 80 Comparação entre dois coeficientes βj lnsaláriohora β0 θ1 cp β2 cp univ β3 exper Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 0 1431040848 1513610255 cp 0066696724 0006828794 9766984279 219304E22 0053310137 0080083312 univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 0 1431040848 1513610255 cp 0010179528 0006935907 146765642 0142244104 002377609 0003417034 cp univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 Note que θ1 00102 exatamente a diferença entre β1 β2 calculada anteriormente β0 β2 e β3 permanecem os mesmos assim como seus errospadrão e assim deve ser Essa é uma maneira de checar se a equação transformada foi apropriadamente estimada Como pvalor 01422 ou 1422 da estatística t da estimativa θ1 é maior do que o nível de significância α não podemos rejeitar H0 θ1 0 ou seja não podemos concluir que há diferença estatística entre β1 e β2 Ou seja não podemos concluir que há diferença no impacto no saláriohora entre um ano adicional de educação profissionalizante e universitária neste caso EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 81 Teste F Teste das Restrições Lineares Gerais Na regressão linear simples o teste t e o teste F produzem a mesma conclusão ou seja se a hipótese nula for rejeitada concluiremos que β1 0 Na regressão múltipla o teste t e o teste F tem propósitos diferentes 1 O teste F é utilizado para determinar se existe uma relação significativa entre a variável dependente e o conjunto de todas as variáveis independentes Referimonos ao teste F como teste de significância global 2 Se o teste F exibir uma significância global o teste t é usado para determinar se cada uma das variáveis independentes individuais é significativa Um teste t é realizado para cada uma das variáveis independentes do modelo Referimonos a cada um desses testes t como teste de significância individual H0 β1 β2 βk 0 Ha Um ou mais parâmetros não são iguais a zero Se H0 for rejeitada o teste nos dá suficientes evidências estatísticas para concluirmos que um ou mais dos parâmetros não são iguais a zero e que a relação global entre y e o conjunto de variáveis independentes x1 x2 xk é significativa Entretanto se H0 não puder ser rejeitada não teremos evidências suficientes para concluir que uma relação significativa está presente EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 82 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restrições Lineares Gerais Distribuição Amostral de MSRMSE F 84 Não Rejeitar H0 Não Rejeitar H0 Rejeitar H0 Rejeitar H0 F a 𝑭𝜶 Valor Crítico no Excel Distribuição F INVF1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Português FINV1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Inglês k graus de liberdade no numerador n k 1 graus de liberdade no denominador Rejeitar 𝑯𝟎 quando p valor 𝜶 ou quando a estatística de teste F é superior ao F crítico Valor Crítico dado uma Distribuição F Valor Crítico dado uma Distribuição F pvalor da Estatística F no Excel DISTFEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Português FDISTEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Inglês EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restrições Lineares Gerais Teste F no Excel 85 Tabela ANOVA Teste 𝑭 Ho Todos os coeficientes 𝜷𝟏 𝜷𝟐 𝜷𝒏 𝟎 zero Estatística do Teste 𝑭 pvalor da Estatística do Teste 𝑭 𝑯𝟎 𝜷𝟏 𝜷𝟐 𝜷𝒌 𝟎 𝑯𝒂 𝑼𝒎 𝒐𝒖 𝒎𝒂𝒊𝒔 𝒑𝒂𝒓â𝒎𝒆𝒕𝒓𝒐𝒔 𝒏ã𝒐 𝒔ã𝒐 𝒊𝒈𝒖𝒂𝒊𝒔 𝒂 𝒛𝒆𝒓𝒐 Rejeitar 𝑯𝟎 quando pvalor 𝜶 ou quando a estatística de teste F é superior ao F crítico SUMMARY OUTPUT Regression Statistics Multiple R 0879095465 R Square 0772808837 Adjusted R Square 0761859865 Standard Error 0148142268 Observations 88 ANOVA df SS MS F Significance F Regression 4 6196075706 1549018926 7058277758 645207E26 Residual 83 1821528924 0021946132 Total 87 8017604629 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 0263743402 0569664802 0462979986 0644590344 0869296977 1396783781 lnavaliação 1043065443 0151446069 6887372164 10115E09 0741845302 1344285584 quartos 0033839208 0022098313 1531302791 0129497317 0010113447 0077791864 lnterreno 0007437885 0038561495 0192883735 0847521219 0069259378 0084135148 lnárea 0103238445 0138430473 0745778318 0457908275 0378571088 0172094198 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior SUMMARY OUTPUT Regression Statistics Multiple R 0772704088 R Square 0597071608 Adjusted R Square 059476916 Standard Error 075273119 Observations 353 ANOVA df SS MS F Significance F Regression 2 293864021 1469320105 2593203491 822011E70 Residual 350 1983114856 0566604245 Total 352 4921755066 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1122380399 0108312003 103624748 99657E265 1101077974 1143682825 anos 0071317976 001250501 5703152077 25042E08 0046723559 0095912392 jogosano 0020174478 000134287 1502340873 101913E39 0017533369 0022815587 Teste de Restrições de Exclusão Exemplo Modelo Restrito 88 𝑭 𝑺𝑸𝑹𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝑺𝑸𝑹𝒊𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝑺𝑸𝑹𝒊𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝒏 𝒌 𝟏 𝒒 𝒏 𝒅𝒆 𝒓𝒆𝒔𝒕𝒓𝒊çõ𝒆𝒔 Estatística ou Razão Aumento relativo na soma dos quadrados dos resíduos SQR quando nos movemos do modelo irrestrito para o restrito 𝑘 número de variáveis independentes do modelo irrestrito com todas as variáveis 𝑭 𝟏𝟗𝟖 𝟑𝟏 𝟏𝟖𝟑 𝟏𝟗 𝟏𝟖𝟑 𝟏𝟗 𝟑𝟓𝟑 𝟓 𝟏 𝟑 𝑭 𝟗 𝟓𝟓 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior ANOVA Distribuição Amostral de MSRMSE 90 Não Rejeitar H0 Não Rejeitar H0 Rejeitar H0 Rejeitar H0 F Valor Crítico dado uma Distribuição F Valor Crítico dado uma Distribuição F a 1 𝑭𝜶 Valor Crítico no Excel Distribuição F INVF1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Português FINV1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Inglês q n de restrições graus de liberdade no numerador n k 1 graus de liberdade no denominador 4 Rejeitar 𝑯𝟎 quando p valor 𝜶 ou quando a estatística de teste F é superior ao F crítico pvalor da Estatística F do Excel DISTFEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Português FDISTEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Inglês EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Variável Dependente claramente identificada titulada Variáveis Independentes claramente identificadas tituladas Coeficientes e seus respectivos errospadrão estatística t e estrelas indicando seu nível de significância estatística o significante com α 001 1 o significante com α 005 5 o significante com α 01 10 o Não colocar estrelas quando não há significância estatística Número de observações em cada regressão 91 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Explicando Resultados de Regressões FOCO NO QUE É O PRINCIPAL Foque nas variáveis de interesse oIndique seu sinal magnitude significância estatística e econômica interpretação etc oNão perca tempo com outros coeficientes a menos que eles tenham dado um resultado estranho fora do esperado sinal oposto ao esperado magnitude enorme etc Não reporte resultados e regressões em tabelas que você não irá discutir eou mencionar oSe não é importante o suficiente para mencionar ou discutir não é importante suficiente para estar em uma tabela 92 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Exemplo 93 Fonte Gubbi S R Aulakh P S Ray S Sarkar M B Chittoor R 2010 Do international acquisitions by emergingeconomy firms create shareholder value The case of Indian firms Journal of International Business Studies 413 397418 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior josecarreraunifespbr 94 Obrigado Dúvidas EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Métodos Quantitativos Aplicados Regressão Linear Simples Prof Dr José Marcos Carrera Junior São Paulo Setembro 2023 1 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mini Currículo do Professor Prof Dr José Marcos Carrera Junior Forte experiência em Finanças Corporativas MA Valuation e Controladoria adquirida durante a vida acadêmica e profissional em consultorias boutique de investimento e em grandes multinacionais tendo participado de diversas transações nacionais e internacionais Atualmente é Assessor Financeiro e Professor de Finanças Corporativas Doutor pela Fundação Getulio Vargas FGVEAESP com estágio doutoral na Universidade de Columbia em Nova York Mestre em Administração de Empresas pela Fundação Getulio Vargas FGVEAESP e Mestre em Finanças pela Universidade de São Paulo FEAUSP formado em Administração de Empresas pela Universidade de São Paulo FEAUSP Professor de Métodos Quantitativos Aplicados ao Mercado Financeiro na UNIFESP Universidade Federal de São Paulo FIA FECAP In Company FGV In Company Ibmec In Company MBA EACHUSP e Saint Paul Escola de Negócios e Financial Advisor na Plata Capital Partners e na Pezco Economic Business Intelligence Sócio fundador do Finanças 101 canal no YouTube com vídeos e aulas de finanças e economia Contato josemarcoscjgmailcom 2 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Fonte ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística Aplicada à Administração e Economia 3 WOOLDRIDGE Jeffrey M Introdução à econometria uma abordagem moderna Cengage EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Introdução As decisões gerenciais muitas vezes se baseiam na relação entre duas ou mais variáveis Objetivo Estudar o efeito que algumas variáveis exercem nas outras o Depois de considerar as despesas com publicidade e vendas um gestor de marketing pode tentar prever as vendas para um dado nível de gastos com propaganda o Um serviço de utilidade pública pode utilizar a relação entre a alta da temperatura diária e a demanda por eletricidade para prever o consumo de eletricidade com base nas altas temperaturas diárias previstas para o próximo mês Às vezes o gestor confia na intuição para julgar como duas variáveis estão relacionadas No entanto se for possível obter dados um procedimento estatístico chamado análise de regressão pode ser utilizado para desenvolver uma equação mostrando como as variáveis estão relacionadas o Explicar uma variável y em termos de outra variável x o Estudar como varia a variável y com variações da variável x 4 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressões Lineares e sua Aplicação Regressão é talvez o modelo mais popular e utilizado em finanças e contabilidade o Transparente e intuitivo o Robusto e de fácil construção o Mesmo não evidenciando causalidade é útil para descrever relações Como pesquisadores estamos interessados em explicar como o mundo das finanças funciona o Como as escolhas da estrutura de capital da empresa são explicadas por suas oportunidades de investimentos o Se as oportunidades de investimento mudarem por alguma razão aleatória como será o impacto médio esperado na estrutura de capital o De maneira mais ampla como a variável aleatória é explicada por outra variável aleatória 5 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variável Dependente e Independente 6 Variável Dependente y Variável Independente x Variável Explicada Variável de Resposta Variável Prevista Regressando Variável que está sendo prevista Variável aleatória de interesse Comportamento se deseja explicar Depende de outras variáveis Variável Explicativa Variável de Controle Variável Previsora Regressor Variável que utilizadas para prever outra Independente de outras variáveis Variáveis Aleatórias e Observáveis EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Modelo de Regressão Linear Simples FRP Função de Regressão Populacional 7 𝟎 𝟏 Consiste em determinar uma função matemática que descreva o comportamento de determinada variável com base em valores de uma ou mais varáveis Utilizando a análise de regressão podemos desenvolver uma equação mostrando como a variável está relacionada a independente Existe um valor observado de para cada valor observado de Variável dependente Observável Parâmetros do modelo Não observáveis 𝟎 Constante 𝟏 Coeficiente Angular ou Inclinação da Reta de Regressão Variável independente Observável Erro Variável aleatória não observável que corresponde ao que explica a variabilidade em que não pode ser explicada pela relação linear entre as variáveis e outros fatores que afetam além de EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Possíveis linhas de regressão linear simples 10 Ey Ey x Inclinação é positiva 𝜷𝟏 𝟎 Reta de Regressão Intercepto b0 Ey Ey x Reta de Regressão Intercepto b0 Ey Ey x Inclinação b1 é zero Reta de Regressão Intercepto b0 Relação Linear Positiva Relação Linear Negativa Nenhuma Relação Um aumento em está relacionado com um aumento em Um aumento em está relacionado com uma redução em Um aumento ou redução em não está relacionado com um aumento ou redução em Inclinação é negativa 𝜷𝟏 𝟎 Não há relação 𝜷𝟏 𝟎 𝟎 𝟏 Equação de Regressão Linear Simples Estimada FRA Função de Regressão Amostral Com Base em Dados Amostrais ŷ𝑏₀𝑏₁𝑥 ŷ Estimador pontual de Ey ou valor estimado de y Parâmetros do modelo 𝑏₀ Constante 𝑏₁ Coeficiente Angular ou Inclinação da Reta de Regressão Variável independente Se os valores dos parâmetros da população 𝛽₀ e 𝛽₁ fossem conhecidos poderíamos utilizar a equação Eyx 𝛽₀𝛽₁𝑥 para calcular o valor médio de y para um dado valor de x Na prática os valores dos parâmetros não são conhecidos e devem ser estimados utilizandose dados amostrais As estatísticas amostrais de 𝛽₀ e 𝛽₁ são calculadas como estimativas dos parâmetros da população e denotados por 𝑏₀ e 𝑏₁ ŷ é o valor médio de y para um dado valor de x ŷ é a estimação por ponto do valor esperado de y Ey para determinado valor de x EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior O processo de estimação na Regressão Linear Simples 12 Modelo de Regressão 𝟎 𝟏 Equação de Regressão E b0 b1x Parâmetros Desconhecidos b0 b1 Dados Amostrais x y x1 y1 xn yn b0 e b1 fornecem estimativas de b0 e b1 Equação de Regressão Estimada Estatísticas Amostrais b0 b1 0 1 ˆy b b x 0 1 ˆy b b x EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Atenção Importante 13 A análise de regressão NÃO pode ser interpretada como um procedimento para estabelecer uma relação de causa e efeito entre as variáveis Ela só pode indicar como ou em que medida as variáveis estão relacionadasassociadas umas as outras EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Definição do modelo de regressão simples Ao escrever um modelo que explicará em termos de defrontamonos com três questões oComo nunca há uma relação perfeita e exata entre duas variáveis como consideraremos outros fatores que afetam oQual é a relação funcional entre e oComo podemos estar certos de que estamos capturando uma relação certeris paribus entre e 14 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Contexto A Armands Pizza Parlors é uma rede de restaurantes de comida italiana localizada em cinco estados norteamericanos As localizações mais bemsucedidas dos restaurantes Armands estão próximos a campi universitários Os gerentes acreditam que as vendas trimestrais nesses restaurantes designadas estão relacionadas positivamente com o tamanho da população estudantil designado Ou seja os restaurantes próximos a campi universitários que contam com uma grande população estudantil tendem a gerar mais vendas que aqueles que estão localizados próximos a campi que contam com uma pequena população estudantil Usando análise de regressão podemos determinar uma equação que mostra como a variável dependente está relacionada com a variável independente 15 Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Dados Foram coletados dados de uma amostra de dez restaurantes Armands Pizza Parlors localizados na proximidades de diversos campi universitários Para cada restaurante da população um valor x da população estudantil corresponde a um valor y de vendas trimestrais Em relação à iésima observação ou restaurante da amostra 𝑥𝑖 é o tamanho da população estudantil em milhares de estudantes e 𝑦𝑖 são as vendas trimestrais do restaurante i em milhares de dólares Notamos que o restaurante 1 com 𝑥12 e 𝑦158 localizase próximo a um campus com 2 mil estudantes e tem vendas trimestrais de US 58 mil Restaurante População de Estudantes em milhares Vendas Trimestrais em milhares de dólares 1 2 58 2 6 105 3 8 88 4 8 118 5 12 117 6 16 137 7 20 157 8 20 169 9 22 149 10 26 202 Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Diagrama de Dispersão Os diagramas de dispersão para análise de regressão são construídos com a variável independente x no eixo horizontal e a variável dependente y no eixo vertical O diagrama de dispersão nos possibilita observar os dados graficamente e tirar conclusões prévias sobre a possível relação entre variáveis Pelo gráfico de dispersão ao lado as vendas trimestrais parecem ser mais elevadas nos campi que possuem maiores populações estudantis Além disso a relação entre o tamanho da população estudantil e as vendas trimestrais parece aproximarse de uma linha reta de fato uma relação linear positiva é indicada entre x e y Por conseguinte escolhemos o modelo de regressão linear simples para representar a relação entre as vendas trimestrais e a população de estudantes Nossa próxima tarefa é usar os dados amostrais para determinar os valores de 𝑏₀ e 𝑏₁ na equação de regressão linear simples estimada ŷ𝑏₀𝑏₁𝑥 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Método dos Mínimos Quadrados Ordinários MQO OLS Ordinary Least Squares É um procedimento para o uso de dados amostrais com a finalidade de encontrar a equação de regressão estimada O método dos mínimos quadrados fornece uma equação de regressão estimada que minimiza a soma dos desvios quadrados entre os valores observados da variável dependente 𝒊 e os valores previstos da variável dependente 𝒊 Este critério dos mínimos quadrados é utilizado para escolher a equação que proporciona o melhor ajuste Na prática o método dos mínimos quadrados é o mais utilizado 18 𝟎 𝟏 𝟎 𝒊 𝒊 Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Diagrama de Dispersão A próxima tarefa é utilizar os dados amostrais para determinar os valores de b0 e b1 na equação de regressão linear simples estimada ŷi b0 b1x o ŷi valor previsto das vendas trimestrais em milhares de dólares para o iésimo restaurante o b0 intercepto em y da reta de regressão estimada o b1 inclinação da reta de regressão estimada o xi tamanho da população estudantil em milhares para o iésimo restaurante Para que a reta de regressão estimada forneça um bom ajuste para os dados queremos que as diferenças entre os valores de vendas observados e os valores de vendas previstos sejam pequenos O método dos mínimos quadrados utiliza os dados amostrais para fornecer os valores de b0 e b1 que minimizam a soma dos quadrados dos desvios entre os valores observados da variável dependente yi e os valores previstos da variável dependente ŷi Min yi ŷi² EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 19 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Inclinação e Intercepto 20 𝟏 𝒊 𝒊 𝒊 𝟐 𝒐 𝟏 Inclinação ou Coeficiente Angular Intercepto ou Constante 𝟎 𝟏 𝒊 valor da variável independente para a iésima observação valor médio da variável independente valor médio da variável dependente 𝒊 valor da variável dependente para a iésima observação Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Inclinação e Intercepto Restaurante População de Estudantes em milhares Vendas Trimestrais em milhares de dólares xi ẋ yi ȳ xi ẋyi ȳ xi ẋ² 1 2 58 12 72 864 144 2 6 105 8 25 200 64 3 8 88 6 42 252 36 4 8 118 6 12 72 36 5 12 117 2 13 26 4 6 16 137 2 7 14 4 7 20 157 6 27 162 36 8 20 169 6 39 234 36 9 22 149 8 19 152 64 10 26 202 12 72 864 144 Média 14 130 284 57 Soma 140 1300 2840 568 b1 xi ẋyi ȳ xi ẋ² bo ȳ b1ẋ b1 2840 568 bo 130 5 14 bo 60 b1 5 ŷ b0 b1x ŷ 60 5x EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 21 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Gráfico da Equação de Regressão Estimada 22 𝟎 𝟏 Intercepto 𝟎 60 Inclinação 𝟏 5 A inclinação da reta de regressão estimada é positiva o que implica que à medida que a população de estudantes aumenta as vendas aumentam Podemos concluir com base nas vendas medidas em milhares de dólares e na população de estudantes em milhares que um aumento de 1 mil na população de estudantes está associado a um aumento médio de US 5 mil nas vendas trimestrais As vendas trimestrais devem aumentar US 5 por estudante incremental Intercepto quais seriam as vendas esperadas caso não houvesse nenhum campus universitário próximo US 60 mil Impacto Marginal Sensibilidade Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Previsão por ponto ŷ b0 b1x ŷ 60 5x A equação fornece uma estimativa da relação entre o tamanho da população estudantil x e as vendas trimestrais y Se acreditarmos que a equação de regressão estimada a partir dos mínimos quadrados descreve adequadamente a relação entre as variáveis x e y parecerá razoável utilizar a equação de regressão estimada para desenvolver uma estimção por ponto do valor médio de y para um dado valor de x ou para prever um valor individual de y correspondente a um determinado valor de x Quais as vendas trimestrais esperadas para um restaurante localizado próximo de um campus com 10000 alunos o ŷ b0 b1x o ŷ 60 5x o ŷ 60 5 10 o ŷ 60 50 o ŷ US 110 mil não quer dizer que as vendas trimestrais serão exatamente US 110 mil muitos outros fatores podem afetar as vendas além do número de estudantes nas proximidades EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 23 Coeficiente de Determinação SSE Soma dos Quadrados dos Resíduos SSE Sum of Squares due to Errors A pergunta agora é quão bem a equação de regressão estimada se ajusta aos dados SSE Soma dos Quadrados dos Resíduos Residuo ou Erro diferença entre o valor observado da variável dependente 𝑦𝑖 e o valor previsto da variável dependente ŷ𝑖 SSE erro em utilizar a equação de regressão estimada para predizer os valores da variável dependente Erro ao se prever pelo modelo estimado Coeficiente de Determinação SST Soma dos Quadrados Totais SST Sum of Total Squares Agora suponha que nos seja pedido para desenvolver uma estimativa das vendas trimestrais sem conhecer o tamanho da população de estudantes Sem o conhecimento de quaisquer variáveis relacionadas usaríamos a média da amostra como uma estimativa de vendas trimestre em qualquer restaurante SST Soma dos Quadrados Total SST soma das diferenças entre a variável dependente observada 𝑦𝑖 e o valor médio ou valor esperado da variável dependente 𝑦 ao quadrado SST erro ao utilizar a média da variável dependente 𝑦 para prever os valores 𝑦𝑖 Erro ao se prever pela média geral Coeficiente de Determinação SSR Soma dos Quadrados devida a Regressão SSR Sum of Squares due to Regression SSE medida de quanto as observações se agrupam bem sobra a reta de regressão Erro ao se prever pelo modelo estimado Resíduo ou Erro 𝑦𝑖 ŷ𝑖 SSR medida de quanto os valores estimados na reta de regressão ŷ afastamse da média 𝑦 Ganho ao se prever pelo modelo estimado em comparação a usar a média geral SST medida de quanto as observações se agrupam bem sobra a linha da media 𝑦 Erro ao se prever pela média geral SQT SQReg SQRes SQReg SQT SQRes SQReg 15730 1530 SQReg 14200 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Coeficiente de Determinação 𝟐 NÃO SE ASSUSTE COM 𝟐 BAIXOS 30 Nas ciências sociais aplicadas não são incomuns 𝒓𝟐 baixos nas equações de regressão 𝒓𝟐 aparentemente baixo não significa necessariamente que uma equação de regressão é inútil Ainda é possível que a equação forneça uma boa estimativa da relação certeris paribus entre as variáveis se isso é verdade ou não não depende diretamente da magnitude do 𝒓𝟐 Estudantes que estão se defrontando com regressões pela 1ª vez tendem a pôr muito peso na magnitude do 𝒓𝟐 Por enquanto conscientizese de que usar o 𝒓𝟐 como o principal padrão de medida de sucesso de uma análise econométrica pode levar a confusões Premissas do Modelo de Mínimos Quadrados y β₀ β₁x μ Amostras aleatórias A variável independente x não pode ser constante constantes são capturados em β₀ Colinearidade não perfeita entre as variáveis independentes A variável dependente y está relacionada à variável independente x e ao erro μ de forma linear Implicação a reta de regressão representada por β₀ β₁x μ é a base para a relação entre as variáveis O termo de erro μ é uma variável aleatória com uma média ou valor esperado igual a zero ou seja Eμ 0 Implicação β₀ e β₁ são constantes por conseguinte Eβ₀ β₀ e Eβ₁ β₁ desse modo para um dado valor de x o valor esperado de y é Ey β₀ β₁x Homocedasticidade A variância de μ designada por σ² é a mesma para todos os valores de x Varμx σ² Implicação A variância de y nas proximidades da reta de regressão é igual a σ² e é a mesma para todos os valores de x Heterocedasticidade implica que as estimativas do modelo MQO não sejam as mais eficientesprecisas Média Condicional Zero Exogeneidade Os valores de μ são independentes Eμx Eε 0 Implicação O valor de μ para um valor em particular de x não está relacionado ao valor de μ para qualquer outro valor de x assim o valor de y para um valor em particular de x não está relacionado com o valor de y para qualquer outro valor de x O termo de erro μ é uma variável aleatória e normalmente distribuída Implicação Uma vez que y é uma função linear de μ y também é uma variável aleatória normalmente distribuída EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade A variância de μ designada por 𝟐 é a mesma para todos os valores de 𝟐 32 O valor esperado de se modifica de acordo com o valor específico considerado de Entretanto independentemente do valor de a distribuição de probabilidade do erro e portanto as distribuições de probabilidade de em qualquer ponto em particular depende de o valor real de ser maior ou menor que o seu valor esperado EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade vs Heterocedasticidade 33 Homocedasticidade Heterocedasticidade EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade Exemplo 34 Plotagem residual em relação a x Os resíduos yᵢ ŷᵢ fornecem a melhor informação sobre o termo de erro μ Portanto uma análise dos resíduos é um passo importante para determinar se as suposições referentes a μ são apropriadas Eμx Eμ 0 Exogeneidade Varμx σ² Homocedasticidade Grande parte da análise residual baseiase em um exame das plotagens gráficas Uma plotagem residual em relação à variável independente x é um gráfico no qual os valores da variável independente x são representados pelo eixo horizontal e os valores residuais correspondentes são representados pelo eixo vertical Para cada resíduo é marcado um ponto no gráfico A primeira coordenada de cada ponto é dada pelo valor de xᵢ e a segunda coordenada é dada pelo correspondente valor do resíduo yᵢ ŷᵢ Se a suposição de que a variância do erro μ é idêntica para todos os valores de x e se o modelo de regressão constituir uma representação adequada da relação entre as variáveis a plotagem residual deverá das a impressão geral de uma faixa horizontal de pontos EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Plotagem residual em relação a Exemplo Armands Pizza Parlors Se a suposição de que a variância do erro é idêntica para todos os valores de e se o modelo de regressão constituir uma representação adequada da relação entre as variáveis a plotagem residual deverá das a impressão geral de uma faixa horizontal de pontos 36 Plotagem residual em relação a ŷ Os resíduos yᵢ ŷᵢ fornecem a melhor informação sobre o termo de erro μ Portanto uma análise dos resíduos é um passo importante para determinar se as suposições referentes a μ são apropriadas Grande parte da análise residual baseiase em um exame das plotagens gráficas Uma plotagem residual em relação à variável dependente y é um gráfico no qual os valores da variável dependente y são representados pelo eixo horizontal e os valores residuais correspondentes são representados pelo eixo vertical Para cada resíduo é marcado um ponto no gráfico A primeira coordenada de cada ponto é dada pelo valor de ŷᵢ e a segunda coordenada é dada pelo correspondente valor do resíduo yᵢ ŷᵢ O padrão dessa plotagem residual é idêntico ao da plotagem residual em relação à variável independente y para uma regressão linear simples Para a regressão múltipla multivariada a plotagem residual em relação à variável dependente y é mais amplamente usada em virtude da presença de mais uma variável independente EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade causa viés NÃO Heterocedasticidade o Afetará os errosdesviospadrão das estimativas o Os erros padrão reportados por programas estatísticos assumem homocedasticidade o Se os erros são heterocedásticos as inferências estatísticas sobre estes erros padrão podem estar incorretas e subestimadas EXOGENEIDADE o A violação da hipótese de média condicional zero dos erros é que causa viés nos estimadores o Precisamos respeitar a hipótese de média condicional zero para obter estimadores consistentes o A hipótese de media condicional zero é diferente de homocedasticidade o ENDOGENEIDADE CAUSA VIÉS NOS COEFICIENTES 38 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero EXOGENEIDADE CMI Conditional Mean Independence O erro é independente da média de Se ε e são não correlacionados logo como variáveis aleatórias não são linearmente relacionados Mas isso não é suficiente pois a correlação mede somente a dependência linear entre e É preciso que não tenha relação com qualquer função de 39 Hipótese de Média Condicional Zero EXOGENEIDADE EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Implicações CMI Conditional Mean Independence Lembrese que o erro captura todos os fatores que afetam além de É MUITA COISA Imagine esse problema em estudos de finanças e economia por exemplo oEndividamento ftamanho da empresa Empresas pequenas talvez tenham mais restrições financeiras e portanto menos opções de endividamento oPoupança frenda Pessoas que ganham mais têm mais opções entre gastar ou poupar oInvestimento ffluxo de caixa Empresas com mais fluxo de caixa podem ter mais propensão a investir mesmo que esses investimentos não criem valor 40 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo SalárioHora CMI Conditional Mean Independence outros fatores não observados que afetam o salário hora além de educação oIsso implica outros fatores que afetam salário por hora e não estão em média relacionados aos anos de educação formal oPortanto se entendermos que aptidão inata é parte de então será necessário que os níveis médios de aptidão sejam os mesmos em todas os níveis de educação 41 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo CMI Conditional Mean Independence Se as quantidades de fertilizantes são escolhidas independentemente de outras características das áreas então é verdadeiro e então a qualidade média da terra que estaria no termo de erro não dependeria da quantidade de fertilizantes Entretanto se mais fertilizantes forem usados em áreas de terra de melhor qualidade então o valor esperado do erro varia com o nível de fertilizantes e não se sustenta 42 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Estrutura de Capital CMI Conditional Mean Independence 𝒊 𝟎 𝟏 𝒊 Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Lucratividade o Lucratividade e o termo de erro são independentes e não correlacionados o O termo de erro poderia incluir vários fatores como distância da falência Z de Altman Tamanho MB entre outros É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas pouco lucrativas tendem a ter maior risco de crédito o que resultaria pela teoria do tradeoff de estrutura de capital em um menor endividamento risco de crédito que está capturado no termo de erro está relacionado com a lucratividade o Firmas pouco lucrativas tendem a ter menos caixa e liquidez o que resultaria pela teoria do pecking order de estrutura de capital em um menor endividamento liquidez que está capturado no termo de erro está correlacionado com a lucratividade 43 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Investimento CMI Conditional Mean Independence Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Q de Tobin o Q de Tobin e o termo de erro são independentes e não correlacionados É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas com baixo Q de Tobin podem estar em estresse financeiro e por este motivo investem menos estresse financeiro que está capturado no termo de erro está relacionado com o Q de Tobin o Firmas com alto Q de Tobin podem ser menores mais jovens e apresentarem maiores dificuldades de obtenção de fundos para investimento tamanho ou maturidade que estão capturados no termo de erro estão correlacionado com o Q de Tobin 44 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Razões para Endogeneidade ou Violação da Hipótese de Média Condicional Zero Razões para o erro estar correlacionado com a variável independente Uma variável endógena é quando seu valor depende da variável o Uma variável é endógena quando está relacionada com por alguma razão É possível testar a hipótese de média condicional zero o NÃO Por construção os resíduos tem média zero e não são correlacionados com as variáveis independentes Razões veremos nas próximas aulas em detalhes o Variáveis Omitidas o Erros de MensuraçãoMedida o Simultaneidade 45 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidado com a Interpretação de Causalidade e Linearidade 55 Relação Real não linear Menor valor observado de 𝑥 Maior valor observado de 𝑥 𝟎 𝟏 A equação é boa entre os valores observados de 𝑥 Dada uma relação significativa devemos nos sentir confiantes em usar a equação de regressão estimada para fazer previsões correspondentes a valores de 𝒙 dentro do intervalo de valores de 𝒙 observados na amostra A menos que outras razões indiquem que o modelo é válido além dessa faixa previsões fora do intervalo da variável independente 𝑥 devem ser feitas com cautela Em relação aos restaurantes Armands Pizza Parlors esse intervalo corresponde a valores de 𝑥 entre 2 e 26 mil estudantes Portanto devemos nos sentir confiantes com 1 de significância em usar a equação de regressão estimada para prever as vendas para os restaurantes em que a população estudantil correspondente está entre 2 e 26 mil estudantes EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Um Modelo Linear Simples do Salário Linearidade implica uma variação de uma unidade em que tem o mesmo efeito sobre independentemente do valor inicial de A inclinação da equação de regressão mencionada acima implica um ano a mais de educação formal aumenta o salário por hora em US 054 de maneira constante tanto para o 1º ano de educação quanto para o 20º ano Isso pode ser irrealista para muitas aplicações econômicas Por exemplo no Salário e Educação poderíamos querer considerar retornos crescentes de modo que o próximo ano de educação teria em relação ao anterior um efeito maior sobre os salários Denotando uma relação exponencial o Provavelmente uma caracterização melhor de como o salário muda com o nível de escolaridade é que cada ano de educação aumenta o salário em uma porcentagem constante Por exemplo um aumento na educação de 5 para 6 anos aumenta o salário em digamos 8 certeris paribus e um aumento na educação de 11 para 12 anos também aumenta o salário nos mesmos 8 62 𝟎 𝟏 Anos de educação formal US por hora EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Um Modelo Linear Simples do Salário Um modelo que gera aproximadamente um efeito constante é utilizando o logaritmo natural da variável de interesse A inclinação da equação de regressão em log acima implica um ano a mais de educação formal aumenta o salário por hora em aproximadamente 0083 ou 83 de maneira constante tanto para o 1º ano de educação quanto para o 20º ano o 𝟏𝟎𝟎 𝒍𝒏 𝒚 𝒚 o 100 0083 83 Para grandes variações 𝟏𝟎𝟎 𝒍𝒏 𝒚 𝒚 tornase um mal estimador Para grandes variações devemos transformar o impacto obtido em 𝒚 antes de interpretar os resultados impossível ter variação menor do que 100 no preço de um ativo por exemplo o 𝒚 𝟏𝟎𝟎𝒆𝒙𝒑 𝜷𝟏𝒙 𝟏 o Se 𝛽 056 a variação causada por variação de uma unidade em 𝑥 𝑥 1 não é aproximadamente 56 mas sim 75 o 𝒚 𝟏𝟎𝟎 𝒆𝒙𝒑 𝟎 𝟓𝟔 𝟏 𝟕𝟓 O intercepto não tem muito significado 63 𝟎 𝟏 Anos de educação formal US por hora 𝟎 𝟏 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidado com a interpretação variação vs variação em pontos percentuais Margem de lucro passou de 10 para 9 o 10 de redução 910 1 ou 10 910 o 1 ponto percentual de redução 10 9 Neste caso o coeficiente 086 indica que para 1 ponto percentual de crescimento no Market Share de 20 para 21 por exemplo o ROE sobe em média 086 pontos percentuais de 15 para 1586 por exemplo Neste caso o coeficiente 18501 indica que para 1 ponto percentual de crescimento ROE de 20 para 21 por exemplo o salário do CEO em 1990 sobe em média 18501 mil dólares 65 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Intervalo de Confiança do Valor Médio de Intervalo de Previsão para um Valor Individual de Observe que o intervalo de previsão para um restaurante em particular individual localizado próximo a um campus com 10 mil estudantes é mais amplo que o intervalo de confiança para a media de vendas de todos os restaurantes localizados próximo a campi com 10 mil estudantes A diferença reflete o fato de sermos capazes de estimar o valor médio de mais precisamente do que um valor individual de 70 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior CAPM Capital Asset Pricing Model 71 𝑨 𝒇 𝑨 𝑴 𝒇 𝒓𝑨 Retorno do Ativo 𝑹𝒇 Retorno de um ativo livre de risco 𝑹𝑴 𝑹𝒇 Prêmio de Risco de Mercado quanto uma carteira de mercado rende acima de uma taxa livre de risco 𝑹𝑴 Retorno de uma carteira de mercado 𝜷𝑨 Coeficiente beta do ativo coeficiente angular da reta de regressão formada pelos retornos dos ativos e dos retornos de uma carteira de mercado Quanto que os retornos do ativo respondem às variações do retorno da carteira de mercado 𝑪𝒐𝒗 𝒓𝑨 𝑹𝑴 𝑽𝒂𝒓𝑹𝑴 𝑨 𝒇 𝑨 𝑴 𝒇 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Beta β Medida de Risco Relativo Risco Sistêmico ou Risco Sistemático Risco Sistêmico ou Risco de Mercado o Risco Relativo ao mercado o Único fator de risco relevante no CAPM Quanto o retorno de um ativo responde às variações no retorno de uma carteira diversificada de mercado sensibilidade do retorno do ativo às variações do retorno da carteira de mercado O risco relevante de uma ação é sua contribuição ao risco de uma carteira bem diversificada o Visto que o Beta de uma ação determina como ela afeta o risco de uma carteira de marcado ele é a medida mais relevante do risco de qualquer ação O Beta de uma ação mede sua contribuição para a variância da carteira de mercado por unidade de risco Consequentemente o prêmio de risco por investir em um ativo de risco é dado em função do Beta 72 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Entendendo o Coeficiente Beta β O β beta de uma ação mede sua contribuição para a variância da carteira de mercado por unidade de risco Consequentemente o prêmio de risco por investir em um ativo de risco é dado em função do β β 1 módulo os ativos se comportam da mesma forma que o mercado Se o mercado sobe os ativos sobem no mesmo percentual o mesmo ocorrendo se houver uma baixa no mercado O risco da ação é igual ao risco sistemático do mercado como um todo Estes ativos são chamados tipo médio β 1 módulo estes ativos são do tipo agressivo Se o mercado sobe em determinado percentual o ativo sobe mais que o mercado e se o mercado cai em determinado percentual o ativo cai mais que o mercado Retrata um risco sistemático maior que o da carteira de mercado β 1 módulo estes ativos são do tipo defensivo Apresentam risco sistemático menor do que o do mercado como um todo o 0 β 1 se o mercado sobe em determinado percentual o ativo sobe menos que o mercado e se o mercado cai em determinado percentual o ativo cai menos que o mercado o β 0 o ativo se comporta de maneira contrária ao mercado ou seja se o mercado sobe o ativo cai e viceversa o β 0 o ativo é indiferente ao mercado ou livre de risco 73 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidados com a Regressão a maneira como organizase a regressão definirá o beta Qual o índice utilizado para estimar o 𝑴 o Índice local Ibovespa o Índice global SP500 Qual período utilizado na regressão o Últimos 2 anos o Últimos 5 anos o Últimos 10 anos o Todo o período Que tipo de retorno o Diário o Semanal o Mensal Observar o erro padrão do beta e seu intervalo de confiança 76 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Checklist 1 Defina as variáveis independente x e dependente y 2 Construa o gráfico de dispersão 3 Analise o gráfico de dispersão o que o diagrama de dispersão desenvolvido indica sobre a relação entre as duas variáveis 4 Use o método dos MQO Mínimos Quadrados Ordinários para desenvolver a equação de regressão estimada 5 Interprete os coeficientes do modelo inclinação e o intercepto da equação de regressão estimada 6 Calcule o coeficiente de determinação r2 7 Analise a partir do coeficiente de determinação r2 se a equação de regressão estimada proporcionou um bom ajuste 8 Analise se há evidência estatística para concluir que há uma relação linear significativa entre as variáveis teste t do coeficiente angular β da reta de regressão tendo Ho β 0 9 Calcule os resíduos do modelo 10 Construa um gráfico de resíduos em relação à variável independente x 11 Analise o gráfico de resíduos Qual o padrão da distribuição dos resíduos Este padrão indica que o modelo deve ser utilizado ou devemos procurar um melhor 77 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Linear no Excel 78 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Variável Dependente claramente identificada titulada Variáveis Independentes claramente identificadas tituladas Coeficientes e seus respectivos errospadrão estatística t e estrelas indicando seu nível de significância estatística o significante com α 001 1 o significante com α 005 5 o significante com α 01 10 o Não colocar estrelas quando não há significância estatística Número de observações em cada regressão 81 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Explicando Resultados de Regressões FOCO NO QUE É O PRINCIPAL Foque nas variáveis de interesse oIndique seu sinal magnitude significância estatística e econômica interpretação etc oNão perca tempo com outros coeficientes a menos que eles tenham dado um resultado estranho fora do esperado sinal oposto ao esperado magnitude enorme etc Não reporte resultados e regressões em tabelas que você não irá discutir eou mencionar oSe não é importante o suficiente para mencionar ou discutir não é importante suficiente para estar em uma tabela 82 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Exemplo 83 Fonte Agrawal A K Matsa D A 2013 Labor unemployment risk and corporate financing decisions Journal of Financial Economics 1082 449470 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior josecarreraunifespbr 84 Obrigado Dúvidas
Send your question to AI and receive an answer instantly
Recommended for you
51
Métodos Quantitativos Aplicados - Comparações Envolvendo Médias
Métodos Quantitativos Aplicados
UNIFESP
9
Analise de Regressao Gastos por Aluno vs Desempenho NAEP
Métodos Quantitativos Aplicados
UNIFESP
1
Artigo Cientifico Contabilidade-Governanca-Financas-Metodologia e Resultados
Métodos Quantitativos Aplicados
UNIFESP
56
Teste de Hipótese para a Média - Métodos Quantitativos Aplicados
Métodos Quantitativos Aplicados
UNIFESP
94
Métodos Quantitativos Aplicados: Regressão Linear Múltipla
Métodos Quantitativos Aplicados
UNIFESP
84
Métodos Quantitativos Aplicados: Regressão Linear Simples
Métodos Quantitativos Aplicados
UNIFESP
20
Plano de Aula - Regressão Linear Múltipla e Ajustamento Polinomial - UFMA
Métodos Quantitativos Aplicados
UFMA
13
Lista de Exercícios - Distribuição Normal, Teorema Central do Limite e Intervalos de Confiança
Métodos Quantitativos Aplicados
FUCAPE
4
uma Questao Só
Métodos Quantitativos Aplicados
FIPECAFI
1
Análise de Correspondência e Cluster: Questões e Alternativas
Métodos Quantitativos Aplicados
UMG
Preview text
EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Métodos Quantitativos Aplicados Regressão Linear Múltipla Prof Dr José Marcos Carrera Junior São Paulo Setembro 2023 1 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mini Currículo do Professor Prof Dr José Marcos Carrera Junior Forte experiência em Finanças Corporativas MA Valuation e Controladoria adquirida durante a vida acadêmica e profissional em consultorias boutique de investimento e em grandes multinacionais tendo participado de diversas transações nacionais e internacionais Atualmente é Assessor Financeiro e Professor de Finanças Corporativas Doutor pela Fundação Getulio Vargas FGVEAESP com estágio doutoral na Universidade de Columbia em Nova York Mestre em Administração de Empresas pela Fundação Getulio Vargas FGVEAESP e Mestre em Finanças pela Universidade de São Paulo FEAUSP formado em Administração de Empresas pela Universidade de São Paulo FEAUSP Professor de Métodos Quantitativos Aplicados ao Mercado Financeiro na UNIFESP Universidade Federal de São Paulo FIA FECAP In Company FGV In Company Ibmec In Company MBA EACHUSP e Saint Paul Escola de Negócios e Financial Advisor na Plata Capital Partners e na Pezco Economic Business Intelligence Sócio fundador do Finanças 101 canal no YouTube com vídeos e aulas de finanças e economia Contato josemarcoscjgmailcom 2 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Fonte ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística Aplicada à Administração e Economia 3 WOOLDRIDGE Jeffrey M Introdução à econometria uma abordagem moderna Cengage EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Gastos com ciência espaço e tecnologia vs Suicícios por enforcamento e estrangulamento 4 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Número de pessoas que se afogaram ao cair em piscinas vs Filmes estrelados por Nicolas Cage 5 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Consumo per capita de queijo vs Número de pessoas que morreram enrroladas em seus lençóis 6 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Divórcios em Maine vs Consumo per capita de margarina 7 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Idade da Miss América vs Assassinatos por vapores e objetos quentes 8 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Receita total gerada por videogames vs Doutorados finalizados em ciências da computação nos EUA 9 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Lançamentos aeroespaciais não comerciais no mundo vs Doutorados finalizados em sociologia nos EUA 10 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Comsumo per capita de mozzarella vs Doutorados finalizados em engenharia civil nos EUA 11 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Pessoas que se afogaram ao cair de um barco de pesca vs Taxa de Matrimônio em Kentucky 12 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Importações norteamericanas de petróleo da Noruega vs Motoristas mortos em colisões com trens 13 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Consumo per capita de frango vs Importações norteamericanas totais de petróleo 14 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Número de pessoas que se afogaram em piscinas vs Energia gerada em usinas nucleares nos EUA 15 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Carros japoneses de passageiros vendidos nos EUA vs Suicídios por batidas de veículos automotores 16 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Letras da palavra vencedora do concurso norteamericano de soletração vs número de pessoas mortas por aranhas venenosas 17 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Doutorados finalizados em matemática nos EUA vs Urânio estocado nas usinas nucleares norteamericanas 18 Fonte httpswwwtylervigencomspuriouscorrelations EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Relação Espúria Relação estatística existente entre duas variáveis mas onde não existe nenhuma relação causaefeito entre elas Essa relação estatística pode ocorrer por pura coincidência ou por causa de uma terceira variável Ou seja neste último caso pode ocorrer que as variáveis A e B sejam correlacionadas porque ambas são causadas por uma terceira variável C É muito difícil explicar fenômenos apenas com duas variáveis CORRELAÇÃO NÃO É CAUSALIDADE 19 Variável A Variável B Variável C Relação Espúria entre A e B EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Vendas de Sorvetes vs Ataques de Tubarões 20 Consumo de sorvete Banhistas mais saborosos Mais atrativos para ataques de tubarões Maior consumo de sorvete com bom tempo Mais pessoas nas praias pelo bom tempo Tanto o consumo de sorvete como os ataques de tubarões crescem quando o tempo é ensolarado mas eles não tem relação de causa e efeito entre si O bom tempo faz com que as pessoas consumam mais sorvete e também frequentem mais as praias levando a mais ataques de tubarões EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Simultaneidade Relação Espúria O gato subiu no telhado Causalidade 21 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Introdução Enquanto a regressão linear simples baseiase no desenvolvimento de uma equação de regressão estimada para descrever a relação entre duas variáveis A desvantagem principal de usar a análise de regressão simples em trabalhos empíricos é o fato de ser muito difícil obter conclusões certeris paribus sobre como 𝑥 afeta 𝑦 o A hipótese fundamental que todos os outros fatores que afetam 𝑦 não são correlacionados com 𝑥 é frequentemente irreal na regressão linear simples A regressão múltipla considera situações que envolvem duas ou mais variáveis independentes o Possibilita considerar mais fatores e geralmente produzem melhores estimativas do que a regressão linear simples A análise de regressão múltipla é mais receptiva à análise certeris paribus pois ela nos permite controlar explicitamente muitos outros fatores que de maneira simultânea afetam a variável dependente 𝒚 o Em razão de os modelos de regressão múltipla acomodarem muitas variáveis explicativas que podem estar correlacionadas esperamos inferir causalidade nos casos em que a análise de regressão simples seria enganosa Naturalmente se adicionarmos mais fatores que são úteis para explicar 𝑦 então mais da variação de 𝑦 poderá ser explicada Assim a análise de regressão múltipla pode ser usada para construir melhores modelos para prever a variável dependente 𝒚 O modelo de regressão múltipla ainda é o veículo mais extensamente usado da análise empírica em economia administração contabilidade e em outras ciências sociais aplicadas Os conceitos de modelo de regressão e equação de regressão linear simples são aplicáveis no caso da regressão múltipla 22 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variável Dependente e Independentes 23 Variável Dependente y Variável Independentes x Variável Explicada Variável de Resposta Variável Prevista Regressando Variável que está sendo prevista Variável aleatória de interesse Comportamento se deseja explicar Depende de outras variáveis Variáveis Explicativas Variáveis de Controle Variáveis Previsoras Regressores Variáveis que utilizadas para prever outra Independentes de outras variáveis Variáveis Aleatórias e Observáveis Modelo de Regressão Múltipla FRP Função de Regressão Populacional x₁ x₂ xₖ Variáveis independentes y β₀ β₁x₁ β₂x₂ βₖxₖ μ Variável dependente Parâmetros do modelo β₀ Constante β₁ β₂ βₖ Coeficientes que descrevem a relação linear de cada variável independente com a variável dependente y Erro μ Variável aleatória não observável que corresponde ao que explica a variabilidade em y que não pode ser explicada pela relação linear entre as variáveis independentes x₁ x₂ xₖ e y Utilizando a análise de regressão podemos desenvolver uma equação mostrando como a variável y está relacionada as variáveis independentes x₁ x₂ xₖ Existe um valor observado de y para cada valor observado de x₁ x₂ xₖ Equação de Regressão Múltipla FRP Função de Regressão Populacional Eyx₁ x₂ xₖ β₀ β₁x₁ β₂x₂ βₖxₖ Valor esperado da Variável dependente y dado x₁ x₂ xₖ Parâmetros do modelo β₀ Constante β₁ β₂ βₖ Coeficientes que descrevem a relação linear de cada variável independente com a variável dependente y x₁ x₂ xₖ Variáveis independentes Se o intercepto β₀ está incluso na equação nada se perde ao assumir que o valor médio e esperado do erro na população é zero Eμ 0 Qualquer valor constante que tenha valor esperado diferente de zero é absorvido pela constante Cada distribuição de valores de y tem seu próprio valor médio ou esperado Ey A média ou valor esperado do erroresíduo μ é zero Equação de Regressão Múltipla Estimada FRA Função de Regressão Amostral Com Base em Dados Amostrais ŷ β₀ β₁x₁ β₂x₂ βₖxₖ ŷ Estimador pontual de Ey dado x₁ x₂ xₖ Parâmetros do modelo β₀ Constante β₁ β₂ βₖ Coeficientes estimados que descrevem a relação linear de cada variável independente com a variável dependente y certeris paribus tudo mais constante x₁ x₂ xₖ Variáveis independentes Se os valores dos parâmetros da população β₀ β₁ β₂ βₖ fossem conhecidos poderíamos utilizar a equação Eyx₁ x₂ xₖ β₀ β₁x₁ β₂x₂ βₖxₖ para calcular o valor médio de y para um dado valor de x₁ x₂ xₖ Na prática os valores dos parâmetros geralmente não são conhecidos e devem ser estimados a partir de dados amostrais Uma variável aleatória simples é usada para calcular as estatísticas amostrais de β₀ β₁ β₂ βₖ que são utilizadas como estimativas dos parâmetros da população β₀ β₁ β₂ βₖ ŷ é o valor médio de y para um dado valor de x₁ x₂ xₖ EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Atenção Importante 28 A análise de regressão NÃO pode ser interpretada como um procedimento para estabelecer uma relação de causa e efeito entre as variáveis Ela só pode indicar como ou em que medida as variáveis estão relacionadasassociadas umas as outras EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior MQO Mínimos Quadrados Ordinários OLS Ordinary Least Squares É um procedimento para o uso de dados amostrais com a finalidade de encontrar a equação de regressão estimada O método dos mínimos quadrados fornece uma equação de regressão estimada que minimiza a soma dos desvios quadrados entre os valores observados da variável dependente e os valores previstos da variável dependente denotados por Este critério dos mínimos quadrados é utilizado para escolher a equação que proporciona o melhor ajuste Na prática o método dos mínimos quadrados é o mais utilizado 29 𝒊 𝒊 𝟐 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Múltipla Interpretação dos Coeficientes 𝟎 𝟏 𝟐 Em que representa anos de educação formal e representa anos de experiência no mercado de trabalho Assim salário por hora é determinado por duas variáveis independentes educação e experiência e por outros fatores não observáveis contidos em Basicamente estamos interessados em saber o efeito do grau de educação sobre o salário mantendo fixos todos os outros fatores que afetam o salário por hora isto é estamos interessados no parâmetro 𝟏 Comparada com uma análise de regressão simples que relaciona com a regressão apresentada remove efetivamente a do termo de erro e a coloca explicitamente na equação queremos ver o efeito de educação no salário por hora CONTROLANDO para a experiência Seremos capazes de analisar o efeito da educação no salário por hora mantendo o nível de experiência fixo ou constante somos capazes de CONTROLAR os efeitos da experiência sobre o salário por hora o Na análise de regressão simples teríamos que assumir que experiência é não correlacionada com educação 31 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Linear no Excel 32 Interpretando os resultados supGPA 129 0453emGPA 00094ACT supGPA nota média em um curso superior emGPA nota média do ensino médio ACT nota do teste de avaliação de conhecimentos para ingresso em curso superior O intercepto de 129 é o valor previsto da nota média de um curso superior supGPA se tanto a nota média do ensino médio emGPA como a nota média na avaliação de conhecimentos para ingresso em curso superior ACT forem iguais a zero Como não é possível encontrar ninguém que esteja no ensino superior com nota média no ensino médio e no exame de avaliação de conhecimentos para ingresso ambas iguais a zero a interpretação do intercepto nessa equação é pouco significativa Como esperado há uma relação parcial positiva entre supGPA e emGPA Mantendo ACT fixo um ponto adicional em emGPA está associado a 0453 de incremento em supGPA Em outras palavras se escolhermos dois estudantes A e B e esses estudantes tiverem a mesma nota ACT mas emGPA do estudante A é um ponto maior que a supGPA do estudante B prevemos que o estudante A tem supGPA 0453 maior que supGPA do estudante B isso não quer dizer nada sobre quaisquer duas pessoas reais mas é a nossa melhor previsão O coeficiente ACT implica mantendo emGPA fixo uma variação de 1 ponto na nota em ACT esteja associada a uma variação de 00094 pontos em supGPA Esse é um efeito pequeno e sugere que uma vez considerado o emGPA a nota do ACT não é um forte previsor de supGPA EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 35 Regressão Linear no Excel Saída de Dados SUMMARY OUTPUT Regression Statistics Multiple R 0553554369 R Square 030642244 Adjusted R Square 0302436362 Standard Error 3084475615 Observations 526 coeficiente de determinação R² coeficiente de determinação ajustado R²ajustado Desvio padrão do modelo σ Número de observações n Estatística do Teste F ANOVA df SS MS F Significance F Regression 3 2194111624 7313705413 7687316837 340586E41 Residual 522 4966302686 9513989821 Total 525 716041431 Tabela ANOVA Teste F Ho Todos os coeficientes β₁ β₂ βₙ 0 zero Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 2872734887 0728964293 3940844447 922474E05 4304799048 1440670725 Escolaridade 059896507 0051283549 1167947779 368135E28 0498217566 0699712573 Experiência 002233952 0012056848 1852849079 0064468176 0001346387 0046025426 TempoCargo 0169268652 0021644607 7820361491 293453E14 0126747411 0211789893 Constante β₀ Coeficientes βₙ Erro Padrão sβₙ desvio padrão dos coeficientes Estatística de Teste t dos coeficientes pvalor dos coeficientes Intervalo de Confiança dos coeficientes EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 34 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados o nota média em um curso superior o nota média do ensino médio o nota do teste de avaliação de conhecimentos para ingresso em curso superior Qual é o impacto na nota média em um curso superior ao se aumentar a nota média do ensino médio em 1 ponto e a nota do teste de avaliação de conhecimentos para ingresso em um curso superior em 1 ponto o o o 4 o 36 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados o nota média em um curso superior o nota média do ensino médio o nota do teste de avaliação de conhecimentos para ingresso em curso superior Qual é o impacto na nota média em um curso superior ao se aumentar a nota média do ensino médio em 2 pontos e a nota do teste de avaliação de conhecimentos para ingresso em um curso superior em 10 pontos o o o o 37 Interpretando os resultados lnsaláriohora 0284 0092educação 00041experiência 0022permanência saláriohora salário por hora em dólares educação anos de educação formal experiência anos de experiência no mercado de trabalho permanência anos com o empregador atual O coeficiente 0092 significa que mantendo a experiência e permanência fixoscontroladosconstantes um ano a mais de educação formal aumenta o valor esperado de lnsaláriohora em 0092 o que se traduz em um aumento aproximado de 92 0092 100 no salário por hora Alternativamente se considerarmos duas pessoas com os mesmos níveis de experiência e permanência no emprego o coeficiente de educação é a diferença proporcional no salário por hora previsto quando seus níveis de educação diferem EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 38 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidado com a interpretação variação vs variação em pontos percentuais Margem de lucro passou de 10 para 9 o 10 de redução 910 1 ou 10 910 o 1 ponto percentual de redução 10 9 Neste caso o coeficiente 086 indica que para 1 ponto percentual de crescimento no Market Share de 20 para 21 por exemplo o ROE sobe em média 086 pontos percentuais de 15 para 1586 por exemplo Neste caso o coeficiente 18501 indica que para 1 ponto percentual de crescimento ROE de 20 para 21 por exemplo o salário do CEO em 1990 sobe em média 18501 mil dólares 39 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Usando a Equação de Regressão Estimada para Estimação e Previsão Os procedimentos para estimar o valor médio de e para prever um valor individual de na regressão múltipla são similares aos da análise de regressão linear simples Para fazer previsão pontuais substituímos valores dados na equação de regressão estimada o e obtemos o o 40 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Interpretando os resultados 𝒏 𝟐 𝟕𝟐𝟓 𝑹𝟐 𝟎 𝟎𝟒𝟐𝟐 𝟐 o 𝒏𝒑𝒓𝒆𝟖𝟔 número de vezes que determinado homem foi preso em 1986 o 𝒑𝒄𝒐𝒏𝒅 a proporção de prisões anteriores a 1986 que levaram à condenação proxy da probabilidade de um homem ser condenado por um crime o 𝒔𝒆𝒏𝒕𝒎𝒆𝒅 duração média da sentença cumprida por condenação prévia o 𝒑𝒕𝒆𝒎𝒑𝟖𝟔 duração média da sentença cumprida por condenação prévia efeito do confinamento do crime se um indivíduo está na prisão ele não pode ser preso por um crime fora da prisão o 𝒆𝒎𝒑𝒓𝟖𝟔 número de trimestres durante o qual determinado homem ficou empregado em 1986 oportunidades no mercado de trabalho O fato de as quatro variáveis explicativas explicarem somente pouco mais de 4 da variação em npre86 não necessariamente significa que a equação é inútil Ainda que coletivamente essas variáveis não expliquem muito da variação nas prisões é possível que as estimativas sejam confiáveis dos efeitos certeris paribus de cada variável independente sobre Em geral um 𝟐 baixo indica que é difícil prever resultados individuais sobre com muita precisão 45 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Coeficiente de Determinação 𝟐 NÃO SE ASSUSTE COM 𝟐 BAIXOS 46 Nas ciências sociais aplicadas não são incomuns 𝑹𝟐 baixos nas equações de regressão 𝑹𝟐 aparentemente baixo não significa necessariamente que uma equação de regressão é inútil Ainda é possível que a equação forneça uma boa estimativa da relação certeris paribus entre as variáveis se isso é verdade ou não não depende diretamente da magnitude do 𝑹𝟐 Estudantes que estão se defrontando com regressões pela 1ª vez tendem a pôr muito peso na magnitude do 𝑹𝟐 Por enquanto conscientizese de que usar o 𝑹𝟐 como o principal padrão de medida de sucesso de uma análise econométrica pode levar a confusões EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade vs Heterocedasticidade 49 Homocedasticidade Heterocedasticidade 𝑽𝒂𝒓 𝝁 𝒙𝟏 𝒙𝟐 𝒙𝒌 𝑽𝒂𝒓 𝝁 𝝈𝟐 𝑽𝒂𝒓 𝝁 𝒙𝟏 𝒙𝟐 𝒙𝒌 𝒇𝒙𝟏 𝒙𝟐 𝒙𝒌 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade Exemplo 50 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade causa viés NÃO Heterocedasticidade o Afetará os errosdesviospadrão das estimativas o Os erros padrão reportados por programas estatísticos assumem homocedasticidade o Se os erros são heterocedásticos as inferências estatísticas sobre estes erros padrão podem estar incorretas e subestimadas EXOGENEIDADE o ENDOGENEIDADE A violação da hipótese de média condicional zero dos erros é que causa viés nos estimadores o Precisamos respeitar a hipótese de média condicional zero para obter estimadores consistentes o A hipótese de media condicional zero é diferente de homocedasticidade o ENDOGENEIDADE CAUSA VIÉS NOS COEFICIENTES 53 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero EXOGENEIDADE CMI Conditional Mean Independence O erro é independente da média de Se e são não correlacionados logo como variáveis aleatórias não são linearmente relacionados Mas isso não é suficiente pois a correlação mede somente a dependência linear entre e É preciso que não tenha relação com qualquer função de 54 𝟏 𝟐 𝒌 Hipótese de Média Condicional Zero EXOGENEIDADE EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Implicações CMI Conditional Mean Independence Lembrese que o erro captura todos os fatores que afetam além de É MUITA COISA Imagine esse problema em estudos de finanças e economia por exemplo oEndividamento ftamanho da empresa Empresas pequenas talvez tenham mais restrições financeiras e portanto menos opções de endividamento oPoupança frenda Pessoas que ganham mais têm mais opções entre gastar ou poupar oInvestimento ffluxo de caixa Empresas com mais fluxo de caixa podem ter mais propensão a investir mesmo que esses investimentos não criem valor 55 Hipótese de Média Condicional Zero Exemplo SalárioHora CMI Conditional Mean Independence saláriohora B0 B1educação B2experiência μ μ outros fatores não observados que afetam o saláriohora além de educação e experiência Ainda estamos interessados no efeito de educação sobre o saláriohora mantendo fixos todos os outros fatores que afetam saláriohora experiência neste caso Isto é estamos interessados no parâmetro B1 Como a experiência é apresentada de modo explícito seremos capazes de mensurar o efeito da educação sobre saláriohora mantendo a experiência fixa Na análise de regressão simples saláriohora B0 B1educação μ que coloca experiência no termo de erro μ teríamos que assumir que experiência é não correlacionada com educação uma hipótese tênue E μeducação experiência 0 Isso implica outros fatores que afetam salário por hora e não estão em média relacionados aos anos de educação formal e aos anos de experiência Portanto se entendermos que aptidão inata é parte de μ então será necessário que os níveis médios de aptidão sejam os mesmos em todas as combinações de educação e experiência na população que trabalha A análise de regressão múltipla permite que muitos fatores observados afetem y Poderíamos também incluir semanas de treinamento de trabalho anos de permanência com o empregador atual medidas de aptidão e mesmo variáveis demográficas como o número de irmãos e a educação da mãe EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 57 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo CMI Conditional Mean Independence Se as quantidades de fertilizantes são escolhidas independentemente de outras características das áreas então é verdadeiro e então a qualidade média da terra que estaria no termo de erro não dependeria da quantidade de fertilizantes Entretanto se mais fertilizantes forem usados em áreas de terra de melhor qualidade então o valor esperado do erro varia com o nível de fertilizantes e não se sustenta 58 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Estrutura de Capital CMI Conditional Mean Independence 𝒊 𝟎 𝟏 𝒊 Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Lucratividade o Lucratividade e o termo de erro são independentes e não correlacionados o O termo de erro poderia incluir vários fatores como distância da falência Z de Altman Tamanho MB entre outros É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas pouco lucrativas tendem a ter maior risco de crédito o que resultaria pela teoria do tradeoff de estrutura de capital em um menor endividamento risco de crédito que está capturado no termo de erro está relacionado com a lucratividade o Firmas pouco lucrativas tendem a ter menos caixa e liquidez o que resultaria pela teoria do pecking order de estrutura de capital em um menor endividamento liquidez que está capturado no termo de erro está correlacionado com a lucratividade 59 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Investimento CMI Conditional Mean Independence Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Q de Tobin o Q de Tobin e o termo de erro são independentes e não correlacionados É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas com baixo Q de Tobin podem estar em estresse financeiro e por este motivo investem menos estresse financeiro que está capturado no termo de erro está relacionado com o Q de Tobin o Firmas com alto Q de Tobin podem ser menores mais jovens e apresentarem maiores dificuldades de obtenção de fundos para investimento tamanho ou maturidade que estão capturados no termo de erro estão correlacionado com o Q de Tobin 60 Multicolinearidade O termo variável independente não significa que as variáveis sejam em si mesmas independentes no sentido estatístico A maioria das variáveis independentes de uma regressão múltipla estão até certo ponto correlacionadas Poderíamos calcular o coeficiente de correlação da amostra para determinar o grau em que as variáveis estão relacionadas Na análise de regressão múltipla o termo multicolinearidade referese à correlação entre as variáveis independentes É importante observar que as variáveis independentes podem ser correlacionadas ELAS APENAS NÃO PODEM SER PERFEITAMENTE CORRELACIONADAS COMBINAÇÃO LINEAR EXATA Os estatísticos desenvolveram diversos testes para determinar se a multicolinearidade é suficientemente elevada para causar problemas De acordo com teste prático a multicolinearidade constitui um problema potencial se o valor absoluto do coeficiente de correlação ultrapassar 07 em qualquer par de variáveis independentes Tempo de Viagem em Horas β0 β1Milhas Percorridas β2Litros de Combustível Consumidos Obviamente Milhas Percorridas e Litros de Combustível Consumidos estão altamente correlacionados Suponhamos que a partir do teste t em β1 não consigamos rejeitar H0 β1 0 Esse resultado significa que o tempo de viagem não está relacionado com as milhas percorridas Não necessariamente O que provavelmente significa é que com litros de combustível consumidos já estando no modelo as milhas percorridas não contribuíram significativamente para determinar o tempo de viagen Neste exemplo se soubermos a quantidade de gasolina consumida não obtemos muita informação adicional útil para prever o tempo de viagem ao sabermos as milhas percorridas EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 62 Razões para Endogeneidade ou Violação da Hipótese de Média Condicional Zero Razões para o erro estar correlacionado com a variável independente x Uma variável x endógena é quando seu valor depende da variável y Uma variável x é endógena quando está relacionada com μ por alguma razão É possível testar a hipótese de média condicional zero Eμx1 x2 xk Eμ 0 NÃO Por construção os resíduos tem média zero Eμ 0 e não são correlacionados com as variáveis independentes xp Razões veremos nas próximas aulas em detalhes Variáveis Omitidas Erros de MensuraçãoMedida Simultaneidade EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 61 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Multicolinearidade Perfeita Quando Ocorre Quando uma variável é um múltiplo constante da outra o Um pesquisador inadvertidamente coloca a mesma variável medida em unidades diferentes dentro da equação de regressão Mesma variável com diferentes unidades de medida Quando uma variável independente pode ser expressa como uma função linear exata de duas ou mais outras variáveis independentes o Suponha que queremos estimar o efeito dos gastos de campanha sobre os resultados da campanha Por simplicidade suponha que cada eleição tenha dois candidatos Seja a percentagem de votos do Candidato A seja os gastos de campanha do Candidato A seja a percentagem de votos do Candidato B seja os gastos de campanha do Candidato B seja os gastos totais de campanha o A multicolinearidade perfeita ocorre porque o Não é possível manter a interpretação certeris paribus pois um aumento em ou gera simultaneamente um aumento em A solução para a colinearidade perfeita é simples retire uma das variáveis do modelo 63 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variáveis IndependentesExplicativas Irrelevantes O que acontece se incluirmos no modelo uma variável independente que não deveria estar no modelo oNós estimamos oMas o modelo real deveria ser estimamos Resposta oAinda teremos estimadores consistentes para todos os coeficientes e onde oMas os erros padrão poderão estar sobrestimados mais altos tornando mais difícil de rejeitar a hipótese nula de que o coeficiente é igual a zero tornado mais difícil assim encontrar significância estatística 67 Variáveis IndependentesExplicativas Irrelevantes O que acontece se incluirmos no modelo uma variável independente que não deveria estar no modelo Nós estimamos y β0 β1 x1 β2 x2 μ Mas o modelo real deveria ser estimamos y β0 β1 x1 μ Ou seja β2 0 Adicionar mais variáveis pode não ser uma boa ideia se as variáveis tiverem alta correlação com as demais É difícil segregar efeitos em y de variáveis com alta correlação entre si Por isso temos que evitar adicionar variáveis ao modelos se elas são irrelevantes para explicar y e com alta correlação com as demais Multicolinearidade Quanto menor melhor pois menor será o erro padrão Se Rj2 1 então temos multicolinearidade perfeita e o denominador da fração é zero significa que xj é uma combinação linear perfeita de algumas das outras variáveis independentes da regressão Mais sobre Multicolinearidade Nas ciências sociais em que somos geralmente coletores passivos de dados não há uma boa maneira de reduzir as variâncias dos estimadores não viesados que não seja coletar mais dados Para um determinado conjunto de dados podemos tentar num esforço para reduzir a multicolinearidade suprimir outras variáveis independentes do modelo Infelizmente suprimir uma variável que pertence ao modelo podo levar a viés no estimador Variável omitida fará com que o erro μ esteja relacionado com alguma variável independente violando a hipótese da média condicional zero Um elevado grau de correlação entre certas variáveis independentes pode ser irrelevante no que diz respeito a quão bem podemos estimar outros parâmetros do modelo y β0 β1 x1 β2 x2 β3 x3 μ Em que x2 e x3 são altamente correlacionados Então Varβ2 e Varβ3 podem ser grandes mas o valor da correlação entre x2 e x3 não tem efeito direto sobre Varβ1 Se x1 é não correlacionado com x2 e x3 então R12 0 e Varβ1 σ2 Σi1n xij xj2 Se β1 é o parâmetro de interesse realmente não devemos nos preocupar com o valor da correlação entre x2 e x3 Mais sobre Multicolinearidade Fator de Inflação de Variância FIV VIF Variance Inflation Factor NÃO PODEMOS ESPECIFICAR QUANTA CORRELAÇÃO ENTRE AS VARIÁVEIS EXPLICATIVAS É DEMASIADA Alguns diagnósticos de multicolinearidade são estatísticas abrangentes para detectar um forte relacionamento linear entre quaisquer subconjuntos de variáveis explicativas Pelas razões que acabamos de ver tais estatísticas são de valor questionável porque elas podem mostrar um problema simplesmente porque duas variáveis de controle cujos coeficientes não nos importam são altamente correlacionadas Um pouco mais úteis mais ainda propensas a serem mal empregadas são as estatísticas de coeficientes individuais A mais comum delas é o Fator de Inflação de Variáveis FIV O FIV do βj é simplesmente 11 Rj2 ou seja precisamente o termo em Varβj que é determinado pela correlação entre xj e as outras variáveis explicativas O FIVj é o fator pelo qual Varβj é mais alto porque xj é correlacionado com todas as outras variáveis explicativas Se pudéssemos escolher gostaríamos que FIVj fosse menor mas raramente temos escolha A determinação de um valor de corte para o FIV acima do qual concluirermos que a multicolinearidade é um problema é arbitrária e não é de grande ajuda Algumas vezes o valor 10 é escolhido Se FIVj for maior do que 10 significa que Rj2 será maior do que 09 Mas um FIVj acima de 10 não significa que o desviopadrão de βj será grande demais para ser útil pois o desviopadrão também depende de σ desviopadrão do modelo e de Σi1n xij xj2 soma dos quadrados totais e esta última pode ser aumentada com o aumento do tamanho da amostra Se nosso interesse é no efeito causal de x1 em y então devemos ignorar inteiramente os FIVs de outros coeficientes Teste de Hipótese teste t para βj Pelo teste bicaudal ser mais restritivo que o unicaudal ou seja é mais difícil rejeitar H0 no teste bicaudal pelo fato da área de rejeição nas extremidades da curva ser a metade do tamanho α2 da do teste unicaudal α na prática o teste unicaudal é mais utilizado Teste de Hipóteses dos Coeficientes Significância Estatística e Econômica O coeficiente βn é estatisticamente significante ou significativo Geralmente usamos este termo estatisticamente significante ou estatisticamente significante para dizer que com um nível de significância α o coeficiente βn é diferente de zero Significância estatística depende do tamanho de tβ𝑗 Colocar muita ênfase sobre a significância estatística pode levar à conclusão falsa de que uma variável é importante para explicar y embora seu efeito estimado seja moderadopequeno Os coeficientes podem ser estatisticamente significantes mas podem ser economicamente pequenos baixo impacto económico Sempre verifique a significância econômica tamanho e sinal dos coeficientes estimados βj Qual o tamanho da variação em y por mudanças em x IMPORTANTE Esta magnitude é plausível Se não for você deve ter tido algum problema de especificação no modelo Pode ocorrer baixa significância econômica com significância estatística em grandes amostras o erro padrão diminui ou em casos de muita variância em x Os coeficientes podem ser economicamente significantes mas estatisticamente não significantes Não podemos afirmar que são diferentes de zero Pode ocorrer com amostras pequenas e com pouca variação em x Cuidado Erropadrão alto que diminui a significância estatística também pode ser devido a multicolinearidade Se uma variável não é estatisticamente significante nos níveis usuais 10 5 ou 1 você poderia perguntar ainda se a variável tem o efeito esperado sobre y e se tal efeito é economicamente significante Se ele é grande você deve calcular um pvalor para a estatística t Significância Estatística e Econômica Exemplo 1 Queremos estimar o efeito de uma taxa de contribuição para um plano taxcont sobre a taxa de participação taxap dos trabalhadores nos planos de pensão de contribuição definida existentes nos Estados Unidos A taxa de contribuição é a quantidade com a qual a firma contribui para um fundo de trabalhadores para cada dólar de contribuição do trabalhador até certo limite assim taxcont 075 significa que a firma contribui com US 075 para cada dólar contribuído pelo trabalhador A taxa de participação é a percentagem de trabalhadores habilitados a ter uma conta no plano de pensão totemp é uma medida de tamanho da empresa medida pelo número de empregados Todas as variáveis são estatisticamente significantes pvalor α de 1 Qual o tamanho em um sentido econômico do coeficiente de totemp Mantendo fixo taxcont e idade se uma firma cresce em 10000 empregados a taxa de participação cai em 13 pontos percentuais 10000000013 Isso é um crescimento enorme no número de empregados com um efeito somente modestobaixo na taxa de participação Assim embora o tamanho da firma afete de fato a taxa de participação o efeito econômico não é grande Comparação entre dois coeficientes βj lnsaláriohora β0 β1 cp β2 univ β3 exper Definiremos um novo parâmetro θ1 como sendo a diferença entre β1 β2 θ1 β1 β2 Desta forma nossas hipóteses nula e alternativa e a estatística de teste t serão H0 θ1 0 Ha θ1 0 t θ1 epθ1 Como θ1 β1 β2 podemos também escrever β1 θ1 β2 Substituindo β1 na equação temos lnsaláriohora β0 θ1 β2 cp β2 univ β3 exper lnsaláriohora β0 θ1 cp β2 cp univ β3 exper A ideia fundamental é que o parâmetro θ1 cuja hipótese estamos interessados em testar multiplicia agora a variável cp Mais importante há uma nova variável multiplicando β2 que é a soma de cp univ Assim se quisermos estimar diretamente θ1 então devemos construir a nova variável cp univ e incluíla no modelo de regressão no lugar de univ EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 80 Comparação entre dois coeficientes βj lnsaláriohora β0 θ1 cp β2 cp univ β3 exper Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 0 1431040848 1513610255 cp 0066696724 0006828794 9766984279 219304E22 0053310137 0080083312 univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1472325551 0021060239 6991020095 0 1431040848 1513610255 cp 0010179528 0006935907 146765642 0142244104 002377609 0003417034 cp univ 0076876252 0002308729 3329808416 29551E225 0072350416 0081402088 exper 0004944224 0000157474 3139717547 41227E202 0004635527 0005252922 Note que θ1 00102 exatamente a diferença entre β1 β2 calculada anteriormente β0 β2 e β3 permanecem os mesmos assim como seus errospadrão e assim deve ser Essa é uma maneira de checar se a equação transformada foi apropriadamente estimada Como pvalor 01422 ou 1422 da estatística t da estimativa θ1 é maior do que o nível de significância α não podemos rejeitar H0 θ1 0 ou seja não podemos concluir que há diferença estatística entre β1 e β2 Ou seja não podemos concluir que há diferença no impacto no saláriohora entre um ano adicional de educação profissionalizante e universitária neste caso EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 81 Teste F Teste das Restrições Lineares Gerais Na regressão linear simples o teste t e o teste F produzem a mesma conclusão ou seja se a hipótese nula for rejeitada concluiremos que β1 0 Na regressão múltipla o teste t e o teste F tem propósitos diferentes 1 O teste F é utilizado para determinar se existe uma relação significativa entre a variável dependente e o conjunto de todas as variáveis independentes Referimonos ao teste F como teste de significância global 2 Se o teste F exibir uma significância global o teste t é usado para determinar se cada uma das variáveis independentes individuais é significativa Um teste t é realizado para cada uma das variáveis independentes do modelo Referimonos a cada um desses testes t como teste de significância individual H0 β1 β2 βk 0 Ha Um ou mais parâmetros não são iguais a zero Se H0 for rejeitada o teste nos dá suficientes evidências estatísticas para concluirmos que um ou mais dos parâmetros não são iguais a zero e que a relação global entre y e o conjunto de variáveis independentes x1 x2 xk é significativa Entretanto se H0 não puder ser rejeitada não teremos evidências suficientes para concluir que uma relação significativa está presente EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 82 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restrições Lineares Gerais Distribuição Amostral de MSRMSE F 84 Não Rejeitar H0 Não Rejeitar H0 Rejeitar H0 Rejeitar H0 F a 𝑭𝜶 Valor Crítico no Excel Distribuição F INVF1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Português FINV1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Inglês k graus de liberdade no numerador n k 1 graus de liberdade no denominador Rejeitar 𝑯𝟎 quando p valor 𝜶 ou quando a estatística de teste F é superior ao F crítico Valor Crítico dado uma Distribuição F Valor Crítico dado uma Distribuição F pvalor da Estatística F no Excel DISTFEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Português FDISTEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Inglês EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Teste F Teste das Restrições Lineares Gerais Teste F no Excel 85 Tabela ANOVA Teste 𝑭 Ho Todos os coeficientes 𝜷𝟏 𝜷𝟐 𝜷𝒏 𝟎 zero Estatística do Teste 𝑭 pvalor da Estatística do Teste 𝑭 𝑯𝟎 𝜷𝟏 𝜷𝟐 𝜷𝒌 𝟎 𝑯𝒂 𝑼𝒎 𝒐𝒖 𝒎𝒂𝒊𝒔 𝒑𝒂𝒓â𝒎𝒆𝒕𝒓𝒐𝒔 𝒏ã𝒐 𝒔ã𝒐 𝒊𝒈𝒖𝒂𝒊𝒔 𝒂 𝒛𝒆𝒓𝒐 Rejeitar 𝑯𝟎 quando pvalor 𝜶 ou quando a estatística de teste F é superior ao F crítico SUMMARY OUTPUT Regression Statistics Multiple R 0879095465 R Square 0772808837 Adjusted R Square 0761859865 Standard Error 0148142268 Observations 88 ANOVA df SS MS F Significance F Regression 4 6196075706 1549018926 7058277758 645207E26 Residual 83 1821528924 0021946132 Total 87 8017604629 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 0263743402 0569664802 0462979986 0644590344 0869296977 1396783781 lnavaliação 1043065443 0151446069 6887372164 10115E09 0741845302 1344285584 quartos 0033839208 0022098313 1531302791 0129497317 0010113447 0077791864 lnterreno 0007437885 0038561495 0192883735 0847521219 0069259378 0084135148 lnárea 0103238445 0138430473 0745778318 0457908275 0378571088 0172094198 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior SUMMARY OUTPUT Regression Statistics Multiple R 0772704088 R Square 0597071608 Adjusted R Square 059476916 Standard Error 075273119 Observations 353 ANOVA df SS MS F Significance F Regression 2 293864021 1469320105 2593203491 822011E70 Residual 350 1983114856 0566604245 Total 352 4921755066 Coefficients Standard Error t Stat Pvalue Lower 95 Upper 95 Intercept 1122380399 0108312003 103624748 99657E265 1101077974 1143682825 anos 0071317976 001250501 5703152077 25042E08 0046723559 0095912392 jogosano 0020174478 000134287 1502340873 101913E39 0017533369 0022815587 Teste de Restrições de Exclusão Exemplo Modelo Restrito 88 𝑭 𝑺𝑸𝑹𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝑺𝑸𝑹𝒊𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝑺𝑸𝑹𝒊𝒓𝒆𝒔𝒕𝒓𝒊𝒕𝒐 𝒏 𝒌 𝟏 𝒒 𝒏 𝒅𝒆 𝒓𝒆𝒔𝒕𝒓𝒊çõ𝒆𝒔 Estatística ou Razão Aumento relativo na soma dos quadrados dos resíduos SQR quando nos movemos do modelo irrestrito para o restrito 𝑘 número de variáveis independentes do modelo irrestrito com todas as variáveis 𝑭 𝟏𝟗𝟖 𝟑𝟏 𝟏𝟖𝟑 𝟏𝟗 𝟏𝟖𝟑 𝟏𝟗 𝟑𝟓𝟑 𝟓 𝟏 𝟑 𝑭 𝟗 𝟓𝟓 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior ANOVA Distribuição Amostral de MSRMSE 90 Não Rejeitar H0 Não Rejeitar H0 Rejeitar H0 Rejeitar H0 F Valor Crítico dado uma Distribuição F Valor Crítico dado uma Distribuição F a 1 𝑭𝜶 Valor Crítico no Excel Distribuição F INVF1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Português FINV1 Nível de Significância grau de liberdade 1 grau de liberdade 2 no Excel em Inglês q n de restrições graus de liberdade no numerador n k 1 graus de liberdade no denominador 4 Rejeitar 𝑯𝟎 quando p valor 𝜶 ou quando a estatística de teste F é superior ao F crítico pvalor da Estatística F do Excel DISTFEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Português FDISTEstatística de Teste F grau de liberdade 1 grau de liberdade 2 1 no Excel em Inglês EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Variável Dependente claramente identificada titulada Variáveis Independentes claramente identificadas tituladas Coeficientes e seus respectivos errospadrão estatística t e estrelas indicando seu nível de significância estatística o significante com α 001 1 o significante com α 005 5 o significante com α 01 10 o Não colocar estrelas quando não há significância estatística Número de observações em cada regressão 91 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Explicando Resultados de Regressões FOCO NO QUE É O PRINCIPAL Foque nas variáveis de interesse oIndique seu sinal magnitude significância estatística e econômica interpretação etc oNão perca tempo com outros coeficientes a menos que eles tenham dado um resultado estranho fora do esperado sinal oposto ao esperado magnitude enorme etc Não reporte resultados e regressões em tabelas que você não irá discutir eou mencionar oSe não é importante o suficiente para mencionar ou discutir não é importante suficiente para estar em uma tabela 92 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Exemplo 93 Fonte Gubbi S R Aulakh P S Ray S Sarkar M B Chittoor R 2010 Do international acquisitions by emergingeconomy firms create shareholder value The case of Indian firms Journal of International Business Studies 413 397418 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior josecarreraunifespbr 94 Obrigado Dúvidas EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Métodos Quantitativos Aplicados Regressão Linear Simples Prof Dr José Marcos Carrera Junior São Paulo Setembro 2023 1 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mini Currículo do Professor Prof Dr José Marcos Carrera Junior Forte experiência em Finanças Corporativas MA Valuation e Controladoria adquirida durante a vida acadêmica e profissional em consultorias boutique de investimento e em grandes multinacionais tendo participado de diversas transações nacionais e internacionais Atualmente é Assessor Financeiro e Professor de Finanças Corporativas Doutor pela Fundação Getulio Vargas FGVEAESP com estágio doutoral na Universidade de Columbia em Nova York Mestre em Administração de Empresas pela Fundação Getulio Vargas FGVEAESP e Mestre em Finanças pela Universidade de São Paulo FEAUSP formado em Administração de Empresas pela Universidade de São Paulo FEAUSP Professor de Métodos Quantitativos Aplicados ao Mercado Financeiro na UNIFESP Universidade Federal de São Paulo FIA FECAP In Company FGV In Company Ibmec In Company MBA EACHUSP e Saint Paul Escola de Negócios e Financial Advisor na Plata Capital Partners e na Pezco Economic Business Intelligence Sócio fundador do Finanças 101 canal no YouTube com vídeos e aulas de finanças e economia Contato josemarcoscjgmailcom 2 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Fonte ANDERSON David R SWEENEY Dennis J WILLIAMS Thomas A Estatística Aplicada à Administração e Economia 3 WOOLDRIDGE Jeffrey M Introdução à econometria uma abordagem moderna Cengage EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Introdução As decisões gerenciais muitas vezes se baseiam na relação entre duas ou mais variáveis Objetivo Estudar o efeito que algumas variáveis exercem nas outras o Depois de considerar as despesas com publicidade e vendas um gestor de marketing pode tentar prever as vendas para um dado nível de gastos com propaganda o Um serviço de utilidade pública pode utilizar a relação entre a alta da temperatura diária e a demanda por eletricidade para prever o consumo de eletricidade com base nas altas temperaturas diárias previstas para o próximo mês Às vezes o gestor confia na intuição para julgar como duas variáveis estão relacionadas No entanto se for possível obter dados um procedimento estatístico chamado análise de regressão pode ser utilizado para desenvolver uma equação mostrando como as variáveis estão relacionadas o Explicar uma variável y em termos de outra variável x o Estudar como varia a variável y com variações da variável x 4 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressões Lineares e sua Aplicação Regressão é talvez o modelo mais popular e utilizado em finanças e contabilidade o Transparente e intuitivo o Robusto e de fácil construção o Mesmo não evidenciando causalidade é útil para descrever relações Como pesquisadores estamos interessados em explicar como o mundo das finanças funciona o Como as escolhas da estrutura de capital da empresa são explicadas por suas oportunidades de investimentos o Se as oportunidades de investimento mudarem por alguma razão aleatória como será o impacto médio esperado na estrutura de capital o De maneira mais ampla como a variável aleatória é explicada por outra variável aleatória 5 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Variável Dependente e Independente 6 Variável Dependente y Variável Independente x Variável Explicada Variável de Resposta Variável Prevista Regressando Variável que está sendo prevista Variável aleatória de interesse Comportamento se deseja explicar Depende de outras variáveis Variável Explicativa Variável de Controle Variável Previsora Regressor Variável que utilizadas para prever outra Independente de outras variáveis Variáveis Aleatórias e Observáveis EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Modelo de Regressão Linear Simples FRP Função de Regressão Populacional 7 𝟎 𝟏 Consiste em determinar uma função matemática que descreva o comportamento de determinada variável com base em valores de uma ou mais varáveis Utilizando a análise de regressão podemos desenvolver uma equação mostrando como a variável está relacionada a independente Existe um valor observado de para cada valor observado de Variável dependente Observável Parâmetros do modelo Não observáveis 𝟎 Constante 𝟏 Coeficiente Angular ou Inclinação da Reta de Regressão Variável independente Observável Erro Variável aleatória não observável que corresponde ao que explica a variabilidade em que não pode ser explicada pela relação linear entre as variáveis e outros fatores que afetam além de EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Possíveis linhas de regressão linear simples 10 Ey Ey x Inclinação é positiva 𝜷𝟏 𝟎 Reta de Regressão Intercepto b0 Ey Ey x Reta de Regressão Intercepto b0 Ey Ey x Inclinação b1 é zero Reta de Regressão Intercepto b0 Relação Linear Positiva Relação Linear Negativa Nenhuma Relação Um aumento em está relacionado com um aumento em Um aumento em está relacionado com uma redução em Um aumento ou redução em não está relacionado com um aumento ou redução em Inclinação é negativa 𝜷𝟏 𝟎 Não há relação 𝜷𝟏 𝟎 𝟎 𝟏 Equação de Regressão Linear Simples Estimada FRA Função de Regressão Amostral Com Base em Dados Amostrais ŷ𝑏₀𝑏₁𝑥 ŷ Estimador pontual de Ey ou valor estimado de y Parâmetros do modelo 𝑏₀ Constante 𝑏₁ Coeficiente Angular ou Inclinação da Reta de Regressão Variável independente Se os valores dos parâmetros da população 𝛽₀ e 𝛽₁ fossem conhecidos poderíamos utilizar a equação Eyx 𝛽₀𝛽₁𝑥 para calcular o valor médio de y para um dado valor de x Na prática os valores dos parâmetros não são conhecidos e devem ser estimados utilizandose dados amostrais As estatísticas amostrais de 𝛽₀ e 𝛽₁ são calculadas como estimativas dos parâmetros da população e denotados por 𝑏₀ e 𝑏₁ ŷ é o valor médio de y para um dado valor de x ŷ é a estimação por ponto do valor esperado de y Ey para determinado valor de x EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior O processo de estimação na Regressão Linear Simples 12 Modelo de Regressão 𝟎 𝟏 Equação de Regressão E b0 b1x Parâmetros Desconhecidos b0 b1 Dados Amostrais x y x1 y1 xn yn b0 e b1 fornecem estimativas de b0 e b1 Equação de Regressão Estimada Estatísticas Amostrais b0 b1 0 1 ˆy b b x 0 1 ˆy b b x EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Atenção Importante 13 A análise de regressão NÃO pode ser interpretada como um procedimento para estabelecer uma relação de causa e efeito entre as variáveis Ela só pode indicar como ou em que medida as variáveis estão relacionadasassociadas umas as outras EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Definição do modelo de regressão simples Ao escrever um modelo que explicará em termos de defrontamonos com três questões oComo nunca há uma relação perfeita e exata entre duas variáveis como consideraremos outros fatores que afetam oQual é a relação funcional entre e oComo podemos estar certos de que estamos capturando uma relação certeris paribus entre e 14 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Contexto A Armands Pizza Parlors é uma rede de restaurantes de comida italiana localizada em cinco estados norteamericanos As localizações mais bemsucedidas dos restaurantes Armands estão próximos a campi universitários Os gerentes acreditam que as vendas trimestrais nesses restaurantes designadas estão relacionadas positivamente com o tamanho da população estudantil designado Ou seja os restaurantes próximos a campi universitários que contam com uma grande população estudantil tendem a gerar mais vendas que aqueles que estão localizados próximos a campi que contam com uma pequena população estudantil Usando análise de regressão podemos determinar uma equação que mostra como a variável dependente está relacionada com a variável independente 15 Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Dados Foram coletados dados de uma amostra de dez restaurantes Armands Pizza Parlors localizados na proximidades de diversos campi universitários Para cada restaurante da população um valor x da população estudantil corresponde a um valor y de vendas trimestrais Em relação à iésima observação ou restaurante da amostra 𝑥𝑖 é o tamanho da população estudantil em milhares de estudantes e 𝑦𝑖 são as vendas trimestrais do restaurante i em milhares de dólares Notamos que o restaurante 1 com 𝑥12 e 𝑦158 localizase próximo a um campus com 2 mil estudantes e tem vendas trimestrais de US 58 mil Restaurante População de Estudantes em milhares Vendas Trimestrais em milhares de dólares 1 2 58 2 6 105 3 8 88 4 8 118 5 12 117 6 16 137 7 20 157 8 20 169 9 22 149 10 26 202 Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Diagrama de Dispersão Os diagramas de dispersão para análise de regressão são construídos com a variável independente x no eixo horizontal e a variável dependente y no eixo vertical O diagrama de dispersão nos possibilita observar os dados graficamente e tirar conclusões prévias sobre a possível relação entre variáveis Pelo gráfico de dispersão ao lado as vendas trimestrais parecem ser mais elevadas nos campi que possuem maiores populações estudantis Além disso a relação entre o tamanho da população estudantil e as vendas trimestrais parece aproximarse de uma linha reta de fato uma relação linear positiva é indicada entre x e y Por conseguinte escolhemos o modelo de regressão linear simples para representar a relação entre as vendas trimestrais e a população de estudantes Nossa próxima tarefa é usar os dados amostrais para determinar os valores de 𝑏₀ e 𝑏₁ na equação de regressão linear simples estimada ŷ𝑏₀𝑏₁𝑥 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Método dos Mínimos Quadrados Ordinários MQO OLS Ordinary Least Squares É um procedimento para o uso de dados amostrais com a finalidade de encontrar a equação de regressão estimada O método dos mínimos quadrados fornece uma equação de regressão estimada que minimiza a soma dos desvios quadrados entre os valores observados da variável dependente 𝒊 e os valores previstos da variável dependente 𝒊 Este critério dos mínimos quadrados é utilizado para escolher a equação que proporciona o melhor ajuste Na prática o método dos mínimos quadrados é o mais utilizado 18 𝟎 𝟏 𝟎 𝒊 𝒊 Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Diagrama de Dispersão A próxima tarefa é utilizar os dados amostrais para determinar os valores de b0 e b1 na equação de regressão linear simples estimada ŷi b0 b1x o ŷi valor previsto das vendas trimestrais em milhares de dólares para o iésimo restaurante o b0 intercepto em y da reta de regressão estimada o b1 inclinação da reta de regressão estimada o xi tamanho da população estudantil em milhares para o iésimo restaurante Para que a reta de regressão estimada forneça um bom ajuste para os dados queremos que as diferenças entre os valores de vendas observados e os valores de vendas previstos sejam pequenos O método dos mínimos quadrados utiliza os dados amostrais para fornecer os valores de b0 e b1 que minimizam a soma dos quadrados dos desvios entre os valores observados da variável dependente yi e os valores previstos da variável dependente ŷi Min yi ŷi² EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 19 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Inclinação e Intercepto 20 𝟏 𝒊 𝒊 𝒊 𝟐 𝒐 𝟏 Inclinação ou Coeficiente Angular Intercepto ou Constante 𝟎 𝟏 𝒊 valor da variável independente para a iésima observação valor médio da variável independente valor médio da variável dependente 𝒊 valor da variável dependente para a iésima observação Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Inclinação e Intercepto Restaurante População de Estudantes em milhares Vendas Trimestrais em milhares de dólares xi ẋ yi ȳ xi ẋyi ȳ xi ẋ² 1 2 58 12 72 864 144 2 6 105 8 25 200 64 3 8 88 6 42 252 36 4 8 118 6 12 72 36 5 12 117 2 13 26 4 6 16 137 2 7 14 4 7 20 157 6 27 162 36 8 20 169 6 39 234 36 9 22 149 8 19 152 64 10 26 202 12 72 864 144 Média 14 130 284 57 Soma 140 1300 2840 568 b1 xi ẋyi ȳ xi ẋ² bo ȳ b1ẋ b1 2840 568 bo 130 5 14 bo 60 b1 5 ŷ b0 b1x ŷ 60 5x EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 21 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Gráfico da Equação de Regressão Estimada 22 𝟎 𝟏 Intercepto 𝟎 60 Inclinação 𝟏 5 A inclinação da reta de regressão estimada é positiva o que implica que à medida que a população de estudantes aumenta as vendas aumentam Podemos concluir com base nas vendas medidas em milhares de dólares e na população de estudantes em milhares que um aumento de 1 mil na população de estudantes está associado a um aumento médio de US 5 mil nas vendas trimestrais As vendas trimestrais devem aumentar US 5 por estudante incremental Intercepto quais seriam as vendas esperadas caso não houvesse nenhum campus universitário próximo US 60 mil Impacto Marginal Sensibilidade Mínimos Quadrados Ordinários MQO Exemplo Armands Pizza Previsão por ponto ŷ b0 b1x ŷ 60 5x A equação fornece uma estimativa da relação entre o tamanho da população estudantil x e as vendas trimestrais y Se acreditarmos que a equação de regressão estimada a partir dos mínimos quadrados descreve adequadamente a relação entre as variáveis x e y parecerá razoável utilizar a equação de regressão estimada para desenvolver uma estimção por ponto do valor médio de y para um dado valor de x ou para prever um valor individual de y correspondente a um determinado valor de x Quais as vendas trimestrais esperadas para um restaurante localizado próximo de um campus com 10000 alunos o ŷ b0 b1x o ŷ 60 5x o ŷ 60 5 10 o ŷ 60 50 o ŷ US 110 mil não quer dizer que as vendas trimestrais serão exatamente US 110 mil muitos outros fatores podem afetar as vendas além do número de estudantes nas proximidades EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior 23 Coeficiente de Determinação SSE Soma dos Quadrados dos Resíduos SSE Sum of Squares due to Errors A pergunta agora é quão bem a equação de regressão estimada se ajusta aos dados SSE Soma dos Quadrados dos Resíduos Residuo ou Erro diferença entre o valor observado da variável dependente 𝑦𝑖 e o valor previsto da variável dependente ŷ𝑖 SSE erro em utilizar a equação de regressão estimada para predizer os valores da variável dependente Erro ao se prever pelo modelo estimado Coeficiente de Determinação SST Soma dos Quadrados Totais SST Sum of Total Squares Agora suponha que nos seja pedido para desenvolver uma estimativa das vendas trimestrais sem conhecer o tamanho da população de estudantes Sem o conhecimento de quaisquer variáveis relacionadas usaríamos a média da amostra como uma estimativa de vendas trimestre em qualquer restaurante SST Soma dos Quadrados Total SST soma das diferenças entre a variável dependente observada 𝑦𝑖 e o valor médio ou valor esperado da variável dependente 𝑦 ao quadrado SST erro ao utilizar a média da variável dependente 𝑦 para prever os valores 𝑦𝑖 Erro ao se prever pela média geral Coeficiente de Determinação SSR Soma dos Quadrados devida a Regressão SSR Sum of Squares due to Regression SSE medida de quanto as observações se agrupam bem sobra a reta de regressão Erro ao se prever pelo modelo estimado Resíduo ou Erro 𝑦𝑖 ŷ𝑖 SSR medida de quanto os valores estimados na reta de regressão ŷ afastamse da média 𝑦 Ganho ao se prever pelo modelo estimado em comparação a usar a média geral SST medida de quanto as observações se agrupam bem sobra a linha da media 𝑦 Erro ao se prever pela média geral SQT SQReg SQRes SQReg SQT SQRes SQReg 15730 1530 SQReg 14200 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Coeficiente de Determinação 𝟐 NÃO SE ASSUSTE COM 𝟐 BAIXOS 30 Nas ciências sociais aplicadas não são incomuns 𝒓𝟐 baixos nas equações de regressão 𝒓𝟐 aparentemente baixo não significa necessariamente que uma equação de regressão é inútil Ainda é possível que a equação forneça uma boa estimativa da relação certeris paribus entre as variáveis se isso é verdade ou não não depende diretamente da magnitude do 𝒓𝟐 Estudantes que estão se defrontando com regressões pela 1ª vez tendem a pôr muito peso na magnitude do 𝒓𝟐 Por enquanto conscientizese de que usar o 𝒓𝟐 como o principal padrão de medida de sucesso de uma análise econométrica pode levar a confusões Premissas do Modelo de Mínimos Quadrados y β₀ β₁x μ Amostras aleatórias A variável independente x não pode ser constante constantes são capturados em β₀ Colinearidade não perfeita entre as variáveis independentes A variável dependente y está relacionada à variável independente x e ao erro μ de forma linear Implicação a reta de regressão representada por β₀ β₁x μ é a base para a relação entre as variáveis O termo de erro μ é uma variável aleatória com uma média ou valor esperado igual a zero ou seja Eμ 0 Implicação β₀ e β₁ são constantes por conseguinte Eβ₀ β₀ e Eβ₁ β₁ desse modo para um dado valor de x o valor esperado de y é Ey β₀ β₁x Homocedasticidade A variância de μ designada por σ² é a mesma para todos os valores de x Varμx σ² Implicação A variância de y nas proximidades da reta de regressão é igual a σ² e é a mesma para todos os valores de x Heterocedasticidade implica que as estimativas do modelo MQO não sejam as mais eficientesprecisas Média Condicional Zero Exogeneidade Os valores de μ são independentes Eμx Eε 0 Implicação O valor de μ para um valor em particular de x não está relacionado ao valor de μ para qualquer outro valor de x assim o valor de y para um valor em particular de x não está relacionado com o valor de y para qualquer outro valor de x O termo de erro μ é uma variável aleatória e normalmente distribuída Implicação Uma vez que y é uma função linear de μ y também é uma variável aleatória normalmente distribuída EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade A variância de μ designada por 𝟐 é a mesma para todos os valores de 𝟐 32 O valor esperado de se modifica de acordo com o valor específico considerado de Entretanto independentemente do valor de a distribuição de probabilidade do erro e portanto as distribuições de probabilidade de em qualquer ponto em particular depende de o valor real de ser maior ou menor que o seu valor esperado EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Homocedasticidade vs Heterocedasticidade 33 Homocedasticidade Heterocedasticidade EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade Exemplo 34 Plotagem residual em relação a x Os resíduos yᵢ ŷᵢ fornecem a melhor informação sobre o termo de erro μ Portanto uma análise dos resíduos é um passo importante para determinar se as suposições referentes a μ são apropriadas Eμx Eμ 0 Exogeneidade Varμx σ² Homocedasticidade Grande parte da análise residual baseiase em um exame das plotagens gráficas Uma plotagem residual em relação à variável independente x é um gráfico no qual os valores da variável independente x são representados pelo eixo horizontal e os valores residuais correspondentes são representados pelo eixo vertical Para cada resíduo é marcado um ponto no gráfico A primeira coordenada de cada ponto é dada pelo valor de xᵢ e a segunda coordenada é dada pelo correspondente valor do resíduo yᵢ ŷᵢ Se a suposição de que a variância do erro μ é idêntica para todos os valores de x e se o modelo de regressão constituir uma representação adequada da relação entre as variáveis a plotagem residual deverá das a impressão geral de uma faixa horizontal de pontos EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Plotagem residual em relação a Exemplo Armands Pizza Parlors Se a suposição de que a variância do erro é idêntica para todos os valores de e se o modelo de regressão constituir uma representação adequada da relação entre as variáveis a plotagem residual deverá das a impressão geral de uma faixa horizontal de pontos 36 Plotagem residual em relação a ŷ Os resíduos yᵢ ŷᵢ fornecem a melhor informação sobre o termo de erro μ Portanto uma análise dos resíduos é um passo importante para determinar se as suposições referentes a μ são apropriadas Grande parte da análise residual baseiase em um exame das plotagens gráficas Uma plotagem residual em relação à variável dependente y é um gráfico no qual os valores da variável dependente y são representados pelo eixo horizontal e os valores residuais correspondentes são representados pelo eixo vertical Para cada resíduo é marcado um ponto no gráfico A primeira coordenada de cada ponto é dada pelo valor de ŷᵢ e a segunda coordenada é dada pelo correspondente valor do resíduo yᵢ ŷᵢ O padrão dessa plotagem residual é idêntico ao da plotagem residual em relação à variável independente y para uma regressão linear simples Para a regressão múltipla multivariada a plotagem residual em relação à variável dependente y é mais amplamente usada em virtude da presença de mais uma variável independente EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Heterocedasticidade causa viés NÃO Heterocedasticidade o Afetará os errosdesviospadrão das estimativas o Os erros padrão reportados por programas estatísticos assumem homocedasticidade o Se os erros são heterocedásticos as inferências estatísticas sobre estes erros padrão podem estar incorretas e subestimadas EXOGENEIDADE o A violação da hipótese de média condicional zero dos erros é que causa viés nos estimadores o Precisamos respeitar a hipótese de média condicional zero para obter estimadores consistentes o A hipótese de media condicional zero é diferente de homocedasticidade o ENDOGENEIDADE CAUSA VIÉS NOS COEFICIENTES 38 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero EXOGENEIDADE CMI Conditional Mean Independence O erro é independente da média de Se ε e são não correlacionados logo como variáveis aleatórias não são linearmente relacionados Mas isso não é suficiente pois a correlação mede somente a dependência linear entre e É preciso que não tenha relação com qualquer função de 39 Hipótese de Média Condicional Zero EXOGENEIDADE EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Implicações CMI Conditional Mean Independence Lembrese que o erro captura todos os fatores que afetam além de É MUITA COISA Imagine esse problema em estudos de finanças e economia por exemplo oEndividamento ftamanho da empresa Empresas pequenas talvez tenham mais restrições financeiras e portanto menos opções de endividamento oPoupança frenda Pessoas que ganham mais têm mais opções entre gastar ou poupar oInvestimento ffluxo de caixa Empresas com mais fluxo de caixa podem ter mais propensão a investir mesmo que esses investimentos não criem valor 40 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo SalárioHora CMI Conditional Mean Independence outros fatores não observados que afetam o salário hora além de educação oIsso implica outros fatores que afetam salário por hora e não estão em média relacionados aos anos de educação formal oPortanto se entendermos que aptidão inata é parte de então será necessário que os níveis médios de aptidão sejam os mesmos em todas os níveis de educação 41 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo CMI Conditional Mean Independence Se as quantidades de fertilizantes são escolhidas independentemente de outras características das áreas então é verdadeiro e então a qualidade média da terra que estaria no termo de erro não dependeria da quantidade de fertilizantes Entretanto se mais fertilizantes forem usados em áreas de terra de melhor qualidade então o valor esperado do erro varia com o nível de fertilizantes e não se sustenta 42 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Estrutura de Capital CMI Conditional Mean Independence 𝒊 𝟎 𝟏 𝒊 Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Lucratividade o Lucratividade e o termo de erro são independentes e não correlacionados o O termo de erro poderia incluir vários fatores como distância da falência Z de Altman Tamanho MB entre outros É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas pouco lucrativas tendem a ter maior risco de crédito o que resultaria pela teoria do tradeoff de estrutura de capital em um menor endividamento risco de crédito que está capturado no termo de erro está relacionado com a lucratividade o Firmas pouco lucrativas tendem a ter menos caixa e liquidez o que resultaria pela teoria do pecking order de estrutura de capital em um menor endividamento liquidez que está capturado no termo de erro está correlacionado com a lucratividade 43 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Hipótese de Média Condicional Zero Exemplo Investimento CMI Conditional Mean Independence Um modelo não viesado implica que a média e a variância do termo de erro seja a mesma pra cada nível de Q de Tobin o Q de Tobin e o termo de erro são independentes e não correlacionados É fácil obter algumas evidências de que isso não é verdade para nosso modelo o Firmas com baixo Q de Tobin podem estar em estresse financeiro e por este motivo investem menos estresse financeiro que está capturado no termo de erro está relacionado com o Q de Tobin o Firmas com alto Q de Tobin podem ser menores mais jovens e apresentarem maiores dificuldades de obtenção de fundos para investimento tamanho ou maturidade que estão capturados no termo de erro estão correlacionado com o Q de Tobin 44 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Razões para Endogeneidade ou Violação da Hipótese de Média Condicional Zero Razões para o erro estar correlacionado com a variável independente Uma variável endógena é quando seu valor depende da variável o Uma variável é endógena quando está relacionada com por alguma razão É possível testar a hipótese de média condicional zero o NÃO Por construção os resíduos tem média zero e não são correlacionados com as variáveis independentes Razões veremos nas próximas aulas em detalhes o Variáveis Omitidas o Erros de MensuraçãoMedida o Simultaneidade 45 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidado com a Interpretação de Causalidade e Linearidade 55 Relação Real não linear Menor valor observado de 𝑥 Maior valor observado de 𝑥 𝟎 𝟏 A equação é boa entre os valores observados de 𝑥 Dada uma relação significativa devemos nos sentir confiantes em usar a equação de regressão estimada para fazer previsões correspondentes a valores de 𝒙 dentro do intervalo de valores de 𝒙 observados na amostra A menos que outras razões indiquem que o modelo é válido além dessa faixa previsões fora do intervalo da variável independente 𝑥 devem ser feitas com cautela Em relação aos restaurantes Armands Pizza Parlors esse intervalo corresponde a valores de 𝑥 entre 2 e 26 mil estudantes Portanto devemos nos sentir confiantes com 1 de significância em usar a equação de regressão estimada para prever as vendas para os restaurantes em que a população estudantil correspondente está entre 2 e 26 mil estudantes EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Um Modelo Linear Simples do Salário Linearidade implica uma variação de uma unidade em que tem o mesmo efeito sobre independentemente do valor inicial de A inclinação da equação de regressão mencionada acima implica um ano a mais de educação formal aumenta o salário por hora em US 054 de maneira constante tanto para o 1º ano de educação quanto para o 20º ano Isso pode ser irrealista para muitas aplicações econômicas Por exemplo no Salário e Educação poderíamos querer considerar retornos crescentes de modo que o próximo ano de educação teria em relação ao anterior um efeito maior sobre os salários Denotando uma relação exponencial o Provavelmente uma caracterização melhor de como o salário muda com o nível de escolaridade é que cada ano de educação aumenta o salário em uma porcentagem constante Por exemplo um aumento na educação de 5 para 6 anos aumenta o salário em digamos 8 certeris paribus e um aumento na educação de 11 para 12 anos também aumenta o salário nos mesmos 8 62 𝟎 𝟏 Anos de educação formal US por hora EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Um Modelo Linear Simples do Salário Um modelo que gera aproximadamente um efeito constante é utilizando o logaritmo natural da variável de interesse A inclinação da equação de regressão em log acima implica um ano a mais de educação formal aumenta o salário por hora em aproximadamente 0083 ou 83 de maneira constante tanto para o 1º ano de educação quanto para o 20º ano o 𝟏𝟎𝟎 𝒍𝒏 𝒚 𝒚 o 100 0083 83 Para grandes variações 𝟏𝟎𝟎 𝒍𝒏 𝒚 𝒚 tornase um mal estimador Para grandes variações devemos transformar o impacto obtido em 𝒚 antes de interpretar os resultados impossível ter variação menor do que 100 no preço de um ativo por exemplo o 𝒚 𝟏𝟎𝟎𝒆𝒙𝒑 𝜷𝟏𝒙 𝟏 o Se 𝛽 056 a variação causada por variação de uma unidade em 𝑥 𝑥 1 não é aproximadamente 56 mas sim 75 o 𝒚 𝟏𝟎𝟎 𝒆𝒙𝒑 𝟎 𝟓𝟔 𝟏 𝟕𝟓 O intercepto não tem muito significado 63 𝟎 𝟏 Anos de educação formal US por hora 𝟎 𝟏 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidado com a interpretação variação vs variação em pontos percentuais Margem de lucro passou de 10 para 9 o 10 de redução 910 1 ou 10 910 o 1 ponto percentual de redução 10 9 Neste caso o coeficiente 086 indica que para 1 ponto percentual de crescimento no Market Share de 20 para 21 por exemplo o ROE sobe em média 086 pontos percentuais de 15 para 1586 por exemplo Neste caso o coeficiente 18501 indica que para 1 ponto percentual de crescimento ROE de 20 para 21 por exemplo o salário do CEO em 1990 sobe em média 18501 mil dólares 65 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Intervalo de Confiança do Valor Médio de Intervalo de Previsão para um Valor Individual de Observe que o intervalo de previsão para um restaurante em particular individual localizado próximo a um campus com 10 mil estudantes é mais amplo que o intervalo de confiança para a media de vendas de todos os restaurantes localizados próximo a campi com 10 mil estudantes A diferença reflete o fato de sermos capazes de estimar o valor médio de mais precisamente do que um valor individual de 70 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior CAPM Capital Asset Pricing Model 71 𝑨 𝒇 𝑨 𝑴 𝒇 𝒓𝑨 Retorno do Ativo 𝑹𝒇 Retorno de um ativo livre de risco 𝑹𝑴 𝑹𝒇 Prêmio de Risco de Mercado quanto uma carteira de mercado rende acima de uma taxa livre de risco 𝑹𝑴 Retorno de uma carteira de mercado 𝜷𝑨 Coeficiente beta do ativo coeficiente angular da reta de regressão formada pelos retornos dos ativos e dos retornos de uma carteira de mercado Quanto que os retornos do ativo respondem às variações do retorno da carteira de mercado 𝑪𝒐𝒗 𝒓𝑨 𝑹𝑴 𝑽𝒂𝒓𝑹𝑴 𝑨 𝒇 𝑨 𝑴 𝒇 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Beta β Medida de Risco Relativo Risco Sistêmico ou Risco Sistemático Risco Sistêmico ou Risco de Mercado o Risco Relativo ao mercado o Único fator de risco relevante no CAPM Quanto o retorno de um ativo responde às variações no retorno de uma carteira diversificada de mercado sensibilidade do retorno do ativo às variações do retorno da carteira de mercado O risco relevante de uma ação é sua contribuição ao risco de uma carteira bem diversificada o Visto que o Beta de uma ação determina como ela afeta o risco de uma carteira de marcado ele é a medida mais relevante do risco de qualquer ação O Beta de uma ação mede sua contribuição para a variância da carteira de mercado por unidade de risco Consequentemente o prêmio de risco por investir em um ativo de risco é dado em função do Beta 72 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Entendendo o Coeficiente Beta β O β beta de uma ação mede sua contribuição para a variância da carteira de mercado por unidade de risco Consequentemente o prêmio de risco por investir em um ativo de risco é dado em função do β β 1 módulo os ativos se comportam da mesma forma que o mercado Se o mercado sobe os ativos sobem no mesmo percentual o mesmo ocorrendo se houver uma baixa no mercado O risco da ação é igual ao risco sistemático do mercado como um todo Estes ativos são chamados tipo médio β 1 módulo estes ativos são do tipo agressivo Se o mercado sobe em determinado percentual o ativo sobe mais que o mercado e se o mercado cai em determinado percentual o ativo cai mais que o mercado Retrata um risco sistemático maior que o da carteira de mercado β 1 módulo estes ativos são do tipo defensivo Apresentam risco sistemático menor do que o do mercado como um todo o 0 β 1 se o mercado sobe em determinado percentual o ativo sobe menos que o mercado e se o mercado cai em determinado percentual o ativo cai menos que o mercado o β 0 o ativo se comporta de maneira contrária ao mercado ou seja se o mercado sobe o ativo cai e viceversa o β 0 o ativo é indiferente ao mercado ou livre de risco 73 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Cuidados com a Regressão a maneira como organizase a regressão definirá o beta Qual o índice utilizado para estimar o 𝑴 o Índice local Ibovespa o Índice global SP500 Qual período utilizado na regressão o Últimos 2 anos o Últimos 5 anos o Últimos 10 anos o Todo o período Que tipo de retorno o Diário o Semanal o Mensal Observar o erro padrão do beta e seu intervalo de confiança 76 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Checklist 1 Defina as variáveis independente x e dependente y 2 Construa o gráfico de dispersão 3 Analise o gráfico de dispersão o que o diagrama de dispersão desenvolvido indica sobre a relação entre as duas variáveis 4 Use o método dos MQO Mínimos Quadrados Ordinários para desenvolver a equação de regressão estimada 5 Interprete os coeficientes do modelo inclinação e o intercepto da equação de regressão estimada 6 Calcule o coeficiente de determinação r2 7 Analise a partir do coeficiente de determinação r2 se a equação de regressão estimada proporcionou um bom ajuste 8 Analise se há evidência estatística para concluir que há uma relação linear significativa entre as variáveis teste t do coeficiente angular β da reta de regressão tendo Ho β 0 9 Calcule os resíduos do modelo 10 Construa um gráfico de resíduos em relação à variável independente x 11 Analise o gráfico de resíduos Qual o padrão da distribuição dos resíduos Este padrão indica que o modelo deve ser utilizado ou devemos procurar um melhor 77 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Regressão Linear no Excel 78 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Variável Dependente claramente identificada titulada Variáveis Independentes claramente identificadas tituladas Coeficientes e seus respectivos errospadrão estatística t e estrelas indicando seu nível de significância estatística o significante com α 001 1 o significante com α 005 5 o significante com α 01 10 o Não colocar estrelas quando não há significância estatística Número de observações em cada regressão 81 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Explicando Resultados de Regressões FOCO NO QUE É O PRINCIPAL Foque nas variáveis de interesse oIndique seu sinal magnitude significância estatística e econômica interpretação etc oNão perca tempo com outros coeficientes a menos que eles tenham dado um resultado estranho fora do esperado sinal oposto ao esperado magnitude enorme etc Não reporte resultados e regressões em tabelas que você não irá discutir eou mencionar oSe não é importante o suficiente para mencionar ou discutir não é importante suficiente para estar em uma tabela 82 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior Reportando Resultados de Regressões Exemplo 83 Fonte Agrawal A K Matsa D A 2013 Labor unemployment risk and corporate financing decisions Journal of Financial Economics 1082 449470 EPPEN Escola Paulista de Política Economia e Negócios Curso de Ciências Contábeis Métodos Quantitativos Aplicados Prof Dr José Marcos Carrera Junior josecarreraunifespbr 84 Obrigado Dúvidas