·

Ciências Econômicas ·

Econometria

Send your question to AI and receive an answer instantly

Ask Question

Preview text

APRESENTAÇÃO REGRESSÃO LINEAR MÚLTIPLA Profa Dra Daniela Müller de Quevedo REGRESSÃO LINEAR MÚLTIPLA CONCEITOS BÁSICOS Muitas vezes uma única variável explicativa preditora não será capaz de explicar tudo a respeito da variável resposta Se em vez de uma forem incorporadas várias variáveis independentes passase a ter uma análise de regressão linear múltipla A análise de uma regressão múltipla segue basicamente os mesmos critérios da análise de uma regressão simples A regressão múltipla envolve três ou mais variáveis portanto estimadores Ou seja ainda uma única variável dependente porém duas ou mais variáveis independentes A finalidade das variáveis independentes adicionais é melhorar a capacidade de predição em confronto com a regressão linear simples REGRESSÃO LINEAR MÚLTIPLA Muitas fórmulas matemáticas podem servir para expressar relações entre mais do que duas variáveis mas as mais comumente usadas em estatística em parte por questões de conveniência são as equações lineares da forma Onde Y variável dependente a0 intercepto do eixo y ai coeficiente angular da iésima variável i1n n número de variáveis independentes ε é o erro não explicado pelo modelo 𝑌𝑎0𝑎1 𝑋 1𝑎2 𝑋 2𝑎𝑛 𝑋𝑛𝜀𝑖 Também na regressão múltipla as estimativas dos mínimos quadrados para os coeficientes a0 e ai i1n são obtidas pela escolha dos estimadores que minimizam a soma dos quadrados dos desvios entre os valores observados e os valores ajustados O Método dos Mínimos Quadrados Através do método dos mínimos quadrados devemos obter o mínimo da função E derivandoa em relação aos coeficientes e igualando o resultado a zero Devido à complexidade das fórmulas envolvidas utilizase a abordagem matricial que também permite encontrar o vetor de estimadores verificar propriedades estatísticas e obter a distribuição de probabilidades A estimativa dos parâmetros através do método dos mínimos quadrados requer exaustivos cálculos Deste modo em geral utilizase softwares de estatística para estimação desses parâmetros Os softwares comumente utilizados são o Excel SPSS R entre outros Enquanto uma regressão linear simples de duas variáveis resulta na equação de uma reta um problema de três variáveis implica num plano Fonte Maia 2017 USOS DA REGRESSÃO MÚLTIPLA Ajustar dados estudando o efeito de uma variável X levando em conta outras variáveis independentes Obter uma equação para predizer valores de Y a partir dos valores de várias variáveis X1 X2 Xk Explorar as relações entre múltiplas variáveis X1 X2 Xk para determinar que variáveis influenciam Y O coeficiente de determinação múltipla é uma medida de quão bem a equação e regressão múltipla se ajusta aos dados amostrais Ajuste perfeito R² 1 Ajuste bom R² prox de 1 Ajuste pobre R² prox 0 Defeito Na medida em que mais variáveis são incluídas R² cresce pela simples inclusão de todas as variáveis disponíveis Por causa dessa falha a comparação de diferentes equações é feita mais adequadamente com o ajuste do coeficiente de determinação para o número de variáveis e o tamanho amostral REGRESSÃO LINEAR MÚLTIPLA O COEFICIENTE DE DETERMINAÇÃO EXEMPLO 1 Seja a relação entre renda familiar mensal em 1000 reais Y anos de estudo em graduação e pós graduação X1 e idade X2 do responsável pela família REGRESSÃO LINEAR MÚLTIPLA Y Renda X1 Anos Estudo X2 Idade 4 1 20 8 4 30 10 6 40 12 7 50 Devemos aqui estimar os coeficientes da expressão YRenda a0 a1XEstudo a2XIdade Os resultados abaixo foram encontrados utilizando o aplicativo Excel Coeficientes Erro padrão Interseção a0 19 134 a1 Anos Estudo 1 045 a2 Idade 006 009 Logo a expressão da regressão linear múltipla será dada por 19 1XEstudo 006XIdade De acordo com a equação de regressão múltipla para quem tem 5 anos de estudo e 35 anos de idade a renda estimada será de 19 15 00635 9 mil reais EXEMPLO 2 Para determinar a influência exercida por preço e qualidade sobre a preferência dos clientes por determinada drogaria 8 grandes estabelecimentos numa grande área metropolitana foram ranqueados em termos de preferência por loja qualidade das mercadorias e preço Todas as classificações do ranking foram estabelecidas numa escala de 11 pontos com os números maiores indicando a classificação mais favorável Loja Preferência Y Qualidade X Preço X 1 6 5 3 2 9 6 11 3 8 6 4 4 3 2 1 5 10 6 11 6 4 3 1 7 5 4 7 8 2 1 4 Devemos aqui estimar os coeficientes da expressão YPreferência a0 a1XQualidade a2XPreço Os resultados abaixo foram encontrados utilizando o aplicativo Excel O Excel também fornece a correlação múltipla e o coeficiente de determinação Nesse caso R² 096 o que indica um bom ajuste da equação de regressão aos dados amostrais Coeficientes Interseção 0039072 Qualidade X 1174332 Preço X 0188916 Estatística de regressão R múltiplo 0979895 RQuadrado 0960194 Logo a expressão da regressão linear múltipla representada por 0039 1174XQualidade 1189XPreço EXEMPLO 3 Para determinar a influência exercida por preço e qualidade sobre a preferência dos clientes por determinada drogaria 8 grandes estabelecimentos numa grande área metropolitana foram ranqueados em termos de preferência por loja qualidade das mercadorias e preço Todas as classificações do ranking foram estabelecidas numa escala de 11 pontos com os números maiores indicando a classificação mais favorável ANÁLISE DE RESÍDUOS REGRESSÃO LINEAR MÚLTIPLA Loja Preferência Y Qualidade X Preço X 1 6 5 3 2 9 6 11 3 8 6 4 4 3 2 1 5 10 6 11 6 4 3 1 7 5 4 7 8 2 1 4 1 2 3 4 5 6 7 8 9 10 15 1 05 0 05 1 Preferência Resíduo No exemplo 2 encontramos a expressão da regressão linear múltipla dada por 0039 1174XQualidade 1189XPreço Nesse caso R² 096 o que indica um bom ajuste da equação de regressão aos dados amostrais Multicolinearidade em regressão é uma condição que ocorre quando algumas variáveis preditoras no modelo estão correlacionadas a outras variáveis preditoras A multicolinearidade forte é problemática porque pode aumentar a variância dos coeficientes de regressão tornandoos instáveis Para Garson 2011 multicolinearidade referese à correlação excessiva entre as variáveis preditoras Quando a correlação é excessiva alguns usam a regra de ouro de R090 os erros padrão dos coeficientes se tornam grandes tornando difícil ou impossível avaliar a importância relativa das variáveis preditoras Multicolinearidade é menos importante quando a finalidade da pesquisa é a predição já que os valores preditos da variável dependente permanecem estáveis Os coeficientes função discriminante linear não podem ser interpretados de forma confiável mas os valores ajustados classificados não são afetados Para identificar a multicolinearidade podemos calcular o VIF Fator de inflação de variância MULTICOLINERALIDADE REGRESSÃO LINEAR MÚLTIPLA Se VIF 10 então o coeficiente do modelo está pobremente estimado devido a multicolinearidade EXEMPLO 4 Para determinar a influência exercida por preço e qualidade sobre a preferência dos clientes por determinada drogaria 8 grandes estabelecimentos numa grande área metropolitana foram ranqueados em termos de preferência por loja qualidade das mercadorias e preço Todas as classificações do ranking foram estabelecidas numa escala de 11 pontos com os números maiores indicando a classificação mais favorável Matriz de correlação R Preferência Y Qualidade X1 Preço X2 Preferência Y 1 Qualidade X1 0958 1 Preço X2 0762 0629 1 A partir da matriz de correlação é possível identificar que existe correlação entre todas as variáveis do modelo inclusive entre as variáveis preditoras X1 e X2 Apesar disso não podemos afirmar que exista multicolinearidade utilizando o critério de R 090 de acordo com Garson 2011 Também calculando o valor VIF TESTE DE HIPÓTESES NA REGRESSÃO CONCEITOS BÁSICOS Uma das hipóteses efetuadas para aplicar o método dos mínimos quadrados é a de que tanto a média μ quanto Y a e b se comportam estatisticamente de acordo com a distribuição normal Desta forma é possível utilizar a distribuição t de Student para testar hipóteses sobre os parâmetros do modelo As hipóteses são formuladas de maneira a testar SIGNIFICÂNCIA DOS PARÂMETROS NO MODELO DE REGRESSÃO H0 hipótese nula ai 0 H1hipótese alternativa ai 0 Trabalhando com um determinado nível de significância α e nk graus de liberdade onde n é o número de observações e k o número de variáveis A regra de decisão empregada é a de aceitar H0 toda vez que o valor tabelado de t para nk graus de liberdade seja maior que o valor calculado para o parâmetro que está sendo testado e rejeitar H0 em caso contrário Aceitase H0 se tT tC ou se pvalue p α Rejeitase H0 se tT tC ou se pvalue p α Onde a significância é dada por O valor te tC é obtido através da expressão α ia i C S a t ˆ ˆ Onde é o desvio padrão do parâmetro iaS ˆ É importante destacar aqui que a avaliação da significância dos parâmetros do modelo de regressão deve ser realizado para regressão linear simples e múltipla ANOVA NO MODELO DE REGRESSÃO Para se decidir quão bem o modelo ajustado é adequado à natureza dos dados experimentais podese lançar mão da análise de variância da regressão ANOVA A ANOVA irá particionar a variação total SQDtot da variável dependente Y ou fator resposta em função das variações nos níveis das variávelis independentes X ou regressor A análise de variância para a regressão é apresentada como O valor de pvalue é obtido considerandose que a estatística F tem uma distribuição F com k e Nk1 graus de liberdade Observações É importante relembrar aqui a distribuição FSnedecor Para realizar o teste de significância dos parâmetros e a tabela da ANOVA utilizaremos o aplicativo Excel CRITÉRIOS PARA DECISÃO DE UM MODELO AJUSTADO Para avaliar o ajuste do modelo de regressão é preciso responder aos seguintes questionamentos O modelo é adequado à natureza do fenômeno em estudo ou adequado pelo que se sabe do fenômeno O coeficiente de determinação R2 é elevado No quadro da análise de variância o efeito devido à regressão é significativo O efeito devido daa variávelis independentes é significativo EXEMPLO 5 Em economia admitese que o nível de renda afete a procura de determinado bem de consumo Para a maior parte desses bens uma renda mais elevada acarreta maior procura A única maneira de dizer se um determinado bem de consumo é um bem inferior consiste em coletar os dados Suponha as seguintes observações da renda média e de consumo de determinado produto durante um mês em oito cidades distintas ANOVA NO MODELO DE REGRESSÃO LINEAR SIMPLES Cidade Renda X 1000 Unidades vendidas Y milhares 1 2 3 4 5 6 7 8 5 10 20 8 4 6 12 15 27 46 73 40 30 28 46 59 Estatística de regressão R múltiplo 0984033 RQuadrado 096832 Rquadrado ajustado 096304 Erro padrão 3108329 Observações 8 Coeficient es Erro padrão Stat t valorP 95 inferiores 95 superiores Inferior 950 Superior 950 Interseção 1457738 241009 604848 000092 868011 2047465 868011 2047465 Renda X 290476 021450 1354233 000001 237991 342961 237991 342961 ANOVA gl SQ MQ F F de significação Regressão 1 1771905 1771905 1833946 000001 Resíduo 6 5797024 9661706 Total 7 1829875 Análise O Rquadrado do modelo é alto 09683 a ANOVA diz que o modelo é adequado p 000001 005 Os coeficientes do modelo também são significativos Isto indica que a renda é uma boa variável preditora para unidades vendidas EXEMPLO 6 Seja a relação entre renda familiar mensal em 1000 reais Y anos de estudo em graduação e pós graduação X1 e idade X2 do responsável pela família Y Renda X1 Anos Estudo X2 Idade 4 1 20 8 4 30 10 6 40 12 7 50 ANOVA gl SQ MQ F F de significação Regressão 2 348 174 87 0075593 Resíduo 1 02 02 Total 3 35 Coeficientes Erro padrão Stat t valorP 95 inferiores 95 superiore s Inferior 950 Superior 950 Interseção 19 134 1420127 0390575 150997 1889974 150997 1889974 X1 Anos Estudo 1 045 2236068 026772 468239 6682388 468239 6682388 X2 Idade 006 009 0654654 063099 110454 1224543 110454 1224543 Estatística de regressão R múltiplo 0997138764 RQuadrado 0994285714 Rquadrado ajustado 0982857143 Erro padrão 0447213595 Observações 4 Análise Apesar do R quadrado do modelo ser alto 09943 a ANOVA diz que o modelo não é adequado p 00756 005 Os coeficientes do modelo também não são significativos BARBETTA Pedro Alberto Estatística para cursos de engenharia e informática 3 São Paulo Atlas 2010 Recurso online ISBN 9788522465699 GARSON David 2011 Statnotes Topics in Multivariate Analysis by G David Garson Disponível em httpfacultychassncsuedugarsonPA765statnotehtm Acessado em 06 de setembro de 2021 MAIA Alexandre Gori Econometria conceitos e aplicações aprenda os fundamentos da análise econométrica e resolva problemas econômicos concretos São Paulo Saint Paul 2017 Recurso online ISBN 9788580041286 KAZMIER Leonard J Estatística aplicada à administração e economia 4 Porto Alegre Bookman 2006 1 recurso online Schaum ISBN 9788577802470 Gráficos e tabelas elaborados pela autora REFERÊNCIAS