·
Economia ·
Econometria
Send your question to AI and receive an answer instantly
Recommended for you
Preview text
Exercíciodesafio Regressão múltipla multicolinearidade e heterocedasticidade 1 Considerando o modelo do último exercíciodesafio e a violação das hipóteses de homoscedasticidade e ausência multicolinearidade dos estimadores de MQO responda a Encontre a matriz de correlação simples para as variáveis do modelo O que se pode afirmar da correlação entre as variáveis independentes Isso pode ser um indicativo da existência de multicolinearidade no modelo estimado Explique b Observando o modelo estimado podese concluir alguma coisa acerca da existência de multicolinearidade Explique c Encontre o fator de inflação da variância para ambas as variáveis explicativas Eles são elevados São capazes de influenciar a variância do modelo Explique d Caso a multicolinearidade seja confirmada quais medidas poderiam ser tomadas para que esse problema fosse amenizado na regressão e Faça um gráfico para cada variável independente com relação ao quadrado dos resíduos É possível observar algum padrão em relação ao comportamento deles para com a variável independente Explique f Realize o teste de BreuschPaganGodfrey BPG e verifique se há heterocedasticidade na regressão estimada Qual a conclusão do teste para 10 de significância g Realize o teste de White e verifique se há heterocedasticidade na regressão estimada Qual a conclusão do teste para 10 de significância h Estime novamente a regressão agora com os errospadrão robustos de White i Analise a regressão estimada i houve mudança nos coeficientes da regressão Sim ou não Por quê ii como ficaram os errospadrão após a correção de White Eles estavam subestimados ou superestimados em relação à regressão original iii Refaça o teste 𝑡 de Student a 10 de significância Houve alguma variável explicativa que não foi significativa desta vez Se sim qual foi ano pib emprego capital 1955 114043 8310 182113 1956 120410 8529 193749 1957 129187 8738 205192 1958 134705 8952 215130 1959 139960 9171 225021 1960 150511 9569 237026 1961 157897 9527 248897 1962 165286 9662 260661 1963 178491 10334 275466 1964 199457 10981 295378 1965 212323 11746 315715 1966 226977 11521 337642 1967 241194 11540 363599 1968 260881 12066 391847 1969 277498 12297 422382 1970 296530 12955 455049 1971 306712 13338 484677 1972 329030 13738 520553 1973 354057 15924 561531 1974 374977 14154 609825 ADVERTISEMENT ADVERTISEMENT Lisca de Econometria Regressão múltipla multicolinearidade e heterocedasticidade Matheus 20240531 Criação dos vetores ano c1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 pib c114043 120410 129187 134705 139960 150511 157897 165286 178491 199457 212323 226977 241194 260881 277498 296530 306712 329030 354057 374977 emprego c8310 8529 8738 8952 9171 9569 9527 9662 10334 10981 11746 11521 11540 12066 12297 12955 13338 13738 15924 14154 capital c182113 193749 205192 215130 225021 237026 248897 260661 275466 295378 315715 337642 363599 391847 422382 455049 484677 520553 561531 60982 Criação do data frame dados dataframeano pib emprego capital Encontre a matriz de correlação simples para as variáveis do modelo O que se pode afirmar da correlação entre as variáveis independentes Isso pode ser um indicativo da existência de multicolinearidade no modelo estimado Explique Letra a Matriz de Correlação entre as variáveis cordados ano pib emprego capital ano 10000000 09847855 09701482 06264987 pib 09847855 10000000 09776988 05865478 emprego 09701482 09776988 10000000 06692594 capital 06264987 05865478 06692594 10000000 Vendo a Matriz de correlação atraves de gráfico librarycorrplot Warning package corrplot was built under R version 432 corrplot 092 loaded Cálculo da matriz de correlação cormatrix cordados Criação do gráfico de bolas corrplotcormatrix method circle type lower tlcol black tlcex 08 addCoefcol black numbercex 07 Através do gráfico de bolas da matriz de correlação observamos que quanto mais escura a cor azul maior é a correlação positiva entre as variáveis No gráfico verificamos uma alta correlação entre as variáveis ano e PIB ano e emprego e PIB e emprego todas indicadas por bolas de cor azul escuro A correlação muito alta entre ano e PIB sugere que à medida que o ano aumenta o PIB também aumenta significativamente Similarmente a alta correlação entre ano e emprego indica que o número de empregos cresce substancialmente com o passar dos anos Além disso a correlação significativa entre PIB e emprego mostra que o crescimento do PIB está fortemente associado ao aumento do emprego Essas fortes correlações entre as variáveis são indicativos claros de possível multicolinearidade no modelo estimado A multicolinearidade ocorre quando uma variável independente pode ser prevista com alta precisão a partir das outras variáveis independentes Isso pode dificultar a interpretação dos coeficientes de regressão já que eles se tornam instáveis e menos confiáveis Portanto a análise do gráfico de bolas sugere que a multicolinearidade pode ser um problema significativo no modelo devido às fortes correlações positivas entre as variáveis independentes Esse problema precisa ser tratado para melhorar a precisão e a interpretação do modelo de regressão Observando o modelo estimado podese concluir alguma coisa acerca da existência de multicolinearidade Explique O modelo estimado será C a pi t aliβ0β1a noiβ2 P I Biβ3 Em pr e g oiϵ i m1 lmcapital ano pib emprego summarym1 Call lmformula capital ano pib emprego Residuals Min 1Q Median 3Q Max 242155 26850 2674 42603 139641 Coefficients Estimate Std Error t value Prt Intercept 4873e07 3979e07 1225 02384 ano 2472e04 2044e04 1209 02442 pib 3848e00 1691e00 2276 00370 emprego 1192e02 4679e01 2547 00215 Signif codes 0 0001 001 005 01 1 Residual standard error 89750 on 16 degrees of freedom Multiple Rsquared 05896 Adjusted Rsquared 05126 Fstatistic 7662 on 3 and 16 DF pvalue 0002141 Considerando um nível de significância de 5 o modelo de regressão linear múltipla proposto mostrouse significativo O pval or do teste F foi menor que 005 permitindonos rejeitar a hipótese nula de que o modelo não é significativo Isso indica que pelo menos uma das variáveis independentes do modelo é capaz de explicar as variações na variável dependente que é o C a pi t al O coeficiente de determinação R 2 do modelo foi de 05896 Isso significa que 5896 das variações do C a pi t al são explicadas pelo modelo Este é um bom indicador de que o modelo tem uma capacidade razoável de explicação embora não completa das variações na variável dependente No entanto ao considerar os resultados dos testes T para os coeficientes individuais nem todos os parâmetros do modelo foram significativos Com um pval or maior que 005 tanto o intercepto quanto a variável independente ano não foram significativos no modelo Isso sugere que ao contrário de outras variáveis independentes o ano não contribui significativamente para a explicação das variações do C a pi t al dentro do contexto deste modelo específico Encontre o fator de inflação da variância para ambas as variáveis explicativas Eles são elevados São capazes de influenciar a variância do modelo Explique librarycar Carregando pacotes exigidos carData vifm1 ano pib emprego 3450528 4601156 2362475 A análise dos fatores de inflação da variância VIF para as variáveis independentes do modelo de regressão linear múltipla revela a presença significativa de multicolinearidade A multicolinearidade ocorre quando duas ou mais variáveis independentes estão altamente correlacionadas o que pode inflacionar as variâncias dos coeficientes estimados e dificultar a interpretação dos resultados Os valores de VIF para as variáveis do modelo são Ano 3450 PIB 4601 e Emprego 2362 Geralmente um VIF acima de 10 é considerado um indicativo forte de multicolinearidade Neste caso todos os valores de VIF são muito superiores a 10 sugerindo uma multicolinearidade severa entre as variáveis independentes Para a variável Ano o VIF de 3450 indica que a variância do coeficiente estimado para essa variável é inflacionada em mais de 34 vezes devido à correlação com outras variáveis independentes no modelo A variável PIB apresenta o maior VIF 4601 indicando que a variância do seu coeficiente estimado é inflacionada em mais de 46 vezes sugerindo uma correlação muito alta com outras variáveis independentes especialmente com Emprego e Ano Embora menor que os VIFs de Ano e PIB o VIF de Emprego ainda é muito elevado com um valor de 2362 indicando uma inflacionação da variância do coeficiente em mais de 23 vezes devido à correlação com outras variáveis independentes Os altos valores de VIF confirmam a presença de multicolinearidade significativa no modelo Essa multicolinearidade pode tornar os coeficientes estimados instáveis e difíceis de interpretar Para lidar com esse problema várias medidas podem ser tomadas Primeiramente podese considerar a remoção de uma ou mais variáveis independentes que apresentam alta correlação entre si Outra abordagem seria criar uma nova variável que combine as variáveis altamente correlacionadas Métodos de regularização como regressão ridge ou lasso também podem ser aplicados para reduzir os efeitos da multicolinearidade Caso a multicolinearidade seja confirmada quais medidas poderiam ser tomadas para que esse problema fosse amenizado na regressão Com o objetivo de lidar com a multicolinearidade presente no modelo de regressão linear múltipla uma estratégia é remover a variável ano do modelo e observar se isso melhora os valores dos fatores de inflação da variância VIF A retirada de uma variável altamente correlacionada pode ajudar a reduzir a multicolinearidade e melhorar a estabilidade dos coeficientes estimados m2 lmcapital pib emprego summarym2 Call lmformula capital pib emprego Residuals Min 1Q Median 3Q Max 269231 27378 7558 56325 134750 Coefficients Estimate Std Error t value Prt Intercept 6207e05 2677e05 2319 00331 pib 2392e00 1203e00 1989 00631 emprego 1306e02 4646e01 2810 00120 Signif codes 0 0001 001 005 01 1 Residual standard error 90960 on 17 degrees of freedom Multiple Rsquared 05521 Adjusted Rsquared 04994 Fstatistic 1048 on 2 and 17 DF pvalue 0001084 vifm2 pib emprego 2267312 2267312 Após remover a variável ano do modelo de regressão linear múltipla o novo modelo passou a ser representado pela seguinte equação C a pi t ali00000042072392 PI Bi001306 Em pr e goiϵi A análise dos coeficientes estimados mostra que o coeficiente para o PIB é estatisticamente não significativo ao nível de significância de 5 pval or005 enquanto o coeficiente para o emprego é estatisticamente significativo pval or005 O coeficiente de determinação múltipla R 2 do novo modelo é de 05521 o que significa que aproximadamente 5521 da variação na variável Capital é explicada pelas variáveis explicativas incluídas no modelo P I B e Em pr e g o Por fim ao calcularmos os fatores de inflação da variância VIF para as variáveis P I B e Em pr e g o no novo modelo observamos que ambos possuem um VIF de aproximadamente 2267 Embora menor do que os valores anteriores esses valores ainda estão acima do limite de 10 sugerindo uma possível multicolinearidade moderada entre as variáveis restantes Portanto embora a remoção da variável ano tenha melhorado a significância estatística dos coeficientes e reduzido a multicolinearidade em comparação com o modelo original ainda pode haver alguma multicolinearidade moderada entre as variáveis restantes Isso indica que ainda pode ser necessário realizar mais ajustes ou considerar outras abordagens para lidar com a multicolinearidade no modelo Faça um gráfico para cada variável independente com relação ao quadrado dos resíduos É possível observar algum padrão em relação ao comportamento deles para com a variável independente Explique Cálculo dos resíduos residuos residm2 residuos2 residuos2 Gráficos dos resíduos ao quadrado versus variáveis independentes parmfrowc12 plotpib residuos2 mainResíduos² vs PIB xlabPIB ylabResíduos² plotemprego residuos2 mainResíduos² vs Emprego xlabEmprego ylabResíduos² Através da análise dos gráficos dos resíduos ao quadrado em relação às variáveis independentes observamos que os padrões sugerem uma distribuição semelhante à exponencial para ambos os casos Esse padrão pode indicar que a relação entre as variáveis independentes e os resíduos ao quadrado não é linear Uma distribuição exponencial nos resíduos ao quadrado sugere que o modelo pode não estar capturando completamente a relação entre as variáveis independentes e a variável dependente Isso pode ser um indicativo de que o modelo precisa de uma transformação ou uma forma mais complexa para capturar a natureza subjacente dos dados de forma adequada Realize o teste de BreuschPaganGodfrey BPG e verifique se há heterocedasticidade na regressão estimada Qual a conclusão do teste para 10 de significância librarylmtest Carregando pacotes exigidos zoo Attaching package zoo The following objects are masked from packagebase asDate asDatenumeric bptestm2 studentized BreuschPagan test data m2 BP 12927 df 2 pvalue 0001559 Como o pval or do teste de BreuschPaganGodfrey BPG foi menor que 01 com um nível de significância de 10 rejeitamos a hipótese nula Isso sugere fortemente a presença de heterocedasticidade nos resíduos do modelo A heterocedasticidade implica que a variância dos resíduos não é constante em todas as observações o que viola uma das suposições fundamentais da regressão linear Essa descoberta indica que a variabilidade dos erros não é uniforme em todo o intervalo das variáveis independentes o que pode comprometer a precisão dos coeficientes estimados e distorcer as inferências feitas a partir do modelo Realize o teste de White e verifique se há heterocedasticidade na regressão estimada Qual a conclusão do teste para 10 de significância librarylmtest bptestm2 pibemprego Ipib2 Iemprego2 data mtcars studentized BreuschPagan test data m2 BP 19957 df 5 pvalue 0001273 De forma análoga ao teste de BreuschPaganGodfrey o teste de White também fornece indícios sobre a presença de heterocedasticidade nos resíduos do modelo Quando o pval or do teste de White é menor que o nível de significância estabelecido 10 rejeitamos a hipótese nula corroborando a presença de heterocedasticidade nos resíduos Essa confirmação através do teste de White fortalece a conclusão anterior reforçando a ideia de que a variância dos resíduos não é constante em todas as observações Assim como no teste de BreuschPaganGodfrey a presença de heterocedasticidade segundo o teste de White sugere que a variabilidade dos erros não é uniforme em todo o intervalo das variáveis independentes o que pode comprometer a precisão dos coeficientes estimados e distorcer as inferências feitas a partir do modelo Estime novamente a regressão agora com os errospadrão robustos de White Estimativa da regressão com errospadrão robustos de White librarysandwich Warning package sandwich was built under R version 433 coeftestm2 vcov vcovHCm2 type HC1 t test of coefficients Estimate Std Error t value Prt Intercept 62075e05 38656e05 16058 01267 pib 23919e00 23530e00 10166 03236 emprego 13056e02 79244e01 16475 01178 Analise a regressão estimada houve mudança nos coeficientes da regressão Sim ou não Por quê Não não houve mudança significativa nos coeficientes da regressão Isso é evidenciado pelos valores estimados dos coeficientes para as variáveis independentes P I B e e m pr e go no novo modelo os quais são bastante semelhantes aos valores estimados no modelo original Apesar das diferenças nas estimativas pontuais as variações nos coeficientes não são estatisticamente significativas como indicado pelos pval or e s associados aos testes T para os coeficientes Portanto podemos concluir que não houve mudança substancial nos coeficientes da regressão entre o modelo original e o novo modelo como ficaram os errospadrão após a correção de White Eles estavam subestimados ou superestimados em relação à regressão original Errospadrão robustos sqrtdiagvcovHCm2 type HC1 Intercept pib emprego 3865552e05 2352957e00 7924424e01 Após a correção de White os errospadrão aumentaram em relação à regressão original Isso indica que os errospadrão originais estavam subestimados Errospadrão subestimados podem levar a uma avaliação excessivamente otimista da significância estatística dos coeficientes Portanto a correção de White é importante para garantir estimativas de coeficientes mais precisas e confiáveis corrigindo a subestimação dos errospadrão que pode resultar da presença de heterocedasticidade nos resíduos Refaça o teste de Student a 10 de significância Houve alguma variável explicativa que não 𝑡 foi significativa desta vez Se sim qual foi De acordo com o teste T no novo modelo com os errospadrão robustos de White não houve nenhuma variável independente significativa
Send your question to AI and receive an answer instantly
Recommended for you
Preview text
Exercíciodesafio Regressão múltipla multicolinearidade e heterocedasticidade 1 Considerando o modelo do último exercíciodesafio e a violação das hipóteses de homoscedasticidade e ausência multicolinearidade dos estimadores de MQO responda a Encontre a matriz de correlação simples para as variáveis do modelo O que se pode afirmar da correlação entre as variáveis independentes Isso pode ser um indicativo da existência de multicolinearidade no modelo estimado Explique b Observando o modelo estimado podese concluir alguma coisa acerca da existência de multicolinearidade Explique c Encontre o fator de inflação da variância para ambas as variáveis explicativas Eles são elevados São capazes de influenciar a variância do modelo Explique d Caso a multicolinearidade seja confirmada quais medidas poderiam ser tomadas para que esse problema fosse amenizado na regressão e Faça um gráfico para cada variável independente com relação ao quadrado dos resíduos É possível observar algum padrão em relação ao comportamento deles para com a variável independente Explique f Realize o teste de BreuschPaganGodfrey BPG e verifique se há heterocedasticidade na regressão estimada Qual a conclusão do teste para 10 de significância g Realize o teste de White e verifique se há heterocedasticidade na regressão estimada Qual a conclusão do teste para 10 de significância h Estime novamente a regressão agora com os errospadrão robustos de White i Analise a regressão estimada i houve mudança nos coeficientes da regressão Sim ou não Por quê ii como ficaram os errospadrão após a correção de White Eles estavam subestimados ou superestimados em relação à regressão original iii Refaça o teste 𝑡 de Student a 10 de significância Houve alguma variável explicativa que não foi significativa desta vez Se sim qual foi ano pib emprego capital 1955 114043 8310 182113 1956 120410 8529 193749 1957 129187 8738 205192 1958 134705 8952 215130 1959 139960 9171 225021 1960 150511 9569 237026 1961 157897 9527 248897 1962 165286 9662 260661 1963 178491 10334 275466 1964 199457 10981 295378 1965 212323 11746 315715 1966 226977 11521 337642 1967 241194 11540 363599 1968 260881 12066 391847 1969 277498 12297 422382 1970 296530 12955 455049 1971 306712 13338 484677 1972 329030 13738 520553 1973 354057 15924 561531 1974 374977 14154 609825 ADVERTISEMENT ADVERTISEMENT Lisca de Econometria Regressão múltipla multicolinearidade e heterocedasticidade Matheus 20240531 Criação dos vetores ano c1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 pib c114043 120410 129187 134705 139960 150511 157897 165286 178491 199457 212323 226977 241194 260881 277498 296530 306712 329030 354057 374977 emprego c8310 8529 8738 8952 9171 9569 9527 9662 10334 10981 11746 11521 11540 12066 12297 12955 13338 13738 15924 14154 capital c182113 193749 205192 215130 225021 237026 248897 260661 275466 295378 315715 337642 363599 391847 422382 455049 484677 520553 561531 60982 Criação do data frame dados dataframeano pib emprego capital Encontre a matriz de correlação simples para as variáveis do modelo O que se pode afirmar da correlação entre as variáveis independentes Isso pode ser um indicativo da existência de multicolinearidade no modelo estimado Explique Letra a Matriz de Correlação entre as variáveis cordados ano pib emprego capital ano 10000000 09847855 09701482 06264987 pib 09847855 10000000 09776988 05865478 emprego 09701482 09776988 10000000 06692594 capital 06264987 05865478 06692594 10000000 Vendo a Matriz de correlação atraves de gráfico librarycorrplot Warning package corrplot was built under R version 432 corrplot 092 loaded Cálculo da matriz de correlação cormatrix cordados Criação do gráfico de bolas corrplotcormatrix method circle type lower tlcol black tlcex 08 addCoefcol black numbercex 07 Através do gráfico de bolas da matriz de correlação observamos que quanto mais escura a cor azul maior é a correlação positiva entre as variáveis No gráfico verificamos uma alta correlação entre as variáveis ano e PIB ano e emprego e PIB e emprego todas indicadas por bolas de cor azul escuro A correlação muito alta entre ano e PIB sugere que à medida que o ano aumenta o PIB também aumenta significativamente Similarmente a alta correlação entre ano e emprego indica que o número de empregos cresce substancialmente com o passar dos anos Além disso a correlação significativa entre PIB e emprego mostra que o crescimento do PIB está fortemente associado ao aumento do emprego Essas fortes correlações entre as variáveis são indicativos claros de possível multicolinearidade no modelo estimado A multicolinearidade ocorre quando uma variável independente pode ser prevista com alta precisão a partir das outras variáveis independentes Isso pode dificultar a interpretação dos coeficientes de regressão já que eles se tornam instáveis e menos confiáveis Portanto a análise do gráfico de bolas sugere que a multicolinearidade pode ser um problema significativo no modelo devido às fortes correlações positivas entre as variáveis independentes Esse problema precisa ser tratado para melhorar a precisão e a interpretação do modelo de regressão Observando o modelo estimado podese concluir alguma coisa acerca da existência de multicolinearidade Explique O modelo estimado será C a pi t aliβ0β1a noiβ2 P I Biβ3 Em pr e g oiϵ i m1 lmcapital ano pib emprego summarym1 Call lmformula capital ano pib emprego Residuals Min 1Q Median 3Q Max 242155 26850 2674 42603 139641 Coefficients Estimate Std Error t value Prt Intercept 4873e07 3979e07 1225 02384 ano 2472e04 2044e04 1209 02442 pib 3848e00 1691e00 2276 00370 emprego 1192e02 4679e01 2547 00215 Signif codes 0 0001 001 005 01 1 Residual standard error 89750 on 16 degrees of freedom Multiple Rsquared 05896 Adjusted Rsquared 05126 Fstatistic 7662 on 3 and 16 DF pvalue 0002141 Considerando um nível de significância de 5 o modelo de regressão linear múltipla proposto mostrouse significativo O pval or do teste F foi menor que 005 permitindonos rejeitar a hipótese nula de que o modelo não é significativo Isso indica que pelo menos uma das variáveis independentes do modelo é capaz de explicar as variações na variável dependente que é o C a pi t al O coeficiente de determinação R 2 do modelo foi de 05896 Isso significa que 5896 das variações do C a pi t al são explicadas pelo modelo Este é um bom indicador de que o modelo tem uma capacidade razoável de explicação embora não completa das variações na variável dependente No entanto ao considerar os resultados dos testes T para os coeficientes individuais nem todos os parâmetros do modelo foram significativos Com um pval or maior que 005 tanto o intercepto quanto a variável independente ano não foram significativos no modelo Isso sugere que ao contrário de outras variáveis independentes o ano não contribui significativamente para a explicação das variações do C a pi t al dentro do contexto deste modelo específico Encontre o fator de inflação da variância para ambas as variáveis explicativas Eles são elevados São capazes de influenciar a variância do modelo Explique librarycar Carregando pacotes exigidos carData vifm1 ano pib emprego 3450528 4601156 2362475 A análise dos fatores de inflação da variância VIF para as variáveis independentes do modelo de regressão linear múltipla revela a presença significativa de multicolinearidade A multicolinearidade ocorre quando duas ou mais variáveis independentes estão altamente correlacionadas o que pode inflacionar as variâncias dos coeficientes estimados e dificultar a interpretação dos resultados Os valores de VIF para as variáveis do modelo são Ano 3450 PIB 4601 e Emprego 2362 Geralmente um VIF acima de 10 é considerado um indicativo forte de multicolinearidade Neste caso todos os valores de VIF são muito superiores a 10 sugerindo uma multicolinearidade severa entre as variáveis independentes Para a variável Ano o VIF de 3450 indica que a variância do coeficiente estimado para essa variável é inflacionada em mais de 34 vezes devido à correlação com outras variáveis independentes no modelo A variável PIB apresenta o maior VIF 4601 indicando que a variância do seu coeficiente estimado é inflacionada em mais de 46 vezes sugerindo uma correlação muito alta com outras variáveis independentes especialmente com Emprego e Ano Embora menor que os VIFs de Ano e PIB o VIF de Emprego ainda é muito elevado com um valor de 2362 indicando uma inflacionação da variância do coeficiente em mais de 23 vezes devido à correlação com outras variáveis independentes Os altos valores de VIF confirmam a presença de multicolinearidade significativa no modelo Essa multicolinearidade pode tornar os coeficientes estimados instáveis e difíceis de interpretar Para lidar com esse problema várias medidas podem ser tomadas Primeiramente podese considerar a remoção de uma ou mais variáveis independentes que apresentam alta correlação entre si Outra abordagem seria criar uma nova variável que combine as variáveis altamente correlacionadas Métodos de regularização como regressão ridge ou lasso também podem ser aplicados para reduzir os efeitos da multicolinearidade Caso a multicolinearidade seja confirmada quais medidas poderiam ser tomadas para que esse problema fosse amenizado na regressão Com o objetivo de lidar com a multicolinearidade presente no modelo de regressão linear múltipla uma estratégia é remover a variável ano do modelo e observar se isso melhora os valores dos fatores de inflação da variância VIF A retirada de uma variável altamente correlacionada pode ajudar a reduzir a multicolinearidade e melhorar a estabilidade dos coeficientes estimados m2 lmcapital pib emprego summarym2 Call lmformula capital pib emprego Residuals Min 1Q Median 3Q Max 269231 27378 7558 56325 134750 Coefficients Estimate Std Error t value Prt Intercept 6207e05 2677e05 2319 00331 pib 2392e00 1203e00 1989 00631 emprego 1306e02 4646e01 2810 00120 Signif codes 0 0001 001 005 01 1 Residual standard error 90960 on 17 degrees of freedom Multiple Rsquared 05521 Adjusted Rsquared 04994 Fstatistic 1048 on 2 and 17 DF pvalue 0001084 vifm2 pib emprego 2267312 2267312 Após remover a variável ano do modelo de regressão linear múltipla o novo modelo passou a ser representado pela seguinte equação C a pi t ali00000042072392 PI Bi001306 Em pr e goiϵi A análise dos coeficientes estimados mostra que o coeficiente para o PIB é estatisticamente não significativo ao nível de significância de 5 pval or005 enquanto o coeficiente para o emprego é estatisticamente significativo pval or005 O coeficiente de determinação múltipla R 2 do novo modelo é de 05521 o que significa que aproximadamente 5521 da variação na variável Capital é explicada pelas variáveis explicativas incluídas no modelo P I B e Em pr e g o Por fim ao calcularmos os fatores de inflação da variância VIF para as variáveis P I B e Em pr e g o no novo modelo observamos que ambos possuem um VIF de aproximadamente 2267 Embora menor do que os valores anteriores esses valores ainda estão acima do limite de 10 sugerindo uma possível multicolinearidade moderada entre as variáveis restantes Portanto embora a remoção da variável ano tenha melhorado a significância estatística dos coeficientes e reduzido a multicolinearidade em comparação com o modelo original ainda pode haver alguma multicolinearidade moderada entre as variáveis restantes Isso indica que ainda pode ser necessário realizar mais ajustes ou considerar outras abordagens para lidar com a multicolinearidade no modelo Faça um gráfico para cada variável independente com relação ao quadrado dos resíduos É possível observar algum padrão em relação ao comportamento deles para com a variável independente Explique Cálculo dos resíduos residuos residm2 residuos2 residuos2 Gráficos dos resíduos ao quadrado versus variáveis independentes parmfrowc12 plotpib residuos2 mainResíduos² vs PIB xlabPIB ylabResíduos² plotemprego residuos2 mainResíduos² vs Emprego xlabEmprego ylabResíduos² Através da análise dos gráficos dos resíduos ao quadrado em relação às variáveis independentes observamos que os padrões sugerem uma distribuição semelhante à exponencial para ambos os casos Esse padrão pode indicar que a relação entre as variáveis independentes e os resíduos ao quadrado não é linear Uma distribuição exponencial nos resíduos ao quadrado sugere que o modelo pode não estar capturando completamente a relação entre as variáveis independentes e a variável dependente Isso pode ser um indicativo de que o modelo precisa de uma transformação ou uma forma mais complexa para capturar a natureza subjacente dos dados de forma adequada Realize o teste de BreuschPaganGodfrey BPG e verifique se há heterocedasticidade na regressão estimada Qual a conclusão do teste para 10 de significância librarylmtest Carregando pacotes exigidos zoo Attaching package zoo The following objects are masked from packagebase asDate asDatenumeric bptestm2 studentized BreuschPagan test data m2 BP 12927 df 2 pvalue 0001559 Como o pval or do teste de BreuschPaganGodfrey BPG foi menor que 01 com um nível de significância de 10 rejeitamos a hipótese nula Isso sugere fortemente a presença de heterocedasticidade nos resíduos do modelo A heterocedasticidade implica que a variância dos resíduos não é constante em todas as observações o que viola uma das suposições fundamentais da regressão linear Essa descoberta indica que a variabilidade dos erros não é uniforme em todo o intervalo das variáveis independentes o que pode comprometer a precisão dos coeficientes estimados e distorcer as inferências feitas a partir do modelo Realize o teste de White e verifique se há heterocedasticidade na regressão estimada Qual a conclusão do teste para 10 de significância librarylmtest bptestm2 pibemprego Ipib2 Iemprego2 data mtcars studentized BreuschPagan test data m2 BP 19957 df 5 pvalue 0001273 De forma análoga ao teste de BreuschPaganGodfrey o teste de White também fornece indícios sobre a presença de heterocedasticidade nos resíduos do modelo Quando o pval or do teste de White é menor que o nível de significância estabelecido 10 rejeitamos a hipótese nula corroborando a presença de heterocedasticidade nos resíduos Essa confirmação através do teste de White fortalece a conclusão anterior reforçando a ideia de que a variância dos resíduos não é constante em todas as observações Assim como no teste de BreuschPaganGodfrey a presença de heterocedasticidade segundo o teste de White sugere que a variabilidade dos erros não é uniforme em todo o intervalo das variáveis independentes o que pode comprometer a precisão dos coeficientes estimados e distorcer as inferências feitas a partir do modelo Estime novamente a regressão agora com os errospadrão robustos de White Estimativa da regressão com errospadrão robustos de White librarysandwich Warning package sandwich was built under R version 433 coeftestm2 vcov vcovHCm2 type HC1 t test of coefficients Estimate Std Error t value Prt Intercept 62075e05 38656e05 16058 01267 pib 23919e00 23530e00 10166 03236 emprego 13056e02 79244e01 16475 01178 Analise a regressão estimada houve mudança nos coeficientes da regressão Sim ou não Por quê Não não houve mudança significativa nos coeficientes da regressão Isso é evidenciado pelos valores estimados dos coeficientes para as variáveis independentes P I B e e m pr e go no novo modelo os quais são bastante semelhantes aos valores estimados no modelo original Apesar das diferenças nas estimativas pontuais as variações nos coeficientes não são estatisticamente significativas como indicado pelos pval or e s associados aos testes T para os coeficientes Portanto podemos concluir que não houve mudança substancial nos coeficientes da regressão entre o modelo original e o novo modelo como ficaram os errospadrão após a correção de White Eles estavam subestimados ou superestimados em relação à regressão original Errospadrão robustos sqrtdiagvcovHCm2 type HC1 Intercept pib emprego 3865552e05 2352957e00 7924424e01 Após a correção de White os errospadrão aumentaram em relação à regressão original Isso indica que os errospadrão originais estavam subestimados Errospadrão subestimados podem levar a uma avaliação excessivamente otimista da significância estatística dos coeficientes Portanto a correção de White é importante para garantir estimativas de coeficientes mais precisas e confiáveis corrigindo a subestimação dos errospadrão que pode resultar da presença de heterocedasticidade nos resíduos Refaça o teste de Student a 10 de significância Houve alguma variável explicativa que não 𝑡 foi significativa desta vez Se sim qual foi De acordo com o teste T no novo modelo com os errospadrão robustos de White não houve nenhuma variável independente significativa