·
Ciências Econômicas ·
Econometria
Send your question to AI and receive an answer instantly
Recommended for you
82
P2 - Econometria Variáveis Dummy e Multicolinearidade
Econometria
UFRRJ
1
Roteiro Avaliacao Econometria 3 - Autocorrelacao e Heterocedasticidade
Econometria
UFRRJ
1
P1 - Econometria
Econometria
UFRRJ
2
Econometria
Econometria
UFRRJ
1
Analise Graficos Distribuicao Probabilidade Estimadores Lineares - Escolha Estimador Ideal
Econometria
PUC
1
Distribuição Amostral das Médias e Cálculo de Probabilidades
Econometria
UNITAU
101
Multicolinearidade na Regressão Linear Múltipla
Econometria
PUC
1
Projeto Econometria II - Análise de Retornos de Carteira com Metodologia Box-Jenkins
Econometria
FECAP
1
Análise de Vendas de Atum e Determinantes dos Rendimentos do Trabalho
Econometria
PUC
1
Lista de Exercicios Econometria UFABC - Resolucao em R
Econometria
UFABC
Preview text
UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO IM ALUNOS Danilo Gustavo Alves Carneiro Rebeca Rodrigues Grozima Ferreira e Igor Gabriel da Silva Lima PROFESSOR JÚLIO PROJETO 1 ECONOMETRIA Introdução do projeto Os parâmetros definidos para a análise da regressão foram M1 Selic IPC e PIB Trimestral Com base nisso faremos as análises importando a base de dados do BACEN e após isso será apresentado o gráfico de relação entre as variáveis 1 Importação da Base de Dados import numpy as np import pandas as pd import statsmodelsapi as sm import matplotlibpyplot as plt import seaborn as sns snsset import matplotlib matplotlibrcParamsfigurefigsize147 2 Importação da Base de Dados do Bacen Importando a base de dados do BACEN def consultabccodigobcb url httpapibcbgovbrdadosseriebcdatasgsdadosformatojsonformatco digobcb df pdreadjsonurl dfdata pdtodatetimedfdata dayfirst True dfsetindexdata inplaceTrue return df IPCA consultabc433 IPCA SELIC consultabc4390 SELIC PIB consultabc4380 PIB M1 consultabc27841 M1 demand pdDataFrame startdate M1index0 demandM1 M1M1locstartdate demandPIB PIBPIBlocstartdate demandIPCA IPCAIPCAlocstartdate demandSELIC SELICSELIClocstartdate demand 3 Gráfico de Relação entre Variáveis M1 x PIB pltscatterdemandPIBdemandM1 pltaxis06010 pltxlabelPIB pltylabelM1 pltshow Observando o gráfico M1 x PIB acima podese notar o baixo grau de dispersão Assim o valor da variância tende a ser pequeno fazendo com que o valor da relação se aproxime da média M1 x IPCA M1 X IPCA pltscatterdemandIPCAdemandM1 pltaxis0208 pltxlabelIPCA pltylabelM1 pltshow Analisando o gráfico M1 x IPCA notase o alto grau de dispersão Assim o valor da variância tende a ser grande fazendo com que o valor dessa relação se distancie da média Essa distância da média também ocorre pois o IPCA é muito sensível com qualquer variação do mercado o afetando M1 x SELIC M1 X Selic pltscatterdemandSELICdemandM1 pltaxis015010 pltxlabelSELIC pltylabelM1 pltshow Observando o gráfico M1 x SELIC acima notase o intercepto negativo com um grau de dispersão mediano Dito isso a tendência é um valor da variância não tão grande mas também não tão pequeno fazendo com que o valor dessa relação esteja próximo da média IPCA x SELIC IPCA X SELIC pltscatterdemandSELICdemandIPCA pltaxis01101 pltxlabelSELIC pltylabelIPCA pltshow Olhando o gráfico IPCA x SELIC percebese um alto grau de dispersão assim tendese o valor da variância ser grande levando o valor dessa relação para bem distante da média Essa distância da média ocorre também porque o IPCA e a SELIC são indicadores com extrema sensibilidade de qualquer movimentação de mercado Elas variam e o tempo de análise desses indicadores são diferentes e depende de outros fatores do mercado 4 Regressão Linear y demandM1 x1 demandPIB x2 demandIPCA x3 demandSELIC Regressão Simples PIB reg simples PIB X smaddconstantx1 reg smOLSyXfit regsummary Observando em relação a variável dependente T 2 por isso o coeficiente não é significativo no modelo e sendo o P valor 005 é considerado estatisticamente não significativo o que faz rejeitar a hipótese nula no modelo Agora analisando em relação ao PIB T 2 assim o coeficiente é significativo no modelo e sendo P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não seja rejeitada Regressão Múltipla reg multipla x npcolumnstackx1x2x3 x smaddconstantx regM smOLSyxfit regMsummary Observando em relação a variável dependente T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada Analisando em relação ao PIB que é o x1 T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada Analisando em relação ao IPCA que é o x2 T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada Analisando em relação a Selic que é o x3 T 2 por isso o coeficiente não é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada 5 Regressão em Log Regressão Simples em Log y nplogdemandM1 x1 demandPIB x2 demandIPCA x3 demandSELIC reg simples em log PIB X smaddconstantx1 reglog smOLSyXfit reglogsummary Observando em relação a variável dependente T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada Agora analisando em relação ao PIB T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada 6 Modelo Semilog e LogLog import numpy as np import pandas as pd import statsmodelsapi as sm Dados fornecidos data data 20221101 20221201 20230101 20230201 20230301 M1 8658832 8655916 8847596 8881228 8770878 PIB 7604048 7688595 7688595 7288150 7969288 IPCA 0630769 0953846 0815385 1292308 1082308 SELIC 0733813 0805755 0805755 0661871 0841727 df pdDataFramedata Calculando os logaritmos naturais dflnM1 nplogdfM1 dflnIPCA nplogdfIPCA dflnSELIC nplogdfSELIC Modelo semilog X dflnM1 lnIPCA lnSELIC X smaddconstantX Adicionando constante y dfPIB modelsemilog smOLSy Xfit printmodelsemilogsummary Observando o modelo semilog notase como o PIB é afetado por mudanças percentuais nas variáveis independentes M1 IPCA e SELIC representadas pelos coeficientes que são interpretados como elasticidades indicam quão sensível é o PIB a essas mudanças Valores P indicam significância estática dos coeficientes o Rsquared mostra o quanto da variação do PIB é explicada pelas variáveis independentes Modelo loglog X dflnM1 lnIPCA lnSELIC X smaddconstantX Adicionando constante y nplogdfPIB Logaritmo natural de PIB modelloglog smOLSy Xfit printmodelloglogsummary Observando o modelo loglog os coeficientes estimados representam as elasticidades ou seja a sensibilidade do PIB em relação às mudanças percentuais nas variáveis independentes M1 IPCA e SELIC Valores P indicam a significância estatística dos coeficientes O Rsquared mostra quanto da variação do logaritmo do PIB é explicada pelas variáveis independentes PROJETO 2 ECONOMETRIA DADOS Aqui importamos os dados import numpy as np import pandas as pd import statsmodelsapi as sm import matplotlibpyplot as plt import seaborn as sns snsset import matplotlib matplotlibrcParamsfigurefigsize147 from statsmodelsstatsoutliersinfluence import varianceinflationfactor from statsmodelsformulaapi import ols def consultabccodigobcb url httpapibcbgovbrdadosseriebcdatasgsdadosformatojsonformatco digobcb df pdreadjsonurl dfdata pdtodatetimedfdata dayfirst True dfsetindexdata inplaceTrue return df IPCA consultabc433 IPCA SELIC consultabc4390 SELIC PIB consultabc4380 PIB M1 consultabc27841 M1 demand pdDataFrame startdate M1index0 demandM1 M1M1locstartdate demandPIB PIBPIBlocstartdate demandIPCA IPCAIPCAlocstartdate demandSELIC SELICSELIClocstartdate demand M1 PIB IPCA SELIC data 20011201 1000000 1000000 1000000 1000000 20020101 1074440 0994320 0800000 1100719 20020201 1079686 0986377 0553846 0899281 20020301 1114002 1048028 0923077 0985612 20020401 1156756 1065205 1230769 1064748 20231001 8716211 8322965 0369231 0719424 20231101 8962349 8397019 0430769 0661871 20231201 8943018 8332422 0861538 0640288 20240101 9129145 7847872 0646154 0697842 20240201 9129145 7874582 1276923 0575540 267 rows 4 columns CORRELAÇÃO Nessa etapa faremos estudaremos a correlação entre as variáveis do nosso modelo matrizcorrelacao demandcorr snsheatmapmatrizcorrelacao annotTrue center0 vmin1 vmax1 squareTrue linewidths001 cmapcoolwarm pltshow Ao observar nossa matriz de correlação vemos que a nossa variável resposta M1 apresenta uma correlação quase linear com o PIB o que faz sentido pela natureza dos indicadores Uma correlação tão alta pode indicar que o modelo somente com o PIB se adapte muito bem Também podemos esperar que ela explique maior parte da variabilidade do modelo M1 e IPCA tem uma correlação próxima de zero e portanto fraca o que significa que o IPCA pode não se adaptar bem em um modelo de regressão linear o que não significa que não exista correlação mas talvez outra função de ligação se comporte melhor A selic tem uma correlação moderada negativa o que indicaria que quando a selic diminui a oferta monetária deve apresentar crescimento Regressão linear múltipla y demandM1 x1 demandPIB x2 demandIPCA x3 demandSELIC x npcolumnstackx1x2x3 x smaddconstantx regM smOLSyxfit regMsummary OLS Regression Results Dep Variable M1 Rsquared 0955 Model OLS Adj Rsquared 0955 Method Least Squares Fstatistic 1875 Date Wed 01 May 2024 Prob Fstatistic 388e177 Time 194821 LogLikelihood 19740 No Observations 267 AIC 4028 Df Residuals 263 BIC 4172 Df Model 3 Covariance Type nonrobust coef std err t Pt 0025 0975 const 07393 0150 4935 0000 0444 1034 x1 10880 0019 58432 0000 1051 1125 x2 02226 0052 4308 0000 0121 0324 x3 10031 0139 7214 0000 1277 0729 Omnibus 24226 DurbinWatson 0222 ProbOmnibus 0000 JarqueBera JB 31679 Skew 0643 ProbJB 132e07 Kurtosis 4092 Cond No 284 Notes 1 Standard Errors assume that the covariance matrix of the errors is correctly specified Nosso modelo de regressão linear múltipla fica da forma Y 07393 1088X1 02226X2 10031X3 O modelo parece bem ajustado as variáveis explicativas são todas significativas e o R2 indica que em torno 95 da variância da nossa variável resposta é explicada por esse modelo Análise dos resíduos residuos regMresid plthistresiduos pltxlabelResíduos pltylabelFrequência plttitleDistribuição dos Resíduos pltshow Acima vemos o histograma dos resíduos Para a nossa regressão linear é interessante verificar se os resíduos tem distribuição normal por isso a forma de sino é um bom indicativo Abaixo veremos o QQPlot smqqplotresiduos pltxlabelQuantis Teóricos pltylabelQuantis Observados plttitleQQplot dos Resíduos pltshow O QQPlot parece bastante uma reta indicando que nossos resíduos estão bem próximos de uma distribuição normal o que mais uma vez pode sugerir que a regressão linear foi bem aplicada Verificando multicolineariedade Fator de inflação da variância x smaddconstantx X x Xdf pdDataFramex 1 columnsPIB IPCA SELIC vifs for i in rangeXdfshape1 vif varianceinflationfactorXdfvalues i vifsappendvif for i vif in enumeratevifs printfVIF para a variavel Xdfcolumnsi vif2f VIF para a variavel PIB 672 VIF para a variavel IPCA 101 VIF para a variavel SELIC 101 O VIF Fator de Inflação da Variância para o IPCA e SELIC são bem próximos de 1 o que é indicativo que a multicolinearidade para essas variáveis seja quase inexistentes VIF 1 indica que não há multicolinearidade Enquanto isso o VIF do PIB é significantemente maior que 5 o que indica multicolinearidade ou seja há alta correlação com outras variáveis independentes Faremos mais testes para verificar correlação Teste DurbinWatson utilizada para verificar a presença de autocorrelação nos resíduos de um modelo de regressão dwtest smstatsstattoolsdurbinwatsonregMresid printDurbinWatson test printfDW dwtest5f DurbinWatson test DW 022217 022217398595722235 O teste de durbin watson é abaixo de 2 o que indica correlação positiva entre os resíduos isso afeta a credibilidade do modelo uma vez que o ideal é não ter correlação
Send your question to AI and receive an answer instantly
Recommended for you
82
P2 - Econometria Variáveis Dummy e Multicolinearidade
Econometria
UFRRJ
1
Roteiro Avaliacao Econometria 3 - Autocorrelacao e Heterocedasticidade
Econometria
UFRRJ
1
P1 - Econometria
Econometria
UFRRJ
2
Econometria
Econometria
UFRRJ
1
Analise Graficos Distribuicao Probabilidade Estimadores Lineares - Escolha Estimador Ideal
Econometria
PUC
1
Distribuição Amostral das Médias e Cálculo de Probabilidades
Econometria
UNITAU
101
Multicolinearidade na Regressão Linear Múltipla
Econometria
PUC
1
Projeto Econometria II - Análise de Retornos de Carteira com Metodologia Box-Jenkins
Econometria
FECAP
1
Análise de Vendas de Atum e Determinantes dos Rendimentos do Trabalho
Econometria
PUC
1
Lista de Exercicios Econometria UFABC - Resolucao em R
Econometria
UFABC
Preview text
UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO IM ALUNOS Danilo Gustavo Alves Carneiro Rebeca Rodrigues Grozima Ferreira e Igor Gabriel da Silva Lima PROFESSOR JÚLIO PROJETO 1 ECONOMETRIA Introdução do projeto Os parâmetros definidos para a análise da regressão foram M1 Selic IPC e PIB Trimestral Com base nisso faremos as análises importando a base de dados do BACEN e após isso será apresentado o gráfico de relação entre as variáveis 1 Importação da Base de Dados import numpy as np import pandas as pd import statsmodelsapi as sm import matplotlibpyplot as plt import seaborn as sns snsset import matplotlib matplotlibrcParamsfigurefigsize147 2 Importação da Base de Dados do Bacen Importando a base de dados do BACEN def consultabccodigobcb url httpapibcbgovbrdadosseriebcdatasgsdadosformatojsonformatco digobcb df pdreadjsonurl dfdata pdtodatetimedfdata dayfirst True dfsetindexdata inplaceTrue return df IPCA consultabc433 IPCA SELIC consultabc4390 SELIC PIB consultabc4380 PIB M1 consultabc27841 M1 demand pdDataFrame startdate M1index0 demandM1 M1M1locstartdate demandPIB PIBPIBlocstartdate demandIPCA IPCAIPCAlocstartdate demandSELIC SELICSELIClocstartdate demand 3 Gráfico de Relação entre Variáveis M1 x PIB pltscatterdemandPIBdemandM1 pltaxis06010 pltxlabelPIB pltylabelM1 pltshow Observando o gráfico M1 x PIB acima podese notar o baixo grau de dispersão Assim o valor da variância tende a ser pequeno fazendo com que o valor da relação se aproxime da média M1 x IPCA M1 X IPCA pltscatterdemandIPCAdemandM1 pltaxis0208 pltxlabelIPCA pltylabelM1 pltshow Analisando o gráfico M1 x IPCA notase o alto grau de dispersão Assim o valor da variância tende a ser grande fazendo com que o valor dessa relação se distancie da média Essa distância da média também ocorre pois o IPCA é muito sensível com qualquer variação do mercado o afetando M1 x SELIC M1 X Selic pltscatterdemandSELICdemandM1 pltaxis015010 pltxlabelSELIC pltylabelM1 pltshow Observando o gráfico M1 x SELIC acima notase o intercepto negativo com um grau de dispersão mediano Dito isso a tendência é um valor da variância não tão grande mas também não tão pequeno fazendo com que o valor dessa relação esteja próximo da média IPCA x SELIC IPCA X SELIC pltscatterdemandSELICdemandIPCA pltaxis01101 pltxlabelSELIC pltylabelIPCA pltshow Olhando o gráfico IPCA x SELIC percebese um alto grau de dispersão assim tendese o valor da variância ser grande levando o valor dessa relação para bem distante da média Essa distância da média ocorre também porque o IPCA e a SELIC são indicadores com extrema sensibilidade de qualquer movimentação de mercado Elas variam e o tempo de análise desses indicadores são diferentes e depende de outros fatores do mercado 4 Regressão Linear y demandM1 x1 demandPIB x2 demandIPCA x3 demandSELIC Regressão Simples PIB reg simples PIB X smaddconstantx1 reg smOLSyXfit regsummary Observando em relação a variável dependente T 2 por isso o coeficiente não é significativo no modelo e sendo o P valor 005 é considerado estatisticamente não significativo o que faz rejeitar a hipótese nula no modelo Agora analisando em relação ao PIB T 2 assim o coeficiente é significativo no modelo e sendo P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não seja rejeitada Regressão Múltipla reg multipla x npcolumnstackx1x2x3 x smaddconstantx regM smOLSyxfit regMsummary Observando em relação a variável dependente T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada Analisando em relação ao PIB que é o x1 T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada Analisando em relação ao IPCA que é o x2 T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada Analisando em relação a Selic que é o x3 T 2 por isso o coeficiente não é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada 5 Regressão em Log Regressão Simples em Log y nplogdemandM1 x1 demandPIB x2 demandIPCA x3 demandSELIC reg simples em log PIB X smaddconstantx1 reglog smOLSyXfit reglogsummary Observando em relação a variável dependente T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada Agora analisando em relação ao PIB T 2 por isso o coeficiente é significativo no modelo e sendo o P valor 005 é considerado estatisticamente significativo o que faz a hipótese nula no modelo não ser rejeitada 6 Modelo Semilog e LogLog import numpy as np import pandas as pd import statsmodelsapi as sm Dados fornecidos data data 20221101 20221201 20230101 20230201 20230301 M1 8658832 8655916 8847596 8881228 8770878 PIB 7604048 7688595 7688595 7288150 7969288 IPCA 0630769 0953846 0815385 1292308 1082308 SELIC 0733813 0805755 0805755 0661871 0841727 df pdDataFramedata Calculando os logaritmos naturais dflnM1 nplogdfM1 dflnIPCA nplogdfIPCA dflnSELIC nplogdfSELIC Modelo semilog X dflnM1 lnIPCA lnSELIC X smaddconstantX Adicionando constante y dfPIB modelsemilog smOLSy Xfit printmodelsemilogsummary Observando o modelo semilog notase como o PIB é afetado por mudanças percentuais nas variáveis independentes M1 IPCA e SELIC representadas pelos coeficientes que são interpretados como elasticidades indicam quão sensível é o PIB a essas mudanças Valores P indicam significância estática dos coeficientes o Rsquared mostra o quanto da variação do PIB é explicada pelas variáveis independentes Modelo loglog X dflnM1 lnIPCA lnSELIC X smaddconstantX Adicionando constante y nplogdfPIB Logaritmo natural de PIB modelloglog smOLSy Xfit printmodelloglogsummary Observando o modelo loglog os coeficientes estimados representam as elasticidades ou seja a sensibilidade do PIB em relação às mudanças percentuais nas variáveis independentes M1 IPCA e SELIC Valores P indicam a significância estatística dos coeficientes O Rsquared mostra quanto da variação do logaritmo do PIB é explicada pelas variáveis independentes PROJETO 2 ECONOMETRIA DADOS Aqui importamos os dados import numpy as np import pandas as pd import statsmodelsapi as sm import matplotlibpyplot as plt import seaborn as sns snsset import matplotlib matplotlibrcParamsfigurefigsize147 from statsmodelsstatsoutliersinfluence import varianceinflationfactor from statsmodelsformulaapi import ols def consultabccodigobcb url httpapibcbgovbrdadosseriebcdatasgsdadosformatojsonformatco digobcb df pdreadjsonurl dfdata pdtodatetimedfdata dayfirst True dfsetindexdata inplaceTrue return df IPCA consultabc433 IPCA SELIC consultabc4390 SELIC PIB consultabc4380 PIB M1 consultabc27841 M1 demand pdDataFrame startdate M1index0 demandM1 M1M1locstartdate demandPIB PIBPIBlocstartdate demandIPCA IPCAIPCAlocstartdate demandSELIC SELICSELIClocstartdate demand M1 PIB IPCA SELIC data 20011201 1000000 1000000 1000000 1000000 20020101 1074440 0994320 0800000 1100719 20020201 1079686 0986377 0553846 0899281 20020301 1114002 1048028 0923077 0985612 20020401 1156756 1065205 1230769 1064748 20231001 8716211 8322965 0369231 0719424 20231101 8962349 8397019 0430769 0661871 20231201 8943018 8332422 0861538 0640288 20240101 9129145 7847872 0646154 0697842 20240201 9129145 7874582 1276923 0575540 267 rows 4 columns CORRELAÇÃO Nessa etapa faremos estudaremos a correlação entre as variáveis do nosso modelo matrizcorrelacao demandcorr snsheatmapmatrizcorrelacao annotTrue center0 vmin1 vmax1 squareTrue linewidths001 cmapcoolwarm pltshow Ao observar nossa matriz de correlação vemos que a nossa variável resposta M1 apresenta uma correlação quase linear com o PIB o que faz sentido pela natureza dos indicadores Uma correlação tão alta pode indicar que o modelo somente com o PIB se adapte muito bem Também podemos esperar que ela explique maior parte da variabilidade do modelo M1 e IPCA tem uma correlação próxima de zero e portanto fraca o que significa que o IPCA pode não se adaptar bem em um modelo de regressão linear o que não significa que não exista correlação mas talvez outra função de ligação se comporte melhor A selic tem uma correlação moderada negativa o que indicaria que quando a selic diminui a oferta monetária deve apresentar crescimento Regressão linear múltipla y demandM1 x1 demandPIB x2 demandIPCA x3 demandSELIC x npcolumnstackx1x2x3 x smaddconstantx regM smOLSyxfit regMsummary OLS Regression Results Dep Variable M1 Rsquared 0955 Model OLS Adj Rsquared 0955 Method Least Squares Fstatistic 1875 Date Wed 01 May 2024 Prob Fstatistic 388e177 Time 194821 LogLikelihood 19740 No Observations 267 AIC 4028 Df Residuals 263 BIC 4172 Df Model 3 Covariance Type nonrobust coef std err t Pt 0025 0975 const 07393 0150 4935 0000 0444 1034 x1 10880 0019 58432 0000 1051 1125 x2 02226 0052 4308 0000 0121 0324 x3 10031 0139 7214 0000 1277 0729 Omnibus 24226 DurbinWatson 0222 ProbOmnibus 0000 JarqueBera JB 31679 Skew 0643 ProbJB 132e07 Kurtosis 4092 Cond No 284 Notes 1 Standard Errors assume that the covariance matrix of the errors is correctly specified Nosso modelo de regressão linear múltipla fica da forma Y 07393 1088X1 02226X2 10031X3 O modelo parece bem ajustado as variáveis explicativas são todas significativas e o R2 indica que em torno 95 da variância da nossa variável resposta é explicada por esse modelo Análise dos resíduos residuos regMresid plthistresiduos pltxlabelResíduos pltylabelFrequência plttitleDistribuição dos Resíduos pltshow Acima vemos o histograma dos resíduos Para a nossa regressão linear é interessante verificar se os resíduos tem distribuição normal por isso a forma de sino é um bom indicativo Abaixo veremos o QQPlot smqqplotresiduos pltxlabelQuantis Teóricos pltylabelQuantis Observados plttitleQQplot dos Resíduos pltshow O QQPlot parece bastante uma reta indicando que nossos resíduos estão bem próximos de uma distribuição normal o que mais uma vez pode sugerir que a regressão linear foi bem aplicada Verificando multicolineariedade Fator de inflação da variância x smaddconstantx X x Xdf pdDataFramex 1 columnsPIB IPCA SELIC vifs for i in rangeXdfshape1 vif varianceinflationfactorXdfvalues i vifsappendvif for i vif in enumeratevifs printfVIF para a variavel Xdfcolumnsi vif2f VIF para a variavel PIB 672 VIF para a variavel IPCA 101 VIF para a variavel SELIC 101 O VIF Fator de Inflação da Variância para o IPCA e SELIC são bem próximos de 1 o que é indicativo que a multicolinearidade para essas variáveis seja quase inexistentes VIF 1 indica que não há multicolinearidade Enquanto isso o VIF do PIB é significantemente maior que 5 o que indica multicolinearidade ou seja há alta correlação com outras variáveis independentes Faremos mais testes para verificar correlação Teste DurbinWatson utilizada para verificar a presença de autocorrelação nos resíduos de um modelo de regressão dwtest smstatsstattoolsdurbinwatsonregMresid printDurbinWatson test printfDW dwtest5f DurbinWatson test DW 022217 022217398595722235 O teste de durbin watson é abaixo de 2 o que indica correlação positiva entre os resíduos isso afeta a credibilidade do modelo uma vez que o ideal é não ter correlação