·
Cursos Gerais ·
Estatística Econômica e Introdução à Econometria
Send your question to AI and receive an answer instantly
Recommended for you
42
Exercícios Computacionais Capitulo 02 - Introdução a Econometria de Wooldridge
Estatística Econômica e Introdução à Econometria
UMG
22
Análise do Erro Quadrático Médio e Métodos de Estimação
Estatística Econômica e Introdução à Econometria
UMG
7
Amostragem Estratificada: Fundamentos e Cálculos
Estatística Econômica e Introdução à Econometria
UMG
4
Exercícios Computacionais Capitulo 02 - Introdução a Econometria de Wooldridge
Estatística Econômica e Introdução à Econometria
UMG
5
Análise Exploratória de Dados e Pesquisa Matrimonial - Exercícios Estatísticos
Estatística Econômica e Introdução à Econometria
UMG
25
Intervalos de Confiança: Conceitos e Cálculos
Estatística Econômica e Introdução à Econometria
UMG
1
Regressão Linear e Política Monetária - Análise de Dados Históricos
Estatística Econômica e Introdução à Econometria
UMG
4
Exercícios Computacionais Capitulo 02 - Introdução a Econometria de Wooldridge
Estatística Econômica e Introdução à Econometria
UMG
5
Exercícios Computacionais Capitulo 02 - Introdução a Econometria de Wooldridge
Estatística Econômica e Introdução à Econometria
UMG
25
Elementos Fundamentais dos Testes de Hipóteses
Estatística Econômica e Introdução à Econometria
UMG
Preview text
ii Considere um modelo para explicar o preço do refrigerante psoda em termos de proporção da população que é negra e com renda mediana psoda β0 β1prpblck β2income u Estime o modelo por MQO e registre os resultados em forma de equação incluindo o tamanho da amostra e o Rquadrado Não use notação científica ao relatar as estimativas Interprete o coeficiente sobre prpblck Você acha que ele é economicamente grande iii Compare a estimativa do item ii com a estimativa de regressão simples de psoda sobre prpblck O efeito de discriminação é maior ou menor quando se controla a renda iv Um modelo com elasticidadepreço constante em relação à renda pode ser mais adequado Registre as estimativas do modelo logpsoda β0 β1prpblck β2logincome u Se prpblck aumenta 020 20 pontos percentuais qual é a alteração percentual estimada em psoda Dica A resposta é 2xx você deve encontrar o xx v Agora adicione a variável prppov à regressão do item iv O que acontece com βprpblck vi Encontre a correlação entre logincome e prppov É aproximadamente o que você esperava vii Avalie a seguinte afirmação Como logincome e prppob são altamente correlacionadas elas não têm por que estar na mesma regressão C9 Use os dados do arquivo CHARITY para responder às questões a seguir i Estime a equação gift β0 β1mailsyear β2giftlast β3propresp u por MQO e registre os resultados da forma usual incluindo o tamanho da amostra e o Rquadrado De que forma o Rquadrado se compara com o obtido pela regressão simples que omite giftlast e proprepsp ii Interprete o coeficiente sobre mailsyear Ele é maior ou menor do que o coeficiente correspondente da regressão simples iii Interprete o coeficiente sobre proprepsp Tenha cuidado ao notar as unidades de medida de proprepsp iv Agora acrescente a variável avggift à equação O que acontece com o efeito estimado de mailsyear v Na equação do item iv o que aconteceu com o coeficiente de giftlast O que você acha que está acontecendo C10 Use os dados do arquivo HTV para responder essa questão O conjunto de dados inclui informações sobre salários escolaridade escolaridade dos pais e diversas outras variáveis a respeito de 1230 homens trabalhadores em 1991 i O que é a variação da variável educ na amostra Qual porcentagem de homens completou o ensino médio mas não o ensino superior São os homens ou seus pais que têm em média níveis mais altos de escolaridade ii Estime o modelo de regressão educ β0 β1motheduc β2fatheduc u Exercícios em computador C1 Um problema de interesse de agentes de saúde e outros é determinar os efeitos de fumar durante a gravidez sobre a saúde da criança Uma medida da saúde infantil é o peso ao nascer um peso muito baixo ao nascer pode colocar o recémnascido em risco de contrair várias doenças Como os fatores além do fumo que podem afetar o ii Estime o modelo atndrte β0 β1priGPA β2ACT u e escreva os resultados em forma de equação Interprete o intercepto Ele tem um significado útil iii Discuta os coeficientes de inclinação estimados Há alguma surpresa iv Qual é a atndrte prevista se priGPA 365 e ACT 20 O que você tira desse resultado Existem alguns estudantes na amostra com esses valores das variáveis explicativas v Se o estudante A tiver priGPA 31 e ACT 21 e o estudante B tiver priGPA 21 e ACT 26 qual é a diferença prevista em suas taxas de frequência C5 Confirme a interpretação eliminando a influência dos estimadores de MQO ao fazer explicitamente a eliminação da influência no Exemplo 32 Isso exige que primeiro você regresse educ em exper e tenure e salve os resíduos r1 Em seguida regresse logwage sobre r1 Compare o coeficiente de r1 com o coeficiente de educ na regressão de logwage sobre educ exper e tenure C6 Use o conjunto de dados do arquivo WAGE2 para resolver este problema Como sempre certifiquese que todas as regressões seguintes contenham um intercepto i Execute uma regressão simples de QI sobre educ para obter o coeficiente de inclinação digamos δ ii Faça a regressão simples de logwage sobre educ e obtenha o coeficiente de inclinação chamado de β1 iii Execute a regressão múltipla de logwage sobre educ e QI e obtenha os coeficientes de inclinação β1 e β2 respectivamente iv Verifique se β1 β1 β2δ1 C7 Use os dados do arquivo MEAP93 para responder a essa questão i Estime o modelo math10 β0 β1logexpend β2lnchprg u e registre os resultados na forma usual incluindo o tamanho da amostra e o Rquadrado Os sinais dos coeficientes de inclinação são os que você esperava Explique ii Como você interpreta o intercepto que estimou no item i Em especial faz sentido definir duas variáveis explicativas como zero Dica Lembrese que log1 0 iii Agora faça a regressão simples de math10 sobre logexpend e compare o coeficiente de inclinação com aquele obtido no item i O efeito de gastos estimado agora é maior ou menor do que no item i iv Encontre a correlação entre lexpend logexpend e lnchprg O sinal da relação faz sentido para você v Use o item iv para explicar suas descobertas no item iii C8 Use os dados do arquivo DISCRIM para responder a essa questão São dados sobre preços de vários itens em restaurantes de fast food e características da população dividida por CEP em Nova Jersey e Pensilvânia A ideia é ver se os restaurantes cobram preços mais altos em áreas com uma maior concentração de negros i Encontre os valores médios da proporção de negros prpblck e renda income na amostra além de seus desvios padrão Quais são as unidades de medida de prpblck e income peso ao nascer são provavelmente relacionados com o ato de fumar devemos leválos em conta Por exemplo uma renda mais alta geralmente resulta em acesso a um melhor cuidado prénatal bem como uma melhor nutrição da mãe Uma equação que reconhece isso é bwght β0 β0cigs β2 faminc u i Qual é o sinal mais provável para β2 ii Você acha que cigs e faminc são possivelmente correlacionados Explique por que a correlação deve ser positiva ou negativa iii Agora estime a equação com e sem faminc usando os dados do arquivo BWGHT Registre os resultados em forma de equação incluindo o tamanho da amostra e o Rquadrado Discuta seus resultados verificando se adicionar faminc altera substancialmente o efeito estimado de cigs sobre bwght C2 Use os dados do arquivo HPRICE1 para estimar o modelo price β0 β1 sqrft β2 bdrms u Em que price é o preço da residência medido em milhares de dólares i Escreva os resultados em forma de equação ii Qual é o aumento estimado do preço de uma casa com um quarto a mais mantendo a área constante iii Qual é o aumento estimado do preço de uma casa com um quarto adicional de 140 pés quadrados Compare isso com sua resposta ao item ii iv Qual porcentagem de variação do preço é explicada pela área e número de quartos v A primeira casa da amostra tem sqrft 2438 e bdrms 4 Encontre o preço de venda previsto dessa casa a partir da linha de regressão MQO vi O preço de venda real da primeira casa da amostra foi US 300000 assim price 300 Encontre o resíduo para essa casa O valor sugere que o comprador pagou pouco ou muito pela casa C3 O arquivo CEOSAL2 contém dados sobre 177 CEOs e pode ser usado para examinar os efeitos do desempenho da empresa sobre o salário destes executivos i Estime um modelo que relacione o salário anual às vendas e ao valor de mercado da companhia Faça o modelo do tipo de elasticidade constante para ambas as variáveis independentes Escreva os resultados em forma de equação ii Adicione profits ao modelo do item i Por que essa variável não pode ser incluída em forma logarítmica Você poderia dizer que essas variáveis de desempenho da empresa explicam a maior parte da variação dos salários dos CEOs iii Acrescente a variável ceoten ao modelo do item ii Qual é o retorno percentual estimado para outro ano de permanência do CEO mantendo os outros valores fixos iv Encontre o coeficiente de correlação amostral entre as variáveis logmktval e profits Essas variáveis são altamente correlacionadas O que isso diz sobre os estimadores de MQO C4 Use os dados do arquivo ATTEND para este exercício i Obtenha os valores mínimo máximo e médio para as variáveis atndrte priGPA e ACT 120 Introdução à econometria por MQO e registre os resultados na forma usual Quanta variação amostral em educ pode ser explicada pela escolaridade dos pais Interprete o coeficiente de motheduc iii Adicione a variável ability uma medida da habilidade cognitiva à regressão do item ii e registre os resultados em forma de equação Habilidade ajuda a explicar variações na educação mesmo depois de controlar os dados de escolaridade dos pais Explique iv Exige cálculo Agora estime uma equação em que ability apareça em forma quadrática educ β0 β1 motheduc β2 fatheduc β3 abil β4 abil2 u Usando as estimativas β3 e β4 use cálculo para encontrar o valor de abil chameo de abil em que educ é minimizada Os outros coeficientes e valores das variáveis de educação dos pais não têm efeito estamos mantendo a escolaridade dos pais fixa Note que abil é medida de forma que valores negativos são admissíveis Você também pode verificar que a segunda derivativa é positiva assim você realmente tem um mínimo v Comente sobre apenas uma pequena fração de homens da amostra terem habilidade menor do que o valor calculado no item iv Por que isso é importante vi Se você tiver acesso a um software estatístico que inclua recursos gráficos use as estimativas do item iv para desenhar um gráfico das relações entre a educação prevista e abil Defina motheduc e fatheduc como os valores médios da amostra 1218 e 1245 respectivamente C11 Use os dados do arquivo MEAPSINGLE para estudar os efeitos de residências com apenas um dos pais sobre o desempenho em matemática Estes dados são provenientes de um subconjunto de escolas do sudeste de Michigan no ano 2000 As variáveis socioeconômicas foram obtidas por CEP em que os CEPs são determinados a escolas com base em seus endereços de correspondência i Execute a regressão simples de math4 sobre pctsgle e registre os resultados no formato usual Interprete o coeficiente de inclinação O efeito sobre a monoparentalidade parece grande ou pequeno ii Adicione as variáveis lmedinc e free à equação O que acontece com o coeficiente de pctsgle Explique o que está acontecendo iii Encontre a correlação amostral entre lmedinc e free Ela tem o sinal que você esperava iv A correlação substancial entre lmedinc e free significa que você deve retirar um deles da regressão para estimar melhor o efeito causal da monoparentalidade no desempenho dos estudantes Explique v Encontre os fatores de inflação da variância FIVs de cada uma das variáveis explicativas que aparecem na regressão do item ii Quais variáveis têm o FIV maior Esse conhecimento afeta o modelo que você usa para estudar o efeito causal pela monoparentalidade sobre o desempenho em matemática C12 Os dados do arquivo ECONMATH contêm médias e pontuações de testes padronizados além do desempenho em um curso introdutório de Economia de estudantes em uma grande universidade pública A variável a ser explicada é score a nota final do curso medida como porcentagem i Quantos estudantes receberam uma nota perfeita no curso Qual foi a nota média Encontre as médias e desvios padrão de actmth e acteng e discuta como eles se comparam ii Estime uma equação linear relacionando score a colGPA actmth e acteng em que colGPA é medida no início do período Registre os resultados na forma usual iii Você diria que a nota ACT em matemática ou inglês é um melhor previsor de desempenho do curso de Economia Explique iv Discuta o tamanho do Rquadrado na regressão Exercícios Computacionais 20240926 C1 b wghtβ0β1 ci g sβ2 f am incu i Qual o sinal mais provável para β2 O sinal mais provavel para β2 é positivo isso significa que quanto maior for a renda familiar esperase que o peso ao nascer b wght seja maior também ii Você acha que c i gs e f ami nc são possívelmente correlacionados Acredito que as variáveis independentes estejam negativamente correlacionadas ou seja conforme a renda familiar f ami nc aumenta o número de cigarros fumados durante a gravidez tende a diminuir Isso pode ocorrer porque famílias de maior poder aquisitivo geralmente têm acesso a mais informações sobre os riscos do tabagismo durante a gestação além de melhores tratamentos e cuidados médicos Esses fatores contribuem para uma conscientização maior e consequentemente uma redução no consumo de cigarros durante a gravidez iii Analise do MRLM com e sem a variável f ami nc librarywooldridge Warning package wooldridge was built under R version 432 databwght attachbwght The following object is masked by GlobalEnv bwght The following object is masked from packagewooldridge bwght Com a variável faminc m1 lmbwghtbwght cigs faminc summarym1 Call lmformula bwghtbwght cigs faminc Residuals Min 1Q Median 3Q Max 96061 11543 0638 13126 150083 Coefficients Estimate Std Error t value Prt Intercept 11697413 104898 111512 2e16 cigs 046341 009158 5060 475e07 faminc 009276 002919 3178 000151 Signif codes 0 0001 001 005 01 1 Residual standard error 2006 on 1385 degrees of freedom Multiple Rsquared 00298 Adjusted Rsquared 00284 Fstatistic 2127 on 2 and 1385 DF pvalue 7942e10 Sem a variável faminc m2 lmbwghtbwght cigs summarym2 Call lmformula bwghtbwght cigs Residuals Min 1Q Median 3Q Max 96772 11772 0297 13228 151228 Coefficients Estimate Std Error t value Prt Intercept 11977190 057234 209267 2e16 cigs 051377 009049 5678 166e08 Signif codes 0 0001 001 005 01 1 Residual standard error 2013 on 1386 degrees of freedom Multiple Rsquared 002273 Adjusted Rsquared 002202 Fstatistic 3224 on 1 and 1386 DF pvalue 1662e08 Considerando o pvalor do teste F o modelo M1 que inclui a variável f ami nc renda familiar é significativo ao nível de 5 Ao analisar o teste t das variáveis independentes tanto c i gs número de cigarros fumados por dia durante a gravidez quanto f ami nc foram estatisticamente significativas Isso indica que as variações dessas variáveis explicam as variações da variável dependente b wght peso ao nascer No entanto com um R 2 de 00298 apenas 298 das variações em b wght são explicadas pelo modelo M1 Já o modelo M2 que exclui a variável f ami nc também é significativo ao nível de 5 com um R 2 de 00227 indicando que 227 das variações em b wght são explicadas pela variável c i gs sozinha Isso sugere que embora a renda familiar f ami nc seja estatisticamente significativa para explicar as variações no peso ao nascer sua contribuição para a capacidade explicativa do modelo é relativamente baixa C2 datahprice1 attachhprice1 m3 lmprice sqrft bdrms summarym3 Call lmformula price sqrft bdrms Residuals Min 1Q Median 3Q Max 127627 42876 7051 32589 229003 Coefficients Estimate Std Error t value Prt Intercept 1931500 3104662 0622 0536 sqrft 012844 001382 9291 139e14 bdrms 1519819 948352 1603 0113 Signif codes 0 0001 001 005 01 1 Residual standard error 6304 on 85 degrees of freedom Multiple Rsquared 06319 Adjusted Rsquared 06233 Fstatistic 7296 on 2 and 85 DF pvalue 22e16 i Escreva os resultados em forma de equação pr ic ei1931013 sq r f ti1520bd r m siui ii Qual é o aumento estimado do preço de uma casa com um quarto a mais mantendo a área constante O aumento estimado do preço de uma casa com um quarto a mais mantendo a área constante é dado pelo coeficiente de bd r m s que é 1520 Isso significa que ao adicionar um quarto sem alterar o tamanho da casa o preço estimado da casa aumenta em cerca de 1520 unidades de medidas independentemente da área iii Qual é o aumento estimado do preço de uma casa com um quarto adicional de 140 pés quadrados Quando se adiciona um quarto e a casa tem uma área de 140 pés quadrados o aumento no preço será apenas devido ao número adicional de quartos conforme indicado pelo coeficiente de bd r m s Assim o aumento estimado no preço para um quarto a mais continua sendo 1520 um independentemente do tamanho da área iv Qual a porcentagem de variação do preço é explicada pela área e número de quartos O percentual que o preço é explicado pela área e a quantidade de quarto é determinada pelo coeficiente de determinação R 2 do MRLM que foi 06319 ou seja 6319 da variação do preço é explicada pelo modelo de regressão proposto v Encontrando o valore previsto quando sqrft 2438 e bdrms 4 valores dataframesqrft 2438 bdrms 4 pred predictm3 newdata valores pred 1 3546052 O valor previsto da casa é de US 35460520 vi Comparação com o preço real real hprice1price1 erro realpred erro 1 5460525 O valor predito teve um valor maior em aproximadamente US 5460525 sugerindo que o comprador pagou um valor menor pouco pela casa de acordo com o modelo encontrado C3 i Estimando o modelo dataceosal2 attachceosal2 m4 lmlsalary lsales lmktval summarym4 Call lmformula lsalary lsales lmktval Residuals Min 1Q Median 3Q Max 228060 031137 001269 030645 191210 Coefficients Estimate Std Error t value Prt Intercept 462092 025441 18163 2e16 lsales 016213 003967 4087 667e05 lmktval 010671 005012 2129 00347 Signif codes 0 0001 001 005 01 1 Residual standard error 05103 on 174 degrees of freedom Multiple Rsquared 02991 Adjusted Rsquared 02911 Fstatistic 3713 on 2 and 174 DF pvalue 3727e14 l o g s al ar y i462016lo g sal e si011l o g mk t v aliϵi ii Adicionar pr of i t s ao modelo m5 lmlsalary lsales lmktval profits summarym5 Call lmformula lsalary lsales lmktval profits Residuals Min 1Q Median 3Q Max 227002 031026 001027 031043 191489 Coefficients Estimate Std Error t value Prt Intercept 4687e00 3797e01 12343 2e16 lsales 1614e01 3991e02 4043 792e05 lmktval 9753e02 6369e02 1531 0128 profits 3566e05 1520e04 0235 0815 Signif codes 0 0001 001 005 01 1 Residual standard error 05117 on 173 degrees of freedom Multiple Rsquared 02993 Adjusted Rsquared 02872 Fstatistic 2464 on 3 and 173 DF pvalue 253e13 A razão pela qual você não pode incluir pr of i t s lucros na forma de logaritmo é que essa variável provavelmente contém valores negativos ou zero Isso impede a transformação logarítmica já que o logaritmo natural não está definido nesses casos Essas variáveis em conjunto explicam cerca de 2993 da variação dos salários dos CEOs ou seja não explicam a maior parte iii Adicionar a variável c eot en ao modelo m6 lmlsalary lsales lmktval profits ceoten summarym6 Call lmformula lsalary lsales lmktval profits ceoten Residuals Min 1Q Median 3Q Max 248792 029369 000827 029951 185524 Coefficients Estimate Std Error t value Prt Intercept 4558e00 3803e01 11986 2e16 lsales 1622e01 3948e02 4109 614e05 lmktval 1018e01 6303e02 1614 01083 profits 2905e05 1503e04 0193 08470 ceoten 1168e02 5342e03 2187 00301 Signif codes 0 0001 001 005 01 1 Residual standard error 05062 on 172 degrees of freedom Multiple Rsquared 03183 Adjusted Rsquared 03024 Fstatistic 2008 on 4 and 172 DF pvalue 1387e13 Para cada ano adicional do CEO na empresa estimasse um aumento de aproximadamente 116 iv Correlação entra as variaveis l mk t v al e pr of i t s cormktval profits 1 0918128 A correlação entre as variáveis é positiva e forte quando duas variáveis independentes têm uma correlação de 092 a multicolinearidade provavelmente estará presente dificultando a interpretação dos coeficientes e aumentando os erros padrão C4 i Encontrar os valores mínimo máximo e médio das variáveis dataattend attachattend The following object is masked by GlobalEnv attend The following object is masked from packagewooldridge attend summaryatndrte Min 1st Qu Median Mean 3rd Qu Max 625 7500 8750 8171 9375 10000 summarypriGPA Min 1st Qu Median Mean 3rd Qu Max 0857 2190 2560 2587 2942 3930 summaryACT Min 1st Qu Median Mean 3rd Qu Max 1300 2000 2200 2251 2500 3200 ii Estimar o modelo m7 lmatndrte priGPA ACT summarym7 Call lmformula atndrte priGPA ACT Residuals Min 1Q Median 3Q Max 65373 6765 2125 9635 29615 Coefficients Estimate Std Error t value Prt Intercept 75700 3884 1949 2e16 priGPA 17261 1083 1594 2e16 ACT 1717 0169 1016 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1438 on 677 degrees of freedom Multiple Rsquared 02906 Adjusted Rsquared 02885 Fstatistic 1387 on 2 and 677 DF pvalue 22e16 at nd r t ei75701726 pr i G P Ai172 ACT iϵ i De acordo com o intercepto estamasse que se o GPA cumulativo e a prontuação ACT forem zero isso implica que as aulas assistindas serão em torno de 76 Interpretação dos valores estimados Para cada aumento em uma unidade no GPA cumulativo estimasse um aumento de aproximadamente 1 aulas assistidas enquanto para cada aumento em uma unidade a nota do ACT diminui em aproximadamente duas aulas assistidas Valore previsto valores2 dataframepriGPA 365 ACT 20 pred2 predictm7 newdata valores2 pred2 1 1043705 real2 subsetattend priGPA 365 ACT 20 if nrowreal2 0 printExistem observações com priGPA 365 e ACT 20 printresultado else printNão existem observações com priGPA 365 e ACT 20 1 Não existem observações com priGPA 365 e ACT 20 Estimasse que para uma pessoa que possuí uma GPA cumulativo de 366 e uma pontuação ACT de 20 tenhas assistindo em torno de 104 aulas porém não há nenhuma observação com esses dados na amostra v Diferença na taxa de frequência estA dataframepriGPA 31 ACT 21 predA predictm7 newdata estA estB dataframepriGPA 21 ACT 26 predB predictm7 newdata estB predA predB 1 2584336 C6 i Primeiro modelo Q Iiβ0γ1e duciϵ i datawage2 attachwage2 The following object is masked from ceosal2 age m8 lmIQ educ summarym8 Call lmformula IQ educ Residuals Min 1Q Median 3Q Max 50228 7262 0907 8772 37373 Coefficients Estimate Std Error t value Prt Intercept 536872 26229 2047 2e16 educ 35338 01922 1839 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 129 on 933 degrees of freedom Multiple Rsquared 02659 Adjusted Rsquared 02652 Fstatistic 338 on 1 and 933 DF pvalue 22e16 ii Segundo modelo l o g wa ge β0β1e duciϵ i m9 lmlwage educ summarym9 Call lmformula lwage educ Residuals Min 1Q Median 3Q Max 194620 024832 003507 027440 128106 Coefficients Estimate Std Error t value Prt Intercept 5973063 0081374 7340 2e16 educ 0059839 0005963 1004 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 04003 on 933 degrees of freedom Multiple Rsquared 009742 Adjusted Rsquared 009645 Fstatistic 1007 on 1 and 933 DF pvalue 22e16 iii Terceiro Modelo l o g wa ge β0β1e ducβ2Q I m10 lmlwage educ IQ summarym10 Call lmformula lwage educ IQ Residuals Min 1Q Median 3Q Max 201601 024367 003359 027960 123783 Coefficients Estimate Std Error t value Prt Intercept 56582877 00962408 58793 2e16 educ 00391199 00068382 5721 143e08 IQ 00058631 00009979 5875 587e09 Signif codes 0 0001 001 005 01 1 Residual standard error 03933 on 932 degrees of freedom Multiple Rsquared 01297 Adjusted Rsquared 01278 Fstatistic 6942 on 2 and 932 DF pvalue 22e16 iv Verificando se β1β1β2γ1 coefm8 coefm8 coefm9 coefm9 coefm10 coefm10 gamma coefm8educ betam9 coefm9educ beta1 coefm10educ beta2 coefm10IQ condicao betam9 beta1 beta2 gamma if condicao printA condição é satisfeita o estimador do modelo 9 é igual à soma e multiplicação dos estimadores dos outros modelos else printA condição NÃO é satisfeita 1 A condição é satisfeita o estimador do modelo 9 é igual à soma e multiplicação dos estimadores dos outros modelos C7 i Estimando o modelo datameap93 attachmeap93 The following objects are masked from ceosal2 lsalary salary The following object is masked from packagewooldridge benefits m11 lmmath10 lexpend lnchprg summarym11 Call lmformula math10 lexpend lnchprg Residuals Min 1Q Median 3Q Max 24294 6172 1293 4855 43203 Coefficients Estimate Std Error t value Prt Intercept 2036075 2507288 0812 04172 lexpend 622969 297263 2096 00367 lnchprg 030459 003536 8614 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 9526 on 405 degrees of freedom Multiple Rsquared 01799 Adjusted Rsquared 01759 Fstatistic 4443 on 2 and 405 DF pvalue 22e16 Os sinais dos coeficientes no modelo de regressão fazem sentido O coeficiente positivo de l o g e x pe nd indica que maiores despesas por aluno estão associadas a melhores resultados em matemática o que é esperado já que mais recursos geralmente proporcionam melhores condições de aprendizado Por outro lado o coeficiente negativo de l nch pr g sugere que um maior percentual de alunos no programa de almoço gratuito está relacionado a um desempenho pior o que pode refletir desvantagens socioeconômicas que afetam negativamente o aprendizado Assim ambos os sinais estão alinhados com interpretações plausíveis no contexto educacional ii Interpretação do intercepto O intercepto de 2036 indica que sob a condição teórica de que as despesas por aluno l o g e x pe nd e o percentual de alunos no programa de almoço gratuito l nch pr g sejam ambos zero o modelo prevê um percentual de alunos em nível satisfatório em matemática de aproximadamente 2036 Essa interpretação não faz sentido prático já que porcentagens não podem ser negativas Embora matematicamente possível definir ambas as variáveis explicativas como zero pode não ser realista no contexto educacional Por exemplo ter despesas por aluno iguais a zero ou um percentual de alunos no programa de almoço gratuito também igual a zero é improvável e pode não refletir a realidade de qualquer sistema educacional Portanto embora o intercepto possa ser calculado sua interpretação prática é limitada e muitas vezes não é útil iii Comparando o modelo um um modelo de regressão simples m12 lmmath10 lexpend summarym12 Call lmformula math10 lexpend Residuals Min 1Q Median 3Q Max 22343 7100 0914 6148 39093 Coefficients Estimate Std Error t value Prt Intercept 69341 26530 2614 0009290 lexpend 11164 3169 3523 0000475 Signif codes 0 0001 001 005 01 1 Residual standard error 1035 on 406 degrees of freedom Multiple Rsquared 002966 Adjusted Rsquared 002727 Fstatistic 1241 on 1 and 406 DF pvalue 00004752 O efeito dos gastos l o g e x pe nd no segundo modelo 1116 é maior do que no primeiro modelo 623 Essa diferença sugere que ao considerar apenas as despesas por aluno o impacto no desempenho em matemática é mais significativo A inclusão da variável l nch pr g no primeiro modelo parece ter diluído o efeito da despesa por aluno possivelmente devido à correlação entre as variáveis ou ao fato de que o percentual de alunos no programa de almoço gratuito pode estar capturando parte do efeito que de outra forma seria atribuído a l o g e x pe nd iv Correlação corlexpend lnchprg 1 01927042 Faz sentido e pode refletir uma relação lógica em que um aumento nas despesas está associado a uma diminuição na dependência de programas de assistência alimentar v Use o item iv para explicar suas descobertas do item iii A correlação negativa pode sugerir que os alunos com maior acesso a recursos refletido em l o g e x pe nd tendem a depender menos de programas como o l nch pr g Portanto quando analisados juntos essas variáveis podem capturar dinâmicas sociais e econômicas que influenciam o desempenho escolar A análise conjunta das variáveis ajuda a entender como diferentes fatores interagem e afetam o desempenho dos alunos em matemática destacando a complexidade das relações educacionais C8 i Medidas das variáveis datadiscrim attachdiscrim meanprpblck narm TRUE 1 01134864 meanincome narm TRUE 1 4705378 sdprpblck narm TRUE 1 01824165 sdincome narm TRUE 1 1317929 a variável pr pbl c k é medida em proporção enquanto i nco me em mulhares de doláres ii Modelo de regressão m13 lmpsoda prpblck income summarym13 Call lmformula psoda prpblck income Residuals Min 1Q Median 3Q Max 029401 005242 000333 004231 044322 Coefficients Estimate Std Error t value Prt Intercept 9563e01 1899e02 50354 2e16 prpblck 1150e01 2600e02 4423 126e05 income 1603e06 3618e07 4430 122e05 Signif codes 0 0001 001 005 01 1 Residual standard error 008611 on 398 degrees of freedom 9 observations deleted due to missingness Multiple Rsquared 006422 Adjusted Rsquared 005952 Fstatistic 1366 on 2 and 398 DF pvalue 1835e06 ps od ai0 96012 pr p blc ki0000002inc om eiui R2 00642 n 401 O coeficiente da variável prpblck no modelo de regressão é 012 indicando que um aumento de 1 unidade na proporção de negros está associado a um aumento de aproximadamente 115 no consumo de refrigerante ps od a mantendo a renda constante Este efeito é estatisticamente significativo com um pvalor proximo de 0 Comparado ao coeficiente da variável income que é 0000002 o impacto de pr pbl c k é consideravelmente maior sugerindo que a proporção de negros tem uma influência mais significativa no consumo de refrigerante Portanto o coeficiente de pr pbl c k não apenas é estatisticamente relevante mas também pode ser considerado economicamente significativo dependendo do contexto do estudo iii Comparando o resultado com um MRLS m14 lmpsoda prpblck summarym14 Call lmformula psoda prpblck Residuals Min 1Q Median 3Q Max 030884 005963 001135 003206 044840 Coefficients Estimate Std Error t value Prt Intercept 103740 000519 19987 2e16 prpblck 006493 002396 271 000702 Signif codes 0 0001 001 005 01 1 Residual standard error 00881 on 399 degrees of freedom 9 observations deleted due to missingness Multiple Rsquared 001808 Adjusted Rsquared 001561 Fstatistic 7345 on 1 and 399 DF pvalue 0007015 Ao comparar os resultados dos modelos de regressão linear múltipla MRLM e linear simples MRLS para a variável psoda observase que a inclusão da variável income no MRLM intensifica o efeito da proporção de negros pr pbl c k sobre o consumo de refrigerante No MRLS o coeficiente de prpblck é 006 indicando um aumento de aproximadamente 649 no consumo com um aumento de 1 unidade na proporção de negros No MRLM esse coeficiente sobe para 012 refletindo um aumento de 115 no consumo sugerindo que a renda contribui significativamente para explicar essa relação Portanto o MRLM revela um impacto mais forte e significativo de pr pbl c k sobre ps od a demonstrando a importância de considerar múltiplas variáveis na análise iv Elasticidade Constante m15 lmlpsoda prpblck lincome summarym15 Call lmformula lpsoda prpblck lincome Residuals Min 1Q Median 3Q Max 033563 004695 000658 004334 035413 Coefficients Estimate Std Error t value Prt Intercept 079377 017943 4424 125e05 prpblck 012158 002575 4722 324e06 lincome 007651 001660 4610 543e06 Signif codes 0 0001 001 005 01 1 Residual standard error 00821 on 398 degrees of freedom 9 observations deleted due to missingness Multiple Rsquared 006809 Adjusted Rsquared 006341 Fstatistic 1454 on 2 and 398 DF pvalue 8039e07 Um aumento de 20 na proporção de negors causaria um aumento de e 10 1215802e 1 024316279 um aumento de 20 da proporção causará um aumento de 279 no consumo de refrigerante v adicionando a variável pr p po v m16 lmlpsoda prpblck lincome prppov summarym16 Call lmformula lpsoda prpblck lincome prppov Residuals Min 1Q Median 3Q Max 032218 004648 000651 004272 035622 Coefficients Estimate Std Error t value Prt Intercept 146333 029371 4982 94e07 prpblck 007281 003068 2373 00181 lincome 013696 002676 5119 48e07 prppov 038036 013279 2864 00044 Signif codes 0 0001 001 005 01 1 Residual standard error 008137 on 397 degrees of freedom 9 observations deleted due to missingness Multiple Rsquared 008696 Adjusted Rsquared 008006 Fstatistic 126 on 3 and 397 DF pvalue 6917e08 Com a inclusão da variável prppov no modelo o coeficiente de prpblck aumentou de 0073 para 0122 indicando que a relação entre a proporção de negros e o consumo de refrigerante se fortaleceu Isso sugere que pr p po v está capturando fatores adicionais que influenciam o consumo resultando em uma relação mais pronunciada entre pr pbl c k e l p so da vi Correlação entre as variáveis corlincome prppov use completeobs 1 0838467 A correlação de 0838 entre l o g inc om e e pr p po v indica uma relação negativa forte o que sugere que à medida que a renda aumenta a proporção de pessoas vivendo na pobreza tende a diminuir Esse resultado é esperado pois em geral uma maior renda está associada a melhores condições socioeconômicas o que pode levar a uma redução na pobreza Portanto essa correlação está alinhada com as expectativas teóricas sobre a relação entre renda e pobreza vii Avaliando a afirmação A afirmação de que variáveis altamente correlacionadas não deveriam estar na mesma regressão é correta pois pode levar à multicolinearidade que afeta a precisão das estimativas dos coeficientes e dificulta a interpretação dos efeitos individuais No entanto a inclusão dessas variáveis pode ser justificada dependendo do contexto do estudo e dos objetivos da análise Em situações de multicolinearidade é possível usar técnicas como análise de componentes principais ou selecionar variáveis com base em critérios teóricos C9 i Estimando o Modelo de Regressão datacharity attachcharity m16 lmgift mailsyear giftlast propresp summarym16 Call lmformula gift mailsyear giftlast propresp Residuals Min 1Q Median 3Q Max 52893 7050 3650 1397 241206 Coefficients Estimate Std Error t value Prt Intercept 4551518 0803034 5668 154e08 mailsyear 2166259 0331927 6526 753e11 giftlast 0005927 0001432 4138 358e05 propresp 15358605 0874539 17562 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1443 on 4264 degrees of freedom Multiple Rsquared 008336 Adjusted Rsquared 008271 Fstatistic 1293 on 3 and 4264 DF pvalue 22e16 m17 lmgift mailsyear summarym17 Call lmformula gift mailsyear Residuals Min 1Q Median 3Q Max 11287 7976 5976 2687 245999 Coefficients Estimate Std Error t value Prt Intercept 20141 07395 2724 000648 mailsyear 26495 03431 7723 14e14 Signif codes 0 0001 001 005 01 1 Residual standard error 1496 on 4266 degrees of freedom Multiple Rsquared 001379 Adjusted Rsquared 001356 Fstatistic 5965 on 1 and 4266 DF pvalue 1404e14 Ao comparar os valores de R 2 dos dois modelos observamos que o modelo MRLM apresenta um R 2 de 00834 enquanto o MRLS tem um R 2 de 00138 Isso indica que o MRLM que inclui as variáveis m ail s ye ar gi f t l ast e pr o pr es p explica uma maior proporção da variação da variável dependente gift em comparação com o MRLS que considera apenas a variável m ail s ye ar como variável independente A inclusão das variáveis adicionais no MRLM resulta em um ajuste mais robusto e uma explicação mais eficaz dos dados ii Interpretação do coeficiente β1 No MRLM o coeficiente de m ail s ye ar é de aproximadamente 2166 enquanto no MRLS o coeficiente de m ail s ye ar é de aproximadamente 265 Isso indica que no MRLM para cada aumento de uma unidade em m ail s ye ar a variável gi f t aumenta em cerca de 2166 enquanto no MRLS essa mesma mudança resulta em um aumento de 265 Portanto o coeficiente de m ail s ye ar no MRLS é maior do que no MRLM Essa diferença sugere que ao considerar apenas m ail s ye ar o efeito desta variável sobre gi f t é mais pronunciado enquanto sua inclusão em um modelo mais complexo reduz seu impacto iii Interpretação do coeficiente β3 No MRLM o coeficiente de pr o pr es p é de aproximadamente 15359 Isso significa que ao aumentar a variável propresp em uma unidade esperase que a variável gi f t aumente em cerca de 15359 unidades mantendo as outras variáveis constantes ou seja m ail s ye ar e gi f t l ast Esse coeficiente sugere um impacto substancial de pr o pr es p sobre gi f t indicando que quanto maior a proporção de respostas maior é o valor do presente Em termos práticos isso pode indicar que um aumento na proporção de respostas está fortemente associado a um aumento significativo nas doações ou presentes recebidos iv Adicionando a variável a v g gi f t m18 lmgift mailsyear giftlast propresp avggift summarym18 Call lmformula gift mailsyear giftlast propresp avggift Residuals Min 1Q Median 3Q Max 197016 5883 2065 3031 221256 Coefficients Estimate Std Error t value Prt Intercept 732776 075822 9664 2e16 mailsyear 120117 031242 3845 0000122 giftlast 026086 001076 24251 2e16 propresp 1620464 081753 19821 2e16 avggift 052695 002108 24996 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1347 on 4263 degrees of freedom Multiple Rsquared 02005 Adjusted Rsquared 01998 Fstatistic 2673 on 4 and 4263 DF pvalue 22e16 O coeficiente de m ail s ye ar diminui para aproximadamente 1201 em comparação ao modelo anterior onde era cerca de 2166 Isso indica que com a adição de a v g gi f t o impacto do número de cartas enviadas por ano sobre o valor do presente recebido diminuiu sugerindo que parte do efeito anterior de m ail s ye ar estava sendo capturado por gi f t l ast e a v g gi f t v O que acontece com o coeficiente de gi f t l ast O coeficiente de gi f t l ast agora é de aproximadamente 0261 que é uma mudança significativa em relação ao modelo anterior O sinal negativo indica que um aumento em gi f t l ast está associado a uma diminuição no valor do presente recebido o que pode sugerir que quanto mais presente foi dado anteriormente menor é o valor esperado de presentes futuros talvez devido à saturação ou expectativa do doador C10 i datahtv attachhtv The following objects are masked from wage2 educ exper lwage sibs south urban wage The following objects are masked from bwght fatheduc motheduc vareduc narm TRUE 1 5542945 totalhomens nrowhtv homensensinomedio sumeduc 12 narm TRUE porcentagemhomensensinomedio homensensinomedio totalhomens 100 porcentagemhomensensinomedio 1 4162602 meaneduc 1 130374 meanfatheduc 1 1244715 A variação de e duc é de aproximadamente 554 4163 dos homens da amostra tem o ensino médio concluido e os homens tem uma média de nível educacional maior que dos seus pais ii Modelo estimado m19 lmeduc motheduc fatheduc summarym19 Call lmformula educ motheduc fatheduc Residuals Min 1Q Median 3Q Max 62898 09400 04037 11239 81672 Coefficients Estimate Std Error t value Prt Intercept 696435 031982 21776 2e16 motheduc 030420 003193 9528 2e16 fatheduc 019029 002228 8539 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 2042 on 1227 degrees of freedom Multiple Rsquared 02493 Adjusted Rsquared 0248 Fstatistic 2037 on 2 and 1227 DF pvalue 22e16 Cerca de 2493 da variação de e duc pode ser explicada pela a variação dos pais para cada aumento em uma unidade de medida o nível de educação da mãe estimasse um aumento de 030 no nível de edcuação do homem iii Adicionando a variável de habilidade no modelo m20 lmeduc motheduc fatheduc abil summarym20 Call lmformula educ motheduc fatheduc abil Residuals Min 1Q Median 3Q Max 5407 1195 0199 1076 7012 Coefficients Estimate Std Error t value Prt Intercept 844869 028954 29180 2e16 motheduc 018913 002851 6635 487e11 fatheduc 011109 001988 5586 285e08 abil 050248 002572 19538 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1784 on 1226 degrees of freedom Multiple Rsquared 04275 Adjusted Rsquared 04261 Fstatistic 3052 on 3 and 1226 DF pvalue 22e16 e duci845020mot hed uci011 f at he duci050abiliui De acordo com o teste T a vriável abi l é estatisticamente significativa ou seja as suas variações são capazes de explicar as variações da variável dependente e duc iv Forma quadrática abil2 abil2 m21 lmeduc motheduc fatheduc abil abil2 summarym21 Call lmformula educ motheduc fatheduc abil abil2 Residuals Min 1Q Median 3Q Max 52506 11274 01355 10223 70482 Coefficients Estimate Std Error t value Prt Intercept 8240226 0287410 28671 2e16 motheduc 0190126 0028096 6767 203e11 fatheduc 0108939 0019601 5558 335e08 abil 0401462 0030288 13255 2e16 abil2 0050599 0008304 6093 148e09 Signif codes 0 0001 001 005 01 1 Residual standard error 1758 on 1225 degrees of freedom Multiple Rsquared 04444 Adjusted Rsquared 04425 Fstatistic 2449 on 4 and 1225 DF pvalue 22e16 coeficientes coefm21 beta3 coeficientesabil beta4 coeficientesabil2 abilmin beta32beta4 abilmin abil 3967098 A quantidade de abi l em que e duc é minimizado é de 397 v Valores de abi l menores que em iv prop sumabil abilmintotalhomens100 prop 1 8414634 Cerca de 122 dos homens observados na amostra tem a ahbilidade menor que o valor que minimiza e duc vi Gráfico educpred predictm21 ploteducpred abil C11 i MRLS datameapsingle attachmeapsingle The following objects are masked from meap93 enroll lenroll The following object is masked from wage2 married m22 lmmath4 pctsgle summarym22 Call lmformula math4 pctsgle Residuals Min 1Q Median 3Q Max 47791 8310 1600 8092 50317 Coefficients Estimate Std Error t value Prt Intercept 9677043 159680 6060 2e16 pctsgle 083288 007068 1178 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1248 on 227 degrees of freedom Multiple Rsquared 03795 Adjusted Rsquared 03768 Fstatistic 1389 on 1 and 227 DF pvalue 22e16 O coeficiente de inclinação do modelo para a variável pct s gl e é 083 indicando que para cada aumento de 1 na porcentagem de estudantes em famílias monoparentais a nota média em matemática m at h4 tende a diminuir em aproximadamente 083 pontos Esse efeito é estatisticamente significativo com um pvalor de p muito menor que 0001 Embora a redução de 083 pontos possa parecer pequena em uma escala de 0 a 100 ela pode ter um impacto perceptível especialmente se a média das notas estiver em torno de 50 a 70 Portanto essa relação negativa sugere que a monoparentalidade pode influenciar de forma relevante o desempenho em matemática ii Adicionando mais variáveis independentes no modelo m23 lmmath4 pctsgle lmedinc free summarym23 Call lmformula math4 pctsgle lmedinc free Residuals Min 1Q Median 3Q Max 34919 7195 0931 7313 50152 Coefficients Estimate Std Error t value Prt Intercept 5172322 5847814 0884 0377 pctsgle 019965 015872 1258 0210 lmedinc 356013 504170 0706 0481 free 039642 007035 5635 52e08 Signif codes 0 0001 001 005 01 1 Residual standard error 117 on 225 degrees of freedom Multiple Rsquared 04598 Adjusted Rsquared 04526 Fstatistic 6385 on 3 and 225 DF pvalue 22e16 Ao adicionar as variáveis l me di nc renda média e f r e e programas gratuitos o coeficiente de pct s gl e percentagem de famílias monoparentais cai para 020 indicando que cada aumento de 1 na monoparentalidade resulta em uma diminuição de aproximadamente 020 pontos na nota em matemática mas essa relação não é significativa pvalor 0210 A inclusão dessas variáveis sugere que o efeito da monoparentalidade no desempenho em matemática é reduzido quando se considera renda média e acesso a programas gratuitos iii Correlação entre as variáves corlmedinc free 1 07469703 A correlação indica uma correlação negativa forte Isso sugere que à medida que a renda média aumenta o acesso a programas gratuitos tende a diminuir o que é um resultado esperado já que famílias com maior renda geralmente têm menos necessidade de assistência gratuita iv Analisando a correlação Sim a correlação negativa forte de 075 entre as variáveis l me di nc e f r e e indica que pode haver multicolinearidade no modelo de regressão linear múltipla Quando duas variáveis independentes estão altamente correlacionadas isso pode afetar a precisão das estimativas dos coeficientes e a interpretação dos resultados Portanto é aconselhável considerar a remoção de uma das variáveis para melhorar a robustez do modelo e evitar problemas de multicolinearidade v FIVs librarycar Carregando pacotes exigidos carData vifm23 pctsgle lmedinc free 5740981 4118812 3188079 No modelo a variável pct s gl e apresenta o maior Valor de Inflação da Variância VIF de 574 indicando uma preocupação potencial com multicolinearidade Geralmente um VIF acima de 5 sugere que a variável está altamente correlacionada com outras variáveis independentes no modelo o que pode distorcer as estimativas dos coeficientes e comprometer a interpretabilidade do modelo C12 i dataeconmath attacheconmath The following object is masked from wage2 age The following object is masked from ceosal2 age The following object is masked from bwght male sumscore 100 1 0 meanmathscr 1 7875 meanactmth narm TRUE 1 232113 sdactmth narm TRUE 1 3773354 meanacteng narm TRUE 1 2259459 sdacteng narm TRUE 1 3788735 Nenhum aluno obteve a nota perfeita sc or e 100 A média das notas de matemática foi de 788 Ao considerar as notas do ACT observouse que as médias em matemática foram superiores às de inglês embora a variação das notas em inglês tenha sido maior ii MRLM m24 lmscore colgpa actmth acteng summarym24 Call lmformula score colgpa actmth acteng Residuals Min 1Q Median 3Q Max 39855 6215 0444 6812 32670 Coefficients Estimate Std Error t value Prt Intercept 1617402 280044 5776 109e08 colgpa 1236620 071506 17294 2e16 actmth 088335 011220 7873 111e14 acteng 005176 011106 0466 0641 Signif codes 0 0001 001 005 01 1 Residual standard error 1035 on 810 degrees of freedom 42 observations deleted due to missingness Multiple Rsquared 03972 Adjusted Rsquared 0395 Fstatistic 1779 on 3 and 810 DF pvalue 22e16 iii Com base no modelo de regressão as notas em matemática ac t m t h e o GPA do colégio c ol g pa são preditores significativos do desempenho acadêmico score no curso de Economia com coeficientes positivos que indicam uma relação direta A nota em inglês ac t e ng por outro lado não mostrou um efeito significativo pvalor 0641 Portanto as notas em matemática e o GPA são as melhores variáveis preditivas para o desempenho no curso enquanto a nota em inglês não contribui de forma relevante para a previsão iv Coeficiente de determinação O R 2 do modelo foi de 03972 o que indica que aproximadamente 3972 da variação nas notas sc or e dos alunos é explicada pelas variáveis independentes c ol g pa ac t m t h e ac t e ng Isso sugere que o modelo tem uma capacidade moderada de explicar o desempenho acadêmico dos alunos no curso de Economia mas também indica que há outros fatores que influenciam as notas e não estão incluídos no modelo
Send your question to AI and receive an answer instantly
Recommended for you
42
Exercícios Computacionais Capitulo 02 - Introdução a Econometria de Wooldridge
Estatística Econômica e Introdução à Econometria
UMG
22
Análise do Erro Quadrático Médio e Métodos de Estimação
Estatística Econômica e Introdução à Econometria
UMG
7
Amostragem Estratificada: Fundamentos e Cálculos
Estatística Econômica e Introdução à Econometria
UMG
4
Exercícios Computacionais Capitulo 02 - Introdução a Econometria de Wooldridge
Estatística Econômica e Introdução à Econometria
UMG
5
Análise Exploratória de Dados e Pesquisa Matrimonial - Exercícios Estatísticos
Estatística Econômica e Introdução à Econometria
UMG
25
Intervalos de Confiança: Conceitos e Cálculos
Estatística Econômica e Introdução à Econometria
UMG
1
Regressão Linear e Política Monetária - Análise de Dados Históricos
Estatística Econômica e Introdução à Econometria
UMG
4
Exercícios Computacionais Capitulo 02 - Introdução a Econometria de Wooldridge
Estatística Econômica e Introdução à Econometria
UMG
5
Exercícios Computacionais Capitulo 02 - Introdução a Econometria de Wooldridge
Estatística Econômica e Introdução à Econometria
UMG
25
Elementos Fundamentais dos Testes de Hipóteses
Estatística Econômica e Introdução à Econometria
UMG
Preview text
ii Considere um modelo para explicar o preço do refrigerante psoda em termos de proporção da população que é negra e com renda mediana psoda β0 β1prpblck β2income u Estime o modelo por MQO e registre os resultados em forma de equação incluindo o tamanho da amostra e o Rquadrado Não use notação científica ao relatar as estimativas Interprete o coeficiente sobre prpblck Você acha que ele é economicamente grande iii Compare a estimativa do item ii com a estimativa de regressão simples de psoda sobre prpblck O efeito de discriminação é maior ou menor quando se controla a renda iv Um modelo com elasticidadepreço constante em relação à renda pode ser mais adequado Registre as estimativas do modelo logpsoda β0 β1prpblck β2logincome u Se prpblck aumenta 020 20 pontos percentuais qual é a alteração percentual estimada em psoda Dica A resposta é 2xx você deve encontrar o xx v Agora adicione a variável prppov à regressão do item iv O que acontece com βprpblck vi Encontre a correlação entre logincome e prppov É aproximadamente o que você esperava vii Avalie a seguinte afirmação Como logincome e prppob são altamente correlacionadas elas não têm por que estar na mesma regressão C9 Use os dados do arquivo CHARITY para responder às questões a seguir i Estime a equação gift β0 β1mailsyear β2giftlast β3propresp u por MQO e registre os resultados da forma usual incluindo o tamanho da amostra e o Rquadrado De que forma o Rquadrado se compara com o obtido pela regressão simples que omite giftlast e proprepsp ii Interprete o coeficiente sobre mailsyear Ele é maior ou menor do que o coeficiente correspondente da regressão simples iii Interprete o coeficiente sobre proprepsp Tenha cuidado ao notar as unidades de medida de proprepsp iv Agora acrescente a variável avggift à equação O que acontece com o efeito estimado de mailsyear v Na equação do item iv o que aconteceu com o coeficiente de giftlast O que você acha que está acontecendo C10 Use os dados do arquivo HTV para responder essa questão O conjunto de dados inclui informações sobre salários escolaridade escolaridade dos pais e diversas outras variáveis a respeito de 1230 homens trabalhadores em 1991 i O que é a variação da variável educ na amostra Qual porcentagem de homens completou o ensino médio mas não o ensino superior São os homens ou seus pais que têm em média níveis mais altos de escolaridade ii Estime o modelo de regressão educ β0 β1motheduc β2fatheduc u Exercícios em computador C1 Um problema de interesse de agentes de saúde e outros é determinar os efeitos de fumar durante a gravidez sobre a saúde da criança Uma medida da saúde infantil é o peso ao nascer um peso muito baixo ao nascer pode colocar o recémnascido em risco de contrair várias doenças Como os fatores além do fumo que podem afetar o ii Estime o modelo atndrte β0 β1priGPA β2ACT u e escreva os resultados em forma de equação Interprete o intercepto Ele tem um significado útil iii Discuta os coeficientes de inclinação estimados Há alguma surpresa iv Qual é a atndrte prevista se priGPA 365 e ACT 20 O que você tira desse resultado Existem alguns estudantes na amostra com esses valores das variáveis explicativas v Se o estudante A tiver priGPA 31 e ACT 21 e o estudante B tiver priGPA 21 e ACT 26 qual é a diferença prevista em suas taxas de frequência C5 Confirme a interpretação eliminando a influência dos estimadores de MQO ao fazer explicitamente a eliminação da influência no Exemplo 32 Isso exige que primeiro você regresse educ em exper e tenure e salve os resíduos r1 Em seguida regresse logwage sobre r1 Compare o coeficiente de r1 com o coeficiente de educ na regressão de logwage sobre educ exper e tenure C6 Use o conjunto de dados do arquivo WAGE2 para resolver este problema Como sempre certifiquese que todas as regressões seguintes contenham um intercepto i Execute uma regressão simples de QI sobre educ para obter o coeficiente de inclinação digamos δ ii Faça a regressão simples de logwage sobre educ e obtenha o coeficiente de inclinação chamado de β1 iii Execute a regressão múltipla de logwage sobre educ e QI e obtenha os coeficientes de inclinação β1 e β2 respectivamente iv Verifique se β1 β1 β2δ1 C7 Use os dados do arquivo MEAP93 para responder a essa questão i Estime o modelo math10 β0 β1logexpend β2lnchprg u e registre os resultados na forma usual incluindo o tamanho da amostra e o Rquadrado Os sinais dos coeficientes de inclinação são os que você esperava Explique ii Como você interpreta o intercepto que estimou no item i Em especial faz sentido definir duas variáveis explicativas como zero Dica Lembrese que log1 0 iii Agora faça a regressão simples de math10 sobre logexpend e compare o coeficiente de inclinação com aquele obtido no item i O efeito de gastos estimado agora é maior ou menor do que no item i iv Encontre a correlação entre lexpend logexpend e lnchprg O sinal da relação faz sentido para você v Use o item iv para explicar suas descobertas no item iii C8 Use os dados do arquivo DISCRIM para responder a essa questão São dados sobre preços de vários itens em restaurantes de fast food e características da população dividida por CEP em Nova Jersey e Pensilvânia A ideia é ver se os restaurantes cobram preços mais altos em áreas com uma maior concentração de negros i Encontre os valores médios da proporção de negros prpblck e renda income na amostra além de seus desvios padrão Quais são as unidades de medida de prpblck e income peso ao nascer são provavelmente relacionados com o ato de fumar devemos leválos em conta Por exemplo uma renda mais alta geralmente resulta em acesso a um melhor cuidado prénatal bem como uma melhor nutrição da mãe Uma equação que reconhece isso é bwght β0 β0cigs β2 faminc u i Qual é o sinal mais provável para β2 ii Você acha que cigs e faminc são possivelmente correlacionados Explique por que a correlação deve ser positiva ou negativa iii Agora estime a equação com e sem faminc usando os dados do arquivo BWGHT Registre os resultados em forma de equação incluindo o tamanho da amostra e o Rquadrado Discuta seus resultados verificando se adicionar faminc altera substancialmente o efeito estimado de cigs sobre bwght C2 Use os dados do arquivo HPRICE1 para estimar o modelo price β0 β1 sqrft β2 bdrms u Em que price é o preço da residência medido em milhares de dólares i Escreva os resultados em forma de equação ii Qual é o aumento estimado do preço de uma casa com um quarto a mais mantendo a área constante iii Qual é o aumento estimado do preço de uma casa com um quarto adicional de 140 pés quadrados Compare isso com sua resposta ao item ii iv Qual porcentagem de variação do preço é explicada pela área e número de quartos v A primeira casa da amostra tem sqrft 2438 e bdrms 4 Encontre o preço de venda previsto dessa casa a partir da linha de regressão MQO vi O preço de venda real da primeira casa da amostra foi US 300000 assim price 300 Encontre o resíduo para essa casa O valor sugere que o comprador pagou pouco ou muito pela casa C3 O arquivo CEOSAL2 contém dados sobre 177 CEOs e pode ser usado para examinar os efeitos do desempenho da empresa sobre o salário destes executivos i Estime um modelo que relacione o salário anual às vendas e ao valor de mercado da companhia Faça o modelo do tipo de elasticidade constante para ambas as variáveis independentes Escreva os resultados em forma de equação ii Adicione profits ao modelo do item i Por que essa variável não pode ser incluída em forma logarítmica Você poderia dizer que essas variáveis de desempenho da empresa explicam a maior parte da variação dos salários dos CEOs iii Acrescente a variável ceoten ao modelo do item ii Qual é o retorno percentual estimado para outro ano de permanência do CEO mantendo os outros valores fixos iv Encontre o coeficiente de correlação amostral entre as variáveis logmktval e profits Essas variáveis são altamente correlacionadas O que isso diz sobre os estimadores de MQO C4 Use os dados do arquivo ATTEND para este exercício i Obtenha os valores mínimo máximo e médio para as variáveis atndrte priGPA e ACT 120 Introdução à econometria por MQO e registre os resultados na forma usual Quanta variação amostral em educ pode ser explicada pela escolaridade dos pais Interprete o coeficiente de motheduc iii Adicione a variável ability uma medida da habilidade cognitiva à regressão do item ii e registre os resultados em forma de equação Habilidade ajuda a explicar variações na educação mesmo depois de controlar os dados de escolaridade dos pais Explique iv Exige cálculo Agora estime uma equação em que ability apareça em forma quadrática educ β0 β1 motheduc β2 fatheduc β3 abil β4 abil2 u Usando as estimativas β3 e β4 use cálculo para encontrar o valor de abil chameo de abil em que educ é minimizada Os outros coeficientes e valores das variáveis de educação dos pais não têm efeito estamos mantendo a escolaridade dos pais fixa Note que abil é medida de forma que valores negativos são admissíveis Você também pode verificar que a segunda derivativa é positiva assim você realmente tem um mínimo v Comente sobre apenas uma pequena fração de homens da amostra terem habilidade menor do que o valor calculado no item iv Por que isso é importante vi Se você tiver acesso a um software estatístico que inclua recursos gráficos use as estimativas do item iv para desenhar um gráfico das relações entre a educação prevista e abil Defina motheduc e fatheduc como os valores médios da amostra 1218 e 1245 respectivamente C11 Use os dados do arquivo MEAPSINGLE para estudar os efeitos de residências com apenas um dos pais sobre o desempenho em matemática Estes dados são provenientes de um subconjunto de escolas do sudeste de Michigan no ano 2000 As variáveis socioeconômicas foram obtidas por CEP em que os CEPs são determinados a escolas com base em seus endereços de correspondência i Execute a regressão simples de math4 sobre pctsgle e registre os resultados no formato usual Interprete o coeficiente de inclinação O efeito sobre a monoparentalidade parece grande ou pequeno ii Adicione as variáveis lmedinc e free à equação O que acontece com o coeficiente de pctsgle Explique o que está acontecendo iii Encontre a correlação amostral entre lmedinc e free Ela tem o sinal que você esperava iv A correlação substancial entre lmedinc e free significa que você deve retirar um deles da regressão para estimar melhor o efeito causal da monoparentalidade no desempenho dos estudantes Explique v Encontre os fatores de inflação da variância FIVs de cada uma das variáveis explicativas que aparecem na regressão do item ii Quais variáveis têm o FIV maior Esse conhecimento afeta o modelo que você usa para estudar o efeito causal pela monoparentalidade sobre o desempenho em matemática C12 Os dados do arquivo ECONMATH contêm médias e pontuações de testes padronizados além do desempenho em um curso introdutório de Economia de estudantes em uma grande universidade pública A variável a ser explicada é score a nota final do curso medida como porcentagem i Quantos estudantes receberam uma nota perfeita no curso Qual foi a nota média Encontre as médias e desvios padrão de actmth e acteng e discuta como eles se comparam ii Estime uma equação linear relacionando score a colGPA actmth e acteng em que colGPA é medida no início do período Registre os resultados na forma usual iii Você diria que a nota ACT em matemática ou inglês é um melhor previsor de desempenho do curso de Economia Explique iv Discuta o tamanho do Rquadrado na regressão Exercícios Computacionais 20240926 C1 b wghtβ0β1 ci g sβ2 f am incu i Qual o sinal mais provável para β2 O sinal mais provavel para β2 é positivo isso significa que quanto maior for a renda familiar esperase que o peso ao nascer b wght seja maior também ii Você acha que c i gs e f ami nc são possívelmente correlacionados Acredito que as variáveis independentes estejam negativamente correlacionadas ou seja conforme a renda familiar f ami nc aumenta o número de cigarros fumados durante a gravidez tende a diminuir Isso pode ocorrer porque famílias de maior poder aquisitivo geralmente têm acesso a mais informações sobre os riscos do tabagismo durante a gestação além de melhores tratamentos e cuidados médicos Esses fatores contribuem para uma conscientização maior e consequentemente uma redução no consumo de cigarros durante a gravidez iii Analise do MRLM com e sem a variável f ami nc librarywooldridge Warning package wooldridge was built under R version 432 databwght attachbwght The following object is masked by GlobalEnv bwght The following object is masked from packagewooldridge bwght Com a variável faminc m1 lmbwghtbwght cigs faminc summarym1 Call lmformula bwghtbwght cigs faminc Residuals Min 1Q Median 3Q Max 96061 11543 0638 13126 150083 Coefficients Estimate Std Error t value Prt Intercept 11697413 104898 111512 2e16 cigs 046341 009158 5060 475e07 faminc 009276 002919 3178 000151 Signif codes 0 0001 001 005 01 1 Residual standard error 2006 on 1385 degrees of freedom Multiple Rsquared 00298 Adjusted Rsquared 00284 Fstatistic 2127 on 2 and 1385 DF pvalue 7942e10 Sem a variável faminc m2 lmbwghtbwght cigs summarym2 Call lmformula bwghtbwght cigs Residuals Min 1Q Median 3Q Max 96772 11772 0297 13228 151228 Coefficients Estimate Std Error t value Prt Intercept 11977190 057234 209267 2e16 cigs 051377 009049 5678 166e08 Signif codes 0 0001 001 005 01 1 Residual standard error 2013 on 1386 degrees of freedom Multiple Rsquared 002273 Adjusted Rsquared 002202 Fstatistic 3224 on 1 and 1386 DF pvalue 1662e08 Considerando o pvalor do teste F o modelo M1 que inclui a variável f ami nc renda familiar é significativo ao nível de 5 Ao analisar o teste t das variáveis independentes tanto c i gs número de cigarros fumados por dia durante a gravidez quanto f ami nc foram estatisticamente significativas Isso indica que as variações dessas variáveis explicam as variações da variável dependente b wght peso ao nascer No entanto com um R 2 de 00298 apenas 298 das variações em b wght são explicadas pelo modelo M1 Já o modelo M2 que exclui a variável f ami nc também é significativo ao nível de 5 com um R 2 de 00227 indicando que 227 das variações em b wght são explicadas pela variável c i gs sozinha Isso sugere que embora a renda familiar f ami nc seja estatisticamente significativa para explicar as variações no peso ao nascer sua contribuição para a capacidade explicativa do modelo é relativamente baixa C2 datahprice1 attachhprice1 m3 lmprice sqrft bdrms summarym3 Call lmformula price sqrft bdrms Residuals Min 1Q Median 3Q Max 127627 42876 7051 32589 229003 Coefficients Estimate Std Error t value Prt Intercept 1931500 3104662 0622 0536 sqrft 012844 001382 9291 139e14 bdrms 1519819 948352 1603 0113 Signif codes 0 0001 001 005 01 1 Residual standard error 6304 on 85 degrees of freedom Multiple Rsquared 06319 Adjusted Rsquared 06233 Fstatistic 7296 on 2 and 85 DF pvalue 22e16 i Escreva os resultados em forma de equação pr ic ei1931013 sq r f ti1520bd r m siui ii Qual é o aumento estimado do preço de uma casa com um quarto a mais mantendo a área constante O aumento estimado do preço de uma casa com um quarto a mais mantendo a área constante é dado pelo coeficiente de bd r m s que é 1520 Isso significa que ao adicionar um quarto sem alterar o tamanho da casa o preço estimado da casa aumenta em cerca de 1520 unidades de medidas independentemente da área iii Qual é o aumento estimado do preço de uma casa com um quarto adicional de 140 pés quadrados Quando se adiciona um quarto e a casa tem uma área de 140 pés quadrados o aumento no preço será apenas devido ao número adicional de quartos conforme indicado pelo coeficiente de bd r m s Assim o aumento estimado no preço para um quarto a mais continua sendo 1520 um independentemente do tamanho da área iv Qual a porcentagem de variação do preço é explicada pela área e número de quartos O percentual que o preço é explicado pela área e a quantidade de quarto é determinada pelo coeficiente de determinação R 2 do MRLM que foi 06319 ou seja 6319 da variação do preço é explicada pelo modelo de regressão proposto v Encontrando o valore previsto quando sqrft 2438 e bdrms 4 valores dataframesqrft 2438 bdrms 4 pred predictm3 newdata valores pred 1 3546052 O valor previsto da casa é de US 35460520 vi Comparação com o preço real real hprice1price1 erro realpred erro 1 5460525 O valor predito teve um valor maior em aproximadamente US 5460525 sugerindo que o comprador pagou um valor menor pouco pela casa de acordo com o modelo encontrado C3 i Estimando o modelo dataceosal2 attachceosal2 m4 lmlsalary lsales lmktval summarym4 Call lmformula lsalary lsales lmktval Residuals Min 1Q Median 3Q Max 228060 031137 001269 030645 191210 Coefficients Estimate Std Error t value Prt Intercept 462092 025441 18163 2e16 lsales 016213 003967 4087 667e05 lmktval 010671 005012 2129 00347 Signif codes 0 0001 001 005 01 1 Residual standard error 05103 on 174 degrees of freedom Multiple Rsquared 02991 Adjusted Rsquared 02911 Fstatistic 3713 on 2 and 174 DF pvalue 3727e14 l o g s al ar y i462016lo g sal e si011l o g mk t v aliϵi ii Adicionar pr of i t s ao modelo m5 lmlsalary lsales lmktval profits summarym5 Call lmformula lsalary lsales lmktval profits Residuals Min 1Q Median 3Q Max 227002 031026 001027 031043 191489 Coefficients Estimate Std Error t value Prt Intercept 4687e00 3797e01 12343 2e16 lsales 1614e01 3991e02 4043 792e05 lmktval 9753e02 6369e02 1531 0128 profits 3566e05 1520e04 0235 0815 Signif codes 0 0001 001 005 01 1 Residual standard error 05117 on 173 degrees of freedom Multiple Rsquared 02993 Adjusted Rsquared 02872 Fstatistic 2464 on 3 and 173 DF pvalue 253e13 A razão pela qual você não pode incluir pr of i t s lucros na forma de logaritmo é que essa variável provavelmente contém valores negativos ou zero Isso impede a transformação logarítmica já que o logaritmo natural não está definido nesses casos Essas variáveis em conjunto explicam cerca de 2993 da variação dos salários dos CEOs ou seja não explicam a maior parte iii Adicionar a variável c eot en ao modelo m6 lmlsalary lsales lmktval profits ceoten summarym6 Call lmformula lsalary lsales lmktval profits ceoten Residuals Min 1Q Median 3Q Max 248792 029369 000827 029951 185524 Coefficients Estimate Std Error t value Prt Intercept 4558e00 3803e01 11986 2e16 lsales 1622e01 3948e02 4109 614e05 lmktval 1018e01 6303e02 1614 01083 profits 2905e05 1503e04 0193 08470 ceoten 1168e02 5342e03 2187 00301 Signif codes 0 0001 001 005 01 1 Residual standard error 05062 on 172 degrees of freedom Multiple Rsquared 03183 Adjusted Rsquared 03024 Fstatistic 2008 on 4 and 172 DF pvalue 1387e13 Para cada ano adicional do CEO na empresa estimasse um aumento de aproximadamente 116 iv Correlação entra as variaveis l mk t v al e pr of i t s cormktval profits 1 0918128 A correlação entre as variáveis é positiva e forte quando duas variáveis independentes têm uma correlação de 092 a multicolinearidade provavelmente estará presente dificultando a interpretação dos coeficientes e aumentando os erros padrão C4 i Encontrar os valores mínimo máximo e médio das variáveis dataattend attachattend The following object is masked by GlobalEnv attend The following object is masked from packagewooldridge attend summaryatndrte Min 1st Qu Median Mean 3rd Qu Max 625 7500 8750 8171 9375 10000 summarypriGPA Min 1st Qu Median Mean 3rd Qu Max 0857 2190 2560 2587 2942 3930 summaryACT Min 1st Qu Median Mean 3rd Qu Max 1300 2000 2200 2251 2500 3200 ii Estimar o modelo m7 lmatndrte priGPA ACT summarym7 Call lmformula atndrte priGPA ACT Residuals Min 1Q Median 3Q Max 65373 6765 2125 9635 29615 Coefficients Estimate Std Error t value Prt Intercept 75700 3884 1949 2e16 priGPA 17261 1083 1594 2e16 ACT 1717 0169 1016 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1438 on 677 degrees of freedom Multiple Rsquared 02906 Adjusted Rsquared 02885 Fstatistic 1387 on 2 and 677 DF pvalue 22e16 at nd r t ei75701726 pr i G P Ai172 ACT iϵ i De acordo com o intercepto estamasse que se o GPA cumulativo e a prontuação ACT forem zero isso implica que as aulas assistindas serão em torno de 76 Interpretação dos valores estimados Para cada aumento em uma unidade no GPA cumulativo estimasse um aumento de aproximadamente 1 aulas assistidas enquanto para cada aumento em uma unidade a nota do ACT diminui em aproximadamente duas aulas assistidas Valore previsto valores2 dataframepriGPA 365 ACT 20 pred2 predictm7 newdata valores2 pred2 1 1043705 real2 subsetattend priGPA 365 ACT 20 if nrowreal2 0 printExistem observações com priGPA 365 e ACT 20 printresultado else printNão existem observações com priGPA 365 e ACT 20 1 Não existem observações com priGPA 365 e ACT 20 Estimasse que para uma pessoa que possuí uma GPA cumulativo de 366 e uma pontuação ACT de 20 tenhas assistindo em torno de 104 aulas porém não há nenhuma observação com esses dados na amostra v Diferença na taxa de frequência estA dataframepriGPA 31 ACT 21 predA predictm7 newdata estA estB dataframepriGPA 21 ACT 26 predB predictm7 newdata estB predA predB 1 2584336 C6 i Primeiro modelo Q Iiβ0γ1e duciϵ i datawage2 attachwage2 The following object is masked from ceosal2 age m8 lmIQ educ summarym8 Call lmformula IQ educ Residuals Min 1Q Median 3Q Max 50228 7262 0907 8772 37373 Coefficients Estimate Std Error t value Prt Intercept 536872 26229 2047 2e16 educ 35338 01922 1839 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 129 on 933 degrees of freedom Multiple Rsquared 02659 Adjusted Rsquared 02652 Fstatistic 338 on 1 and 933 DF pvalue 22e16 ii Segundo modelo l o g wa ge β0β1e duciϵ i m9 lmlwage educ summarym9 Call lmformula lwage educ Residuals Min 1Q Median 3Q Max 194620 024832 003507 027440 128106 Coefficients Estimate Std Error t value Prt Intercept 5973063 0081374 7340 2e16 educ 0059839 0005963 1004 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 04003 on 933 degrees of freedom Multiple Rsquared 009742 Adjusted Rsquared 009645 Fstatistic 1007 on 1 and 933 DF pvalue 22e16 iii Terceiro Modelo l o g wa ge β0β1e ducβ2Q I m10 lmlwage educ IQ summarym10 Call lmformula lwage educ IQ Residuals Min 1Q Median 3Q Max 201601 024367 003359 027960 123783 Coefficients Estimate Std Error t value Prt Intercept 56582877 00962408 58793 2e16 educ 00391199 00068382 5721 143e08 IQ 00058631 00009979 5875 587e09 Signif codes 0 0001 001 005 01 1 Residual standard error 03933 on 932 degrees of freedom Multiple Rsquared 01297 Adjusted Rsquared 01278 Fstatistic 6942 on 2 and 932 DF pvalue 22e16 iv Verificando se β1β1β2γ1 coefm8 coefm8 coefm9 coefm9 coefm10 coefm10 gamma coefm8educ betam9 coefm9educ beta1 coefm10educ beta2 coefm10IQ condicao betam9 beta1 beta2 gamma if condicao printA condição é satisfeita o estimador do modelo 9 é igual à soma e multiplicação dos estimadores dos outros modelos else printA condição NÃO é satisfeita 1 A condição é satisfeita o estimador do modelo 9 é igual à soma e multiplicação dos estimadores dos outros modelos C7 i Estimando o modelo datameap93 attachmeap93 The following objects are masked from ceosal2 lsalary salary The following object is masked from packagewooldridge benefits m11 lmmath10 lexpend lnchprg summarym11 Call lmformula math10 lexpend lnchprg Residuals Min 1Q Median 3Q Max 24294 6172 1293 4855 43203 Coefficients Estimate Std Error t value Prt Intercept 2036075 2507288 0812 04172 lexpend 622969 297263 2096 00367 lnchprg 030459 003536 8614 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 9526 on 405 degrees of freedom Multiple Rsquared 01799 Adjusted Rsquared 01759 Fstatistic 4443 on 2 and 405 DF pvalue 22e16 Os sinais dos coeficientes no modelo de regressão fazem sentido O coeficiente positivo de l o g e x pe nd indica que maiores despesas por aluno estão associadas a melhores resultados em matemática o que é esperado já que mais recursos geralmente proporcionam melhores condições de aprendizado Por outro lado o coeficiente negativo de l nch pr g sugere que um maior percentual de alunos no programa de almoço gratuito está relacionado a um desempenho pior o que pode refletir desvantagens socioeconômicas que afetam negativamente o aprendizado Assim ambos os sinais estão alinhados com interpretações plausíveis no contexto educacional ii Interpretação do intercepto O intercepto de 2036 indica que sob a condição teórica de que as despesas por aluno l o g e x pe nd e o percentual de alunos no programa de almoço gratuito l nch pr g sejam ambos zero o modelo prevê um percentual de alunos em nível satisfatório em matemática de aproximadamente 2036 Essa interpretação não faz sentido prático já que porcentagens não podem ser negativas Embora matematicamente possível definir ambas as variáveis explicativas como zero pode não ser realista no contexto educacional Por exemplo ter despesas por aluno iguais a zero ou um percentual de alunos no programa de almoço gratuito também igual a zero é improvável e pode não refletir a realidade de qualquer sistema educacional Portanto embora o intercepto possa ser calculado sua interpretação prática é limitada e muitas vezes não é útil iii Comparando o modelo um um modelo de regressão simples m12 lmmath10 lexpend summarym12 Call lmformula math10 lexpend Residuals Min 1Q Median 3Q Max 22343 7100 0914 6148 39093 Coefficients Estimate Std Error t value Prt Intercept 69341 26530 2614 0009290 lexpend 11164 3169 3523 0000475 Signif codes 0 0001 001 005 01 1 Residual standard error 1035 on 406 degrees of freedom Multiple Rsquared 002966 Adjusted Rsquared 002727 Fstatistic 1241 on 1 and 406 DF pvalue 00004752 O efeito dos gastos l o g e x pe nd no segundo modelo 1116 é maior do que no primeiro modelo 623 Essa diferença sugere que ao considerar apenas as despesas por aluno o impacto no desempenho em matemática é mais significativo A inclusão da variável l nch pr g no primeiro modelo parece ter diluído o efeito da despesa por aluno possivelmente devido à correlação entre as variáveis ou ao fato de que o percentual de alunos no programa de almoço gratuito pode estar capturando parte do efeito que de outra forma seria atribuído a l o g e x pe nd iv Correlação corlexpend lnchprg 1 01927042 Faz sentido e pode refletir uma relação lógica em que um aumento nas despesas está associado a uma diminuição na dependência de programas de assistência alimentar v Use o item iv para explicar suas descobertas do item iii A correlação negativa pode sugerir que os alunos com maior acesso a recursos refletido em l o g e x pe nd tendem a depender menos de programas como o l nch pr g Portanto quando analisados juntos essas variáveis podem capturar dinâmicas sociais e econômicas que influenciam o desempenho escolar A análise conjunta das variáveis ajuda a entender como diferentes fatores interagem e afetam o desempenho dos alunos em matemática destacando a complexidade das relações educacionais C8 i Medidas das variáveis datadiscrim attachdiscrim meanprpblck narm TRUE 1 01134864 meanincome narm TRUE 1 4705378 sdprpblck narm TRUE 1 01824165 sdincome narm TRUE 1 1317929 a variável pr pbl c k é medida em proporção enquanto i nco me em mulhares de doláres ii Modelo de regressão m13 lmpsoda prpblck income summarym13 Call lmformula psoda prpblck income Residuals Min 1Q Median 3Q Max 029401 005242 000333 004231 044322 Coefficients Estimate Std Error t value Prt Intercept 9563e01 1899e02 50354 2e16 prpblck 1150e01 2600e02 4423 126e05 income 1603e06 3618e07 4430 122e05 Signif codes 0 0001 001 005 01 1 Residual standard error 008611 on 398 degrees of freedom 9 observations deleted due to missingness Multiple Rsquared 006422 Adjusted Rsquared 005952 Fstatistic 1366 on 2 and 398 DF pvalue 1835e06 ps od ai0 96012 pr p blc ki0000002inc om eiui R2 00642 n 401 O coeficiente da variável prpblck no modelo de regressão é 012 indicando que um aumento de 1 unidade na proporção de negros está associado a um aumento de aproximadamente 115 no consumo de refrigerante ps od a mantendo a renda constante Este efeito é estatisticamente significativo com um pvalor proximo de 0 Comparado ao coeficiente da variável income que é 0000002 o impacto de pr pbl c k é consideravelmente maior sugerindo que a proporção de negros tem uma influência mais significativa no consumo de refrigerante Portanto o coeficiente de pr pbl c k não apenas é estatisticamente relevante mas também pode ser considerado economicamente significativo dependendo do contexto do estudo iii Comparando o resultado com um MRLS m14 lmpsoda prpblck summarym14 Call lmformula psoda prpblck Residuals Min 1Q Median 3Q Max 030884 005963 001135 003206 044840 Coefficients Estimate Std Error t value Prt Intercept 103740 000519 19987 2e16 prpblck 006493 002396 271 000702 Signif codes 0 0001 001 005 01 1 Residual standard error 00881 on 399 degrees of freedom 9 observations deleted due to missingness Multiple Rsquared 001808 Adjusted Rsquared 001561 Fstatistic 7345 on 1 and 399 DF pvalue 0007015 Ao comparar os resultados dos modelos de regressão linear múltipla MRLM e linear simples MRLS para a variável psoda observase que a inclusão da variável income no MRLM intensifica o efeito da proporção de negros pr pbl c k sobre o consumo de refrigerante No MRLS o coeficiente de prpblck é 006 indicando um aumento de aproximadamente 649 no consumo com um aumento de 1 unidade na proporção de negros No MRLM esse coeficiente sobe para 012 refletindo um aumento de 115 no consumo sugerindo que a renda contribui significativamente para explicar essa relação Portanto o MRLM revela um impacto mais forte e significativo de pr pbl c k sobre ps od a demonstrando a importância de considerar múltiplas variáveis na análise iv Elasticidade Constante m15 lmlpsoda prpblck lincome summarym15 Call lmformula lpsoda prpblck lincome Residuals Min 1Q Median 3Q Max 033563 004695 000658 004334 035413 Coefficients Estimate Std Error t value Prt Intercept 079377 017943 4424 125e05 prpblck 012158 002575 4722 324e06 lincome 007651 001660 4610 543e06 Signif codes 0 0001 001 005 01 1 Residual standard error 00821 on 398 degrees of freedom 9 observations deleted due to missingness Multiple Rsquared 006809 Adjusted Rsquared 006341 Fstatistic 1454 on 2 and 398 DF pvalue 8039e07 Um aumento de 20 na proporção de negors causaria um aumento de e 10 1215802e 1 024316279 um aumento de 20 da proporção causará um aumento de 279 no consumo de refrigerante v adicionando a variável pr p po v m16 lmlpsoda prpblck lincome prppov summarym16 Call lmformula lpsoda prpblck lincome prppov Residuals Min 1Q Median 3Q Max 032218 004648 000651 004272 035622 Coefficients Estimate Std Error t value Prt Intercept 146333 029371 4982 94e07 prpblck 007281 003068 2373 00181 lincome 013696 002676 5119 48e07 prppov 038036 013279 2864 00044 Signif codes 0 0001 001 005 01 1 Residual standard error 008137 on 397 degrees of freedom 9 observations deleted due to missingness Multiple Rsquared 008696 Adjusted Rsquared 008006 Fstatistic 126 on 3 and 397 DF pvalue 6917e08 Com a inclusão da variável prppov no modelo o coeficiente de prpblck aumentou de 0073 para 0122 indicando que a relação entre a proporção de negros e o consumo de refrigerante se fortaleceu Isso sugere que pr p po v está capturando fatores adicionais que influenciam o consumo resultando em uma relação mais pronunciada entre pr pbl c k e l p so da vi Correlação entre as variáveis corlincome prppov use completeobs 1 0838467 A correlação de 0838 entre l o g inc om e e pr p po v indica uma relação negativa forte o que sugere que à medida que a renda aumenta a proporção de pessoas vivendo na pobreza tende a diminuir Esse resultado é esperado pois em geral uma maior renda está associada a melhores condições socioeconômicas o que pode levar a uma redução na pobreza Portanto essa correlação está alinhada com as expectativas teóricas sobre a relação entre renda e pobreza vii Avaliando a afirmação A afirmação de que variáveis altamente correlacionadas não deveriam estar na mesma regressão é correta pois pode levar à multicolinearidade que afeta a precisão das estimativas dos coeficientes e dificulta a interpretação dos efeitos individuais No entanto a inclusão dessas variáveis pode ser justificada dependendo do contexto do estudo e dos objetivos da análise Em situações de multicolinearidade é possível usar técnicas como análise de componentes principais ou selecionar variáveis com base em critérios teóricos C9 i Estimando o Modelo de Regressão datacharity attachcharity m16 lmgift mailsyear giftlast propresp summarym16 Call lmformula gift mailsyear giftlast propresp Residuals Min 1Q Median 3Q Max 52893 7050 3650 1397 241206 Coefficients Estimate Std Error t value Prt Intercept 4551518 0803034 5668 154e08 mailsyear 2166259 0331927 6526 753e11 giftlast 0005927 0001432 4138 358e05 propresp 15358605 0874539 17562 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1443 on 4264 degrees of freedom Multiple Rsquared 008336 Adjusted Rsquared 008271 Fstatistic 1293 on 3 and 4264 DF pvalue 22e16 m17 lmgift mailsyear summarym17 Call lmformula gift mailsyear Residuals Min 1Q Median 3Q Max 11287 7976 5976 2687 245999 Coefficients Estimate Std Error t value Prt Intercept 20141 07395 2724 000648 mailsyear 26495 03431 7723 14e14 Signif codes 0 0001 001 005 01 1 Residual standard error 1496 on 4266 degrees of freedom Multiple Rsquared 001379 Adjusted Rsquared 001356 Fstatistic 5965 on 1 and 4266 DF pvalue 1404e14 Ao comparar os valores de R 2 dos dois modelos observamos que o modelo MRLM apresenta um R 2 de 00834 enquanto o MRLS tem um R 2 de 00138 Isso indica que o MRLM que inclui as variáveis m ail s ye ar gi f t l ast e pr o pr es p explica uma maior proporção da variação da variável dependente gift em comparação com o MRLS que considera apenas a variável m ail s ye ar como variável independente A inclusão das variáveis adicionais no MRLM resulta em um ajuste mais robusto e uma explicação mais eficaz dos dados ii Interpretação do coeficiente β1 No MRLM o coeficiente de m ail s ye ar é de aproximadamente 2166 enquanto no MRLS o coeficiente de m ail s ye ar é de aproximadamente 265 Isso indica que no MRLM para cada aumento de uma unidade em m ail s ye ar a variável gi f t aumenta em cerca de 2166 enquanto no MRLS essa mesma mudança resulta em um aumento de 265 Portanto o coeficiente de m ail s ye ar no MRLS é maior do que no MRLM Essa diferença sugere que ao considerar apenas m ail s ye ar o efeito desta variável sobre gi f t é mais pronunciado enquanto sua inclusão em um modelo mais complexo reduz seu impacto iii Interpretação do coeficiente β3 No MRLM o coeficiente de pr o pr es p é de aproximadamente 15359 Isso significa que ao aumentar a variável propresp em uma unidade esperase que a variável gi f t aumente em cerca de 15359 unidades mantendo as outras variáveis constantes ou seja m ail s ye ar e gi f t l ast Esse coeficiente sugere um impacto substancial de pr o pr es p sobre gi f t indicando que quanto maior a proporção de respostas maior é o valor do presente Em termos práticos isso pode indicar que um aumento na proporção de respostas está fortemente associado a um aumento significativo nas doações ou presentes recebidos iv Adicionando a variável a v g gi f t m18 lmgift mailsyear giftlast propresp avggift summarym18 Call lmformula gift mailsyear giftlast propresp avggift Residuals Min 1Q Median 3Q Max 197016 5883 2065 3031 221256 Coefficients Estimate Std Error t value Prt Intercept 732776 075822 9664 2e16 mailsyear 120117 031242 3845 0000122 giftlast 026086 001076 24251 2e16 propresp 1620464 081753 19821 2e16 avggift 052695 002108 24996 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1347 on 4263 degrees of freedom Multiple Rsquared 02005 Adjusted Rsquared 01998 Fstatistic 2673 on 4 and 4263 DF pvalue 22e16 O coeficiente de m ail s ye ar diminui para aproximadamente 1201 em comparação ao modelo anterior onde era cerca de 2166 Isso indica que com a adição de a v g gi f t o impacto do número de cartas enviadas por ano sobre o valor do presente recebido diminuiu sugerindo que parte do efeito anterior de m ail s ye ar estava sendo capturado por gi f t l ast e a v g gi f t v O que acontece com o coeficiente de gi f t l ast O coeficiente de gi f t l ast agora é de aproximadamente 0261 que é uma mudança significativa em relação ao modelo anterior O sinal negativo indica que um aumento em gi f t l ast está associado a uma diminuição no valor do presente recebido o que pode sugerir que quanto mais presente foi dado anteriormente menor é o valor esperado de presentes futuros talvez devido à saturação ou expectativa do doador C10 i datahtv attachhtv The following objects are masked from wage2 educ exper lwage sibs south urban wage The following objects are masked from bwght fatheduc motheduc vareduc narm TRUE 1 5542945 totalhomens nrowhtv homensensinomedio sumeduc 12 narm TRUE porcentagemhomensensinomedio homensensinomedio totalhomens 100 porcentagemhomensensinomedio 1 4162602 meaneduc 1 130374 meanfatheduc 1 1244715 A variação de e duc é de aproximadamente 554 4163 dos homens da amostra tem o ensino médio concluido e os homens tem uma média de nível educacional maior que dos seus pais ii Modelo estimado m19 lmeduc motheduc fatheduc summarym19 Call lmformula educ motheduc fatheduc Residuals Min 1Q Median 3Q Max 62898 09400 04037 11239 81672 Coefficients Estimate Std Error t value Prt Intercept 696435 031982 21776 2e16 motheduc 030420 003193 9528 2e16 fatheduc 019029 002228 8539 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 2042 on 1227 degrees of freedom Multiple Rsquared 02493 Adjusted Rsquared 0248 Fstatistic 2037 on 2 and 1227 DF pvalue 22e16 Cerca de 2493 da variação de e duc pode ser explicada pela a variação dos pais para cada aumento em uma unidade de medida o nível de educação da mãe estimasse um aumento de 030 no nível de edcuação do homem iii Adicionando a variável de habilidade no modelo m20 lmeduc motheduc fatheduc abil summarym20 Call lmformula educ motheduc fatheduc abil Residuals Min 1Q Median 3Q Max 5407 1195 0199 1076 7012 Coefficients Estimate Std Error t value Prt Intercept 844869 028954 29180 2e16 motheduc 018913 002851 6635 487e11 fatheduc 011109 001988 5586 285e08 abil 050248 002572 19538 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1784 on 1226 degrees of freedom Multiple Rsquared 04275 Adjusted Rsquared 04261 Fstatistic 3052 on 3 and 1226 DF pvalue 22e16 e duci845020mot hed uci011 f at he duci050abiliui De acordo com o teste T a vriável abi l é estatisticamente significativa ou seja as suas variações são capazes de explicar as variações da variável dependente e duc iv Forma quadrática abil2 abil2 m21 lmeduc motheduc fatheduc abil abil2 summarym21 Call lmformula educ motheduc fatheduc abil abil2 Residuals Min 1Q Median 3Q Max 52506 11274 01355 10223 70482 Coefficients Estimate Std Error t value Prt Intercept 8240226 0287410 28671 2e16 motheduc 0190126 0028096 6767 203e11 fatheduc 0108939 0019601 5558 335e08 abil 0401462 0030288 13255 2e16 abil2 0050599 0008304 6093 148e09 Signif codes 0 0001 001 005 01 1 Residual standard error 1758 on 1225 degrees of freedom Multiple Rsquared 04444 Adjusted Rsquared 04425 Fstatistic 2449 on 4 and 1225 DF pvalue 22e16 coeficientes coefm21 beta3 coeficientesabil beta4 coeficientesabil2 abilmin beta32beta4 abilmin abil 3967098 A quantidade de abi l em que e duc é minimizado é de 397 v Valores de abi l menores que em iv prop sumabil abilmintotalhomens100 prop 1 8414634 Cerca de 122 dos homens observados na amostra tem a ahbilidade menor que o valor que minimiza e duc vi Gráfico educpred predictm21 ploteducpred abil C11 i MRLS datameapsingle attachmeapsingle The following objects are masked from meap93 enroll lenroll The following object is masked from wage2 married m22 lmmath4 pctsgle summarym22 Call lmformula math4 pctsgle Residuals Min 1Q Median 3Q Max 47791 8310 1600 8092 50317 Coefficients Estimate Std Error t value Prt Intercept 9677043 159680 6060 2e16 pctsgle 083288 007068 1178 2e16 Signif codes 0 0001 001 005 01 1 Residual standard error 1248 on 227 degrees of freedom Multiple Rsquared 03795 Adjusted Rsquared 03768 Fstatistic 1389 on 1 and 227 DF pvalue 22e16 O coeficiente de inclinação do modelo para a variável pct s gl e é 083 indicando que para cada aumento de 1 na porcentagem de estudantes em famílias monoparentais a nota média em matemática m at h4 tende a diminuir em aproximadamente 083 pontos Esse efeito é estatisticamente significativo com um pvalor de p muito menor que 0001 Embora a redução de 083 pontos possa parecer pequena em uma escala de 0 a 100 ela pode ter um impacto perceptível especialmente se a média das notas estiver em torno de 50 a 70 Portanto essa relação negativa sugere que a monoparentalidade pode influenciar de forma relevante o desempenho em matemática ii Adicionando mais variáveis independentes no modelo m23 lmmath4 pctsgle lmedinc free summarym23 Call lmformula math4 pctsgle lmedinc free Residuals Min 1Q Median 3Q Max 34919 7195 0931 7313 50152 Coefficients Estimate Std Error t value Prt Intercept 5172322 5847814 0884 0377 pctsgle 019965 015872 1258 0210 lmedinc 356013 504170 0706 0481 free 039642 007035 5635 52e08 Signif codes 0 0001 001 005 01 1 Residual standard error 117 on 225 degrees of freedom Multiple Rsquared 04598 Adjusted Rsquared 04526 Fstatistic 6385 on 3 and 225 DF pvalue 22e16 Ao adicionar as variáveis l me di nc renda média e f r e e programas gratuitos o coeficiente de pct s gl e percentagem de famílias monoparentais cai para 020 indicando que cada aumento de 1 na monoparentalidade resulta em uma diminuição de aproximadamente 020 pontos na nota em matemática mas essa relação não é significativa pvalor 0210 A inclusão dessas variáveis sugere que o efeito da monoparentalidade no desempenho em matemática é reduzido quando se considera renda média e acesso a programas gratuitos iii Correlação entre as variáves corlmedinc free 1 07469703 A correlação indica uma correlação negativa forte Isso sugere que à medida que a renda média aumenta o acesso a programas gratuitos tende a diminuir o que é um resultado esperado já que famílias com maior renda geralmente têm menos necessidade de assistência gratuita iv Analisando a correlação Sim a correlação negativa forte de 075 entre as variáveis l me di nc e f r e e indica que pode haver multicolinearidade no modelo de regressão linear múltipla Quando duas variáveis independentes estão altamente correlacionadas isso pode afetar a precisão das estimativas dos coeficientes e a interpretação dos resultados Portanto é aconselhável considerar a remoção de uma das variáveis para melhorar a robustez do modelo e evitar problemas de multicolinearidade v FIVs librarycar Carregando pacotes exigidos carData vifm23 pctsgle lmedinc free 5740981 4118812 3188079 No modelo a variável pct s gl e apresenta o maior Valor de Inflação da Variância VIF de 574 indicando uma preocupação potencial com multicolinearidade Geralmente um VIF acima de 5 sugere que a variável está altamente correlacionada com outras variáveis independentes no modelo o que pode distorcer as estimativas dos coeficientes e comprometer a interpretabilidade do modelo C12 i dataeconmath attacheconmath The following object is masked from wage2 age The following object is masked from ceosal2 age The following object is masked from bwght male sumscore 100 1 0 meanmathscr 1 7875 meanactmth narm TRUE 1 232113 sdactmth narm TRUE 1 3773354 meanacteng narm TRUE 1 2259459 sdacteng narm TRUE 1 3788735 Nenhum aluno obteve a nota perfeita sc or e 100 A média das notas de matemática foi de 788 Ao considerar as notas do ACT observouse que as médias em matemática foram superiores às de inglês embora a variação das notas em inglês tenha sido maior ii MRLM m24 lmscore colgpa actmth acteng summarym24 Call lmformula score colgpa actmth acteng Residuals Min 1Q Median 3Q Max 39855 6215 0444 6812 32670 Coefficients Estimate Std Error t value Prt Intercept 1617402 280044 5776 109e08 colgpa 1236620 071506 17294 2e16 actmth 088335 011220 7873 111e14 acteng 005176 011106 0466 0641 Signif codes 0 0001 001 005 01 1 Residual standard error 1035 on 810 degrees of freedom 42 observations deleted due to missingness Multiple Rsquared 03972 Adjusted Rsquared 0395 Fstatistic 1779 on 3 and 810 DF pvalue 22e16 iii Com base no modelo de regressão as notas em matemática ac t m t h e o GPA do colégio c ol g pa são preditores significativos do desempenho acadêmico score no curso de Economia com coeficientes positivos que indicam uma relação direta A nota em inglês ac t e ng por outro lado não mostrou um efeito significativo pvalor 0641 Portanto as notas em matemática e o GPA são as melhores variáveis preditivas para o desempenho no curso enquanto a nota em inglês não contribui de forma relevante para a previsão iv Coeficiente de determinação O R 2 do modelo foi de 03972 o que indica que aproximadamente 3972 da variação nas notas sc or e dos alunos é explicada pelas variáveis independentes c ol g pa ac t m t h e ac t e ng Isso sugere que o modelo tem uma capacidade moderada de explicar o desempenho acadêmico dos alunos no curso de Economia mas também indica que há outros fatores que influenciam as notas e não estão incluídos no modelo