33
Estatística Econômica e Introdução à Econometria
UERJ
41
Estatística Econômica e Introdução à Econometria
UERJ
10
Estatística Econômica e Introdução à Econometria
UERJ
24
Estatística Econômica e Introdução à Econometria
UERJ
36
Estatística Econômica e Introdução à Econometria
UERJ
48
Estatística Econômica e Introdução à Econometria
UERJ
17
Estatística Econômica e Introdução à Econometria
UERJ
2
Estatística Econômica e Introdução à Econometria
UNG
1
Estatística Econômica e Introdução à Econometria
UNESP
1
Estatística Econômica e Introdução à Econometria
ESTACIO
Texto de pré-visualização
1239 Obs y x 1 0 1 2 2 0 3 1 1 4 3 1 5 0 0 6 0 1 3 de 3 a Compute calcule os coeficientes da equação yᵢ β₀ β₁xᵢ uᵢ usando os estimadores de MQO obtidos na questão anterior Dica Calcule médias de y e x y e x respectivamente e expanda a tabela acima incluindo desvios de cada variável em relação a sua respectiva média ou seja y y e x x o produto cruzado desses desvios e o quadrado dos desvios de x em relação à sua média b Supondo que os erros sejam homoscedásticos ou seja vale a hipótese HS5 obtenha calcule as estimativas das variâncias condicionais dos estimadores de MQO para β₀ e β₁ Observação Note que você terá que estimar a variância do termo de erro da regressão para obter as variâncias dos estimadores c Obtenha e interprete o R² da regressão UERJ Gilberto Boaretto 2 Causalidade Econometria e Dados 20252 Questão 4 25 da nota Um pesquisador interessado em estudar a escolha entre o tempo gasto dormindo e trabalhando e também o efeito de outros fatores sobre o sono estima a seguinte regressão dormir 363825 0148 trab 1113 educ 220 idade n 706 R² 0113 11228 0017 588 145 em que d o r m i r e t r a b são mensurados em minutos por semana e d u c e i d a d e em anos e os desviospadrão das variáveis são apresentados em parênteses a As variáveis e d u c e i d a d e são individualmente significantes ao nível de 5 de significância contra uma hipótese bilateral Faça os testes t enfatizando hipóteses nula e alternativa estatística do teste valor crítico e conclusão b Devido ao teste efetuado em a o pesquisador resolve estimar o modelo sem as variáveis e d u c e i d a d e dormir 358638 0151 trab n 706 R² 0103 13891 0017 É possível afirmar que as variáveis e d u c e i d a d e são conjuntamente significantes na equação original ao nível de 5 Faça o teste F e justifique sua resposta c Incluir e d u c e i d a d e afeta a relação estimada entre dormir e trabalhar Justifique UERJ Gilberto Boaretto 3 1239 Questão 1 25 da nota Um pesquisador usando dados de 100 classes de quarto ano de tamanho da classe TC e nota média dos alunos NM estimou a seguinte regressão usando o método de mínimos quadrados ordinários NM 5204 582 TC R² 008 a Uma sala de aula tem 22 alunos Qual é a nota média prevista para esta sala de aula b No ano passado uma classe tinha 19 alunos e este ano passou a ter 23 alunos Qual é a mudança prevista na nota média desses alunos c Para esta amostra de 100 classes o tamanho médio das salas é de 214 alunos Qual é a média amostral das notas dos alunos d Interprete o coeficiente de determinação Qual é a sua importância nesta regressão 1 Causalidade Econometria e Dados 20252 Questão 2 25 da nota Considere o modelo de regressão linear simples descrito a seguir yᵢ β₀ β₁ xᵢ uᵢ i 1n em que yᵢ é a variável explicada xᵢ é uma variável explicativa uᵢ é o termo de erro do modelo n é o tamanho da amostra e β₀ e β₁ são parâmetros a Derive o estimador de MQO para β₀ Indiqueo com β₀ Deixeo em função de β₁ o estimador de MQO para β₁ que você derivará no item a seguir b Derive o estimador de MQO para β₁ Indiqueo com β₁ c Liste as quatro hipóteses necessárias para ausência de viés dos estimadores de MQO para β₀ e β₁ Indique cada hipótese por HS1 HS2 HS3 e HS4 Quando for o caso apresente uma expressão matemática que represente a hipótese Questão 3 25 da nota A tabela a seguir apresenta observações das variáveis y e x Responda aos itens a seguir Obs y x 1 0 1 2 2 0 3 1 1 4 3 1 5 0 0 6 0 1 a Compute calcule os coeficientes da equação yᵢ β₀ β₁xᵢ uᵢ usando os estimadores de MQO obtidos na questão anterior Dica Calcule médias de y e x y e x respectivamente e expanda a tabela acima incluindo desvios de cada variável em relação a sua respectiva média ou seja y y e x x o produto cruzado desses desvios e o quadrado dos desvios de x em relação à sua média b Supondo que os erros sejam homoscedásticos ou seja vale a hipótese HS5 obtenha calcule as estimativas das variâncias condicionais dos estimadores de MQO para β₀ e β₁ Observação Note que você terá que estimar a variância do termo de erro da regressão para obter as variâncias dos estimadores c Obtenha e interprete o R² da regressão UERJ Gilberto Boaretto 2 Causalidade Econometria e Dados 20252 Questão 4 25 da nota Um pesquisador interessado em estudar a escolha entre o tempo gasto dormindo e trabalhando e também o efeito de outros fatores sobre o sono estima a seguinte regressão dormir 363825 0148 trab 1113 educ 220 idade n 706 R² 0113 11228 0017 588 145 em que d o r m i r e t r a b são mensurados em minutos por semana e d u c e i d a d e em anos e os desviospadrão das variáveis são apresentados em parênteses a As variáveis e d u c e i d a d e são individualmente significantes ao nível de 5 de significância contra uma hipótese bilateral Faça os testes t enfatizando hipóteses nula e alternativa estatística do teste valor crítico e conclusão b Devido ao teste efetuado em a o pesquisador resolve estimar o modelo sem as variáveis e d u c e i d a d e dormir 358638 0151 trab n 706 R² 0103 13891 0017 É possível afirmar que as variáveis e d u c e i d a d e são conjuntamente significantes na equação original ao nível de 5 Faça o teste F e justifique sua resposta c Incluir e d u c e i d a d e afeta a relação estimada entre dormir e trabalhar Justifique UERJ Gilberto Boaretto 3 QUESTÃO 1 item a A previsão é feita pelo modelo de regressão linear simples em que a variável resposta prevista é dada por NM β₀ β₁ TC Como o pesquisador estimou NM 5204 582 TC basta substituir TC 22 NM22 5204 582 22 Calculando o termo linear 582 22 12804 Substituindo NM22 520400 128040 392360 Portanto para uma sala com 22 alunos a nota média prevista é NM 392360 item b Para comparar anos com tamanhos de turma diferentes utilizase a própria função de regressão pois ela fornece a previsão condicional de NM dado TC Calculase a nota prevista para cada tamanho e em seguida a variação Primeiro para TC 19 NM19 5204 582 19 409820 Depois para TC 23 NM23 5204 582 23 386540 A mudança prevista na nota média quando a turma passa de 19 para 23 alunos é a diferença ΔNM NM23 NM19 386540 409820 23280 item b Partese da função objetivo de MQO sβ0β1 i1n yi β0 β1 ρi2 cujas condições de primeira ordem impõem derivadas parciais nulas Já se obteve no item anterior β0 y β1 x Resta derivar em relação a β1 sβ1 2 i1n xi yi β0 β1 ρi0 Esta equação normal pode ser escrita como i1n ρi yi β0 i1n ρi β1 i1n ρi2 0 Substituindo β0 y β1 x e lembrando que i1n ρi n x i1n ρi yi y β1 x n x β1 i1n ρi20 Reagrupando os termos em β1 i1n ρi yi n x y β1 i1n ρi2 n x2 0 Isolando β1 β1 i1n ρi yi n x yi1n ρi2 n x2 Usando desvios em torno da média obtémse a forma centralizada que é a mais interpretável β1 i1n ρi xyi yi1n ρi x2 Sρ y Sρ ρ Covρ y Varρ Esta expressão mostra que o coeficiente angular mede a covariância entre x e y em unidades por variação de x escalonada pela variância de x Outra forma equivalente usando o coeficiente angular como variação marginal por aluno é Δ N M β1 Δ ρ c 582 23 19 23280 Concluise que a nota média prevista diminui em 23280 pontos quando a turma aumenta de 19 para 23 alunos item c Para regressão linear com intercepto estimada por mínimos quadrados a reta ajustada passa pelo ponto médio amostral isto é N M β0 β1 ρ c Logo usando N M 5204 582 7 c e ρ c 214 N M 5204 582 214 Calculando o produto 582 214 124548 e substituindo N M 5204 124548 395852 Portanto a média amostral das notas dos alunos é N M 395852 item d Em regressão linear o coeficiente de determinação é definido por R2 1 i1n yi ŷi2 i1n yi y2 i1n ŷi y2 i1n yi y2 medindo a fração da variabilidade total de NM em torno de N M que é explicada pela reta N M 5204 582 7 c Como R2 008 concluise que aproximadamente 8 da variação observada em NM é explicada linearmente por 7 c enquanto cerca de 92 permanece não explicada pelo modelo fica nos resíduos Em regressão simples vale ainda R2 r2 de modo que r 008 0283 e como o coeficiente angular é negativo r 0283 Isso indica associação linear fraca e negativa entre 7 c e NM Importância nesta regressão um R2 tão baixo implica baixo poder explicativo do tamanho da classe para prever a nota média previsões com grande dispersão residual e necessidade de outras variáveis ou de outra forma funcional para melhorar o ajuste Note que R2 não estabelece causalidade nem substitui a verificação de significância de β1 ou a análise de resíduos ele apenas quantifica a proporção de variação explicada pelo modelo ajustado item a Partese do modelo de regressão linear simples yi β0 β1 xi ui O estimador de MQO minimiza a soma dos quadrados dos resíduos sβ0 β1 i1n yi β0 β1 xi2 A condição de primeira ordem em β0 exige que a derivada parcial seja nula sβ0 2 i1n yi β0 β1 xi 0 Reorganizando i1n yi n β0 β1 i1n xi 0 Isolando β0 β0 1n i1n yi β1 1n i1n xi y β1 x Assim substituindo o estimador de MQO de β1 que será obtido no item seguinte obtêmse o estimador de MQO para o intercepto β0 y β1 x A expressão mostra que a reta ajustada passa pelo ponto médio amostral x y propriedade fundamental dos MQO com intercepto item c HS1 linearidade nos parâmetros O modelo é corretamente especificado e linear em β0 e β1 yi β0 β1xi ui i 1 n Garante que os MQO são lineares em yi e que o intercepto e a inclinação existem no modelo populacional HS2 amostragem aleatória A amostra xi yini1 é extraída aleatoriamente de uma mesma população de modo que as observações são independentes e identicamente distribuídas Isso permite que médias amostrais sejam estimativas não viciadas de médias populacionais HS3 variabilidade do regressor O regressor apresenta variação na amostra ni1 xi x2 0 equivalentemente Varxi 0 Evita colinearidade perfeita e garante que a inclinação esteja bem definida HS4 exogeneidade estrita ou média condicional nula O erro tem média zero condicionalmente a xi Eui xi 0 Implica que xi é não correlacionado com o erro e assegura que Eβ0 β0 e Eβ1 β1 Observação homocedasticidade e normalidade não são necessárias para ausência de viés elas afetam eficiência e inferência não a nãoviciação item d Considerese o modelo yi β0 β1xi ui e a soma dos quadrados Sβ0 β1 ni1 yi β0 β1xi2 As condições de primeira ordem do MQO geram as equações normais ni1 yi β0 β1xi 0 e ni1 xiyi β0 β1xi 0 Denotando ûi yi β0 β1xi têmse diretamente as propriedades fundamentais dos resíduos 1 Média dos resíduos nula ni1 ûi 0 ū 0 2 Ortogonalidade dos resíduos ao regressor ni1 xi ûi 0 Da primeira equação normal também resulta que a reta ajustada passa pelo ponto médio amostral De fato escrevendo ni1 yi nβ0 β1 ni1 xi 0 β0 ȳ β1 x concluise que ŷ β0 β1x satisfaz ŷx ȳ Essas identidades caracterizam a solução do MQO com intercepto QUESTÃO 3 item a Querse estimar os parâmetros do modelo yi β0 β1xi ui pelos MQO usando as observações yi xi6i1 01 20 11 31 00 01 Os estimadores de MQO obtidos na questão anterior são β1 ni1 xi xyi ȳ ni1 xi x2 e β0 ȳ β1 x Calculase as médias amostrais x 1 0 1 1 0 1 6 0 e ȳ 0 2 1 3 0 0 6 1 Com x 0 as somas centrais ficam Sxx 6i1 xi x2 6i1 xi2 12 02 12 12 02 12 4 Sxy 6i1 xi xyi ȳ 6i1 xiyi 1 11 01 10 12 01 11 4 Logo o coeficiente angular é β1 Sxy Sxx 4 4 1 O intercepto resulta de β0 ȳ β1 x 1 1 0 1 Portanto a equação estimada por MQO é ŷi β0 β1xi 1 1 xi item b Sob homocedasticidade com variância populacional do erro igual a σ2 e condição nos regressors X valem as variâncias condicionais dos estimadores de MQO Varβ1 X σ2 Sxx e Varβ0 X σ2 1n x2 Sxx onde Sxx ni1 xi x2 Como σ2 é desconhecida utilizase o estimador não viciado σ2 SQR n 2 com que SQR ni1 ûi2 e ûi yi ŷi são os resíduos da regressão A partir do item a temse ŷi 1 1 xi Logo para cada observação ŷ 0 1 2 2 1 0 û 0 1 1 1 1 0 Portanto SQR 6i1 ûi2 02 12 12 12 12 02 4 σ2 4 6 2 4 4 1 Das estatísticas amostrais já calculadas têmse x 0 e Sxx 6i1 xi x2 6i1 xi2 4 Substituindo nas fórmulas das variâncias condicionais Varβ1 X σ2 Sxx 14 14 0250 Varβ0 X σ2 1n x2 Sxx 1 16 02 4 16 0167 Assim as estimativas das variâncias condicionais são Varβ1 X 14 e Varβ0 X 16 item c Partese da definição do coeficiente de determinação para regressão linear simples R2 1 Σi1n yi ŷi2 Σi1n yi ȳ2 Σi1n ŷi ȳ2 Σi1n yi ȳ2 onde ȳ é a média amostral ŷi β0 β1 xi e n6 Da alínea a ŷi 1 xi Com os dados yi 0 2 1 3 0 0 ȳ 0 2 1 3 0 06 1 Calculamse as somas de quadrados Soma total de quadrados SQT Σi16 yi ȳ2 12 12 02 22 12 12 8 Soma dos quadrados dos resíduos SQR Σi16 yi ŷi2 Com ŷ 0 1 2 2 1 0 os resíduos são û 0 1 1 1 1 0 logo SQR 02 12 12 12 12 02 4 Coeficiente de determinação R2 1 SQR SQT 1 48 12 0500 Comentário útil em regressão simples vale R2 r2 onde r Σi xi xyi ȳ Σi xi x2 Σi yi ȳ2 4 48 1 2 se modo que r2 12 confirmando o resultado Interpretação aproximadamente 50 da variabilidade de y em torno de ȳ é explicada linearmente por x nesta amostra os outros 50 permanecem nos resíduos QUESTÃO 4 item a O objetivo é testar a significância individual de educ e idade no modelo dormin 363825 0148hrab 1113educ 220idade onde embaixo dos coeficientes estão os errospadrão SEhrab 0017 SEeduc 588 e SEidade 145 Com n706 e três regressores mais intercepto os graus de liberdade para os testes t são df n 4 702 Para cada coeficiente βj testase H0 βj 0 versus H1 βj 0 usando a estatística t βj 0 SEβj que sob H0 segue aproximadamente tdf Para educ teduc 1113 588 1892857 1893 Para idade tidade 220 145 1517241 1517 Valor crítico bicaudal a 5 com df702 é aproximadamente t0975702 1964 Como teduc 1893 1964 e tidade 1517 1964 não se rejeita H0 para nenhuma das duas variáveis ao nível de 5 Conclusão educ e idade não são individualmente significantes a 5 nesta regressão item b Pretendese testar a significância conjunta de educ e idade na regressão original Comparase o modelo completo e o modelo restrito sem educ e idade por meio do teste F para restrições lineares Hipóteses do teste com q2 restrições H0 βeduc 0 e βidade 0 versus H1 pelo menos uma das duas é diferente de zero Usase a forma do F via R2 de modelos aninhados F Rc2 Rr2 q 1 Rc2 n k 1 onde Rc2 0113 completo Rr2 0103 restrito n706 e k3 é o número de regressores no modelo completo sem contar o intercepto hrab educ idade Assim os graus de liberdade são df1 q 2 e df2 n k 1 702 Substituindo F 0113 01032 1 0113702 00102 0887702 0005 0001264 3957 Valor crítico bicaudal ao nível de 5 para F2702 região superior de 5 F2702095 3000 Como F3957 3000 rejeitase H0 a 5 Equivalentemente o valorp do teste é p 0020 005 Conclusão educ e idade são conjuntamente significantes na equação original ao nível de 5 item c Comparase o coeficiente de trab entre os dois modelos Modelo completo dormin 363825 0148 trab 1113 educ 220 idade SEβtrab 0017 Modelo restrito dormin 358638 0151 trab SEβtrab 0017 A variação no coeficiente de trab ao incluir educ e idade é βtrab 0148 0151 0003 isto é uma redução se magnitude se 0003 0151 0019875 1987 Verificase também que o efeito permanece altamente significativo em ambos os modelos No completo tcomp 0148 0017 8706 95 IC 0181 βtrab 0115 No restrito trest 0151 0017 8882 95 IC 0184 βtrab 0118 Os intervalos se sobrepõem fortemente Conclusão incluir educ e idade altera a relação estimada entre dormir e trabalhar apenas de forma muito pequena tornando o efeito de trab levemente menos negativo 0151 para 0148 cerca de 2 Isso sugere que havia um viés por omissão pequeno no modelo restrito como a mudança é para mais próximo de zero o viés era negativo Em termos substantivos a associação entre trab e dormir permanece praticamente a mesma e estatisticamente muito significativa
33
Estatística Econômica e Introdução à Econometria
UERJ
41
Estatística Econômica e Introdução à Econometria
UERJ
10
Estatística Econômica e Introdução à Econometria
UERJ
24
Estatística Econômica e Introdução à Econometria
UERJ
36
Estatística Econômica e Introdução à Econometria
UERJ
48
Estatística Econômica e Introdução à Econometria
UERJ
17
Estatística Econômica e Introdução à Econometria
UERJ
2
Estatística Econômica e Introdução à Econometria
UNG
1
Estatística Econômica e Introdução à Econometria
UNESP
1
Estatística Econômica e Introdução à Econometria
ESTACIO
Texto de pré-visualização
1239 Obs y x 1 0 1 2 2 0 3 1 1 4 3 1 5 0 0 6 0 1 3 de 3 a Compute calcule os coeficientes da equação yᵢ β₀ β₁xᵢ uᵢ usando os estimadores de MQO obtidos na questão anterior Dica Calcule médias de y e x y e x respectivamente e expanda a tabela acima incluindo desvios de cada variável em relação a sua respectiva média ou seja y y e x x o produto cruzado desses desvios e o quadrado dos desvios de x em relação à sua média b Supondo que os erros sejam homoscedásticos ou seja vale a hipótese HS5 obtenha calcule as estimativas das variâncias condicionais dos estimadores de MQO para β₀ e β₁ Observação Note que você terá que estimar a variância do termo de erro da regressão para obter as variâncias dos estimadores c Obtenha e interprete o R² da regressão UERJ Gilberto Boaretto 2 Causalidade Econometria e Dados 20252 Questão 4 25 da nota Um pesquisador interessado em estudar a escolha entre o tempo gasto dormindo e trabalhando e também o efeito de outros fatores sobre o sono estima a seguinte regressão dormir 363825 0148 trab 1113 educ 220 idade n 706 R² 0113 11228 0017 588 145 em que d o r m i r e t r a b são mensurados em minutos por semana e d u c e i d a d e em anos e os desviospadrão das variáveis são apresentados em parênteses a As variáveis e d u c e i d a d e são individualmente significantes ao nível de 5 de significância contra uma hipótese bilateral Faça os testes t enfatizando hipóteses nula e alternativa estatística do teste valor crítico e conclusão b Devido ao teste efetuado em a o pesquisador resolve estimar o modelo sem as variáveis e d u c e i d a d e dormir 358638 0151 trab n 706 R² 0103 13891 0017 É possível afirmar que as variáveis e d u c e i d a d e são conjuntamente significantes na equação original ao nível de 5 Faça o teste F e justifique sua resposta c Incluir e d u c e i d a d e afeta a relação estimada entre dormir e trabalhar Justifique UERJ Gilberto Boaretto 3 1239 Questão 1 25 da nota Um pesquisador usando dados de 100 classes de quarto ano de tamanho da classe TC e nota média dos alunos NM estimou a seguinte regressão usando o método de mínimos quadrados ordinários NM 5204 582 TC R² 008 a Uma sala de aula tem 22 alunos Qual é a nota média prevista para esta sala de aula b No ano passado uma classe tinha 19 alunos e este ano passou a ter 23 alunos Qual é a mudança prevista na nota média desses alunos c Para esta amostra de 100 classes o tamanho médio das salas é de 214 alunos Qual é a média amostral das notas dos alunos d Interprete o coeficiente de determinação Qual é a sua importância nesta regressão 1 Causalidade Econometria e Dados 20252 Questão 2 25 da nota Considere o modelo de regressão linear simples descrito a seguir yᵢ β₀ β₁ xᵢ uᵢ i 1n em que yᵢ é a variável explicada xᵢ é uma variável explicativa uᵢ é o termo de erro do modelo n é o tamanho da amostra e β₀ e β₁ são parâmetros a Derive o estimador de MQO para β₀ Indiqueo com β₀ Deixeo em função de β₁ o estimador de MQO para β₁ que você derivará no item a seguir b Derive o estimador de MQO para β₁ Indiqueo com β₁ c Liste as quatro hipóteses necessárias para ausência de viés dos estimadores de MQO para β₀ e β₁ Indique cada hipótese por HS1 HS2 HS3 e HS4 Quando for o caso apresente uma expressão matemática que represente a hipótese Questão 3 25 da nota A tabela a seguir apresenta observações das variáveis y e x Responda aos itens a seguir Obs y x 1 0 1 2 2 0 3 1 1 4 3 1 5 0 0 6 0 1 a Compute calcule os coeficientes da equação yᵢ β₀ β₁xᵢ uᵢ usando os estimadores de MQO obtidos na questão anterior Dica Calcule médias de y e x y e x respectivamente e expanda a tabela acima incluindo desvios de cada variável em relação a sua respectiva média ou seja y y e x x o produto cruzado desses desvios e o quadrado dos desvios de x em relação à sua média b Supondo que os erros sejam homoscedásticos ou seja vale a hipótese HS5 obtenha calcule as estimativas das variâncias condicionais dos estimadores de MQO para β₀ e β₁ Observação Note que você terá que estimar a variância do termo de erro da regressão para obter as variâncias dos estimadores c Obtenha e interprete o R² da regressão UERJ Gilberto Boaretto 2 Causalidade Econometria e Dados 20252 Questão 4 25 da nota Um pesquisador interessado em estudar a escolha entre o tempo gasto dormindo e trabalhando e também o efeito de outros fatores sobre o sono estima a seguinte regressão dormir 363825 0148 trab 1113 educ 220 idade n 706 R² 0113 11228 0017 588 145 em que d o r m i r e t r a b são mensurados em minutos por semana e d u c e i d a d e em anos e os desviospadrão das variáveis são apresentados em parênteses a As variáveis e d u c e i d a d e são individualmente significantes ao nível de 5 de significância contra uma hipótese bilateral Faça os testes t enfatizando hipóteses nula e alternativa estatística do teste valor crítico e conclusão b Devido ao teste efetuado em a o pesquisador resolve estimar o modelo sem as variáveis e d u c e i d a d e dormir 358638 0151 trab n 706 R² 0103 13891 0017 É possível afirmar que as variáveis e d u c e i d a d e são conjuntamente significantes na equação original ao nível de 5 Faça o teste F e justifique sua resposta c Incluir e d u c e i d a d e afeta a relação estimada entre dormir e trabalhar Justifique UERJ Gilberto Boaretto 3 QUESTÃO 1 item a A previsão é feita pelo modelo de regressão linear simples em que a variável resposta prevista é dada por NM β₀ β₁ TC Como o pesquisador estimou NM 5204 582 TC basta substituir TC 22 NM22 5204 582 22 Calculando o termo linear 582 22 12804 Substituindo NM22 520400 128040 392360 Portanto para uma sala com 22 alunos a nota média prevista é NM 392360 item b Para comparar anos com tamanhos de turma diferentes utilizase a própria função de regressão pois ela fornece a previsão condicional de NM dado TC Calculase a nota prevista para cada tamanho e em seguida a variação Primeiro para TC 19 NM19 5204 582 19 409820 Depois para TC 23 NM23 5204 582 23 386540 A mudança prevista na nota média quando a turma passa de 19 para 23 alunos é a diferença ΔNM NM23 NM19 386540 409820 23280 item b Partese da função objetivo de MQO sβ0β1 i1n yi β0 β1 ρi2 cujas condições de primeira ordem impõem derivadas parciais nulas Já se obteve no item anterior β0 y β1 x Resta derivar em relação a β1 sβ1 2 i1n xi yi β0 β1 ρi0 Esta equação normal pode ser escrita como i1n ρi yi β0 i1n ρi β1 i1n ρi2 0 Substituindo β0 y β1 x e lembrando que i1n ρi n x i1n ρi yi y β1 x n x β1 i1n ρi20 Reagrupando os termos em β1 i1n ρi yi n x y β1 i1n ρi2 n x2 0 Isolando β1 β1 i1n ρi yi n x yi1n ρi2 n x2 Usando desvios em torno da média obtémse a forma centralizada que é a mais interpretável β1 i1n ρi xyi yi1n ρi x2 Sρ y Sρ ρ Covρ y Varρ Esta expressão mostra que o coeficiente angular mede a covariância entre x e y em unidades por variação de x escalonada pela variância de x Outra forma equivalente usando o coeficiente angular como variação marginal por aluno é Δ N M β1 Δ ρ c 582 23 19 23280 Concluise que a nota média prevista diminui em 23280 pontos quando a turma aumenta de 19 para 23 alunos item c Para regressão linear com intercepto estimada por mínimos quadrados a reta ajustada passa pelo ponto médio amostral isto é N M β0 β1 ρ c Logo usando N M 5204 582 7 c e ρ c 214 N M 5204 582 214 Calculando o produto 582 214 124548 e substituindo N M 5204 124548 395852 Portanto a média amostral das notas dos alunos é N M 395852 item d Em regressão linear o coeficiente de determinação é definido por R2 1 i1n yi ŷi2 i1n yi y2 i1n ŷi y2 i1n yi y2 medindo a fração da variabilidade total de NM em torno de N M que é explicada pela reta N M 5204 582 7 c Como R2 008 concluise que aproximadamente 8 da variação observada em NM é explicada linearmente por 7 c enquanto cerca de 92 permanece não explicada pelo modelo fica nos resíduos Em regressão simples vale ainda R2 r2 de modo que r 008 0283 e como o coeficiente angular é negativo r 0283 Isso indica associação linear fraca e negativa entre 7 c e NM Importância nesta regressão um R2 tão baixo implica baixo poder explicativo do tamanho da classe para prever a nota média previsões com grande dispersão residual e necessidade de outras variáveis ou de outra forma funcional para melhorar o ajuste Note que R2 não estabelece causalidade nem substitui a verificação de significância de β1 ou a análise de resíduos ele apenas quantifica a proporção de variação explicada pelo modelo ajustado item a Partese do modelo de regressão linear simples yi β0 β1 xi ui O estimador de MQO minimiza a soma dos quadrados dos resíduos sβ0 β1 i1n yi β0 β1 xi2 A condição de primeira ordem em β0 exige que a derivada parcial seja nula sβ0 2 i1n yi β0 β1 xi 0 Reorganizando i1n yi n β0 β1 i1n xi 0 Isolando β0 β0 1n i1n yi β1 1n i1n xi y β1 x Assim substituindo o estimador de MQO de β1 que será obtido no item seguinte obtêmse o estimador de MQO para o intercepto β0 y β1 x A expressão mostra que a reta ajustada passa pelo ponto médio amostral x y propriedade fundamental dos MQO com intercepto item c HS1 linearidade nos parâmetros O modelo é corretamente especificado e linear em β0 e β1 yi β0 β1xi ui i 1 n Garante que os MQO são lineares em yi e que o intercepto e a inclinação existem no modelo populacional HS2 amostragem aleatória A amostra xi yini1 é extraída aleatoriamente de uma mesma população de modo que as observações são independentes e identicamente distribuídas Isso permite que médias amostrais sejam estimativas não viciadas de médias populacionais HS3 variabilidade do regressor O regressor apresenta variação na amostra ni1 xi x2 0 equivalentemente Varxi 0 Evita colinearidade perfeita e garante que a inclinação esteja bem definida HS4 exogeneidade estrita ou média condicional nula O erro tem média zero condicionalmente a xi Eui xi 0 Implica que xi é não correlacionado com o erro e assegura que Eβ0 β0 e Eβ1 β1 Observação homocedasticidade e normalidade não são necessárias para ausência de viés elas afetam eficiência e inferência não a nãoviciação item d Considerese o modelo yi β0 β1xi ui e a soma dos quadrados Sβ0 β1 ni1 yi β0 β1xi2 As condições de primeira ordem do MQO geram as equações normais ni1 yi β0 β1xi 0 e ni1 xiyi β0 β1xi 0 Denotando ûi yi β0 β1xi têmse diretamente as propriedades fundamentais dos resíduos 1 Média dos resíduos nula ni1 ûi 0 ū 0 2 Ortogonalidade dos resíduos ao regressor ni1 xi ûi 0 Da primeira equação normal também resulta que a reta ajustada passa pelo ponto médio amostral De fato escrevendo ni1 yi nβ0 β1 ni1 xi 0 β0 ȳ β1 x concluise que ŷ β0 β1x satisfaz ŷx ȳ Essas identidades caracterizam a solução do MQO com intercepto QUESTÃO 3 item a Querse estimar os parâmetros do modelo yi β0 β1xi ui pelos MQO usando as observações yi xi6i1 01 20 11 31 00 01 Os estimadores de MQO obtidos na questão anterior são β1 ni1 xi xyi ȳ ni1 xi x2 e β0 ȳ β1 x Calculase as médias amostrais x 1 0 1 1 0 1 6 0 e ȳ 0 2 1 3 0 0 6 1 Com x 0 as somas centrais ficam Sxx 6i1 xi x2 6i1 xi2 12 02 12 12 02 12 4 Sxy 6i1 xi xyi ȳ 6i1 xiyi 1 11 01 10 12 01 11 4 Logo o coeficiente angular é β1 Sxy Sxx 4 4 1 O intercepto resulta de β0 ȳ β1 x 1 1 0 1 Portanto a equação estimada por MQO é ŷi β0 β1xi 1 1 xi item b Sob homocedasticidade com variância populacional do erro igual a σ2 e condição nos regressors X valem as variâncias condicionais dos estimadores de MQO Varβ1 X σ2 Sxx e Varβ0 X σ2 1n x2 Sxx onde Sxx ni1 xi x2 Como σ2 é desconhecida utilizase o estimador não viciado σ2 SQR n 2 com que SQR ni1 ûi2 e ûi yi ŷi são os resíduos da regressão A partir do item a temse ŷi 1 1 xi Logo para cada observação ŷ 0 1 2 2 1 0 û 0 1 1 1 1 0 Portanto SQR 6i1 ûi2 02 12 12 12 12 02 4 σ2 4 6 2 4 4 1 Das estatísticas amostrais já calculadas têmse x 0 e Sxx 6i1 xi x2 6i1 xi2 4 Substituindo nas fórmulas das variâncias condicionais Varβ1 X σ2 Sxx 14 14 0250 Varβ0 X σ2 1n x2 Sxx 1 16 02 4 16 0167 Assim as estimativas das variâncias condicionais são Varβ1 X 14 e Varβ0 X 16 item c Partese da definição do coeficiente de determinação para regressão linear simples R2 1 Σi1n yi ŷi2 Σi1n yi ȳ2 Σi1n ŷi ȳ2 Σi1n yi ȳ2 onde ȳ é a média amostral ŷi β0 β1 xi e n6 Da alínea a ŷi 1 xi Com os dados yi 0 2 1 3 0 0 ȳ 0 2 1 3 0 06 1 Calculamse as somas de quadrados Soma total de quadrados SQT Σi16 yi ȳ2 12 12 02 22 12 12 8 Soma dos quadrados dos resíduos SQR Σi16 yi ŷi2 Com ŷ 0 1 2 2 1 0 os resíduos são û 0 1 1 1 1 0 logo SQR 02 12 12 12 12 02 4 Coeficiente de determinação R2 1 SQR SQT 1 48 12 0500 Comentário útil em regressão simples vale R2 r2 onde r Σi xi xyi ȳ Σi xi x2 Σi yi ȳ2 4 48 1 2 se modo que r2 12 confirmando o resultado Interpretação aproximadamente 50 da variabilidade de y em torno de ȳ é explicada linearmente por x nesta amostra os outros 50 permanecem nos resíduos QUESTÃO 4 item a O objetivo é testar a significância individual de educ e idade no modelo dormin 363825 0148hrab 1113educ 220idade onde embaixo dos coeficientes estão os errospadrão SEhrab 0017 SEeduc 588 e SEidade 145 Com n706 e três regressores mais intercepto os graus de liberdade para os testes t são df n 4 702 Para cada coeficiente βj testase H0 βj 0 versus H1 βj 0 usando a estatística t βj 0 SEβj que sob H0 segue aproximadamente tdf Para educ teduc 1113 588 1892857 1893 Para idade tidade 220 145 1517241 1517 Valor crítico bicaudal a 5 com df702 é aproximadamente t0975702 1964 Como teduc 1893 1964 e tidade 1517 1964 não se rejeita H0 para nenhuma das duas variáveis ao nível de 5 Conclusão educ e idade não são individualmente significantes a 5 nesta regressão item b Pretendese testar a significância conjunta de educ e idade na regressão original Comparase o modelo completo e o modelo restrito sem educ e idade por meio do teste F para restrições lineares Hipóteses do teste com q2 restrições H0 βeduc 0 e βidade 0 versus H1 pelo menos uma das duas é diferente de zero Usase a forma do F via R2 de modelos aninhados F Rc2 Rr2 q 1 Rc2 n k 1 onde Rc2 0113 completo Rr2 0103 restrito n706 e k3 é o número de regressores no modelo completo sem contar o intercepto hrab educ idade Assim os graus de liberdade são df1 q 2 e df2 n k 1 702 Substituindo F 0113 01032 1 0113702 00102 0887702 0005 0001264 3957 Valor crítico bicaudal ao nível de 5 para F2702 região superior de 5 F2702095 3000 Como F3957 3000 rejeitase H0 a 5 Equivalentemente o valorp do teste é p 0020 005 Conclusão educ e idade são conjuntamente significantes na equação original ao nível de 5 item c Comparase o coeficiente de trab entre os dois modelos Modelo completo dormin 363825 0148 trab 1113 educ 220 idade SEβtrab 0017 Modelo restrito dormin 358638 0151 trab SEβtrab 0017 A variação no coeficiente de trab ao incluir educ e idade é βtrab 0148 0151 0003 isto é uma redução se magnitude se 0003 0151 0019875 1987 Verificase também que o efeito permanece altamente significativo em ambos os modelos No completo tcomp 0148 0017 8706 95 IC 0181 βtrab 0115 No restrito trest 0151 0017 8882 95 IC 0184 βtrab 0118 Os intervalos se sobrepõem fortemente Conclusão incluir educ e idade altera a relação estimada entre dormir e trabalhar apenas de forma muito pequena tornando o efeito de trab levemente menos negativo 0151 para 0148 cerca de 2 Isso sugere que havia um viés por omissão pequeno no modelo restrito como a mudança é para mais próximo de zero o viés era negativo Em termos substantivos a associação entre trab e dormir permanece praticamente a mesma e estatisticamente muito significativa