· 2022/1
5
Estatística
UFRPE
6
Estatística
UFRPE
2
Estatística
UFRPE
1
Estatística
UFES
9
Estatística 1
MACKENZIE
1
Estatística 1
PUC
5
Estatística 1
USP
8
Estatística 1
UFES
10
Estatística
UFES
5
Estatística 1
UFCG
Texto de pré-visualização
As questões que precisam de desenvolvimento matemático só serão consideradas com a apresentação do mesmo. Para resolver as questões matemáticas considerem duas casas decimais. Respostas copiadas da internet ou igualzinha a do coleguinha serão zeradas! Segundo Exercício de Avaliação 1) (2 Pontos) Verifique, EXPLICANDO, se as seguintes afirmações são verdadeiras ou falsas. a) A hipótese de normalidade do termo de erro não tem nenhuma implicação na distribuição de probabilidade dos estimadores de MQO. b) Se os valores de X são dependentes do termo de erro, podemos avaliar seus efeitos individuais sobre Y. c) A hipótese de heterocedasticidade [ garante que a variância do termo do erro seja constante independentemente do valor de X. d) O método dos mínimos quadrados escolhe e que para qualquer amostra o somatório dos erros é o menor possível. e) Heterocedasticidade acontece quando o erro aleatório é correlacionado com a variável explicativa. f) Os estimadores de MQO deixam de ser eficientes dentro da classe de estimadores lineares se os erros da regressão não forem normalmente distribuídos. 2) (4 Pontos) A tabela abaixo apresenta dados sobre as taxas de criminalidade (número de homicídios por 100 mil habitantes) e as taxas de desemprego por ano. Ano Criminalidade Desemprego 2017 31,59 13,9 2018 27,8 13,2 2019 21,65 12,8 Para verificar se há alguma relação entre a taxa de criminalidade e taxa de desemprego, sugeriu-se o seguinte modelo: em que Crim representa a taxa de criminalidade e Desem, a de desemprego. a) Estime o modelo de regressão acima e calcule o erro padrão do coeficiente angular. Interprete os resultados dos coeficientes da regressão. b) Utilizando o teste t, diga se o coeficiente angular estimado é estatisticamente significativo ao nível de 5% de significância? (Considere ). c) Construa um intervalo de confiança de 95% para o Você pode rejeitar a hipótese nula de ? Explique. d) Se você tivesse total controle sobre a taxa de desemprego e quisesse obter uma taxa de criminalidade de no máximo 10% em 2020, em que nível a taxa de desemprego teria que estar? 3) (2 Pontos) O que significa dizer que os estimadores de MQO são não-viesados, consistentes e eficientes? 4) (2 Pontos) Explique as questões abaixo: a) Qual a diferença entre as funções de regressão populacional e amostral? b) Qual o papel do termo de erro estocástico, ui, na análise de regressão? Qual a diferença entre o termo de erro estocástico e o resíduo, ûi? 1) (2 Pontos) Verifique, EXPLICANDO, se as seguintes afirmações são verdadeiras ou falsas. a) A hipótese de normalidade do termo de erro não tem nenhuma implicação na distribuição de probabilidade dos estimadores de MQO. R: Falso! No caso de erros com distribuição de probabilidade normal, isto é, 𝜀𝑖 ~ 𝑁(0, 𝜎2), 𝑖 = 1, 2, … , 𝑛, os estimadores de máxima verossimilhança coincidem com os estimadores MQO. Além disso, os estimadores de MQO apresentam distribuição também normal, implicação direta de 𝜀𝑖 ~ 𝑁(0, 𝜎2). b) Se os valores de X são dependentes do termo de erro, podemos avaliar seus efeitos individuais sobre Y. R: Verdadeiro! Neste caso, para cada 𝑋 = 𝑥, tem-se um efeito diferente em 𝑌, a variável dependente, logo, é de interesse verificar os efeitos de 𝑋 em 𝑌 fixado. c) A hipótese de heterocedasticidade garante que a variância do termo do erro seja constante independentemente do valor de 𝑋. R: Falso! A hipótese de homocedasticidade que garante que a variância do termo do seja constante, isto é, 𝑉𝑎𝑟(𝜀𝑖) = 𝜎2, 𝑖 = 1, … , 𝑛, independentemente de 𝑋, ou seja, 𝑉𝑎𝑟(𝜀𝑖|𝑥) = 𝜎2, qualquer que seja 𝑥. d) O método dos mínimos quadrados escolhe e que para qualquer amostra o somatório dos erros é o menor possível. R: Falso! O método dos mínimos quadrados é tal que o somatório dos erros ao quadrado é o menor possível. e) Heterocedasticidade acontece quando o erro aleatório é correlacionado com a variável explicativa. R: Verdadeiro! Tem-se heterocedasticidade no modelo, quando 𝑉𝑎𝑟(𝜀𝑖|𝑥) não é o mesmo para todo 𝑥. f) Os estimadores de MQO deixam de ser eficientes dentro da classe de estimadores lineares se os erros da regressão não forem normalmente distribuídos. R: Verdadeiro! Em caso de não normalidade dos erros, os estimadores podem ter distribuição assintótica normal, no entanto, deixam de ser eficientes. 2) A tabela abaixo apresenta dados sobre as taxas de criminalidade (número de homicídios por 100 mil habitantes) e as taxas de desemprego por ano. Ano Criminalidade Desemprego 2017 31,59 13,9 2018 27,8 13,2 2019 21,65 12,8 a) Estime o modelo de regressão acima e calcule o erro padrão do coeficiente angular. Interprete os resultados dos coeficientes da regressão. Ano Criminalidade (𝑌) Desemprego (𝑋) (𝑥 − 𝑥̅)2 (𝑦 − 𝑦̅)2 (𝑥 − 𝑥̅)(𝑦 − 𝑦̅) 2017 31,59 13,9 0,36 20,95 2,75 2018 27,8 13,2 0,01 0,62 -0,08 2019 21,65 12,8 0,25 28,77 2,68 Total 81,04 39,9 0,62 50,34 5,35 Portanto, obtém-se: 𝑆𝑥𝑥 = 0,62 ; 𝑆𝑦𝑦 = 50,34 ; 𝑆𝑥𝑦 = 5,35. Logo, os estimadores dos parâmetros de regressão são 𝛽̂ = 𝑆𝑥𝑦 𝑆𝑥𝑥 = 5,35 0,62 = 8,63 e 𝛼̂ = 𝑦̅ − 𝛽̂𝑥̅ = 81,04 3 − 8,63 × 39,9 3 = −87,77. ⟹ 𝑌̂ = −87,77 + 8,63𝑋. Erro padrão de 𝛽̂: 𝐸𝑃( 𝛽̂) = √ 𝑆𝑄𝑅 (𝑛 − 2)𝑆𝑥𝑥 . Temos Ano 𝑦𝑖 𝑦̂𝑖 𝜀𝑖 2 2017 31,59 32,19 0,36 2018 27,80 26,15 2,74 2019 21,65 22,69 1,09 Total 81,04 81,03 𝑆𝑄𝑅 = 4,18 ⟹ 𝑛 = 3 ⟹ 𝐸𝑃( 𝛽̂) = √4,18 0,62 = 2,60. A cada uma unidade aumentada na taxa de desemprego, a criminalidade aumenta, em média, 𝛽̂ = 8,63. Para a taxa de desemprego 𝑥 = 0, a criminalidade terá taxa de 𝛼̂ = −87,77 (esta interpretação, sobre 𝛼, não é indicada, pois 𝑥 = 0 não pertence ao intervalo estudado). b) Utilizando o teste t, diga se o coeficiente angular estimado é estatisticamente significativo ao nível de 5% de significância? R: Hipóteses a serem testadas: 𝐻0: 𝛽 = 0 𝑣𝑒𝑟𝑠𝑢𝑠 𝐻1: 𝛽 ≠ 0. Estatística de teste: 𝑇 = 𝛽̂ 𝐸𝑃(𝛽̂) ~ 𝑡1. Região crítica: 𝑃(𝑇 > 𝑡𝑐) = 0,025, 𝑇 ~ 𝑡1 ⟺ 𝑡𝑐 = 12,706 ⟹ 𝑅𝐶 = {𝑇 ∈ ℝ: |𝑇| > 12,706}. Valor observado da estatística de teste: |𝑇𝑜𝑏𝑠| = |8,63 2,60| = 3,319 ∉ 𝑅𝐶; então não se rejeita 𝐻0, e concluímos que o coeficiente angular estimado não é significativo ao nível de 5% de significância. c) Construa um intervalo de confiança de 95% para o Você pode rejeitar a hipótese nula de? Explique. R: 𝐼𝐶(𝛽; 95%) = 𝛽̂ ±× 𝐸𝑃(𝛽̂) ⟹ 𝐼𝐶(𝛽; 95%) = 8,63 ± 12,706 × 2,60 ⟹ 𝐼𝐶(𝛽; 95%) = (−24,406; 41,666). Como o intervalo de confiança encontrado contém o valor nulo, então não se pode rejeitar a hipótese nula 𝐻0: 𝛽 = 0. d) Se você tivesse total controle sobre a taxa de desemprego e quisesse obter uma taxa de criminalidade de no máximo 10% em 2020, em que nível a taxa de desemprego teria que estar? R: Ora, deve-se ter 𝑌̂ = 10 ≥ −87,77 + 8,63𝑥 ⟹ 𝑥 ≤ 10 + 87,77 8,63 = 11,33. Portanto, para obter-se uma taxa de criminalidade de no máximo 10% em 2020, a taxa de desemprego teria que estar no máximo em 11,33%. 3) (2 Pontos) O que significa dizer que os estimadores de MQO são não- viesados, consistentes e eficientes? R: Seja 𝜃 um parâmetro desconhecido (podendo ser um vetor) e 𝜃̂𝑀𝑄 o estimador de MQO de 𝜃. Então, o estimador de MQO é não viesado se, e somente se, 𝐸(𝜃̂𝑀𝑄) = 𝜃. Além disso, 𝜃̂𝑀𝑄 será consistente se lim 𝑛→∞ ℙ(|𝜃̂𝑀𝑄 − 𝜃| > 𝜀) = 0; para qualquer que seja 𝜀 > 0. Agora, seja 𝜃̂∗ um outro estimador qualquer de 𝜃, então o estimador de MQO será eficiente se 𝑉𝑎𝑟(𝜃̂𝑀𝑄) ≤ 𝑉𝑎𝑟( 𝜃̂∗). 4) (2 Pontos) Explique as questões abaixo: a) Qual a diferença entre as funções de regressão populacional e amostral? R: A função de regressão populacional é o modelo teórico (equação) que representam a relação entre as variáveis em estudo. Esta equação é determinada por suposição, ou seja, supõem-se que a relação entre 𝑌 e 𝑋 é de alguma forma expressa por 𝑌𝑖 = 𝑔(𝑋𝑖) + 𝜀𝑖 para alguma função 𝑔(∙), 𝑖 = 1, … , 𝑛. A função de regressão amostral será a estimação da equação/modelo proposta(o) com base em um conjunto de observações da população. Assim, é possível estimar a verdadeira relação entre 𝑋 e 𝑌 com métodos de amostragem e inferenciais, como por exemplo, a estimação dos parâmetros via máxima verossimilhança ou mínimos quadrados. b) Qual o papel do termo de erro estocástico, ui, na análise de regressão? Qual a diferença entre o termo de erro estocástico e o resíduo, ûi? R: O erro estocástico é a diferença entre o observado e o verdadeiro, e apresenta uma grande importância no modelo de regressão, já que também pode ser interpretado como “aquilo que não está sendo medido”. Por exemplo, o modelo simples 𝑌 = 𝛼 + 𝛽𝑋 + 𝜀, está avaliando a relação de 𝑋 e 𝑌, no entanto, outros fatores podem interferir nesta relação, por isso os 𝜀′𝑠 estão ali. Os resíduos são os valores estimados para os erros estocásticos, e a partir deles é possível verificar algumas suposições e interferências dos erros estocásticos no modelo.
5
Estatística
UFRPE
6
Estatística
UFRPE
2
Estatística
UFRPE
1
Estatística
UFES
9
Estatística 1
MACKENZIE
1
Estatística 1
PUC
5
Estatística 1
USP
8
Estatística 1
UFES
10
Estatística
UFES
5
Estatística 1
UFCG
Texto de pré-visualização
As questões que precisam de desenvolvimento matemático só serão consideradas com a apresentação do mesmo. Para resolver as questões matemáticas considerem duas casas decimais. Respostas copiadas da internet ou igualzinha a do coleguinha serão zeradas! Segundo Exercício de Avaliação 1) (2 Pontos) Verifique, EXPLICANDO, se as seguintes afirmações são verdadeiras ou falsas. a) A hipótese de normalidade do termo de erro não tem nenhuma implicação na distribuição de probabilidade dos estimadores de MQO. b) Se os valores de X são dependentes do termo de erro, podemos avaliar seus efeitos individuais sobre Y. c) A hipótese de heterocedasticidade [ garante que a variância do termo do erro seja constante independentemente do valor de X. d) O método dos mínimos quadrados escolhe e que para qualquer amostra o somatório dos erros é o menor possível. e) Heterocedasticidade acontece quando o erro aleatório é correlacionado com a variável explicativa. f) Os estimadores de MQO deixam de ser eficientes dentro da classe de estimadores lineares se os erros da regressão não forem normalmente distribuídos. 2) (4 Pontos) A tabela abaixo apresenta dados sobre as taxas de criminalidade (número de homicídios por 100 mil habitantes) e as taxas de desemprego por ano. Ano Criminalidade Desemprego 2017 31,59 13,9 2018 27,8 13,2 2019 21,65 12,8 Para verificar se há alguma relação entre a taxa de criminalidade e taxa de desemprego, sugeriu-se o seguinte modelo: em que Crim representa a taxa de criminalidade e Desem, a de desemprego. a) Estime o modelo de regressão acima e calcule o erro padrão do coeficiente angular. Interprete os resultados dos coeficientes da regressão. b) Utilizando o teste t, diga se o coeficiente angular estimado é estatisticamente significativo ao nível de 5% de significância? (Considere ). c) Construa um intervalo de confiança de 95% para o Você pode rejeitar a hipótese nula de ? Explique. d) Se você tivesse total controle sobre a taxa de desemprego e quisesse obter uma taxa de criminalidade de no máximo 10% em 2020, em que nível a taxa de desemprego teria que estar? 3) (2 Pontos) O que significa dizer que os estimadores de MQO são não-viesados, consistentes e eficientes? 4) (2 Pontos) Explique as questões abaixo: a) Qual a diferença entre as funções de regressão populacional e amostral? b) Qual o papel do termo de erro estocástico, ui, na análise de regressão? Qual a diferença entre o termo de erro estocástico e o resíduo, ûi? 1) (2 Pontos) Verifique, EXPLICANDO, se as seguintes afirmações são verdadeiras ou falsas. a) A hipótese de normalidade do termo de erro não tem nenhuma implicação na distribuição de probabilidade dos estimadores de MQO. R: Falso! No caso de erros com distribuição de probabilidade normal, isto é, 𝜀𝑖 ~ 𝑁(0, 𝜎2), 𝑖 = 1, 2, … , 𝑛, os estimadores de máxima verossimilhança coincidem com os estimadores MQO. Além disso, os estimadores de MQO apresentam distribuição também normal, implicação direta de 𝜀𝑖 ~ 𝑁(0, 𝜎2). b) Se os valores de X são dependentes do termo de erro, podemos avaliar seus efeitos individuais sobre Y. R: Verdadeiro! Neste caso, para cada 𝑋 = 𝑥, tem-se um efeito diferente em 𝑌, a variável dependente, logo, é de interesse verificar os efeitos de 𝑋 em 𝑌 fixado. c) A hipótese de heterocedasticidade garante que a variância do termo do erro seja constante independentemente do valor de 𝑋. R: Falso! A hipótese de homocedasticidade que garante que a variância do termo do seja constante, isto é, 𝑉𝑎𝑟(𝜀𝑖) = 𝜎2, 𝑖 = 1, … , 𝑛, independentemente de 𝑋, ou seja, 𝑉𝑎𝑟(𝜀𝑖|𝑥) = 𝜎2, qualquer que seja 𝑥. d) O método dos mínimos quadrados escolhe e que para qualquer amostra o somatório dos erros é o menor possível. R: Falso! O método dos mínimos quadrados é tal que o somatório dos erros ao quadrado é o menor possível. e) Heterocedasticidade acontece quando o erro aleatório é correlacionado com a variável explicativa. R: Verdadeiro! Tem-se heterocedasticidade no modelo, quando 𝑉𝑎𝑟(𝜀𝑖|𝑥) não é o mesmo para todo 𝑥. f) Os estimadores de MQO deixam de ser eficientes dentro da classe de estimadores lineares se os erros da regressão não forem normalmente distribuídos. R: Verdadeiro! Em caso de não normalidade dos erros, os estimadores podem ter distribuição assintótica normal, no entanto, deixam de ser eficientes. 2) A tabela abaixo apresenta dados sobre as taxas de criminalidade (número de homicídios por 100 mil habitantes) e as taxas de desemprego por ano. Ano Criminalidade Desemprego 2017 31,59 13,9 2018 27,8 13,2 2019 21,65 12,8 a) Estime o modelo de regressão acima e calcule o erro padrão do coeficiente angular. Interprete os resultados dos coeficientes da regressão. Ano Criminalidade (𝑌) Desemprego (𝑋) (𝑥 − 𝑥̅)2 (𝑦 − 𝑦̅)2 (𝑥 − 𝑥̅)(𝑦 − 𝑦̅) 2017 31,59 13,9 0,36 20,95 2,75 2018 27,8 13,2 0,01 0,62 -0,08 2019 21,65 12,8 0,25 28,77 2,68 Total 81,04 39,9 0,62 50,34 5,35 Portanto, obtém-se: 𝑆𝑥𝑥 = 0,62 ; 𝑆𝑦𝑦 = 50,34 ; 𝑆𝑥𝑦 = 5,35. Logo, os estimadores dos parâmetros de regressão são 𝛽̂ = 𝑆𝑥𝑦 𝑆𝑥𝑥 = 5,35 0,62 = 8,63 e 𝛼̂ = 𝑦̅ − 𝛽̂𝑥̅ = 81,04 3 − 8,63 × 39,9 3 = −87,77. ⟹ 𝑌̂ = −87,77 + 8,63𝑋. Erro padrão de 𝛽̂: 𝐸𝑃( 𝛽̂) = √ 𝑆𝑄𝑅 (𝑛 − 2)𝑆𝑥𝑥 . Temos Ano 𝑦𝑖 𝑦̂𝑖 𝜀𝑖 2 2017 31,59 32,19 0,36 2018 27,80 26,15 2,74 2019 21,65 22,69 1,09 Total 81,04 81,03 𝑆𝑄𝑅 = 4,18 ⟹ 𝑛 = 3 ⟹ 𝐸𝑃( 𝛽̂) = √4,18 0,62 = 2,60. A cada uma unidade aumentada na taxa de desemprego, a criminalidade aumenta, em média, 𝛽̂ = 8,63. Para a taxa de desemprego 𝑥 = 0, a criminalidade terá taxa de 𝛼̂ = −87,77 (esta interpretação, sobre 𝛼, não é indicada, pois 𝑥 = 0 não pertence ao intervalo estudado). b) Utilizando o teste t, diga se o coeficiente angular estimado é estatisticamente significativo ao nível de 5% de significância? R: Hipóteses a serem testadas: 𝐻0: 𝛽 = 0 𝑣𝑒𝑟𝑠𝑢𝑠 𝐻1: 𝛽 ≠ 0. Estatística de teste: 𝑇 = 𝛽̂ 𝐸𝑃(𝛽̂) ~ 𝑡1. Região crítica: 𝑃(𝑇 > 𝑡𝑐) = 0,025, 𝑇 ~ 𝑡1 ⟺ 𝑡𝑐 = 12,706 ⟹ 𝑅𝐶 = {𝑇 ∈ ℝ: |𝑇| > 12,706}. Valor observado da estatística de teste: |𝑇𝑜𝑏𝑠| = |8,63 2,60| = 3,319 ∉ 𝑅𝐶; então não se rejeita 𝐻0, e concluímos que o coeficiente angular estimado não é significativo ao nível de 5% de significância. c) Construa um intervalo de confiança de 95% para o Você pode rejeitar a hipótese nula de? Explique. R: 𝐼𝐶(𝛽; 95%) = 𝛽̂ ±× 𝐸𝑃(𝛽̂) ⟹ 𝐼𝐶(𝛽; 95%) = 8,63 ± 12,706 × 2,60 ⟹ 𝐼𝐶(𝛽; 95%) = (−24,406; 41,666). Como o intervalo de confiança encontrado contém o valor nulo, então não se pode rejeitar a hipótese nula 𝐻0: 𝛽 = 0. d) Se você tivesse total controle sobre a taxa de desemprego e quisesse obter uma taxa de criminalidade de no máximo 10% em 2020, em que nível a taxa de desemprego teria que estar? R: Ora, deve-se ter 𝑌̂ = 10 ≥ −87,77 + 8,63𝑥 ⟹ 𝑥 ≤ 10 + 87,77 8,63 = 11,33. Portanto, para obter-se uma taxa de criminalidade de no máximo 10% em 2020, a taxa de desemprego teria que estar no máximo em 11,33%. 3) (2 Pontos) O que significa dizer que os estimadores de MQO são não- viesados, consistentes e eficientes? R: Seja 𝜃 um parâmetro desconhecido (podendo ser um vetor) e 𝜃̂𝑀𝑄 o estimador de MQO de 𝜃. Então, o estimador de MQO é não viesado se, e somente se, 𝐸(𝜃̂𝑀𝑄) = 𝜃. Além disso, 𝜃̂𝑀𝑄 será consistente se lim 𝑛→∞ ℙ(|𝜃̂𝑀𝑄 − 𝜃| > 𝜀) = 0; para qualquer que seja 𝜀 > 0. Agora, seja 𝜃̂∗ um outro estimador qualquer de 𝜃, então o estimador de MQO será eficiente se 𝑉𝑎𝑟(𝜃̂𝑀𝑄) ≤ 𝑉𝑎𝑟( 𝜃̂∗). 4) (2 Pontos) Explique as questões abaixo: a) Qual a diferença entre as funções de regressão populacional e amostral? R: A função de regressão populacional é o modelo teórico (equação) que representam a relação entre as variáveis em estudo. Esta equação é determinada por suposição, ou seja, supõem-se que a relação entre 𝑌 e 𝑋 é de alguma forma expressa por 𝑌𝑖 = 𝑔(𝑋𝑖) + 𝜀𝑖 para alguma função 𝑔(∙), 𝑖 = 1, … , 𝑛. A função de regressão amostral será a estimação da equação/modelo proposta(o) com base em um conjunto de observações da população. Assim, é possível estimar a verdadeira relação entre 𝑋 e 𝑌 com métodos de amostragem e inferenciais, como por exemplo, a estimação dos parâmetros via máxima verossimilhança ou mínimos quadrados. b) Qual o papel do termo de erro estocástico, ui, na análise de regressão? Qual a diferença entre o termo de erro estocástico e o resíduo, ûi? R: O erro estocástico é a diferença entre o observado e o verdadeiro, e apresenta uma grande importância no modelo de regressão, já que também pode ser interpretado como “aquilo que não está sendo medido”. Por exemplo, o modelo simples 𝑌 = 𝛼 + 𝛽𝑋 + 𝜀, está avaliando a relação de 𝑋 e 𝑌, no entanto, outros fatores podem interferir nesta relação, por isso os 𝜀′𝑠 estão ali. Os resíduos são os valores estimados para os erros estocásticos, e a partir deles é possível verificar algumas suposições e interferências dos erros estocásticos no modelo.