·
Ciências Contábeis ·
Estatística 2
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
16
Slide - Revisão - Estatística 2 - 2024-1
Estatística 2
UFMG
42
Slide - Aula 22 - Regressão Linear Simples - Estatística 2 - 2024-1
Estatística 2
UFMG
5
Lista - Regressão Linear Simples 2021-2
Estatística 2
UFMG
1
Exercícios - Estatística 2 2021 2
Estatística 2
UFMG
58
Projeto - Estatística 2 - 2024-1
Estatística 2
UFMG
21
Lista - Estatística 2 2021-2
Estatística 2
UFMG
40
Slide - Aula 15 - Teste Qui-quadrado de Indepenência - 2024-1
Estatística 2
UFMG
7
Prova - Estatística 2 - 2023-1
Estatística 2
UFMG
3
Prova - Estatística 2 - 2023-2
Estatística 2
UFMG
21
Lista - Estatística 2 2021 2
Estatística 2
UFMG
Texto de pré-visualização
Cássius Henrique EST002 – Estatística II Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Modelo de Regressão Linear Simples Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b0 Não é com frequência que fazemos inferências sobre b0. • Isso só ocorre quando a variável x pode assumir o valor x = 0. Suponha que desejamos testar a hipótese de que o intercepto é igual a um determinado valor, denotado por b00. Desta forma, sejam as hipóteses: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b0 Já sabemos que Sob Ho temos: e que Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b0 Como as variáveis aleatórias No e c são independentes, segue que : Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b0 Estatística de Teste: Critérios de Rejeição: Iguais aos do teste T. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência Intervalar para b0 Intervalo de Confiança para b0 : Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b1 Inferência sobre b1 é mais frequente já que por meio deste parâmetro temos um indicativo da existência ou não de associação linear entre as variáveis envolvidas. Similarmente ao parâmetro b0, consideremos as hipóteses Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b1 Já sabemos que Sob Ho temos: e que Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b1 Como as variáveis aleatórias N1 e c são independentes, segue que : Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b1 Estatística de Teste: Critérios de Rejeição: Iguais aos do teste T. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência Intervalar para b1 Intervalo de Confiança para b1 : Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 Verifique se os parâmetros do modelo do Exemplo (da aula anterior) são significativos e construa o intervalo de confiança para eles. Use um nível de significância de 5%. 220 225 230 235 120 125 130 135 Dureza ~Temperatura Temperatura Dureza Gastos Receitas Gastos ~ Receitas Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Teste para b0 Já calculados Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Teste para b1 Já calculados Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Resultados do R Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Resultados do R 2.5 % 97.5 % (Intercept) 335.260963 393.0990373 Receitas -1.159078 -0.9049217 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 Gastos = 364,2 – 1,032 * Receitas Gastos Receitas Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Para avaliarmos a significância do modelo como um todo utilizamos a análise de variância (ANOVA). • Para isso, consideremos o "Modelo de Regressão Linear Simples" com a suposição de que os erros tem distribuição Normal. A análise de variância é baseada na decomposição da soma de quadrados e nos graus de liberdade associados a variável resposta Y. • Em palavras, o desvio de uma observação em relação à média pode ser decomposto como o desvio da observação em relação ao valor ajustado pela regressão mais o desvio do valor ajustado em relação à média. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Soma de Quadrados em que Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Soma de Quadrados equivale a Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II SQTotais Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II SQResíduos Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II SQRegressão Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Partição dos Graus de Liberdade ▪ Assim como há uma decomposição da soma de quadrados total, existe uma decomposição dos graus de liberdade associados (abreviados por gl). ▪ A decomposição é a seguinte: • gl da SQT: (n – 1) • gl da SQR: 1 • gl da SQE: (n – 2) Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Quadrado Médio A divisão da soma de quadrados pelos respectivos graus de liberdade é o quadrado médio. A decomposição é a seguinte: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Tabela Anova e Teste F Critérios de Rejeição: Iguais ao Teste F Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Considere novamente o exemplo ▪ Deseja-se verificar se há relação entre os gastos e as receitas anuais de uma empresa. ▪ As rendas foram pré-estabelecidas por contrato (com validade de 5 anos) e esses valores são: R1 = R$ 220 000,00 R2 = R$ 225 000,00 R3 = R$ 230 000,00 R4 = R$ 235 000,00 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exemplo Observação Gastos (x1000) em R$ Receitas (x1000) em R$ 1 137 220 2 137 220 3 137 220 4 136 220 5 135 220 6 135 225 7 133 225 8 132 225 9 133 225 10 133 225 11 128 230 12 124 230 13 126 230 14 129 230 15 126 230 16 122 235 17 122 235 18 122 235 19 119 235 20 122 235 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exemplo 220 225 230 235 120 125 130 135 Dureza ~ Temperatura Temperatura Dureza Gastos Receitas Gastos ~ Receitas Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 Para o problema apresentado no Exemplo, construa a tabela ANOVA para verificar se a variável explicativa tem correlação com a variável resposta. 220 225 230 235 120 125 130 135 Dureza ~Temperatura Temperatura Dureza Gasto s Receitas Gastos ~ Receitas Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação Uma das formas de avaliar a qualidade do ajuste do modelo é através do coeficiente de determinação. • Basicamente, este coeficiente indica quanto o modelo foi capaz de explicar os dados coletados. O coeficiente de determinação é dado pela expressão Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação Ou seja, é a razão entre a soma de quadrados da regressão e a soma de quadrados total. No modelo com intercepto, podemos escrever Note que 0 < R² < 1 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação O R² é uma medida descritiva da qualidade do ajuste obtido ➢ Em geral referimo-nos ao R² como a quantidade de variabilidade nos dados que é explicada pelo modelo de regressão ajustado. Entretanto, o valor do coeficiente de determinação depende do número de observações n, tendendo a crescer quando n diminui. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação Embora R² aumente com a adição de termos ao modelo, isto não significa necessariamente que o novo modelo é superior ao anterior. • Na realidade esse novo modelo poderá ser pior do que o anterior. A magnitude de R², também, depende da amplitude de variação da variável regressora (x). Geralmente, R² aumentará com maior amplitude de variação dos x's e diminuirá em caso contrário. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação Ajustado Quanto maior o R²ajustado, mais a variável resposta é explicada pela regressora X. p é o número de coeficientes Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 3 Calcule o coeficiente de determinação e o coeficientes de determinação ajustado para os dados do Exemplo e apresente conclusões sobre o modelo quando à qualidade do ajuste. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 3 – Solução Calcule o coeficiente de determinação e o coeficientes de determinação ajustado para os dados do Exemplo e apresente conclusões sobre o modelo quando à qualidade do ajuste. Modelo bem ajustado! Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 3 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Análise de Resíduos ▪ Comportamento ideal dos resíduos, caso todas as suposições iniciais do modelo estejam corretas Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Análise de Resíduos ▪ Comportamento dos resíduos em uma condição de heterocedasticidade dos mesmos. ▪ Neste exemplo (da figura), a variância dos resíduos é proporcional à resposta média Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Análise de Resíduos ▪ Comportamento dos resíduos em uma condição na qual os erros são homocedásticos, mas a resposta média dos dados é não linear. Neste caso, o comportamento anormal dos resíduos reflete a má especificação da equação de regressão, ou seja, da equação do comportamento médio dos dados. Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Análise de Resíduos do Exemplo Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 Um investigador deseja estudar a possível relação entre o salário (em mil reais) e o tempo de experiência (em anos) no cargo de gerente de agências bancárias de uma grande empresa. Os dados são mostrados na figura abaixo. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) As figuras a seguir mostram o histograma da variável salário em (a) e os boxplot das variáveis (b) salário e (c) experiência. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Algumas estatísticas descritivas dessas variáveis são mostradas abaixo: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Ajustou-se um modelo de regressão, conforme se vê no sumário a seguir. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Foram calculados os intervalos de confiança para os coeficientes da reta de regressão, a um nível de confiança de 95% e os resultados são: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Também foram gerados os gráficos para análise dos resíduos do modelo de regressão e efetuado um teste de normalidade dos resíduos, cujos resultados são: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Por fim, foi ajustado um modelo ANOVA para a reta de regressão linear estimada. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Usando as informações anteriores, responda: a) O que se conclui após a análise exploratória dos dados? b) Quais são as estimativas dos coeficientes da reta de regressão? Eles são significativos a um nível de confiança de 95%? Argumente explicando a região crítica, o p-valor e os intervalos de confiança. c) O que se conclui sobre o coeficiente de determinação? E sobre o coeficiente de determinação ajustado? d) Quais as conclusões sobre o comportamento dos resíduos do modelo? e) Existem evidências que sugerem que o modelo foi mal ajustado (isto é, algum indício de violação nas suposições iniciais do modelo de regressão linear simples)?
Envie sua pergunta para a IA e receba a resposta na hora
Recomendado para você
16
Slide - Revisão - Estatística 2 - 2024-1
Estatística 2
UFMG
42
Slide - Aula 22 - Regressão Linear Simples - Estatística 2 - 2024-1
Estatística 2
UFMG
5
Lista - Regressão Linear Simples 2021-2
Estatística 2
UFMG
1
Exercícios - Estatística 2 2021 2
Estatística 2
UFMG
58
Projeto - Estatística 2 - 2024-1
Estatística 2
UFMG
21
Lista - Estatística 2 2021-2
Estatística 2
UFMG
40
Slide - Aula 15 - Teste Qui-quadrado de Indepenência - 2024-1
Estatística 2
UFMG
7
Prova - Estatística 2 - 2023-1
Estatística 2
UFMG
3
Prova - Estatística 2 - 2023-2
Estatística 2
UFMG
21
Lista - Estatística 2 2021 2
Estatística 2
UFMG
Texto de pré-visualização
Cássius Henrique EST002 – Estatística II Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Modelo de Regressão Linear Simples Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b0 Não é com frequência que fazemos inferências sobre b0. • Isso só ocorre quando a variável x pode assumir o valor x = 0. Suponha que desejamos testar a hipótese de que o intercepto é igual a um determinado valor, denotado por b00. Desta forma, sejam as hipóteses: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b0 Já sabemos que Sob Ho temos: e que Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b0 Como as variáveis aleatórias No e c são independentes, segue que : Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b0 Estatística de Teste: Critérios de Rejeição: Iguais aos do teste T. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência Intervalar para b0 Intervalo de Confiança para b0 : Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b1 Inferência sobre b1 é mais frequente já que por meio deste parâmetro temos um indicativo da existência ou não de associação linear entre as variáveis envolvidas. Similarmente ao parâmetro b0, consideremos as hipóteses Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b1 Já sabemos que Sob Ho temos: e que Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b1 Como as variáveis aleatórias N1 e c são independentes, segue que : Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência para b1 Estatística de Teste: Critérios de Rejeição: Iguais aos do teste T. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Inferência Intervalar para b1 Intervalo de Confiança para b1 : Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 Verifique se os parâmetros do modelo do Exemplo (da aula anterior) são significativos e construa o intervalo de confiança para eles. Use um nível de significância de 5%. 220 225 230 235 120 125 130 135 Dureza ~Temperatura Temperatura Dureza Gastos Receitas Gastos ~ Receitas Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Teste para b0 Já calculados Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Teste para b1 Já calculados Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Resultados do R Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 – Resultados do R 2.5 % 97.5 % (Intercept) 335.260963 393.0990373 Receitas -1.159078 -0.9049217 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 1 Gastos = 364,2 – 1,032 * Receitas Gastos Receitas Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Para avaliarmos a significância do modelo como um todo utilizamos a análise de variância (ANOVA). • Para isso, consideremos o "Modelo de Regressão Linear Simples" com a suposição de que os erros tem distribuição Normal. A análise de variância é baseada na decomposição da soma de quadrados e nos graus de liberdade associados a variável resposta Y. • Em palavras, o desvio de uma observação em relação à média pode ser decomposto como o desvio da observação em relação ao valor ajustado pela regressão mais o desvio do valor ajustado em relação à média. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Soma de Quadrados em que Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Soma de Quadrados equivale a Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II SQTotais Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II SQResíduos Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II SQRegressão Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Partição dos Graus de Liberdade ▪ Assim como há uma decomposição da soma de quadrados total, existe uma decomposição dos graus de liberdade associados (abreviados por gl). ▪ A decomposição é a seguinte: • gl da SQT: (n – 1) • gl da SQR: 1 • gl da SQE: (n – 2) Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Quadrado Médio A divisão da soma de quadrados pelos respectivos graus de liberdade é o quadrado médio. A decomposição é a seguinte: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Tabela Anova e Teste F Critérios de Rejeição: Iguais ao Teste F Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II ANOVA para validação do Modelo Linear Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Considere novamente o exemplo ▪ Deseja-se verificar se há relação entre os gastos e as receitas anuais de uma empresa. ▪ As rendas foram pré-estabelecidas por contrato (com validade de 5 anos) e esses valores são: R1 = R$ 220 000,00 R2 = R$ 225 000,00 R3 = R$ 230 000,00 R4 = R$ 235 000,00 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exemplo Observação Gastos (x1000) em R$ Receitas (x1000) em R$ 1 137 220 2 137 220 3 137 220 4 136 220 5 135 220 6 135 225 7 133 225 8 132 225 9 133 225 10 133 225 11 128 230 12 124 230 13 126 230 14 129 230 15 126 230 16 122 235 17 122 235 18 122 235 19 119 235 20 122 235 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exemplo 220 225 230 235 120 125 130 135 Dureza ~ Temperatura Temperatura Dureza Gastos Receitas Gastos ~ Receitas Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 Para o problema apresentado no Exemplo, construa a tabela ANOVA para verificar se a variável explicativa tem correlação com a variável resposta. 220 225 230 235 120 125 130 135 Dureza ~Temperatura Temperatura Dureza Gasto s Receitas Gastos ~ Receitas Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 2 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação Uma das formas de avaliar a qualidade do ajuste do modelo é através do coeficiente de determinação. • Basicamente, este coeficiente indica quanto o modelo foi capaz de explicar os dados coletados. O coeficiente de determinação é dado pela expressão Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação Ou seja, é a razão entre a soma de quadrados da regressão e a soma de quadrados total. No modelo com intercepto, podemos escrever Note que 0 < R² < 1 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação O R² é uma medida descritiva da qualidade do ajuste obtido ➢ Em geral referimo-nos ao R² como a quantidade de variabilidade nos dados que é explicada pelo modelo de regressão ajustado. Entretanto, o valor do coeficiente de determinação depende do número de observações n, tendendo a crescer quando n diminui. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação Embora R² aumente com a adição de termos ao modelo, isto não significa necessariamente que o novo modelo é superior ao anterior. • Na realidade esse novo modelo poderá ser pior do que o anterior. A magnitude de R², também, depende da amplitude de variação da variável regressora (x). Geralmente, R² aumentará com maior amplitude de variação dos x's e diminuirá em caso contrário. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Coeficiente de Determinação Ajustado Quanto maior o R²ajustado, mais a variável resposta é explicada pela regressora X. p é o número de coeficientes Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 3 Calcule o coeficiente de determinação e o coeficientes de determinação ajustado para os dados do Exemplo e apresente conclusões sobre o modelo quando à qualidade do ajuste. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 3 – Solução Calcule o coeficiente de determinação e o coeficientes de determinação ajustado para os dados do Exemplo e apresente conclusões sobre o modelo quando à qualidade do ajuste. Modelo bem ajustado! Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 3 – Solução Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Análise de Resíduos ▪ Comportamento ideal dos resíduos, caso todas as suposições iniciais do modelo estejam corretas Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Análise de Resíduos ▪ Comportamento dos resíduos em uma condição de heterocedasticidade dos mesmos. ▪ Neste exemplo (da figura), a variância dos resíduos é proporcional à resposta média Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Análise de Resíduos ▪ Comportamento dos resíduos em uma condição na qual os erros são homocedásticos, mas a resposta média dos dados é não linear. Neste caso, o comportamento anormal dos resíduos reflete a má especificação da equação de regressão, ou seja, da equação do comportamento médio dos dados. Fonte: COSTA, 2018 Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Análise de Resíduos do Exemplo Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 Um investigador deseja estudar a possível relação entre o salário (em mil reais) e o tempo de experiência (em anos) no cargo de gerente de agências bancárias de uma grande empresa. Os dados são mostrados na figura abaixo. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) As figuras a seguir mostram o histograma da variável salário em (a) e os boxplot das variáveis (b) salário e (c) experiência. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Algumas estatísticas descritivas dessas variáveis são mostradas abaixo: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Ajustou-se um modelo de regressão, conforme se vê no sumário a seguir. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Foram calculados os intervalos de confiança para os coeficientes da reta de regressão, a um nível de confiança de 95% e os resultados são: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Também foram gerados os gráficos para análise dos resíduos do modelo de regressão e efetuado um teste de normalidade dos resíduos, cujos resultados são: Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Por fim, foi ajustado um modelo ANOVA para a reta de regressão linear estimada. Aula 23 Regressão linear simples: teste de significância da regressão e análise de resíduos Cássius Henrique EST002 – Estatística II Exercício 4 (continuação) Usando as informações anteriores, responda: a) O que se conclui após a análise exploratória dos dados? b) Quais são as estimativas dos coeficientes da reta de regressão? Eles são significativos a um nível de confiança de 95%? Argumente explicando a região crítica, o p-valor e os intervalos de confiança. c) O que se conclui sobre o coeficiente de determinação? E sobre o coeficiente de determinação ajustado? d) Quais as conclusões sobre o comportamento dos resíduos do modelo? e) Existem evidências que sugerem que o modelo foi mal ajustado (isto é, algum indício de violação nas suposições iniciais do modelo de regressão linear simples)?