·

Administração ·

Estatística 2

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

Regressão Linear Simples Análise da Qualidade do Ajuste e Inferência para os Parâmetros do Modelo Professor Guilherme Lopes de Oliveira guilhermeoliveiracefetmgbr Departamento de Computação Centro Federal de Educação Tecnológica de Minas Gerais CEFETMG As Fontes de Variabilidade de Y A Análise de Regressão trabalha com a ideia de que a variabilidade total da variável resposta Y é o resultado de duas fontes de variação Figura Representação dos desvios Bussab e Morettin 2010 Quando os termos SQTotal SQreg OU SQres tiverem que ser cal culados as seguintes formulas alternativas podem ser utilizadas para facilitar os cAlculos n 2 SQTotal S yi y Sw i1 SQres SQ Total Bi Sxy SQReg SQTotal SQRes O Coeficiente de Determinacdo Uma medida de qualidade do ajuste comumente utilizada é 0 cha mado coeficiente de determinacdo que mede a proporcdo da variabi lidade total de Y que é explicada pelo modelo de regressdo SQrRe SQr S Re SE Wy ES B tal que R 01 SQTotal SQTotal At Syy 4 Na regressdo linear simples R coincide com o quadrado de R o coeficiente de correlacdo linear de Pearson entre X e Y O Coeficiente de Determinacdo Uma medida de qualidade do ajuste comumente utilizada é 0 cha mado coeficiente de determinacgdo que mede a proporcdo da variabi lidade total de Y que é explicada pelo modelo de regressdo SQRe SQR R SE yy B tal que R 01 SQTotal SQ Total is Syy Na regressdo linear simples R coincide com o quadrado de R o coeficiente de correlacdo linear de Pearson entre X e Y Exemplo 1 aS 102 R 6 0 3333 07249 72 499 Pr Sw 46 9 Yo ou seja 7249 da variabilidade do consumo Y é explicada pelo modelo de regressdo linear simples que tem o peso do carro X como variavel preditora Estimativa para a Variancia do Erro Além de 60 e 1 a variadncia do termo de erro também é um parametro desconhecido denotado por a7 Os residuos ej yj 9 so usados no calculo da estimativa de o a qual é dada por n 2 a2 iat yi y SQRes n2 n2 OMRes A estimativa 6 necessaria no processo de inferéncia para os para metros do modelo e para suas previsGes Estimativa para a Varidncia do Erro Além de 0 1 a variancia do termo de erro também é um pardmetro desconhecido denotado por a7 Os residuos ej yj Yj so usados no calculo da estimativa de o a qual é dada por g2 a i 9 Ses ny n2 n2 A estimativa G é necessaria no processo de inferéncia para os para metros do modelo e para suas previsGes Exemplo 1 Neste caso temos SQres 46 9 0 3333102 129 Com isto a estimativa para a variadncia do erro é dada por SQr 129 a2 es 16125 2 102 Inferência sob o Modelo de Regressão Linear Uma parte importante da verificação da adequação de um mo delo de regressão linear é a realização de testes de hipóteses em relação aos parâmetros do modelo Tais testes tem o objetivo de verificar a significância da relação linear na população tendo como base o modelo estimado com base nos dados da única amostra disponível no estudo Tais procedimentos inferenciais requerem a validade de algumas suposições a respeito do termo de erro aleatório Suposições do Modelo de Regressão Linear Simples Assumese que os erros ϵi são independentes e normalmente distribuídos com média igual a zero Eϵi 0 e variância constante ao longo da reta Varϵi σ2 para i 1 n Figura Suposições sobre o termo de erro Bussab e Morettin 2010 Testes de Hipdteses para a Inclinacdo 1 Em especial temse interesse em testar se a relacdo linear entre Y e X é significativa na populacdo ou seja testar as hipdteses Ho By 0 Hy By x 0 Podese utilizar a estatistica de teste By 0 B Tobs i V57Sxx ep31 Sob Ho e sob a validade das suposies feitas para o termo de erro a distribuicdo amostral da estatistica Top 6 uma distribuicdo tStudent com n 2 graus de liberdade Exemplo 1 Vamos testar a significancia da relado linear ou seja Ho 31 0 Hy By 0 Temos 3 0 33 Tobs Ar 83 4 546 VG7Sx v1 6125306 Entdo valor p 2Ptg 4546 0005 Portanto Ho deve ser rejeitada com a 5 de significancia Existem evidéncias de que a relacdo linear entre X e Y é significativa na populacao Testes de Hipoteses para o Intercepto J Podemos também estar interessados em testar se a reta passa pela origem ou ndo ou seja testar as seguintes hipdoteses Ho Bp 0 Hy Bo 0 Podese utilizar a estatistica de teste Bo 0 Bo T obs ooo ep So a2 1 x2 EP Po VO lets Sob Ho e sob a validade das suposies feitas para o termo de erro a distribuicdo amostral da estatistica Tp 6 uma distribuicdo tStudent com n 2 graus de liberdade Exemplo 1 Vamos testar a significancia do intercepto ou seja Ho Bo 0 Hy Bo 0 Temos i 39 13 Tobs fo SL 17118 o22 2 161254 S Entdo valor p 2Ptg 17118 0 Portanto Ho deve ser rejeitada com a 5 de significancia Existem evidéncias de que 0 intercepto é significativo na populacdo e portanto deve ser mantido no modelo A Tabela da Analise de Variancia ANOVA Fonte de Somade Grausde Quadrados Variagao Quadrados Liberdade Médios Fy Regresso SQheg 1 QMpreg QMpegQMpes Residuos SQres n2 QMpes Total SQ rota n1 onde QMreg Seg e QMres SOs Sob as suposicdes do modelo a estatistica de teste Fp segue uma distribuicdo F de Fisher Snedecor com 1 e n 2 graus de liberdade Na regressdo linear simples a estatistica Fo fornece um procedimento equivalente ao teste t para testar as hipdteses Ho Bi 0 Hy By 0 Exercício Freund 2006 A tabela a seguir mostra há quantas semanas seis pessoas estam trabalhando num posto de inspeção de automóveis e quantos carros cada uma inspecionou entre o meio dia e as 14h em um determi nado dia Calcule e interprete o coeficiente de determinação neste problema Teste a significância dos coeficientes β0 e β1 usando 5 de significância Exercício Montgomery e Runger 2012 Considere os dados abaixo em que y é a pureza do oxigênio produ zido em um processo químico de destilação e x é a porcentagem de hidrocarbonetos presentes no condensador principal da unidade de destilação Calcule e interprete o coeficiente de determinação neste problema Teste a significância dos coeficientes β0 e β1 usando 5 de significância