·

Administração ·

Estatística Aplicada para Finanças

Send your question to AI and receive an answer instantly

Ask Question

Preview text

MANA6510 Métodos de Pesquisa e Previsão Regressão Linear Simples Método dos Mínimos Quadrados Testes dos Coeficientes Regressão Linear Múltipla Métodos Stepwise Fábio Gerab 6 ciclo Curso de Administração da FEI Regressão Linear Simples e Múltipla X Y X Y X Y Correlação Linear entre duas variáveis aleatórias Representa a capacidade de uma variável prever o valor da outra variável por uma relação linear equação de uma reta Baixa Correlação Linear Alta Correlação Linear Positiva Negativa Modelos de Regressão Pergunta Qual é a relação entre as variáveis Slide 3 Propaganda Vendas Propaganda Vendas Propaganda Vendas Propaganda Vendas Qual é o mais lógico Tipos de modelo de regressão 2 ou mais variáveis explanatórias Múltiplo Simples 1 variável explanatória Modelo de regressão Linear Não linear Linear Não linear Slide 4 Modelo de Regressão Linear A relação entre as variáveis é uma função linear Variável resposta dependente Variável explanatória independente Coeficiente linear Declive da população População yintercepta Erro aleatório y x 0 1 O modelo de RL possui dois componentes Determinístico Aleatório y β0 yintercepta x Mudar em y Mudar em x β1 Declive Linha das médias Slide 6 Modelo de Regressão Linear Simples População linear Modelo de regressão y x 0 1 i i i y x 0 1 E y x Valor observado Valor observado i Erro aleatório Slide 7 Amostra linear Modelo de regressão y x 0 1 ˆ ˆ ˆ i i i y x 0 1 ˆ ˆ ˆi i y x Observação sem amostra i Erro aleatório Valor observado Slide 8 O desafio do modelo de Regressão Linear é partindose de uma amostra Determinar qual a melhor reta que descreva a relação entre x e y 0 20 40 60 0 20 40 60 x y Slide 9 Como você faria uma linha por meio dos pontos Como você determina qual linha encaixa melhor A Melhor Reta Ajustada é aquela para a qual a diferença global entre os valores reais e os valores preditos de y são mínimas O Método dos Mínimos Quadrados minimiliza a soma das diferenças ao quadrado 2 2 1 1 ˆ ˆ n n i i i i i y y Slide 10 Método dos Mínimos quadrados graficamente Calculase a soma dos erros elevados ao quadrado 2 y x 1 3 4 2 0 1 2 2 ˆ ˆ ˆ y x 0 1 ˆ ˆ ˆi i y x 2 2 2 2 2 1 2 3 4 1 ˆ ˆ ˆ ˆ ˆ LS minimizes n i i Minimiza As equações que fornecem os coeficientes da reta 1 1 1 1 2 1 2 1 ˆ n n i i n i i i i xy i n xx i n i i i x y x y SS n SS x x n Declive yintercepta constante 0 1 ˆ ˆ ˆy x Equação de previsão 0 1 ˆ ˆ y x Slide 11 A solução do Método dos Mínimos Quadrados fornece a melhor reta São Encontrase matematica mente os parâmetros beta tal que e tornam mínima a soma dos erros ao quadrado Tabela de Cálculo xi 2 x1 2 x2 2 xn 2 Σxi 2 yi y1 y2 yn Σyi xi x1 x2 xn Σxi 2 2 2 2 2 yi y1 y2 yn Σyi xiyi Σxiyi x1y1 x2y2 xnyn Slide 12 As calculadoras costumam armazenar Sx y Sx2 y2 Sxy n Para o cálculo de Sx Sy e r A solução do Método dos Mínimos Quadrados fornece a melhor reta Você é um analista de marketing para Toys Shop Propaganda Vendas unidades 1 1 2 1 3 2 4 2 5 4 Calcule os Coeficientes que definem a reta resultante da Regressão Linear Slide 13 Exemplo da Regressão Linear entre e unidades Diagrama de dispersão vendas vs publicidade 0 1 2 3 4 0 1 2 3 4 5 Vendas Publicidade Slide 14 Exemplo da Regressão Linear entre e unidades Parâmetros estimados Tabela de solução 2 2 1 1 1 1 1 2 1 4 1 2 3 2 9 4 6 4 2 16 4 8 5 4 25 16 20 15 10 55 26 37 xi yi xi yi xiyi Slide 15 Parâmetros estimados Solução de estimação 1 1 1 1 2 2 1 2 1 15 10 37 5 ˆ 70 15 55 5 n n i i n i i i i i n i n i i i x y x y n x x n ˆ 01 07 y x 0 1 ˆ ˆ 2 070 3 010 y x Slide 16 Linha de regressão encaixada nos dados 0 1 2 3 4 0 1 2 3 4 5 Vendas Publicidade ˆ 1 7 y x Slide 17 Regressão linear Suposições de regressão 1 Média de probabilidade de distribuição de erro aleatório ε é 0 2 Probabilidade de distribuição de erro tem uma variação constante 3 Probabilidade de distribuição de erro ε é normal 4 Erros são idependentes Slide 18 Erro Probabilidade de distribuição x1 x2 x3 y Ey β0 β1x x Slide 19 Probabilidade de distribuição de erro aleatório A dispersão dos erros em torno da média é independente das variáveis homocedasticidade Medidas de variação y x xi 0 1 ˆ ˆ ˆi i y x yi ˆ 2 i i y y Soma inexplicável dos quadrados 2 iy y Soma total dos quadrados 2 ˆ iy y Soma explicável dos quadrados y Slide 20 S2 é a Estimativa de σ2 referente à regressão 2 2 ˆ 2 i i SSE s where SSE y y n 2 2 SSE s s n onde Slide 21 Calculando SSE s2 s exemplo Você é um analista de marketing para Hasbro Toys e reuniu as seguintes informações Propaganda Vendas unidade 1 1 2 1 3 2 4 2 5 4 Encontre SSE s2 e s Slide 22 Calculando SSE solução 1 1 2 1 3 2 4 2 5 4 xi yi 06 13 2 27 34 ˆ y y 04 03 0 07 06 ˆ 2 y y ˆ 01 07 y x 016 009 0 049 036 SSE11 Slide 23 Calculando s2 e s solução 2 11 036667 2 5 2 SSE s n 036667 06055 s Slide 24 Teste do coeficiente Linear Mostra se há uma relação linear entre x e y Envolve o declive da população 1 Hipóteses H0 1 0 Não há relação linear Ha 1 0 Há relação linear Base teórica é a distribuição amostral do declive Slide 25 Coeficiente do declive teste estatístico 1 1 1 ˆ 2 1 2 1 ˆ ˆ 2 onde xx n i n i xx i i t df n s S SS x SS x n Slide 26 Teste de coeficiente linear de declive exemplo Você é um analista de marketing para Hasbro Toys e acha β0 01 β1 07 e s 06055 Propaganda Vendas unidades 1 1 2 1 3 2 4 2 5 4 A relação ao nível 005 de significância é significante Slide 27 Teste de coeficiente Linear de declive solução H0 Ha df Valores críticos Teste de estatística Decisão Conclusão t 0 3182 3182 0025 Rejeitado H0 Rejeitado H0 0025 1 0 1 0 005 5 2 3 Slide 28 Tabela de solução xi yi xi 2 yi 2 xiyi 1 1 1 1 1 2 1 4 1 2 3 2 9 4 6 4 2 16 4 8 5 4 25 16 20 15 10 55 26 37 Slide 29 Teste de estatística solução 1 1 ˆ 2 1 ˆ 06055 01914 15 55 5 ˆ 070 3657 01914 xx S S SS t S Slide 30 Teste de coeficiente de declive solução H0 1 0 Ha 1 0 005 df 5 2 3 Valores críticos Teste estatística Decisão Conclusão 1 1 ˆ ˆ 070 3657 01914 t S Rejeitado 005 Há evidência de uma relação t 0 3182 3182 0025 Rejeitado H0 Rejeitado H0 0025 Slide 31 Outro exemplo de Regressão Linear Você é um economista para a cooperativa do município e junta as seguintes informações Fertilizante lb Produção lb 4 30 6 55 10 65 12 90 Encontre os Coeficientes que definem a reta resultante da Regressão Linear Diagrama de dispersão colheita versus fertilizante 0 2 4 6 8 10 0 5 10 15 Colheita lb Fertilizante lb Slide 33 Parâmetro estimado Tabela de solução 4 30 16 900 12 6 55 36 3025 33 10 65 100 4225 65 12 90 144 8100 108 32 240 296 16250 218 xi 2 yi xi yi xiyi 2 Slide 34 Parâmetro estimado solução 1 1 1 1 2 2 1 2 1 32 24 218 4 ˆ 065 32 296 4 n n i i n i i i i i n i n i i i x y x y n x x n 0 1 ˆ ˆ 6 065 8 080 y x ˆ 08 065 y x Slide 35 Interpretação de coeficientes solução Slide 36 2 Yintercepta 0 É esperado que a média da colheita y seja 08 lb quando nenhum fertilizante x é usado 1 Declive 1 É esperado que a colheita y aumente 065 lb para cada lb que aumentar em fertilizante x ˆ 08 065 y x Esperase que cada aumento de 1 lb no uso de fertilizante resulte em um aumento de 065 lb na produção 2 Yintercepta 0 É esperado que a média da colheita y seja 08 lb quando nenhum fertilizante x é usado 1 Declive 1 É esperado que a colheita y aumente 065 lb para cada lb que aumentar em fertilizante x Quando nenhum fertilizante for aplicado esperase uma produção total de 08 lb Linha de regressão encaixada nos dados Colheita lb Fertilizante lb 0 2 4 6 8 10 0 5 10 15 ˆ 08 065 y x Slide 37 Sugestão Verifique se o coeficiente linear é significativo MANA6510 REGRESSÃO LINEAR MÚLTIPLA RLM Análise Multivariada Possibilita estudos de situações em que todas as variáveis sejam aleatórias e interrelacionadas de modo que seus efeitos não possam se interpretados de forma separada Análise de múltiplas variáveis em um único relacionamento ou conjunto de relações Fábio Gerab A Análise Multivariada possibilita extrair informações de bases de dados com alta complexidade MANA6510 Regressão Linear Múltipla Fábio Gerab Quantas variáveis são analisadas simultaneamente Análise Univariada Análise Bivariada Análise Multivariada Uma Mais de duas Duas Exemplos Exemplos Exemplos Testes de Hipótese para Uma Média Uma Proporção Uma variância Comparação de duas médias ou variâncias Correlação Linear Regressão Linear Simples Teste de independência de duas variáveis Técnicas de Dependência Técnicas de Interdependência A Regressão Linear Múltipla é uma Análise Multivariada de fámília das técnicas de DEPENDÊNCIA MANA6510 Dependência e Independência de Variáveis aleatórias Fábio Gerab O objetivo das técnicas de dependência é a previsão das variáveleis dependentes pelas variáveleis independentes Técnicas de Dependência Classificação de técnicas estatísticas diferenciadas por terem uma ou um conjunto de variáveis identificadas como as variáveleis dependentes e as variáveleis remanescentes como independentes MANA6510 Regressão Linear Múltipla A RLM é uma das principais técnicas Multivariadas para análise de Dependência entre variáveis aleatórias Modelo Regressão Linear Múltipla A relação entre 1 váriavel dependente e 2 ou mais variáveis independentes é uma função linear 0 1 1 2 2 k k y x x x Variável resposta dependente Variáveis explanatórias independentes Declives populacionais População Yintercepta Erro aleatório MANA6510 Regressão Linear Múltipla A RLM é uma das principais técnicas Multivariadas para análise de Dependência entre variáveis aleatórias Modelo Regressão Linear Múltipla Suposição para probabilidade de distribuição de ε 1 Média é 0 2 Variação constante σ2 3 Normalmente distribuído 4 Erros são independentes MANA6510 Regressão Linear Múltipla A RLM é uma das principais técnicas Multivariadas para análise de Dependência entre variáveis aleatórias Modelo Regressão Linear Múltipla Exemplo de modelo com 2 variáveis independentes A relação entre 1 váriavel dependente e 2 ou mais variáveis independentes é uma função linear Modelo Supõe nenhuma interação entre x1 e x2 Efeito de x1 em Ey é o mesmo apesar dos valores de x2 0 1 1 2 2 E y x x MANA6510 Regressão Linear Múltipla A RLM é uma das principais técnicas Multivariadas para análise de Dependência entre variáveis aleatórias Modelo bivariado de regressão múltipla populacional Sem interação as variáveis preditoras Xi são independentes y x1 b0 Plano de resposta Observado y ei x2 x1i x2i 0 1 1 2 2 i i i i y x x 0 1 1 2 2 i i E y x x MANA6510 Regressão Linear Múltipla A RLM é uma das principais técnicas Multivariadas para análise de Dependência entre variáveis aleatórias Estimação dos parâmetros do modelo linear Método dos Mínimos quadrados O Melhor Modelo Ajustada é aquele para a qual a diferença global entre os valores reais e os valores preditos de y são mínimas O Método dos Mínimos Quadrados minimaliza a soma das diferenças ao quadrado 2 2 1 1 ˆ ˆ n n i i i i i y y MANA6510 Regressão Linear Múltipla Método dos Mínimos Quadrados para Várias Variáveis A computação possibilitou e tornou acessível o tratamento estatístico de bancos de dados grandes e complexos Muito complicado para fazer a mão Ai MANA6510 ANOVA aplicada à RLM Se S2 Regressão for a variância explicada pelo modelo de regressão e S2 Erro a variância correspondente ao erro de regressão então A Análise de Variância pode ser aplicada à RLM de maneira a se testar se ao menos um dos coeficientes lineares é significativo F S2 Regressão S2 Erro Se F calculado for maior que o F de teste então ao menos um coeficiente linear será significativo MANA6510 ANOVA aplicada à RLM Variâncias S2 Total SQT N 1 S2 Regressão SQR k S2 Erro SQE N k 1 Graus de Liberdade Total N 1 Regressão k Erro N k 1 Estatística a ser testada F S2 Regressâo S2 Erro Para Uma RLM com N observações e k variáveis independentes vem SQT SQR SQE A Análise de Variância pode ser aplicada à RLM de maneira a se testar se ao menos um dos coeficientes lineares é significativo MANA6510 ANOVA aplicada à RLM A Análise de Variância pode ser aplicada à RLM de maneira a se testar se ao menos um dos coeficientes lineares é significativo SQT SQR SQE SQT Yi Yi2 SQE Yi Yi est2 Yi est i 0 1 1 2 2 i i E y x x SQR SQT SQE Coeficiente Múltiplo de Determinação e Coeficiente Múltiplo de Determinação Ajustado R2 representa a parcela do comporta mento de y explicada pela dependência linear com as vaiáveis independentes xi Coeficiente Múltiplo de Determinação R2 fornece a fração da variação em y explica por todos os x variáveis do modelo de RLM em conjunto 2 yy Variação esclarecida SSE R 1 Variação total SS Coeficiente Múltiplo de Determinação Ajustado R2 a Considera o tamanho da amostra n e o número de parâmetros k da RLM Interpretação similar ao R2 SQR SQT R2 a 1 N 1N k 1 1 R2 MANA6510 Regressão Linear Múltipla Exemplo Você trabalha em publicidade para o New York Times e quer achar o efeito de tamanho da propaganda e a circulação do jornal 000 no número de respostas a propaganda 00 Para isso você reuniu as seguintes informações abaixo y x1 x2 Resp Tam Circ 1 1 2 4 8 8 1 3 1 3 5 7 2 6 4 4 10 6 Estime os parâmetros da regressão linear múltipla MANA6510 Regressão Linear Múltipla Exemplo Você trabalha em publicidade para o New York Times e quer achar o efeito de tamanho da propaganda e a circulação do jornal 000 no número de respostas a propaganda 00 Para isso você reuniu as seguintes informações abaixo Estime os parâmetros da regressão linear múltipla y x1 x2 Resp Tam Circ 1 1 2 4 8 8 1 3 1 3 5 7 2 6 4 4 10 6 Como o nível de significância é menor que 005 ao menos um coeficiente i é significativo Assim podemos continuar o modelo de RLM MANA6510 Regressão Linear Múltipla Exemplo Você trabalha em publicidade para o New York Times e quer achar o efeito de tamanho da propaganda e a circulação do jornal 000 no número de respostas a propaganda 00 Para isso você reuniu as seguintes informações abaixo Estime os parâmetros da regressão linear múltipla Parâmetros estimativos com o auxílio computacional aplicando o Método dos Mínimos Quadrados y x1 x2 Resp Tam Circ 1 1 2 4 8 8 1 3 1 3 5 7 2 6 4 4 10 6 Parâmetros estimativos Parâmetro padrão T para H0 Variável DF Estimada Erro Param0 ProbT INTERCEP 1 00640 02599 0246 08214 TAMPROP 1 02049 00588 3656 00399 CIRC 1 02805 00686 4089 00264 0 2 1 1 2 ˆ 00640 02049 02805 y x x MANA6510 Regressão Linear Múltipla Exemplo Você trabalha em publicidade para o New York Times e quer achar o efeito de tamanho da propaganda e a circulação do jornal 000 no número de respostas a propaganda 00 Para isso você reuniu as seguintes informações abaixo Estime os parâmetros da regressão linear múltipla y x1 x2 Resp Tam Circ 1 1 2 4 8 8 1 3 1 3 5 7 2 6 4 4 10 6 1 2 ˆ 00640 02049 02805 y x x Interpretação dos coeficientes 1 Declive 1 É esperado que o número de respostas para essa propaganda cresça por 02049 para cada 100 polegadas quadradas que a propaganda crescer em tamanho mantendose a circulação constante 2 Declive 2 É esperado que o número de respostas para essa propaganda cresça por 02805 a cada unidade 1000 que crescer em circulação segurando o tamanho da propaganda constante Coeficiente Múltiplo de Determinação e Coeficiente Múltiplo de Determinação Ajustado R2 representa a parcela do comporta mento de y explicada pela dependência linear com as vaiáveis independentes xi 2 yy Variação esclarecida SSE R 1 Variação total SS SQR SQT R2 a 1 N 1N k 1 1 R2 Como R2 a 0956 isto significa que o modelo linear múltiplo explicou 956 da variabilidade das vendas MANA6510 Regressão Linear Múltipla Exemplo Parâmetros estimativos Parâmetro padrão T para H0 Variável DF Estimada Erro Param0 ProbT INTERCEP 1 00640 02599 0246 08214 TAMPROP 1 02049 00588 3656 00399 CIRC 1 02805 00686 4089 00264 1 2 ˆ 00640 02049 02805 y x x São todos os i significativos Prob T corresponde ao p value associado ao coeficiente i em um teste de significância t de student Assim para um teste ao nível de significância quando este valor for superior a o correspondente i não será estatisticamente significativo Assim ao nível de significância de 5 005 As inclinações 1 02049 cujo pvalue é 00399 é significativa 2 02805 cujo pvalue é 00264 é significativo A constante 0 00640 cujo pvalue é 08214 não é significativa MANA6510 Regressão Linear Múltipla Exemplo Parâmetros estimativos Parâmetro padrão T para H0 Variável DF Estimada Erro Param0 ProbT INTERCEP 1 00640 02599 0246 08214 TAMPROP 1 02049 00588 3656 00399 CIRC 1 02805 00686 4089 00264 1 2 ˆ 00640 02049 02805 y x x Obs Poderíamos repetir o ajuste sem o termo constante Isto é fixando constante 0 0 MULTICOLINEARIDADE na RLM Fábio Gerab Na RLM quando duas ou mais variáveis são fortemente correlacionadas O modelo falha em definir os coeficientes i a elas associadas Duas variáveis fortemente correlacionadas tendem a ser proporcionais Quando este efeito ocorre dizemos que as variáveis apresentam forte multicolinearidade Multicolinearidades elevadas podem resultar em ambiguidades na solução do melhor modelo de Regressão Linear dificultando a determinação da importância relativa dos coeficientes Em uma RLM devemos evitar multicolinearidades elevadas MANA6510 REGRESSÃO LINEAR MÚLTIPLA RLM A multicolinearidade entre as variáveis independentes pode ser avaliada antes e depois do modelo de regressão Antes da RLM Correlações lineares muito elevadas apontam para a presença de multicolinearidade Depois da RLM O indicador de multicolinearidade Variance Inflaction Factor VIF deve ser inferior a 10 na prática VIF 5 já podem produzir problemas de multicolinearidade Onde VIF 1T T 1 Rk 2 T é chamado de Tolerância sendo Rk 2 é o coeficiente de ajuste da regressão da variável k com as demais variáveis explicativas MANA6510 Regressão Linear Múltipla Exemplo Você trabalha em publicidade para o New York Times e quer achar o efeito de tamanho da propaganda e a circulação do jornal 000 no número de respostas a propaganda 00 Para isso você reuniu as seguintes informações abaixo Estime os parâmetros da regressão linear múltipla y x1 x2 Resp Tam Circ 1 1 2 4 8 8 1 3 1 3 5 7 2 6 4 4 10 6 1 2 ˆ 00640 02049 02805 y x x Resp Tam Circ Pearson Correlation Resp 1000 909 931 Tam 909 1000 741 Circ 931 741 1000 Análise de Multicolinearidade A presença de correlação moderada entre as variáveis independentes pode indicar uma multicolinearidade forte na RLM MANA6510 Regressão Linear Múltipla Exemplo Você trabalha em publicidade para o New York Times e quer achar o efeito de tamanho da propaganda e a circulação do jornal 000 no número de respostas a propaganda 00 Para isso você reuniu as seguintes informações abaixo Estime os parâmetros da regressão linear múltipla y x1 x2 Resp Tam Circ 1 1 2 4 8 8 1 3 1 3 5 7 2 6 4 4 10 6 1 2 ˆ 00640 02049 02805 y x x Model Unstandardized Coefficients Standardized Coefficients t Sig Collinearity Statistics B Std Error Beta Tolerance VIF 1 Constant 064 260 246 821 Tam 205 059 486 3484 040 451 2219 Circ 280 069 571 4089 026 451 2219 Análise de Multicolinearidade Como o Variance Inflaction Factor para as variáveis independentes é menor que 10 aceitase o resultado da RLM como viável quando a multicilinearidade MANA6510 Regressão Linear Múltipla Exemplo Você trabalha em publicidade para o New York Times e quer achar o efeito de tamanho da propaganda e a circulação do jornal 000 no número de respostas a propaganda 00 Para isso você reuniu as seguintes informações abaixo Estime os parâmetros da regressão linear múltipla y x1 x2 Resp Tam Circ 1 1 2 4 8 8 1 3 1 3 5 7 2 6 4 4 10 6 1 2 ˆ 00640 02049 02805 y x x Model Unstandardized Coefficients Standardized Coefficients t Sig Collinearity Statistics B Std Error Beta Tolerance VIF 1 Constant 064 260 246 821 Tam 205 059 486 3484 040 451 2219 Circ 280 069 571 4089 026 451 2219 Importância Relativa dos Coeficientes Como os coeficientes i são afetados pela escala de medição a sua importância real para a explicação da variável dependente é dada pelos coeficientes padronizados Standardized Coefficients Da tabela acima percebese que a Circulação tem efeito maior sobre as vendas que o tamanho da propaganda MANA6510 Regressão Linear Múltipla Os Métodos Stepwise permitem definir passo a passo quais são as variáveis independentes significativas que devem permanecer no modelo de RLM Os métodos Stepwise podem ser caracterizados por duas principais abordagens Método STEPWISE Método STEPWISE FOWARD SELECTION Método STEPWISE BACKWARD ELININATION Fábio Gerab Métodos STEPWISE 6 ciclo Curso de Administração da FEI MANA6510 Regressão Linear Múltipla Método STEPWISE As Variáveis Independentes são adicionadas ao modelo uma a uma a partir da mais significante segundo as probabilidades da distribuição F A inclusão cessa quando as variáveis deixam de ser significativas Fábio Gerab 06 de agosto de 2012 Métodos STEPWISE A computação possibilitou e tornou acessível o tratamento estatístico de bancos de dados grandes e complexos MANA6510 Regressão Linear Múltipla Método STEPWISE FOWARD As Variáveis Independentes são adicionadas ao modelo uma a uma a partir da mais fortemente correlacionada com a variável dependente A inclusão cessa quando as variáveis deixam de ser significativas Fábio Gerab 06 de agosto de 2012 Métodos STEPWISE A computação possibilitou e tornou acessível o tratamento estatístico de bancos de dados grandes e complexos MANA6510 Regressão Linear Múltipla Método STEPWISE BACKWARD Método STEPWISE BACKWARD ELININATION Todas as Variáveis Independentes são inicialmente inseridas no modelo de RLM As Variáveis Independentes são então excluídas do modelo uma a uma a partir da variável não significativa mais fracamente correlacionada com a variável dependente A exclusão cessa quando todas as variáveis sobreviventes no modelo são estatisticamente significativas Fábio Gerab 06 de agosto de 2012 Métodos STEPWISE A computação possibilitou e tornou acessível o tratamento estatístico de bancos de dados grandes e complexos MANA6510 Regressão Linear Múltipla Exemplos Reais Fábio Gerab Fábio Menezes de Ávila UFRGS 2010 Modelo de precificação de imóveis a partir das suas características utilizando RLM MANA6510 Regressão Linear Múltipla Exemplos Reais Fábio Gerab Modelo de precificação de imóveis a partir das suas característic as utilizando RLM Exemplo 1 Fábio Gerab Modelo de precificação de imóveis a partir das suas característic as utilizando RLM 1 Variável Dependente VALOR e 22 Variáveis independentes Exemplo 1 Fábio Gerab Modelo de precificação de imóveis a partir das suas característic as utilizando RLM Exemplo 1 Fábio Gerab Modelo de precificação de imóveis a partir das suas característic as utilizando RLM Método SETPWISE Exemplo 1 Fábio Gerab Modelo de precificação de imóveis a partir das suas característic as utilizando RLM Modelo de RLM SETPWISE Exemplo 1 Fábio Gerab Modelo de precificação de imóveis a partir das suas característic as utilizando RLM Y VALOR Exemplo 1 Fábio Gerab Modelo de precificação de imóveis a partir das suas característic as utilizando RLM Exemplo 1 Fábio Gerab Rentabilidade de empresas a partir de demonstrativos financeiros MRA Exemplo 2 DETERMINANTS OF FINANCIAL PERFORMANCE IN BRAZILIAN COMPANIES A MULTIRATIO MODEL USING MULTIVARIATE STATISTICAL METHOD Hong Y Ching e Fábio Gerab Principais Fatores Financeiros provenientes da Análise de Componentes Principais que impactam a rentabilidade ROS e suas variáveis representativas 4 MRA DETERMINANTS OF FINANCIAL PERFORMANCE IN BRAZILIAN COMPANIES A MULTIRATIO MODEL USING MULTIVARIATE STATISTICAL METHOD Exemplo 2 PADÃO DE DEPENDÊNCIA DAS NOTAS DE FÍSICA 1 EM FUNÇÃO DAS DEMAIS NOTAS DO PROMEIRO CICLO DE ENGENHARIA DIURNO NA FEI MRA Exemplo 2 O desempenho em Física 1 deve ser influenciados por conhecimentos em Cálculo Geometria Analítica Computação Desenho Sociologia Análise Descritiva N Mean Std Deviation Variance Statistic Statistic Std Error Statistic Statistic MA1110 759 4362319 0971990 26778290 7171 MA1210 759 4794862 0990342 27283883 7444 CC1410 759 6287747 0724851 19969621 3988 FS1110 759 5569829 0744498 20510886 4207 ME1110 759 4691173 0788236 21715876 4716 CS1210 759 6069565 0371713 10240685 1049 Valid N listwise 759 MA1110 Cálculo Diferencial e Integral I MA1210 Cálculo Vetorial e Geometria Analítica CC1410 Introdução à Computação ME1110 Desenho Técnico CS1210 Sociologia FS1110 Física I PADÃO DE DEPENDÊNCIA DAS NOTAS DE FÍSICA 1 EM FUNÇÃO DAS DEMAIS NOTAS DO PROMEIRO CICLO DE ENGENHARIA DIURNO NA FEI MRA Exemplo 2 O desempenho em Física 1 deve ser influenciados por conhecimentos em Cálculo Geometria Analítica Computação Desenho Sociologia Método STEPWISE BACKWARD Física I como variável dependente CS1210 foi excluída na segunda interação como não significativa para explicar Física 1 Modelo1 todas as Variáveis Modelo 2 todas menos CS1210 PADÃO DE DEPENDÊNCIA DAS NOTAS DE FÍSICA 1 EM FUNÇÃO DAS DEMAIS NOTAS DO PROMEIRO CICLO DE ENGENHARIA DIURNO NA FEI MRA Exemplo 2 O desempenho em Física 1 deve ser influenciados por conhecimentos em Cálculo Geometria Analítica Computação Desenho Sociologia Método STEPWISE BACKWARD Física I como variável dependente A Análise de Variância ANOVA aponta para a existência de coeficientes significativos PADÃO DE DEPENDÊNCIA DAS NOTAS DE FÍSICA 1 EM FUNÇÃO DAS DEMAIS NOTAS DO PROMEIRO CICLO DE ENGENHARIA DIURNO NA FEI Modelo de Regressão Múltiplo Física I como variável dependente Física1 1766 0308 Geometria Analítica 0156 Cálculo 1 0177 Computação 0113 Desenho A importância relativa na regressão é dada pelos coeficientes padronizados PADÃO DE DEPENDÊNCIA DAS NOTAS DE FÍSICA 1 EM FUNÇÃO DAS DEMAIS NOTAS DO PROMEIRO CICLO DE ENGENHARIA DIURNO NA FEI Modelo de Regressão Múltiplo Física I como variável dependente Física1 1766 0308 Geometria Analítica 0156 Cálculo 1 0177 Computação 0113 Desenho A importância relativa na regressão é dada pelos coeficientes padronizados Não temos problemas com a Multicolinea ridade pois VIF 10 PADÃO DE DEPENDÊNCIA DAS NOTAS DE FÍSICA 1 EM FUNÇÃO DAS DEMAIS NOTAS DO PROMEIRO CICLO DE ENGENHARIA DIURNO NA FEI Modelo de Regressão Múltiplo Física I como variável dependente Física1 1766 0308 Geometria Analítica 0156 Cálculo 1 0177 Computação 0113 Desenho A Qualidade do ajuste da regressão é dada pelo R2 a O Modelo de RLM explicou 618 do comportamento das notas de Física 1 PADÃO DE DEPENDÊNCIA DAS NOTAS DE FÍSICA 1 EM FUNÇÃO DAS DEMAIS NOTAS DO PROMEIRO CICLO DE ENGENHARIA DIURNO NA FEI Modelo de Regressão Múltiplo Física I como variável dependente Física1 1766 0308 Geometria Analítica 0156 Cálculo 1 0177 Computação 0113 Desenho A normalidade dos resíduos é condição necessária para uma boa RLM A normalidade dos resíduos pode ser comprovada pelo gráfico acima Obrigado Fábio Gerab