·
Ciências Contábeis ·
Estatística 2
Send your question to AI and receive an answer instantly
Recommended for you
3
Lista 3 - Estatística 2 - 2021-1
Estatística 2
UFRJ
2
Teste 1 - Estatística 2 2021 1
Estatística 2
UFRJ
1
Trabalho sobre Regressão Simples
Estatística 2
UFRJ
26
Slide - Inferência Estatística
Estatística 2
UFRJ
3
Lista 3 - Estatística 2 2021-2
Estatística 2
UFRJ
5
Lista - Estatística 2 2021 2
Estatística 2
UFRJ
4
P2 - Estatística 2 2022 1
Estatística 2
UFRJ
5
Lista - Estatística 2 - 2021-1
Estatística 2
UFRJ
6
Lista 2 - Estatística 2 2021-2
Estatística 2
UFRJ
35
Slide - Análise de Regressão Linear - Estatística 2 - 2021-1
Estatística 2
UFRJ
Preview text
Estatística II para Ciências contábeis 20241 Professora Débora Zava Belo Trabalho 2 O trabalho pode ser feito em grupos de até 4 pessoas Este deve ser enviado em dois arquivos um relatório em pdf que será corrigido e o arquivo da análise de dados feito em Excel ou R Um exemplo do relatório pode ser encontrado no arquivo Templatepdf É importante colocar o DRE de todos os integrantes do grupo no relatório Além de informar qual banco de dados foi escolhido O trabalho contará com apresentação em slides em pdf de até 20 minutos por grupo seguindo as datas dos sorteios O relatório deve ser enviado por email até 2359 do dia 0407 quintafeira debora zavadmeufrjbr No email adicione todos os participantes do grupo como destinatários 1 Os bancos de dados foram simulados e com base no arquivo escolhido pedese a Crie definições para cada variável do seu banco de dados Preste atenção nos valores que cada variável assume não diga que uma variável é idade se ela assumir valores ne gativos por exemplo Elabore uma introdução para suas variáveis Diga qual interesse em estudar essas características e qual motivo de utilizar tais variáveis regressoras É possível procurar inspiração na literatura ou inventar problemas fantasiosos Adicione toda essa informação na sua introdução b Para o modelo especifique um modelo de regressão linear múltipla teórico para seus dados escreva a equação do modelo teórico Descreva todos os termos e variáveis do modelo no contexto do problema Descreva como é feito um teste de hipóteses T para um parâmetro e como é elaborado um teste F É importante definir 1 Hipóteses a serem testadas 2 Estatística de teste e sua distribuição 3 Região Crítica 4 Valor observado e 5 Tomada de decisão Escreva as expressões das estatísticas de teste em cada caso e especifique a sua respectiva distribuição c Para sua aplicação apresente suas variáveis Construa um gráfico para representar a relação das variáveis consideradas no estudo e analiseo Ajuste o modelo completo definido na seção anterior e interprete seus resultados Verifique se seus coeficientes são significativos utilizando nível de significância de 5 e seguindo os passos que você definiu na seção anterior d Alguma variável foi não significativa Ajuste outro modelo sem elas Calcule uma medida global de qualidade do ajuste para o modelo final interpretea no contexto do problema e compare graficamente sua variável resposta observada e a estimada Faça gráfico de dispersão entre os valores ajustados e os resíduos padronizados Construa também o QQ Plot dos resíduos padronizados do modelo Com base nestes gráficos existe alguma violação da hipótese de normalidade e homocedasticidade dos erros e Para sua conclusão relembre de forma resumida o que foi feito em todo o relatório Faça as considerações que achar necessárias Estatística II para Ciências Contábeis 20241 1 Desenvolvimento de um modelo baseado em regressão linear múltipla para auxílio em decisões financeiras e de investimento para empresas Nomes dos Alunos 1 INTRODUÇÃO O mundo do investimento vem ganhando espaço com o desenvolvimento de novas tecnologias e plataformas que facilitam a aplicação de um capital com o objetivo de rentabilizálo de modo que o retorno gerado possa ser direcionado para diferentes finalidades dentre elas expandir as receitas O investimento pessoal é comumente empregado para a geração de reservas financeiras e renda fixa e o mesmo pode ser observado para empresas e empreendimentos os quais utilizando do investimento financeiro para expandir suas receitas de forma mais segura bem como aumentar os lucros e criar reservas rentáveis Porém o investimento para empresas deve ser ponderado de acordo com diferentes variáveis que impactam diretamente a receita dentre elas o crescimento econômico despesas índice de produção taxas de juros associadas aos diferentes tipos de investimento e até mesmo a inflação sobre os bens e serviços Dessa forma neste trabalho buscamos desenvolver um modelo baseado em regressão linear múltipla para o auxílio em decisões financeiras para o investimento de empresas considerando as seguintes variáveis crescimento econômico aumento da produção de bens e serviços da empresa taxa de juros custo do financiamento do investimento confiança do consumidor disposição dos consumidores a investir seu capital índice de produção atividade econômica e capacidade produtiva da empresa inflação aumento contínuo e generalizado dos preços dos bens e serviços em uma economia Portanto considerando o banco de dados atribuído a este trabalho o modelo aqui proposto busca relacionar a variável dependente Y aqui denominado como Investimento com as variáveis independentes X1 X2 X3 X4 e X5 acima listadas aqui denominadas como Cresceconomico Taxajuros Confianca Indiceproducao e Inflacao 2 MODELO 21 MODELO DE REGRESSÃO LINEAR MÚLTIPLA Para este estudo utilizamos o modelo de regressão linear múltipla de modo que seja possível predizer a relação e o valor que uma variável dependente Y assume a medida que as variáveis independentes Xi alterem seus valores Então por se tratar de uma regressão linear este modelo propõe estimar o valor de Y a partir de Xi utilizando uma equação linear Dessa forma temos que a regressão linear múltipla pode ser dada pela equação Yb 0b1 X1b2 X 2b3 X 3bnXne Onde b0 interceptação da linha de regressão biXi sendo i ε 1 n coeficiente angular de regressão bi sobre a variável independente Xi e erro do modelo ou resíduo Ao considerar várias variáveis independentes é preciso estimar e ajustar cada coeficiente bi para cada variável independente Xi de modo que o modelo consiga chegar o mais próximo de uma linha reta uma vez que tratamos de uma regressão linear Os coeficientes bi são estimados considerando o efeito que cada variável independente tem sobre a variável independente Dessa forma alguns testes estatísticos se fazem necessários na construção do modelo 22 TESTE DE HIPÓTESE T PARA UM PARÂMETRO Uma vez estimados os coeficientes angulares é necessário averiguar a significância de tais coeficientes e se estes fazem com que sua variável independente tenha uma relação isolada com a variável dependente o que devemos evitar Portanto para o teste de hipóteses t para os coeficientes temos que as hipóteses são H0 bi 0 variável independente tem relação isolada com a variável dependente Ha bi 0 variável independente não tem relação isolada com a variável dependente As hipóteses descritas acima são assim atribuídas uma vez que um estimador ao assumir o valor 0 anula o valor associado a variável independente Dessa forma devemos rejeitar H0 para concluir que o coeficiente é significativo Para isso devemos utilizamos a seguinte estatística de teste t bi Sbi Onde bi N0 Sbi 2 sendo Sbi a variância dos coeficientes Além disso obter um valor de p significativo menor que 005 para um intervalo de confiança de 95 região crítica Ao encontrar uma variável não significativa devemos desconsiderála na construção do modelo 23 TESTE DE HIPÓTESE F Como os coeficientes são estimados de modo a ajustar o comportamento de cada variável independente na predição da variável dependente fazse necessário avaliar se este ajuste foi significativo e se contribui para a predição da variável dependente Dessa forma semelhante as hipóteses do teste t para os parâmetros temos que para o teste de hipótese F do modelo as hipóteses são H0 b1 b2 b3 bn nenhuma variável independente contribui para predição da variável dependente Ha bi 0 onde i ε 1 n as variáveis independentes contribuem para a predição da variável dependente Portanto para concluir que as variáveis independentes são capazes de explicar a variável dependente devemos rejeitar a hipótese nula H0 Para isso utilizamos o teste F de análise de variância considerando uma distribuição F dos parâmetros A estatística F é dada por F SQRegn SQResnk1 Onde SQReg é a soma dos quadrados que representa a variabilidade dos resíduos e SQRes é a soma dos quadrados que representa a variabilidade do modelo de regressão Sendo n o número de variáveis independentes e k o número de variáveis independentes que permaneceram no modelo de regressão A hipótese nula será rejeitada quando obtemos um valor de p significativo que seja menor que 005 ou seja o valor de p deve pertencer a região crítica na curva de distribuição F 3 APLICAÇÃO O modelo de regressão linear múltipla implementado neste trabalho propõe um valor de investimento para empresas considerando algumas variáveis que podem ter impacto direto na decisão financeira e no lucro do capital aplicado Portanto o modelo proposto é capaz de relacionar e predizer a variável dependente Investimento a partir das variáveis independentes X1 Cresceconomico X2 Taxajuros X3 Confianca X4 Indiceproducao X5 Inflacao A base de dados utilizada está disponível no Anexo 1 Inicialmente avaliamos a relação entre as variáveis que foram consideradas neste estudo bem como a distribuição de cada variável Figura 1 Figura 1 Visualização da relação entre as variáveis e suas distribuições Como podemos notar pela Figura 1 existe uma correlação entre as variáveis independentes Cresceconomico Taxajuros e Indiceproducao com a variável dependente Investimento Além disso se notarmos na diagonal do gráfico podemos observar que as distribuições das variáveis se assemelham com a curva de distribuição normal Apesar das variáveis independentes Confianca e Inflacao não apresentarem correlação com a variável dependente Investimento seguimos nossas análises com todas as variáveis de modo que um modelo completo fosse implementado para averiguar a significância de cada coeficiente Dessa forma construímos o modelo utilizando a função lm disponível pela linguagem de programação R o arquivo de análise estará disponível em Trabalho2R e avaliamos se os resíduos seguiam uma distribuição normal Figura 2 A normalidade dos resíduos foi confirmada pelo teste de ShapiroWilk Figura 2 QQ Plot dos resíduos padronizados do modelo completo Pela Figura 2 podemos notar que os resíduos se aproximam da reta indicando que se aproximam de uma distribuição normal Considerando a normalidade dos resíduos seguimos as análise avaliando a significância dos coeficientes estimados pelo modelo Figura 3 Figura 3 Teste t para os coeficientes do modelo completo Podemos notar pela Figura 3 que as variáveis Cresceconomico Taxajuros e Indiceproducao tiveram valor de p menor que 005 enquanto as variáveis Confianca e Inflacao obtiveram valor de p maior que 005 indicando que os coeficiente de Cresceconomico Taxajuros e Indiceproducao são significativos Os resultados observados nas Figuras 1 e 3 corroboraram para concluirmos que as variáveis Confianca e Inflacao não foram significativas e para ajustarmos melhor o modelo retiramos estas variáveis das análises subseguintes Ao ajustarmos o modelo novamente utilizando apenas as variáveis significativas notamos novamente que os resíduos seguem uma distribuição normal Figura 4 Figura 4 QQ Plot dos resíduos padronizados do modelo ajustado Além disso todos os coeficientes se mostraram significativos com valores de p menores que 005 e um valor de R2 de 098 Figura 5 Figura 5 Teste t para os coeficientes do modelo ajustado Uma vez ajustado um modelo completo para predizer a variável Investimento e outro modelo ajustado contendo apenas as variáveis significativas para predizer a variável Investimento avaliamos então qual dos dois modelos se mostrou melhor para a nossa aplicação Dessa forma conduzimos uma análise de variância ANOVA nos dois modelos a qual testa as seguintes hipóteses H0 as variáveis removidas não possuem significância Ha as variáveis removidas são significativas Dessa forma ao observarmos um valor de p significativo menor que 005 rejeitamos H0 ou seja o segundo modelo ajustado não se apresentar melhor que o primeiro modelo completo ajustado Figura 6 Figura 6 Análise ANOVA para comparação dos dois modelos ajustados Como observado na Figura 6 o valor de p do teste foi maior que 005 o que indica que não rejeitamos H0 isto é o segundo modelo ajustado se apresenta melhor que o primeiro modelo ajustado contendo todas as variáveis O segundo modelo ajustado indica que a predição do investimento de empresas é dependente das variáveis Cresceconomico Taxajuros e Indiceproducao então por fim avaliamos se o ajuste foi significativo e se estas variáveis são capazes de fato de predizer a variável dependente Investimento Figura 7 Para isso realizamos o teste F de homocedasticidade em que as hipóteses testadas são H0 nenhuma variável contribui para predição de Investimento Ha as variáveis contribuem para a predição de Investimento Figura 7 Teste F de significância do ajuste do modelo Como observado na Figura 7 o valor de p observado foi menor que 005 o que indica que o ajuste foi significativo e que as variáveis independentes contribuem para a predição da variável dependente Investimento ou seja rejeitamos a hipótese nula 4 CONCLUSÃO A regressão linear múltipla tem como objetivo estimar uma variável dependente a partir do comportamento observado das variáveis independentes as quais podem assumir diferentes valores e esta variação implica no valor assumido pela variável estimada E com o intuito de aplicar este modelo a um problema que apresenta uma alta variação das variáveis associadas e necessita de uma precisão na predição aplicamos um modelo de regressão linear múltipla para a predição de investimentos para empresas Dentre as variáveis que influenciam nesta decisão financeira temos as variáveis de crescimento econômico taxa de juros confiança do consumidor índice de produção e inflação porém ao ajustar o modelo de regressão observamos que as variáveis de confiança do consumidor e inflação não apresentaram significância na predição da variável investimento Dessa forma o ajuste de um modelo de regressão linear múltipla com as variáveis de crescimento econômico taxa de juros e índice de produção se mostrou mais apropriado com um valor de significância muito inferior a 005 e valor de R² de 098 indicando que estas variáveis são as principais variáveis que contribuem para predizer o investimento de uma empresa 5 REFERÊNCIAS HANCK C et al Introduction to econometrics with R p 400 2018 McNulty K 2020 peopleanalyticsregressionbook GitHub repository Retrieved from httpsgithubcomkeithmcnultypeopleanalyticsregressionbook nd Entenda as características dos investimentos Portal do Investidor Retrieved from httpswwwgovbrinvestidorptbrinvestirantesdeinvestirentendaas caracteristicasdosinvestimentos nd Como funcionam os investimentos para empresas 4 tipos Blog Agendor Retrieved from httpswwwagendorcombrbloginvestimentosparaempresas nd Regressão linear múltipla no R Tutorial com exemplos DataCamp Retrieved from httpswwwdatacampcompttutorialmultiplelinearregressionrtutorial Anexo 1 Identificador Y X1 X2 X3 X4 X5 1 773762 12 11274 621 14 1189 2 793505 17 1765 558 19 0297 3 773977 14 6359 67 15 2075 4 871665 17 3415 525 15 009 5 839651 15 7477 612 16 1996 6 645313 16 5829 846 11 0735 7 524514 7 4958 721 13 005 8 727514 14 1008 668 16 0474 9 823507 17 3379 463 13 0276 10 860294 17 3572 635 25 3128 11 689092 15 3466 619 15 1323 12 941396 20 5172 549 15 0246 13 894935 16 8325 732 16 0987 14 856289 17 6323 449 12 0812 15 536935 11 6885 768 16 0744 16 1068542 19 10594 442 22 1228 17 885746 17 1712 577 21 0716 18 592597 11 7409 682 8 0294 19 1022796 20 2452 552 23 0224 20 805986 13 9062 566 16 0204 21 714246 13 6142 64 12 1636 22 739699 15 677 65 16 004 23 557491 10 893 485 14 064 24 844282 20 5346 615 18 062 25 717104 14 622 511 19 0509 26 679067 12 4481 596 22 0322 27 63619 14 591 42 15 1114 28 496847 11 2071 583 9 0815 29 584571 11 1373 618 13 0818 30 703559 13 3177 605 21 2203 31 727491 14 023 34 16 0127 32 662979 10 6533 648 15 1094 33 947596 20 1698 673 21 1306 34 80923 17 45 441 16 0001 35 815984 20 4862 76 17 1468 36 787363 17 2271 452 13 1408 37 86037 17 181 816 18 0008 38 835014 13 7608 535 19 0168 39 702043 13 789 679 15 0785 40 660219 13 4427 747 18 1074 41 698436 12 2732 414 17 0413 42 809407 16 7249 486 11 0776 43 828493 16 2561 518 17 0017 44 1035813 20 10151 529 15 0589 45 563013 11 081 506 12 1205 46 695261 15 1527 406 11 1541 47 775639 15 5373 513 12 0022 48 784796 18 3998 454 17 0266 49 787324 10 15788 609 16 06 50 868645 17 6825 551 15 0477 51 705773 11 8361 581 15 0924 52 777304 13 8098 74 15 1392 53 470919 9 1737 48 8 1021 54 735395 13 4655 695 15 0694 55 765908 13 4046 587 19 2241 56 601021 13 913 513 13 0008 57 858181 16 1237 626 21 02 58 793656 13 6252 496 17 0309 59 728526 10 5672 672 19 0071 60 833569 17 1843 471 16 0028 61 877261 17 4727 996 18 1603 62 946284 19 9708 769 14 0135 63 843899 17 817 736 19 0618 64 779755 15 1635 457 15 1807 65 580833 13 1429 435 11 083 66 759206 17 1202 487 11 0852 67 85751 14 1002 641 17 0265 68 854485 17 6005 803 14 0051 69 793387 15 4729 553 15 0968 70 707303 11 2001 453 21 0471 71 575659 13 2707 642 10 0044 72 743057 14 899 653 16 3358 73 878657 19 4459 584 12 1423 74 1119067 22 13299 652 17 2648 75 881028 18 5726 733 12 0126 76 666628 12 1566 545 15 1441 77 616013 14 5349 655 14 0272 78 807814 15 1062 741 21 0523 79 703808 8 14256 575 16 0493 80 698896 12 1982 445 18 094 81 738232 11 4864 659 20 1858 82 864265 18 145 625 16 0547 83 675471 13 2637 535 11 0524 84 65108 10 636 807 13 0183 85 741032 16 744 662 14 0061 86 709021 13 3217 527 16 1328 87 765045 16 115 565 17 0719 88 683374 11 6738 63 13 1264 89 658407 10 8529 678 14 0884 90 871569 14 3313 642 24 1367 91 775276 18 772 72 12 1711 92 78032 14 233 751 20 0197 93 480301 11 8073 535 13 081 94 708444 12 6808 623 14 172 95 954765 20 3895 645 17 0283 96 721841 11 1967 569 20 0058 97 85892 15 40 774 19 0046 98 690827 15 2199 691 9 0427 99 742842 17 1094 664 10 1006 100 70139 17 577 57 14 1439 101 819789 15 6273 534 15 0095 102 789572 13 6174 489 19 0531 103 55029 11 291 548 15 0247 104 788368 14 7306 54 14 1093 105 888878 19 2786 671 16 0559 106 827054 12 7098 592 22 0084 107 833416 15 1182 523 22 2411 108 960552 16 7724 486 21 0586 109 778802 16 2294 659 14 0715 110 549626 12 6438 557 16 0586 111 435649 9 887 616 6 41 112 705514 12 5448 761 14 188 113 99487 20 787 705 15 069 114 940906 16 15932 615 12 1283 115 919878 18 5756 831 16 0592 116 657046 11 1472 627 19 1661 117 87336 16 289 576 22 0747 118 909454 19 5568 481 15 0759 119 934562 15 9784 59 21 0055 120 750367 16 2181 742 14 0888 121 581535 12 365 519 11 0195 122 793226 14 5762 583 15 043 123 616045 12 575 715 12 1743 124 865748 18 1474 523 22 0892 125 698819 12 1527 651 22 0699 126 654791 14 2473 615 15 0007 127 75678 17 251 588 9 0004 128 683613 6 11001 485 20 0989 129 690353 14 3461 579 11 0887 130 778023 18 271 741 14 0293 131 468901 10 9203 635 14 0561 132 74777 15 52 541 13 1827 133 835723 15 7961 853 14 0534 134 695425 10 10765 672 13 13 135 654866 12 4372 56 13 0146 136 718511 16 1563 415 15 0609 137 838564 22 4142 662 9 0047 138 78592 14 734 704 13 0753 139 890066 17 11332 544 11 0615 140 664472 17 5696 578 13 1538 141 736556 13 2362 63 18 0975 142 915728 19 2916 603 15 1209 143 882894 19 1308 724 15 0899 144 829653 16 2471 645 18 0417 145 829485 18 1595 619 14 1386 146 856825 20 2115 515 12 0569 147 730687 10 8289 678 18 1131 148 957299 22 4063 482 13 0285 149 706892 16 4106 661 16 0248 150 773619 13 9363 651 12 0746 Desenvolvimento de um modelo baseado em regressão linear múltipla para auxílio em decisões financeiras e de investimento para empresas Alunos Introdução Desenvolver um modelo baseado em regressão linear múltipla para o auxílio em decisões financeiras para o investimento de empresas considerando as seguintes variáveis crescimento econômico aumento da produção de bens e serviços da empresa taxa de juros custo do financiamento do investimento confiança do consumidor disposição dos consumidores a investir seu capital índice de produção atividade econômica e capacidade produtiva da empresa inflação aumento contínuo e generalizado dos preços dos bens e serviços em uma economia Modelo de regressão linear múltipla b0 interceptação da linha de regressão biXi sendo i ε 1 n coeficiente angular de regressão bi sobre a variável independente Xi e erro do modelo ou resíduo Teste t para um parâmetro Onde bi N0 Sbi2 sendo Sbi a variância dos coeficientes Hipóteses H0 bi 0 variável independente tem relação isolada com a variável dependente Ha bi 0 variável independente não tem relação isolada com a variável dependente Teste de hipótese F Onde SQReg é a variabilidade dos resíduos SQRes é a variabilidade do modelo de regressão n o número de variáveis independentes k o número de variáveis independentes que permaneceram no modelo de regressão Hipóteses H0 b1 b2 b3 bn nenhuma variável independente contribui para predição da variável dependente Ha bi 0 onde i ε 1 n as variáveis independentes contribuem para a predição da variável dependente Aplicação X1 Cresceconomico X2 Taxajuros X3 Confianca X4 Indiceproducao X5 Inflacao Relação entre as variáveis e suas distribuições QQ Plot dos resíduos padronizados do modelo completo Teste t para os coeficientes do modelo completo QQ Plot dos resíduos padronizados do modelo ajustado Teste t para os coeficientes do modelo ajustado Análise ANOVA para comparação dos modelos Teste F de significância do ajuste do modelo Conclusão Ajuste de um modelo de regressão linear múltipla com as variáveis crescimento econômico aumento da produção de bens e serviços da empresa taxa de juros custo do financiamento do investimento índice de produção atividade econômica e capacidade produtiva da empresa
Send your question to AI and receive an answer instantly
Recommended for you
3
Lista 3 - Estatística 2 - 2021-1
Estatística 2
UFRJ
2
Teste 1 - Estatística 2 2021 1
Estatística 2
UFRJ
1
Trabalho sobre Regressão Simples
Estatística 2
UFRJ
26
Slide - Inferência Estatística
Estatística 2
UFRJ
3
Lista 3 - Estatística 2 2021-2
Estatística 2
UFRJ
5
Lista - Estatística 2 2021 2
Estatística 2
UFRJ
4
P2 - Estatística 2 2022 1
Estatística 2
UFRJ
5
Lista - Estatística 2 - 2021-1
Estatística 2
UFRJ
6
Lista 2 - Estatística 2 2021-2
Estatística 2
UFRJ
35
Slide - Análise de Regressão Linear - Estatística 2 - 2021-1
Estatística 2
UFRJ
Preview text
Estatística II para Ciências contábeis 20241 Professora Débora Zava Belo Trabalho 2 O trabalho pode ser feito em grupos de até 4 pessoas Este deve ser enviado em dois arquivos um relatório em pdf que será corrigido e o arquivo da análise de dados feito em Excel ou R Um exemplo do relatório pode ser encontrado no arquivo Templatepdf É importante colocar o DRE de todos os integrantes do grupo no relatório Além de informar qual banco de dados foi escolhido O trabalho contará com apresentação em slides em pdf de até 20 minutos por grupo seguindo as datas dos sorteios O relatório deve ser enviado por email até 2359 do dia 0407 quintafeira debora zavadmeufrjbr No email adicione todos os participantes do grupo como destinatários 1 Os bancos de dados foram simulados e com base no arquivo escolhido pedese a Crie definições para cada variável do seu banco de dados Preste atenção nos valores que cada variável assume não diga que uma variável é idade se ela assumir valores ne gativos por exemplo Elabore uma introdução para suas variáveis Diga qual interesse em estudar essas características e qual motivo de utilizar tais variáveis regressoras É possível procurar inspiração na literatura ou inventar problemas fantasiosos Adicione toda essa informação na sua introdução b Para o modelo especifique um modelo de regressão linear múltipla teórico para seus dados escreva a equação do modelo teórico Descreva todos os termos e variáveis do modelo no contexto do problema Descreva como é feito um teste de hipóteses T para um parâmetro e como é elaborado um teste F É importante definir 1 Hipóteses a serem testadas 2 Estatística de teste e sua distribuição 3 Região Crítica 4 Valor observado e 5 Tomada de decisão Escreva as expressões das estatísticas de teste em cada caso e especifique a sua respectiva distribuição c Para sua aplicação apresente suas variáveis Construa um gráfico para representar a relação das variáveis consideradas no estudo e analiseo Ajuste o modelo completo definido na seção anterior e interprete seus resultados Verifique se seus coeficientes são significativos utilizando nível de significância de 5 e seguindo os passos que você definiu na seção anterior d Alguma variável foi não significativa Ajuste outro modelo sem elas Calcule uma medida global de qualidade do ajuste para o modelo final interpretea no contexto do problema e compare graficamente sua variável resposta observada e a estimada Faça gráfico de dispersão entre os valores ajustados e os resíduos padronizados Construa também o QQ Plot dos resíduos padronizados do modelo Com base nestes gráficos existe alguma violação da hipótese de normalidade e homocedasticidade dos erros e Para sua conclusão relembre de forma resumida o que foi feito em todo o relatório Faça as considerações que achar necessárias Estatística II para Ciências Contábeis 20241 1 Desenvolvimento de um modelo baseado em regressão linear múltipla para auxílio em decisões financeiras e de investimento para empresas Nomes dos Alunos 1 INTRODUÇÃO O mundo do investimento vem ganhando espaço com o desenvolvimento de novas tecnologias e plataformas que facilitam a aplicação de um capital com o objetivo de rentabilizálo de modo que o retorno gerado possa ser direcionado para diferentes finalidades dentre elas expandir as receitas O investimento pessoal é comumente empregado para a geração de reservas financeiras e renda fixa e o mesmo pode ser observado para empresas e empreendimentos os quais utilizando do investimento financeiro para expandir suas receitas de forma mais segura bem como aumentar os lucros e criar reservas rentáveis Porém o investimento para empresas deve ser ponderado de acordo com diferentes variáveis que impactam diretamente a receita dentre elas o crescimento econômico despesas índice de produção taxas de juros associadas aos diferentes tipos de investimento e até mesmo a inflação sobre os bens e serviços Dessa forma neste trabalho buscamos desenvolver um modelo baseado em regressão linear múltipla para o auxílio em decisões financeiras para o investimento de empresas considerando as seguintes variáveis crescimento econômico aumento da produção de bens e serviços da empresa taxa de juros custo do financiamento do investimento confiança do consumidor disposição dos consumidores a investir seu capital índice de produção atividade econômica e capacidade produtiva da empresa inflação aumento contínuo e generalizado dos preços dos bens e serviços em uma economia Portanto considerando o banco de dados atribuído a este trabalho o modelo aqui proposto busca relacionar a variável dependente Y aqui denominado como Investimento com as variáveis independentes X1 X2 X3 X4 e X5 acima listadas aqui denominadas como Cresceconomico Taxajuros Confianca Indiceproducao e Inflacao 2 MODELO 21 MODELO DE REGRESSÃO LINEAR MÚLTIPLA Para este estudo utilizamos o modelo de regressão linear múltipla de modo que seja possível predizer a relação e o valor que uma variável dependente Y assume a medida que as variáveis independentes Xi alterem seus valores Então por se tratar de uma regressão linear este modelo propõe estimar o valor de Y a partir de Xi utilizando uma equação linear Dessa forma temos que a regressão linear múltipla pode ser dada pela equação Yb 0b1 X1b2 X 2b3 X 3bnXne Onde b0 interceptação da linha de regressão biXi sendo i ε 1 n coeficiente angular de regressão bi sobre a variável independente Xi e erro do modelo ou resíduo Ao considerar várias variáveis independentes é preciso estimar e ajustar cada coeficiente bi para cada variável independente Xi de modo que o modelo consiga chegar o mais próximo de uma linha reta uma vez que tratamos de uma regressão linear Os coeficientes bi são estimados considerando o efeito que cada variável independente tem sobre a variável independente Dessa forma alguns testes estatísticos se fazem necessários na construção do modelo 22 TESTE DE HIPÓTESE T PARA UM PARÂMETRO Uma vez estimados os coeficientes angulares é necessário averiguar a significância de tais coeficientes e se estes fazem com que sua variável independente tenha uma relação isolada com a variável dependente o que devemos evitar Portanto para o teste de hipóteses t para os coeficientes temos que as hipóteses são H0 bi 0 variável independente tem relação isolada com a variável dependente Ha bi 0 variável independente não tem relação isolada com a variável dependente As hipóteses descritas acima são assim atribuídas uma vez que um estimador ao assumir o valor 0 anula o valor associado a variável independente Dessa forma devemos rejeitar H0 para concluir que o coeficiente é significativo Para isso devemos utilizamos a seguinte estatística de teste t bi Sbi Onde bi N0 Sbi 2 sendo Sbi a variância dos coeficientes Além disso obter um valor de p significativo menor que 005 para um intervalo de confiança de 95 região crítica Ao encontrar uma variável não significativa devemos desconsiderála na construção do modelo 23 TESTE DE HIPÓTESE F Como os coeficientes são estimados de modo a ajustar o comportamento de cada variável independente na predição da variável dependente fazse necessário avaliar se este ajuste foi significativo e se contribui para a predição da variável dependente Dessa forma semelhante as hipóteses do teste t para os parâmetros temos que para o teste de hipótese F do modelo as hipóteses são H0 b1 b2 b3 bn nenhuma variável independente contribui para predição da variável dependente Ha bi 0 onde i ε 1 n as variáveis independentes contribuem para a predição da variável dependente Portanto para concluir que as variáveis independentes são capazes de explicar a variável dependente devemos rejeitar a hipótese nula H0 Para isso utilizamos o teste F de análise de variância considerando uma distribuição F dos parâmetros A estatística F é dada por F SQRegn SQResnk1 Onde SQReg é a soma dos quadrados que representa a variabilidade dos resíduos e SQRes é a soma dos quadrados que representa a variabilidade do modelo de regressão Sendo n o número de variáveis independentes e k o número de variáveis independentes que permaneceram no modelo de regressão A hipótese nula será rejeitada quando obtemos um valor de p significativo que seja menor que 005 ou seja o valor de p deve pertencer a região crítica na curva de distribuição F 3 APLICAÇÃO O modelo de regressão linear múltipla implementado neste trabalho propõe um valor de investimento para empresas considerando algumas variáveis que podem ter impacto direto na decisão financeira e no lucro do capital aplicado Portanto o modelo proposto é capaz de relacionar e predizer a variável dependente Investimento a partir das variáveis independentes X1 Cresceconomico X2 Taxajuros X3 Confianca X4 Indiceproducao X5 Inflacao A base de dados utilizada está disponível no Anexo 1 Inicialmente avaliamos a relação entre as variáveis que foram consideradas neste estudo bem como a distribuição de cada variável Figura 1 Figura 1 Visualização da relação entre as variáveis e suas distribuições Como podemos notar pela Figura 1 existe uma correlação entre as variáveis independentes Cresceconomico Taxajuros e Indiceproducao com a variável dependente Investimento Além disso se notarmos na diagonal do gráfico podemos observar que as distribuições das variáveis se assemelham com a curva de distribuição normal Apesar das variáveis independentes Confianca e Inflacao não apresentarem correlação com a variável dependente Investimento seguimos nossas análises com todas as variáveis de modo que um modelo completo fosse implementado para averiguar a significância de cada coeficiente Dessa forma construímos o modelo utilizando a função lm disponível pela linguagem de programação R o arquivo de análise estará disponível em Trabalho2R e avaliamos se os resíduos seguiam uma distribuição normal Figura 2 A normalidade dos resíduos foi confirmada pelo teste de ShapiroWilk Figura 2 QQ Plot dos resíduos padronizados do modelo completo Pela Figura 2 podemos notar que os resíduos se aproximam da reta indicando que se aproximam de uma distribuição normal Considerando a normalidade dos resíduos seguimos as análise avaliando a significância dos coeficientes estimados pelo modelo Figura 3 Figura 3 Teste t para os coeficientes do modelo completo Podemos notar pela Figura 3 que as variáveis Cresceconomico Taxajuros e Indiceproducao tiveram valor de p menor que 005 enquanto as variáveis Confianca e Inflacao obtiveram valor de p maior que 005 indicando que os coeficiente de Cresceconomico Taxajuros e Indiceproducao são significativos Os resultados observados nas Figuras 1 e 3 corroboraram para concluirmos que as variáveis Confianca e Inflacao não foram significativas e para ajustarmos melhor o modelo retiramos estas variáveis das análises subseguintes Ao ajustarmos o modelo novamente utilizando apenas as variáveis significativas notamos novamente que os resíduos seguem uma distribuição normal Figura 4 Figura 4 QQ Plot dos resíduos padronizados do modelo ajustado Além disso todos os coeficientes se mostraram significativos com valores de p menores que 005 e um valor de R2 de 098 Figura 5 Figura 5 Teste t para os coeficientes do modelo ajustado Uma vez ajustado um modelo completo para predizer a variável Investimento e outro modelo ajustado contendo apenas as variáveis significativas para predizer a variável Investimento avaliamos então qual dos dois modelos se mostrou melhor para a nossa aplicação Dessa forma conduzimos uma análise de variância ANOVA nos dois modelos a qual testa as seguintes hipóteses H0 as variáveis removidas não possuem significância Ha as variáveis removidas são significativas Dessa forma ao observarmos um valor de p significativo menor que 005 rejeitamos H0 ou seja o segundo modelo ajustado não se apresentar melhor que o primeiro modelo completo ajustado Figura 6 Figura 6 Análise ANOVA para comparação dos dois modelos ajustados Como observado na Figura 6 o valor de p do teste foi maior que 005 o que indica que não rejeitamos H0 isto é o segundo modelo ajustado se apresenta melhor que o primeiro modelo ajustado contendo todas as variáveis O segundo modelo ajustado indica que a predição do investimento de empresas é dependente das variáveis Cresceconomico Taxajuros e Indiceproducao então por fim avaliamos se o ajuste foi significativo e se estas variáveis são capazes de fato de predizer a variável dependente Investimento Figura 7 Para isso realizamos o teste F de homocedasticidade em que as hipóteses testadas são H0 nenhuma variável contribui para predição de Investimento Ha as variáveis contribuem para a predição de Investimento Figura 7 Teste F de significância do ajuste do modelo Como observado na Figura 7 o valor de p observado foi menor que 005 o que indica que o ajuste foi significativo e que as variáveis independentes contribuem para a predição da variável dependente Investimento ou seja rejeitamos a hipótese nula 4 CONCLUSÃO A regressão linear múltipla tem como objetivo estimar uma variável dependente a partir do comportamento observado das variáveis independentes as quais podem assumir diferentes valores e esta variação implica no valor assumido pela variável estimada E com o intuito de aplicar este modelo a um problema que apresenta uma alta variação das variáveis associadas e necessita de uma precisão na predição aplicamos um modelo de regressão linear múltipla para a predição de investimentos para empresas Dentre as variáveis que influenciam nesta decisão financeira temos as variáveis de crescimento econômico taxa de juros confiança do consumidor índice de produção e inflação porém ao ajustar o modelo de regressão observamos que as variáveis de confiança do consumidor e inflação não apresentaram significância na predição da variável investimento Dessa forma o ajuste de um modelo de regressão linear múltipla com as variáveis de crescimento econômico taxa de juros e índice de produção se mostrou mais apropriado com um valor de significância muito inferior a 005 e valor de R² de 098 indicando que estas variáveis são as principais variáveis que contribuem para predizer o investimento de uma empresa 5 REFERÊNCIAS HANCK C et al Introduction to econometrics with R p 400 2018 McNulty K 2020 peopleanalyticsregressionbook GitHub repository Retrieved from httpsgithubcomkeithmcnultypeopleanalyticsregressionbook nd Entenda as características dos investimentos Portal do Investidor Retrieved from httpswwwgovbrinvestidorptbrinvestirantesdeinvestirentendaas caracteristicasdosinvestimentos nd Como funcionam os investimentos para empresas 4 tipos Blog Agendor Retrieved from httpswwwagendorcombrbloginvestimentosparaempresas nd Regressão linear múltipla no R Tutorial com exemplos DataCamp Retrieved from httpswwwdatacampcompttutorialmultiplelinearregressionrtutorial Anexo 1 Identificador Y X1 X2 X3 X4 X5 1 773762 12 11274 621 14 1189 2 793505 17 1765 558 19 0297 3 773977 14 6359 67 15 2075 4 871665 17 3415 525 15 009 5 839651 15 7477 612 16 1996 6 645313 16 5829 846 11 0735 7 524514 7 4958 721 13 005 8 727514 14 1008 668 16 0474 9 823507 17 3379 463 13 0276 10 860294 17 3572 635 25 3128 11 689092 15 3466 619 15 1323 12 941396 20 5172 549 15 0246 13 894935 16 8325 732 16 0987 14 856289 17 6323 449 12 0812 15 536935 11 6885 768 16 0744 16 1068542 19 10594 442 22 1228 17 885746 17 1712 577 21 0716 18 592597 11 7409 682 8 0294 19 1022796 20 2452 552 23 0224 20 805986 13 9062 566 16 0204 21 714246 13 6142 64 12 1636 22 739699 15 677 65 16 004 23 557491 10 893 485 14 064 24 844282 20 5346 615 18 062 25 717104 14 622 511 19 0509 26 679067 12 4481 596 22 0322 27 63619 14 591 42 15 1114 28 496847 11 2071 583 9 0815 29 584571 11 1373 618 13 0818 30 703559 13 3177 605 21 2203 31 727491 14 023 34 16 0127 32 662979 10 6533 648 15 1094 33 947596 20 1698 673 21 1306 34 80923 17 45 441 16 0001 35 815984 20 4862 76 17 1468 36 787363 17 2271 452 13 1408 37 86037 17 181 816 18 0008 38 835014 13 7608 535 19 0168 39 702043 13 789 679 15 0785 40 660219 13 4427 747 18 1074 41 698436 12 2732 414 17 0413 42 809407 16 7249 486 11 0776 43 828493 16 2561 518 17 0017 44 1035813 20 10151 529 15 0589 45 563013 11 081 506 12 1205 46 695261 15 1527 406 11 1541 47 775639 15 5373 513 12 0022 48 784796 18 3998 454 17 0266 49 787324 10 15788 609 16 06 50 868645 17 6825 551 15 0477 51 705773 11 8361 581 15 0924 52 777304 13 8098 74 15 1392 53 470919 9 1737 48 8 1021 54 735395 13 4655 695 15 0694 55 765908 13 4046 587 19 2241 56 601021 13 913 513 13 0008 57 858181 16 1237 626 21 02 58 793656 13 6252 496 17 0309 59 728526 10 5672 672 19 0071 60 833569 17 1843 471 16 0028 61 877261 17 4727 996 18 1603 62 946284 19 9708 769 14 0135 63 843899 17 817 736 19 0618 64 779755 15 1635 457 15 1807 65 580833 13 1429 435 11 083 66 759206 17 1202 487 11 0852 67 85751 14 1002 641 17 0265 68 854485 17 6005 803 14 0051 69 793387 15 4729 553 15 0968 70 707303 11 2001 453 21 0471 71 575659 13 2707 642 10 0044 72 743057 14 899 653 16 3358 73 878657 19 4459 584 12 1423 74 1119067 22 13299 652 17 2648 75 881028 18 5726 733 12 0126 76 666628 12 1566 545 15 1441 77 616013 14 5349 655 14 0272 78 807814 15 1062 741 21 0523 79 703808 8 14256 575 16 0493 80 698896 12 1982 445 18 094 81 738232 11 4864 659 20 1858 82 864265 18 145 625 16 0547 83 675471 13 2637 535 11 0524 84 65108 10 636 807 13 0183 85 741032 16 744 662 14 0061 86 709021 13 3217 527 16 1328 87 765045 16 115 565 17 0719 88 683374 11 6738 63 13 1264 89 658407 10 8529 678 14 0884 90 871569 14 3313 642 24 1367 91 775276 18 772 72 12 1711 92 78032 14 233 751 20 0197 93 480301 11 8073 535 13 081 94 708444 12 6808 623 14 172 95 954765 20 3895 645 17 0283 96 721841 11 1967 569 20 0058 97 85892 15 40 774 19 0046 98 690827 15 2199 691 9 0427 99 742842 17 1094 664 10 1006 100 70139 17 577 57 14 1439 101 819789 15 6273 534 15 0095 102 789572 13 6174 489 19 0531 103 55029 11 291 548 15 0247 104 788368 14 7306 54 14 1093 105 888878 19 2786 671 16 0559 106 827054 12 7098 592 22 0084 107 833416 15 1182 523 22 2411 108 960552 16 7724 486 21 0586 109 778802 16 2294 659 14 0715 110 549626 12 6438 557 16 0586 111 435649 9 887 616 6 41 112 705514 12 5448 761 14 188 113 99487 20 787 705 15 069 114 940906 16 15932 615 12 1283 115 919878 18 5756 831 16 0592 116 657046 11 1472 627 19 1661 117 87336 16 289 576 22 0747 118 909454 19 5568 481 15 0759 119 934562 15 9784 59 21 0055 120 750367 16 2181 742 14 0888 121 581535 12 365 519 11 0195 122 793226 14 5762 583 15 043 123 616045 12 575 715 12 1743 124 865748 18 1474 523 22 0892 125 698819 12 1527 651 22 0699 126 654791 14 2473 615 15 0007 127 75678 17 251 588 9 0004 128 683613 6 11001 485 20 0989 129 690353 14 3461 579 11 0887 130 778023 18 271 741 14 0293 131 468901 10 9203 635 14 0561 132 74777 15 52 541 13 1827 133 835723 15 7961 853 14 0534 134 695425 10 10765 672 13 13 135 654866 12 4372 56 13 0146 136 718511 16 1563 415 15 0609 137 838564 22 4142 662 9 0047 138 78592 14 734 704 13 0753 139 890066 17 11332 544 11 0615 140 664472 17 5696 578 13 1538 141 736556 13 2362 63 18 0975 142 915728 19 2916 603 15 1209 143 882894 19 1308 724 15 0899 144 829653 16 2471 645 18 0417 145 829485 18 1595 619 14 1386 146 856825 20 2115 515 12 0569 147 730687 10 8289 678 18 1131 148 957299 22 4063 482 13 0285 149 706892 16 4106 661 16 0248 150 773619 13 9363 651 12 0746 Desenvolvimento de um modelo baseado em regressão linear múltipla para auxílio em decisões financeiras e de investimento para empresas Alunos Introdução Desenvolver um modelo baseado em regressão linear múltipla para o auxílio em decisões financeiras para o investimento de empresas considerando as seguintes variáveis crescimento econômico aumento da produção de bens e serviços da empresa taxa de juros custo do financiamento do investimento confiança do consumidor disposição dos consumidores a investir seu capital índice de produção atividade econômica e capacidade produtiva da empresa inflação aumento contínuo e generalizado dos preços dos bens e serviços em uma economia Modelo de regressão linear múltipla b0 interceptação da linha de regressão biXi sendo i ε 1 n coeficiente angular de regressão bi sobre a variável independente Xi e erro do modelo ou resíduo Teste t para um parâmetro Onde bi N0 Sbi2 sendo Sbi a variância dos coeficientes Hipóteses H0 bi 0 variável independente tem relação isolada com a variável dependente Ha bi 0 variável independente não tem relação isolada com a variável dependente Teste de hipótese F Onde SQReg é a variabilidade dos resíduos SQRes é a variabilidade do modelo de regressão n o número de variáveis independentes k o número de variáveis independentes que permaneceram no modelo de regressão Hipóteses H0 b1 b2 b3 bn nenhuma variável independente contribui para predição da variável dependente Ha bi 0 onde i ε 1 n as variáveis independentes contribuem para a predição da variável dependente Aplicação X1 Cresceconomico X2 Taxajuros X3 Confianca X4 Indiceproducao X5 Inflacao Relação entre as variáveis e suas distribuições QQ Plot dos resíduos padronizados do modelo completo Teste t para os coeficientes do modelo completo QQ Plot dos resíduos padronizados do modelo ajustado Teste t para os coeficientes do modelo ajustado Análise ANOVA para comparação dos modelos Teste F de significância do ajuste do modelo Conclusão Ajuste de um modelo de regressão linear múltipla com as variáveis crescimento econômico aumento da produção de bens e serviços da empresa taxa de juros custo do financiamento do investimento índice de produção atividade econômica e capacidade produtiva da empresa