·

Cursos Gerais ·

Métodos Quantitativos Aplicados

Send your question to AI and receive an answer instantly

Ask Question

Preview text

A CORRELAÇÃO E A REGRESSÃO LINEAR 1 SUMÁRIO A Correlação e a Regressão Linear 2 2 A correlação e a Regressão Linear Ao analisar um conjunto de variáveis buscamos compreender como elas se relacionam A correlação por exemplo nos indica a direção e força do relacionamento entre as variáveis que pode ir desde uma relação negativa forte até positiva forte passando também pela possibilidade de se identificar uma ausência de correlação A regressão linear simples por sua vez tem como objetivo buscar sintetizar o relacionamento entre as duas variáveis através de uma reta Como resultado a regra estimada pela regressão será capaz de estimar o que acontece com uma determinada variável resposta Y quando uma outra variável explicativa X muda Note que estamos buscando estabelecer aqui relações de causalidade temos uma relação de causa e efeito conforme síntese a seguir Variável x variável CAUSA também chamada de variável independente Variável y variável EFEITO também chamada de variável dependente uma vez que seu comportamento está condicionado à variação de x Essa reta estimada pela regressão terá portanto o seguinte formato y a bx Em que y variável efeito ou variável dependente x variável causa ou variável independente a coeficiente de intersecção estimado representa aquele valor esperado para y quando x assumir o valor zero b coeficiente de inclinação da reta estimada estabelece o comportamento da relação entre x e y Consideremos o seguinte exemplo buscase realizar uma comparação entre nível de gastos com propaganda e faturamento da empresa com o objetivo de analisar se os investimentos em propaganda têm potencial em se refletir em resultados para o negócio Tempo Gastos com Receita da Se nós colocarmos esses pontos em um gráfico chamado gráfico de dispersão será possível analisar com maiores detalhes O gráfico de dispersão tem como objetivo identificar visualmente se há algum sinal de relacionamento entre as variáveis No eixo Y eixo vertical são colocadas propaganda R empresa R 1 100 4500 2 200 6500 3 300 7500 4 400 8000 5 500 8200 6 600 8500 3 as receitas da empresa que se trata da variável dependente em nossa análise ou o efeito No eixo X eixo horizontal são colocados os gastos com propaganda que se trata de nossa variável independente ou a causa Os pontos no gráfico indicam os pares de pontos mencionados na tabela anterior Por exemplo quando o investimento em propaganda foi de R100 as receitas da empresa foram de R4500 o que está destacado no primeiro ponto do gráfico abaixo Com base nesse gráfico de dispersão é possível verificar visualmente uma certa tendência positiva quando x aumenta y aumenta também Há portanto uma correlação positiva entre as variáveis No entanto se pedirmos para diferentes pessoas traçarem uma reta de tendência que melhor represente a relação entre x e y certamente cada pessoa irá traçar uma reta ligeiramente diferente da outra Sendo assim a regressão linear surge como uma técnica para traçar aquela reta que ofereça os menores erros possíveis ou seja aquela reta que minimize os erros ou em outras palavras os resíduos Isso significa dizer que uma boa reta de predição torna os resíduos destacados na figura abaixo os menores possíveis o que quer dizer que a reta está sendo eficiente em estimar aquele y em função de x que mais se aproxime do verdadeiro y para esse ponto Para compreender melhor o significado desses conceitos verifique o gráfico a seguir que conta com a equação de regressão linear para os dados mencionados 4 Com base no gráfico acima é possível visualizar visualmente os conceitos mencionados Note que as linhas pontilhadas indicam os erros ou resíduos da regressão estimada ou seja a diferença entre as vendas estimadas pela regressão com base em um determinado nível de propaganda dada pelo valor da reta traçada e as reais vendas nesse nível de investimento em propaganda dadas pelo ponto observado na tabela nossa amostra Sendo assim a melhor reta de tendência para explicar a relação linear entre essas variáveis é dada por aquela que minimiza esses resíduos