·

Marketing e Comunicação ·

Estatística Aplicada para Finanças

Send your question to AI and receive an answer instantly

Ask Question

Preview text

MEDIDAS DE ASSOCIAÇÃO ENTRE VARIÁVEIS Covariância e Correlação Retomando Medidas descritivas Medidas de Tendência Central e Posição descrevem um aspecto dos dados numéricos que é a posição do centro da distribuição Medidas de Dispersão descrevem a variabilidade dos dados em relação a uma medida de tendência central Medidas de Associação medem a relação entre dados de duas ou mais séries Série 1 18 25 31 36 45 48 53 Série 2 3 5 8 10 15 22 33 45 2 Análise bivariada O objetivo é analisar as relações que podem existir entre as variáveis estudadas Ou seja desejase conhecer se valores altos ou baixos de uma das variáveis implicam em valores altos ou baixos da outra variável x y Medidas de Associação entre duas variáveis Covariância Coeficiente de Correlação Diagrama de Dispersão e Linha de Tendência Um Diagrama de Dispersão é uma apresentação gráfica da relação entre duas variáveis quantitativas Os valores de uma variável são plotados no eixo horizontal e os valores da outra variável no eixo vertical O padrão geral dos pontos plotados sugere a relação geral entre as variáveis Uma linha de tendência é uma aproximação dessa relação Diagrama de Dispersão Uma relação Positiva x y Uma relação Negativa x y Sem relação aparente x y x y Relação Não Linear 8 Exemplo Considere o gráfico abaixo que apresenta o faturamento médio anual em milhões de reais em várias filiais de uma multinacional Analisando o gráfico poderíamos perguntar o que determina resultados tão diferentes Possíveis fatores população investimentos número de empresas concorrentes etc Covariância 11 A covariância é uma medida estatística onde é possível comparar duas variáveis permitindo entender como elas se relacionam entre si Pode ser usada para avaliar o comportamento da variável Y quando a variável X aumenta ou diminui Dá uma ideia da dispersão dos dados em relação às médias das variáveis X e Y Covariância da População 𝐶𝑜𝑣 𝑥 𝑦 𝜎𝑥𝑦 𝑥𝑖 𝜇𝑥𝑦𝑖 𝜇𝑦 𝑛 Covariância da Amostra 𝐶𝑜𝑣 𝑥 𝑦 𝑠𝑥𝑦 𝑥𝑖 ҧ𝑥𝑦𝑖 ത𝑦 𝑛 1 12 A covariância será positiva se as duas variáveis tendem a variar no mesmo sentido isto é valores de X acima da sua média estão associados a valores de Y acima de sua média o mesmo ocorrendo para valores de ambos inferiores à média maior concentração nos quadrantes I e III A covariância será negativa se valores acima da média de uma variável estão associados a valores inferiores à média da outra variável maior concentração nos quadrantes II e IV 𝑠𝑥𝑦12611 𝑠𝑥𝑦230 Exemplo Número de horas de estudo e nota obtida por 8 alunos em uma prova dados fictícios Aluno x horas y nota A 8 10 B 7 8 C 6 4 D 3 8 E 3 6 F 6 9 G 5 7 H 2 4 0 1 2 3 4 5 6 7 8 9 10 11 0 1 2 3 4 5 6 7 8 9 Nota y Horas de estudo x 0 1 2 3 4 5 6 7 8 9 10 11 0 1 2 3 4 5 6 7 8 9 Nota y Horas de estudo x Existe associação É possível identificar 0 2 4 6 8 10 12 0 2 4 6 8 10 Nota y Horas de estudo x Análise gráfica apenas pode ser subjetiva 16 IMPORTANTE A análise gráfica pode ser muito subjetiva e insuficiente Além disso não se pode dizer que a covariância mede a intensidade da relação entre duas variáveis pois dimensões diferentes podem gerar valores diferentes Para avaliar isso usamos o COEFICIENTE DE CORRELAÇÃO DE PEARSON que indica o nível de intensidade que ocorre na correlação linear entre as variáveis Para dados amostrais 𝑟 𝑛 σ 𝑥𝑖𝑦𝑖 σ 𝑥𝑖 σ 𝑦𝑖 𝑛 σ 𝑥𝑖2 σ 𝑥𝑖 2 𝑛 σ 𝑦2 σ 𝑦𝑖 2 OU 𝒓 𝒔𝒙𝒚 𝒔𝒙𝒔𝒚 Correlação Relação entre duas variáveis quantitativas Definição quantificação do grau em que duas variáveis aleatórias estão relacionadas desde que a relação seja linear Não especifica se a relação é de causa e efeito 18 O valor do coeficiente de correlação r tem a variação no intervalo 11 Fonte Coeficiente de correlação de Pearson gpestatisticanetlifyapp 21 Para os dados acima obtemos os seguintes valores do coeficiente de correlação Faturamento x População 𝑟 018 Quanto maior a população maior o faturamento No entanto a relação linear entre essas grandezas é bastante fraca Faturamento x Renda 𝑟 009 Quanto maior a renda menor o faturamento No entanto a relação linear entre essas grandezas é extremamente fraca Faturamento x Gasto com propaganda 𝑟 092 Quanto maior o gasto com propaganda maior o faturamento A relação linear entre essas grandezas é forte Faturamento x Número de concorrentes 𝑟 092 Quanto maior o número de concorrentes menor o faturamento A relação linear entre essas grandezas é forte Exemplo PublicidadeVendas Diagrama de Dispersão Estamos interessados em investigar a relação se existe alguma entre o número de comerciais e o valor das vendas 1 3 2 1 3 14 24 18 17 30 x Número de Comerciais y Faturamento 1000 y x Número de Comerciais Faturamento 1000 5 10 15 20 25 30 0 35 1 2 3 0 4 O gráfico indica Relação positiva entre o número de comerciais e o faturamento Valores maiores de faturamento estão associadas a um número maior de comerciais A relação não é perfeita os pontos plotados no diagrama de dispersão não estão em uma linha reta Coeficiente de correlação 090 Exemplo Número de horas de estudo e nota obtida por 8 alunos em uma prova dados fictícios Aluno x horas y nota A 8 10 B 7 8 C 6 4 D 3 8 E 3 6 F 6 9 G 5 7 H 2 4 0 2 4 6 8 10 12 0 2 4 6 8 10 Nota y Horas de estudo x Gráfico de Dispersão Coeficiente de correlação 058 Existe uma associação regular positiva Cidade Renda Familiar Valor do imóvel 1000 A 628 928 B 668 1167 C 678 1081 D 712 1309 E 712 1011 F 741 1149 G 752 1259 H 758 1453 I 773 1259 J 788 1452 K 792 1358 L 824 1269 M 826 1619 N 853 1450 O 870 1515 P 891 1621 Q 974 1919 R 1000 1736 S 1064 1681 T 1323 2341 Exemplo Renda familiar média e valor médio do imóvel para 20 cidades nos EUA 2000 Coeficiente de Correlação 093 50 100 150 200 250 50 60 70 80 90 100 110 120 130 140 Valor do imóvel 1000 Renda familiar 1000 Gráfico de Dispersão