·

Administração ·

Estatística Aplicada para Finanças

Send your question to AI and receive an answer instantly

Ask Question

Preview text

MANA6510 Métodos de Pesquisa e Previsão 6 ciclo Curso de Administração da FEI Análises Bivariadas Fábio Gerab Correlação Linear Coeficiente de Correlação e de Determinação Teste do Coeficiente de Correlação Testes de QuiQuadrado 2 Variância Propriedades Var k 0 k constante Var kX k2 VarX Var aX b a2 VarX a e b constantes Var X Y VarX VarY 2 covXY definição covXY E XEX YEY ou covXY EXY EXEY Covariânci a entre duas variáveis é a média do produto das duas menos o produto das suas médias 3 Se X e Y são independentes então EXY EXEY Logo Se X e Y são independentes então CovXY 0 VarXY VarX VarY Variáveis aleatórias independentes tem Covariância nula A Covariância está associada à dependência Linear entre as variáveis covXY Covariância X Y X Y X Y Correlação Linear entre duas variáveis aleatórias Representa a capacidade de uma variável prever o valor da outra variável por uma relação linear equação de uma reta Baixa Correlação Linear Alta Correlação Linear Positiva Negativa Pergunta Quão forte é a relação linear entre duas variáveis Resposta Coeficiente de Correlação Linear é o Coeficiente de Correlação populacional r Coeficiente de Correlação amostral estimativa de Seus valores variam de 1 a 1 Fornecem um nível de associação linear Não definem arelação causaefeito Slide 5 Coeficiente de Correlação Linear Coeficiente de Correlação Linear de Pearson Karl Pearson Inglês 1857 1936 Valores para o Coeficiente de correlação Linear 10 10 0 05 05 Não há correlação linear Correlação negativa perfeita Correlação positiva perfeita Aumentando o grau de correlação positiva Aumentando o grau de correlação negativa McClave Bensn Sincich Slide 6 Coeficiente de Correlação Linear r O valor de r indica o grau de dependência entre as variáveis X e Y da mesma forma que a covXY porém seu valor é limitado ao intervalo 11 Assim valores de r próximos de 1 ou de 1 indicam forte grau de dependência e valores próximos de 0 indicam fraco grau de dependência entre X e Y 7 covXY sx x sy Cálculo do Coeficiente de Correlação Linear da População r xy xx yy SS r SS SS 2 2 2 2 xx yy xy x SS x n y SS y n x y SS xy n Onde Capítulo 10 Regressão linear simples Slide 8 Cálculo do Coeficiente de Correlação Linear da Amostra O Cálculo de r é bastante simples O Coeficiente de Determinação r2 Fornece a fração da variação esclarecida pela relação entre x e y 0 r2 1 r2 coeficiente de correlação2 Slide 9 Coeficiente de Determinação r2 r2 representa a parcela do comporta mento de y explicada pela dependência linear com x e viceversa Você é um analista de marketing obteve os seguintes resultados Propaganda Vendas unidades 1 1 2 1 3 2 4 2 5 4 Calcule o coeficiente de correlação r Slide 10 Exemplo de Cálculo do Coeficiente de Correlação Linear da Amostra Tabela de solução xi yi xi 2 yi 2 xiyi 1 1 1 1 1 2 1 4 1 2 3 2 9 4 6 4 2 16 4 8 5 4 25 16 20 15 10 55 26 37 Slide 11 Exemplo de Cálculo do Coeficiente de Correlação Linear da Amostra As calculadoras costumam armazenar x y x2 y2 xy n Para o cálculo de Sx Sy e r Coeficiente de correlação solução 2 2 2 2 2 2 15 55 10 5 10 26 6 5 1510 37 7 5 xx yy xy x SS x n y SS y n x y SS xy n 7 0904 10 6 xy xx yy SS r SS SS Slide 12 Exemplo de Cálculo do Coeficiente de Correlação Linear da Amostra Coeficiente de determinação solução r2 coeficiente de correlação2 r2 09042 r2 0817 Interpretação Por volta de 817 da variação amostral em vendas y pode ser explicada quando se utiliza em um modelo linear o gasto em propaganda x para prognosticar vendas y Slide 13 Cálculo do Coeficiente de Determinação Sendo o coeficiente de correlação da população vamos testar a um nível de significância a hipótese H0 0 H1 0 teste bilateral tres t n2 2 Aceitase H0 0 coeficiente de correlação r não significativo tres t n2 2 Rejeitase H0 0 e aceitase H1 0 coeficiente de correlação r significativo A significância do coeficiente de correlação pode ser avaliada pela estatística t de Student com n2 graus de liberdade sendo n o número de pares amostrados Teste de Significância para o Coeficiente de Correlação Teste de Significância para o Coeficiente de Correlação Exemplo 1 Suponha o coeficiente de correlação como 04 e o número de observações igual a 10 Isto é uma correlação significativa usando um nível de significância de 5 H0 0 H1 0 teste bilateral tres 04 10 212 1 04212 1234 t n2 2 t 8 0025 2306 Logo como tres t 8 0025 Aceitase H0 0 Portanto o coeficiente de correlação r não é significativo ao nível de significância de 5 Teste de Significância para o Coeficiente de Correlação Exemplo 2 Suponha o coeficiente de correlação como 04 e o número de observações igual a 30 Isto é uma correlação significativa usando um nível de significância de 5 H0 0 H1 0 teste bilateral tres 04 30 212 1 04212 2309 t n2 2 t 28 0025 2048 Logo como tres t 28 0025 rejeitase H0 0 e aceitase H1 0 Portanto o coeficiente de correlação r é significativo ao nível de significância de 5 Você é um analista de marketing para Toys Shop Propaganda Vendas unidades 1 1 2 1 3 2 4 2 5 4 Calcule o coeficiente de correlação r Slide 17 Exemplo de Cálculo do Coeficiente de Correlação Linear da Amostra Coeficiente de correlação solução 2 2 2 2 2 2 15 55 10 5 10 26 6 5 1510 37 7 5 xx yy xy x SS x n y SS y n x y SS xy n 7 0904 10 6 xy xx yy SS r SS SS Slide 18 Exemplo de Cálculo do Coeficiente de Correlação Linear da Amostra r2 0817 Teste de Significância para o Coeficiente de Correlação Coeficiente de Correlação r 09037 Número de observações n 5 Nível de significância 5 H0 0 H1 0 teste bilateral tres 09037 5212 1 09037212 3656 t n2 2 t 3 0025 3182 Logo como tres t 2 0025 rejeitase H0 0 e aceitase H1 0 Portanto o coeficiente de correlação r é significativo ao nível de significância de 5 Você é um economista para a cooperativa do município e junta as seguintes informações Fertilizante lb Produção lb 4 30 6 55 10 65 12 90 Encontre o coeficiente de correlação Slide 20 Outro exemplo de Cálculo de r e r2 Tabela de solução 4 30 16 900 12 6 55 36 3025 33 10 65 100 4225 65 12 90 144 8100 108 32 240 296 16250 218 xi 2 yi xi yi xiyi 2 Slide 21 Outro exemplo de Cálculo de r Coeficiente de corelação solução 2 2 2 2 2 2 32 296 40 4 24 1625 185 4 3224 218 26 4 xx yy xy x SS x n y SS y n x y SS xy n 26 0956 40 185 xy xx yy SS r SS SS Slide 22 Outro exemplo de Cálculo de r r2 09562 0914 Teste de Significância para o Coeficiente de Correlação Coeficiente de Correlação r 0956 Número de observações n 4 Nível de significância 5 H0 0 H1 0 teste bilateral tres 0956 4 212 1 0956212 4609 t n2 2 t 2 0025 4303 Logo como tres t 2 0025 rejeitase H0 0 e aceitase H1 0 Portanto o coeficiente de correlação r é significativo ao nível de significância de 5 MANA6510 Distribuição de QuiQuadrado 2 Fábio Gerab Distribuição amostral da Variância S2 A distribuição amostral da variância S2 é proporcional à uma Distribuição de Quiquadrado 2 A distribuição amostral de S2 é proporcional à distribuição 2 pois S2 2 2n1 S2 2 2n1 R R Z x n n i i 2 1 2 2 MANA6510 Distribuição de QuiQuadrado 2 Fábio Gerab Onde É o número de graus de liberdade A distribuição de 2 é definida pela função 2 MANA6510 Graus de Liberdade Fábio Gerab O número de Graus de liberdade mensura o número de determinações independentes utilizadas na estimação de um parâmetro da população onde n é o número de elementos na amostra elementos na amostra e k é o número de vínculos ou restrições existentes na análisa nk MANA6510 Distribuição de QuiQuadrado 2 Fábio Gerab A variável 2 nunca é negativa Distribuição de quiquadrado 2 MANA6510 Distribuição de QuiQuadrado 2 Fábio Gerab Ex para 4 e 2 temos 2 2 42 11668 2 10 6 3 1 A Distribuição de 2 Depende do número de graus de liberdade Testes utilizando a Distribuição 2 Fábio Gerab Os testes de 2 tem múltiplas aplicações Testes de 2 Ideia básica Como 2 fornece a distribuição do desvio quadrático médio em relação ao parâmetro médio ela pode ser utilizada para testar hipóteses sobre estes desvios Etapas dos testes 1 Compare o resultado observado com o resultado esperado determinando sua diferença 2 Suponha que a hipóteses nula H0 são verdadeiras assim diferenças muito grandes não são esperadas 3 Calcule o valor obtido para o 2 através da soma das diferenças ao quadrado 4 Teste a hipótese nula H0 para valor encontrado do 2 utilizando a distribuição de 2 para graus de liberdade e para um nível de significância estabelecido rejeitando valores muito grandes Tabelas de Contingência Teste de independência para dados categóricos teste de proporções Fábio Gerab Variável categórica Posiciona o objeto de estudo em um grupo ou categoria Lembrando que quando duas variáveis X e Y são independentes então Pxiyj Pxi Pyj ij Logo testar a independência das variáveis significa testar a hipótese H0 Pxiyj Pxi Pyj H1 Pxiyj Pxi Pyj Utilizando a variável 2 O teste de 2 é sempre um teste unilateral à direita Tabelas de Contingência Teste de independência para dados categóricos Fábio Gerab Usar uma tabela de contingência tabela cruzada para encontrar as frequências esperadas Usar uma distribuição quiquadrado para testar se duas variáveis são independentes Tabela de contingência r c Mostra as frequências observadas para duas variáveis As frequências observadas são arranjadas nas fileiras r e nas colunas c A interseção de uma fileira com uma coluna é chamada de célula A Tabela de Contingência também é chamada de Tabela Cruzada Cross Table Fábio Gerab Tabelas de Contingência Teste de independência para dados categóricos Exemplo 1 A tabela de contingência mostra os resultados de uma amostra aleatória de 550 presidentes de empresas classificados por idade e tamanho da empresaAdaptado de Grant Thornton LLP The Segal Company Idade Tamanho 39 ou menos 40 49 50 59 60 69 70 ou mais Pequena média 42 69 108 60 21 Grande 5 18 85 120 22 Fábio Gerab Tabelas de Contingência Teste de independência para dados categóricos Assumindo que as duas variáveis são independentes podese usar a tabela de contingência para encontrar a frequência esperada para cada célula Idade Tamanho 39 ou menos 40 49 50 59 60 69 70 ou mais Total Pequena Média 42 69 108 60 21 300 Grande 5 18 85 120 22 250 Total 47 87 193 180 43 550 Fábio Gerab Tabelas de Contingência Teste de independência para dados categóricos 12 300 87 4745 550 E 13 300 193 10527 550 E Idade Tamanho da empresa 39 ou menos 40 49 50 59 60 69 70 ou mais Total Pequena Média 42 69 108 60 21 300 Grande 5 18 85 120 22 250 Total 47 87 193 180 43 550 Valores esperados Valores Observados Fábio Gerab Tabelas de Contingência Teste de independência para dados categóricos Tendose os valores observados O e esperados E calculase a variável quiquadrado 2 2 O E E Idade Tamanho da empresa 39 ou menos 40 49 50 59 60 69 70 ou mais Total Pequena Média 42 2564 69 4745 108 10527 60 9818 21 2345 300 Grande 5 2136 18 3955 85 8773 120 8182 22 1955 250 Total 47 87 193 180 43 550 Fábio Gerab Tabelas de Contingência Teste de independência para dados categóricos 2 2 O E E Assim 2 resp 779 2 2 2 2 2 2 2 2 2 2 42 2564 69 4745 108 10527 60 9818 21 2345 2564 4745 10527 9818 2345 5 2136 18 3955 85 8773 120 8182 22 1955 2136 3955 8773 8182 1955 779 Tabelas de Contingência Teste de independência para dados categóricos 001 χ2 0 13277 779 Teste ao nível de significância 001 1 a hipótese H0 onde H0 Idades são independentes dos tamanhos das empresas H1 Idades não são independentes dos tamanhos das empresas O número de Graus de Liberdade do teste será x y r 1 c 1 Logo para α 001 2 1 5 1 4 Temos da tabela da distribuição de 2 que P 2 4001 13277 001 1 Fábio Gerab Tabelas de Contingência Teste de independência para dados categóricos Distribuição 2 Tabelas de Contingência Teste de independência para dados categóricos 001 χ2 0 13277 779 Como o quiquadrado proveniente dos dados coletados 2 res 779 é maior que 13277 então rejeita se ao nível de 1 a hipótese H0 Logo O teste indica que as idades dos Presidentes dependem do tamanho da empresa Teste ao nível de significância 001 1 a hipótese H0 onde H0 Idades são independentes dos tamanhos das empresas H1 Idades não são independentes dos tamanhos das empresas Tabelas de Contingência Teste de independência para dados categóricos As seguintes condições devem ser preenchidas para o uso do teste quiquadrado para independência 1 As frequências observadas devem ser obtidas usando uma amostra aleatória 2 Cada frequência esperada deve ser maior que ou igual a 5 Observação importantes Exemplo 2 Um gestor deseja testar a um nível de significância de 25 se a incidência de defeitos em uma linha de produção independe do turno da de trabalho Para tanto ele avalia a qualidade da produção ao longo de uma semana tal que A ideia é testar se a proporção de defeitos é a mesma para todos os turnos Tabelas de Contingência Teste de independência para dados categóricos teste de proporções Turno Manhã Tarde Noite Defeituosos 45 55 70 Perfeitos 905 890 870 Frequências observadas e esperadas Proporção média 170 2835 5996 Tabelas de Contingência Teste de independência para dados categóricos teste de proporções 2 res 4557257 9058932893 555672567 870883728837 629 21 31 2 Da Tabela da Dist 2 temos 2 20025 7378 Como 2 res 2 20025 aceitase a hipótese nula H0 Logo O teste a um nível de 25 não confirma a existência de diferença Turno Manhã Tarde Noite Total Defeituosos 45 55 70 170 Defeituosos Esperados 570 567 564 Perfeitos 905 890 870 2665 Perfeitos Esperados 8930 8883 8836 Total 950 945 940 2835 Fábio Gerab Tabelas de Contingência Teste de independência para dados categóricos Distribuição 2 2 usado para o Teste da Qualidade do Ajuste Fábio Gerab 06 de agosto de 2012 Distribuição 2 sendo utilizada para testar se uma distribuição de frequência se encaixa numa distribuição de probabilidade afirmada Ex 1 Será que os nascimentos são distribuídos igualmente ao longo dos dias da semana ou menos bebes nascem aos sábados e domingos pelo fato de os médicos considerarem nascimentos no final de semana inconvenientes Dia Dom Seg Ter Qua Qui Sex Sáb Nascimentos verificados 13 23 24 20 27 18 15 Testar a um nível de 10 H0 p1p2p3p4p5p6p7 17 H1 nem todos pi 17 Utilizando a amostragem aleatória de 140 nascimentos de registros locais abaixo testar a igualdade para um nível de significância 01 2 no Teste da Qualidade do Ajuste Fábio Gerab 06 de agosto de 2012 Quando o teste de 2 é aplicado a uma hipótese de variável categórica que tem uma dist probabilidade especificada ele é chamado de Teste da Qualidade o Ajuste Testar H0 p1 p2 p3 4 p5 p6 p7 17 H1 nem todos pi 17 Neste caso só uma variável está em estudo teremos n1 71 6 Dia Dom Seg Ter Qua Qui Sex Sab Soma Nascimentos Verificados 13 23 24 20 27 18 15 140 Nascimentos Esperados 20 20 20 20 20 20 20 140 Diferença 7 3 4 0 7 2 5 0 Diferença2 49 9 16 0 49 4 25 152 Diferença220 245 045 080 000 245 020 125 76 Fábio Gerab Teste da Qualidade do Ajuste Distribuição 2 2 no Teste da Qualidade do Ajuste Fábio Gerab 06 de agosto de 2012 Distribuição 2 sendo utilizada para testar se uma distribuição de frequência se encaixa numa distribuição de probabilidade afirmada Assim 2 res 76 Neste caso só uma variável está em estudo teremos n1 71 6 Da tabela teremos para 2 dado por tabela 2 6 010 1064 Assim como 2 res 76 2 6 010 1064 aceitamos para um nível de significância de 10 a hipótese H0 2 2 O E E 76 Concluise que os 140 nascimentos observados não forneceram evidências suficientes de que os nascimentos não sejam igualmente prováveis ao longo da semana MANA6510 Teste de uma variância Fábio Gerab A distribuição de 2 Permite testar valores assumidos para a variância Distribuição amostral de S2 Logo a distribuição amostral de S2 é proporcional à distribuição 2 pois S2 2 2n1 MANA6510 Teste de uma variância Exemplo 1 O gerente de produção desconfia que a dispersão dos comprimentos do vergalhões produzidos está elevada O supervisor desta linha de produção de afirma que o desvio padrão do comprimento dos vergalhões produzidos é de até 5 mm Uma amostra de 12 vergalhões apontou um desvio padrão de 75 mm Baseado nesta amostra a um nível de 5 é possível aceitar a afirmação do supervisor Afimativa 5 Amostra de tamanho n 12 forneceu S 75 Vamos proceder um teste unilateral à direita tal que H0 5 H1 5 MANA6510 Teste de uma variância Exemplo 1 O gerente de produção desconfia que a dispersão dos comprimentos do vergalhões produzidos está elevada O supervisor desta linha de produção de afirma que o desvio padrão do comprimento dos vergalhões produzidos é de até 5 mm Uma amostra de 12 vergalhões apontou um desvio padrão de 75 mm Baseado nesta amostra a um nível de 5 é possível aceitar a afirmação do supervisor Amostra de tamanho n 12 forneceu S 75 Logo 2 S2 n1 2 Como 2 res 752 121 52 5625 11 25 2475 e 2 2 11005 19675 Assim como 2 res 2475 2 11 05 19675 rejeitamos para um nível de significância de 5 a hipótese H0 Concluise que a amostra a um nível de 5 não confirma a declaração do supervisor Fábio Gerab Teste da Qualidade do Ajuste Distribuição 2 Obrigado Fábio Gerab