·

Ciências Contábeis ·

Estatística 2

· 2021/2

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Estatística II Capítulo II Coeficiente de Correlação Prof. Moacir Manoel Rodrigues Junior, Dr. Faculdade de Administração e Ciências Contábeis Universidade Federal do Rio de Janeiro Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Sumário 1 Contexto Geral 2 Coeficiente de Correlação 3 Teste sobre Coeficiente de Correlação 4 Intervalo de Confiança do Coeficiente de Correlação Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Contexto Geral Os testes apresentados até o momento, em especial o de Médias para Amostras Independentes e o Teste ANOVA, são exemplos de associações entre duas variáveis. Nesses casos, a associação realizada é entre uma variável qualitativa (categórica) e outra quantitativa (numérica). O que vamos buscar nesse início do Capítulo 4 é a relação entre duas variáveis quantitativas. Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Situação 1: Considerando duas variáveis: X− Número de anos de serviço; e Y − Número de Clientes de agentes de uma companhia de seguros. Pelo gráfico, é possível perceber a existência entre as duas variáveis no sentido de quanto mais anos de serviço maior o número de clientes aumenta. Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Situação 2: Considerando duas variáveis: X− renda bruta mensal (expressa em número de salários mínimos); e Y − porcentagem da renda bruta anual gasta com assistência médica. Nesse caso, a relação entre as duas variáveis é inversa. Ou seja, quanto maior a renda anual, menor tende a ser o percentual gasto com saúde. Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Quando comparamos duas variáveis, procuramos geralmente qual o grau de associação entre elas. Existem para tanto duas estatísticas que dão conta disso, a covariância e a correlação. A medida de covariância mede o grau de associação bruto (não padronizado). O coeficiente de correlação é uma medida padronizada de covariância. Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Dadas duas variáveis aleatórias X e Y , ambas assumidas normalmente distribuídas, cada qual com médias µX e µY e desvios-padrão σX e σY , respectivamente. A covariância σXY associa, em relação a média, como cada observação se comporta observando X e Y . Desvio em Relação a média de X → xi = (Xi − X) Desvio em Relação a média de Y → yi = (Yi − Y ) Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Se a observação estiver tanto em X como em Y acima da média, a característica é de que a informação é diretamente relacionada. O mesmo ocorre quando ambas estão abaixo da média. Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Se a observação em X estiver acima da média e Y abaixo da média, a característica é de que a informação é inversamente relacionada. O mesmo ocorre quando X está abaixo da média e Y está acima dela. Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação É possível observar que: Quando a informação está abaixo da média, então: X − X < 0 e Y − Y < 0 Quando a informação está acima da média, então: X − X > 0 e Y − Y > 0 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Nesse caso, considerando a multiplicação dos resíduos em relação a média, temos: (Xi − X)(Yi − Y ) > 0 (Xi − X)(Yi − Y ) > 0 (Positivo) × (Positivo) (Negativo) × (Negativo) (Xi − X)(Yi − Y ) < 0 (Xi − X)(Yi − Y ) < 0 (Positivo) × (Negativo) (Negativo) × (Positivo) Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlacdo Teste sobre Coeficiente de Correlacdo Intervalo de Confianca do Coeficiente de Correlacdo Coeficiente de Covariancia: A associacao entre duas variaveis esta vinculado ao grau de concordancia/discordancia apresentado por elas dada sua centralizacao frente as respectivas médias. Dados n pares de valores (Xi, Y1),..-,(Xn, Yn), chamaremos de covariancia entre as duas variaveis X e Y a P(X — X\%; — ¥ — ! I cov(X, Y) _— i 1( )( ) n Observacao: esta medida nao oferece uma escala padrao, esta Ke contaminada pelas métricas utilizadas em cada medida. — UFRJ Contexto Geral Coeficiente de Correlacdo Teste sobre Coeficiente de Correlacdo Intervalo de Confianca do Coeficiente de Correlacdo Coeficiente de Correlacao: Na busca por uma medida padronizada, define-se a seguir o coeficiente de correlacao: Dados n pares de valores (Xj. Yi), (X2, Y2),---, (Xn; Yn), chamaremos de coeficiente de correlacdo entre as duas variaveis X eYa (X,Y) COV corr(X, Y) = ———— ox: oy ou _ _ Sor (X} — X)(¥; — Y = I ! - corr(X, Y) = eM XO) ar n . Y\2 n : V)\2 JrRa(X — XP D(% - ¥) £ JFRI Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Observações O coeficiente de correlação pode ser visto como a média dos produtos dos valores padronizados das variáveis. A notação mais comum para a medida populacional da correlação é ρX,Y . A letra rX,Y é associado ao valor amostral da correlação, ou valor estimado. corr(X, Y ) = rX,Y . É fácil assumir que corr(X, Y ) = corr(Y , X). Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Não é difícil perceber que o coeficiente de correlação satisfaz −1 ≤ corr(X, Y ) ≤ 1 Correlação Negativa −1 ≤ r ≤ 0 Correlação Nula r ≈ 0 Correlação Positiva 0 ≤ r ≤ 1 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Valores de Referência: Correlação Perfeita Negativa r = −1 Correlação Nula r = 0 Correlação Perfeita Positiva r = 1 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Exemplo: Vamos retornar aos dados apresentados na Situação 1. Nela busca-se associar duas variáveis: X− Número de anos de serviço; e Y − Número de clientes de agentes de uma companhia de seguros. Agente Anos de serviço (X) Número de clientes (Y ) A 2 48 B 3 50 C 4 56 D 5 52 E 4 43 F 6 60 G 7 62 H 8 58 I 8 64 I 10 72 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Coeficiente de Correlação Exercício: Para os dados apresentados na Situação 2, calcular os coeficientes de covariância e correlação das variáveis: X− renda bruta mensal (expressa em número de salários mínimos); e Y − porcentagem da renda bruta anual gasta com assistência médica. Família X Y A 12 7,2 B 16 7,4 C 18 7,0 D 20 6,5 E 28 6,6 F 30 6,7 G 40 6,0 H 48 5,6 I 50 6,0 J 54 5,5 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Teste sobre Coeficiente de Correlação Inferência sobre Correlação Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral (eX ire nln -Me lM ela c-1 Torte) Teste sobre Coeficiente de Correlacao Intervalo de Confian¢a do Coeficiente de Correlacao Estatistica Amostral Considerando o estimador de correlacdo r de Pearson. Sua estatistica, quando assumir a referéncia de p = 0, é dada por: n—-2 Teal =F 1— r? Essa estatistica segue a distribuicdo amostral t de Student com n— 2 graus de liberdade. Or UFRJ Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Teste sobre Coeficiente de Correlação Exemplo 1: (Continuação...) Vamos retornar à Situação 1. X− Número de anos de serviço; e Y − Número de clientes de agentes de uma companhia de seguros. A correlação estimada é estatisticamente diferente de zero? Solução: Passo 1: Hipótese Hipótese Nula: H0 : ρ = 0 Hipótese Alternativa: H1 : ρ ̸= 0 Passo 2: Região Crítica (RC) Como n = 10(n − 2 = 8 graus de liberdade), para α = 0, 05, tem-se tcrít = 2, 306 RC = (−∞; −2, 306) ∪ (2, 306, +∞) Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Exemplo 1: (Continuacdo...) Solucao: Passo 3: Estatistica do teste Com r = 0,8768 e n= 10: n—-2 10-2 Teal = 14] ——> = 0, 8768, | —————_~. = 5, 1574 af VT °°" 10, 87682 Passo 4: Conclusdo Como |Teai| > | Terit| + 5,157 > 2,306, Rejeitar Ho e Aceitar Hi. Gy UFRJ Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Intervalo de Confiança sobre Correlação Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Seja ρ = ρX,Y o verdadeiro coeficiente de correlação populacional desconhecido. Vamos apresentar a distribuição amostral r para duas condições da população: ρ = 0 e ρ ̸= 0(ρ = ρ0). Em ambos os casos, a distribuição amostral exige que a distribuição da v.a. (X, Y ) na população seja normal bidimensional. Fisher propôs a seguinte estatística: ξ = 1 2ln1 + r 1 − r Com distribuição muito próxima de uma normal N(µξ, σ2 ξ), onde: µξ = 1 2ln1 + ρ0 1 − ρ0 , σ2 ξ = 1 n − 3 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Exemplo: Teste para ρ = ρ0. Durante muito tempo, o coeficiente de correlação entre a nota final num curso de treinamento de operários e sua produtividade, após seis meses de curso, resultou ser 0, 50. Foram introduzidas modificações no curso, com o intuito de aumentar a correlação. e o coeficiente de correlação de uma amostra de 28 operários submetidos ao novo curso foi 0, 65, você diria que os objetivos de modificação foram atingidos? Solução: Passo 1: Hipótese Hipótese Nula: H0 : ρ = 0.5 Hipótese Alternativa: H0 : ρ > 0.5 (uni-caudal) Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Solução:(continuação...) Passo 2: Estatística do teste Com ρ0 = 0, 5 e n = 28 Estimando µξ: µξ = 1 2ln1 + ρ0 1 − ρ0 µξ = 1 2ln1 + 0, 5 1 − 0, 5 = 0, 549 Estimando σξ: σ2 ξ = 1 n − 3 σ2 ξ = 1 28 − 3 = 1 25 = 0, 04 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Solução:(continuação...) Passo 3: Estatística Calculada Com ρ0 = 0, 65 e n = 28 ξ = 1 2ln1 + ρ0 1 − ρ0 = 1 2ln1 + 0, 65 1 − 0, 65 = 0, 774 Como ξ ∼ N(µξ, σ2 σξ), transforma-se para a distribuição normal padrão: Zcal = ξ − µξρ σξρ = 0, 774 − 0, 549 √0, 04 = 1, 125 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Solução:(continuação...) Passo 4: Estatística Crítica Assumindo o nível de significância α = 0, 05, para a estatística normal padrão (unicaudal): Zcrit = 1, 65 Passo 5: Conclusão Como |Zcal| < |Zcrit| → 1, 125 < 1, 65, Não-Rejeitar H0. Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Coeficiente de Correlacdo Teste sobre Coeficiente de Correlacdo Intervalo de Confianca do Coeficiente de Correlacdo Define-se o intervalo de confianca, para a = 0,05, como (considerar Zit = 1,96 por haver o limite inferior e superior): IC(E|r) = br + Zerit/0%, = 0,774 + 1, 96/0, 04 IC(E|&o) = 0,774 +0, 392 Limite Inferior Limite Superior fing = 0, 774 — 0, 392 = 0, 382 Esup = 0,774 + 0,392 = 1, 166F 9 UFRJ Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Considerando a Transformação de Fisher: ξ = 1 2ln1 + r 1 − r → r = e2ξ − 1 e2ξ + 1 Passo 6: Intervalo de Confiança (continuação...) Limite Inferior ξinf = 0, 774 − 0, 392 = 0, 382 r = e2·0,382 − 1 e2·0,382 + 1 = 0, 364 Limite Superior ξsup = 0, 774 + 0, 392 = 1, 166 r = e2·1,166 − 1 e2·1,166 + 1 = 0, 823 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Contexto Geral Coeficiente de Correlação Teste sobre Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Intervalo de Confiança do Coeficiente de Correlação Exemplo 1: (Continuação...) Vamos retornar à Situação 1. X− Número de anos de serviço; e Y − Número de clientes de agentes de uma companhia de seguros. Qual o intervalo de confiança desta estatística, para nível de confiança de 95%? Solução: Intervalo de confiança 95%(α = 0, 05)(considerar Zcrit = 1, 96): µξ = 1 2ln1 + r 1 − r = 1 2ln1 + 0, 8768 1 − 0, 8768 = 1, 3618 σ2 ξ = 1 n − 3 = σ2 ξ = 1 10 − 3 = 1 7 = 0, 1429 Prof. Moacir Manoel Rodrigues Junior, Dr. Estatística II Coeficiente de Correlacdo Teste sobre Coeficiente de Correlagao Intervalo de Confianca do Coeficiente de Correlacdo Solucao: (continuacao...) IC(E|r) = we, + Zerte/o2, = 1,3618 + 1,96,/0, 1429 IC(é|r) = 1, 3618 + 0, 7409 &ing = 1,3618—0,7409 =0,6209 = sup = 1, 3618+0, 7409 = 2, 1027 2-0,6209 2:2,1027 eo —1 eos all linf = €2-0,6209 4 = 0,5516 sup = @22,1027 4 1 = 0, 9706 Conclusao: Com 95% de confianca, temos que Gens 0,5516 < p < 0,9706.