·

Administração ·

Inferência Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

CORRELAC AO E REGRESS AO UAEstCCTUFCG UAEstCCTUFCG Correlacao e Regressao 115 Correlacao e Regressao Introducao A analise de correlacao e regressao compreende a analise de da dos amostrais para saber se e como duas ou mais variaveis quan titativas estao relacionadas uma com a outra numa populacao A correlacao mede a forca ou o grau de relacionamento entre as duas variaveis a regressao da uma equacao que descreve o rela cionamento em termos matematicos Estudaremos a relacao linear Y β0 β1X UAEstCCTUFCG Correlacao e Regressao 215 Correlacao e Regressao Introducao Os dados para a analise de correlacao e regressao provˆem de observacoes de variaveis emparelhadas a Para um problema de duas variaveis isto significa que cada observacao origina dois valores um para cada variavel Por exemplo i peso e altura dos alunos do primeiro ano dos cursos de Administracao e Economia ii quantidade de trigo produzida e quantidade de agua recebida por canteiros numa estacao experimental iii acuidade visual e idade de um grupo de pessoas UAEstCCTUFCG Correlacao e Regressao 315 Correlacao e Regressao Introducao Os dados para a analise de correlacao e regressao provˆem de observacoes de variaveis emparelhadas b Para um problema com trˆes variaveis cada observacao origina trˆes valores Por exemplo alem da idade e altura de cada indivıduo poderıamos incluir tambem o peso na analise UAEstCCTUFCG Correlacao e Regressao 415 Correlacao Existe uma correlacao entre duas variaveis quando uma delas esta de alguma forma relacionada com a outra Definigao O coeficiente de correlagao linear r mede o grau de relacionamento linear entre os valores emparelhados x e y em uma amostra Sendo 2 yi as observacées individuais de cada elemento de uma amostra de tamanho n o coeficiente de correlacao linear é dado por n r iat LiYi NIY n1SSy onde S é o desvio padrao amostral da varidvel x e Sy é o desvio padrao amostral da varidvel y Propriedades do Coeficiente de Correlacao Linear 1 1 r 1 2 Interpretacao Se o valor de r esta proximo de zero concluımos que nao ha correlacao linear significativa entre x e y mas se r esta proximo de 1 ou 1 concluımos pela existˆencia de correlacao linear significativa entre x e y 3 r mede a intensidade ou grau de um relacionamento linear Nao serve para medir a intensidade de um relacionamento naolinear UAEstCCTUFCG Correlacao e Regressao 615 Exemplo Coeficiente de Correlacao Linear Exemplo Suponha que tenhamos coletado dados de vendedores de carros usados sobre quilometragem em unidades de 1000 Km e precos em reais de uma certa marca Os dados se encontram na Tabela 1 Tabela Dados amostrais hipoteticos Quilometragem e Preco de venda de carros Observacao i Quilometragem xi Preco de venda yi 1 40 10000 2 30 15000 3 30 12000 4 25 18000 5 50 8000 6 60 10000 7 65 5000 UAEstCCTUFCG Correlacao e Regressao 715 Exemplo Coeficiente de Correlacao Linear Exemplo Suponha que tenhamos coletado dados de vendedores de carros usados sobre quilometragem em unidades de 1000 Km e precos em reais de uma certa marca Os dados se encontram na Tabela 1 Tabela Dados amostrais hipoteticos Quilometragem e Preco de venda de carros Observacao i Quilometragem xi Preco de venda yi 8 10 30000 9 15 25000 10 20 20000 11 55 8000 12 40 15000 13 35 20000 14 30 20000 UAEstCCTUFCG Correlacao e Regressao 815 Exemplo Coeficiente de Correlacao Linear Um dispositivo bastante util para se verificar uma relacao linear entre essas duas variaveis e o diagrama de dispersao a seguir Percebemos que parece haver uma associacao linear entre as variaveis porque no conjunto a medida que a quilometragem aumenta diminui o preco do carro Contudo e muito util quantificar esta associacao UAEstCCTUFCG Correlacao e Regressao 915 Exemplo Coeficiente de Correlacao Linear Considerando os dados da Tabela 1 obtemos So way 6400000 j1 14 14 14 14 S vj 505 Sax 21825 S y 216000 S y 3996000000 11 11 i1 i1 Dai podemos calcular a média e 0 desvio padrao das variaveis X e Y 140 M4 p Liat 3607 7 Liat 15408 57 14 14 e g Doi v7 nz 21825 1436 07 16 66 n1 13 roy any 1415428 57 5 Viz yi ny 3996000000 15428 57 7143 74 n1 13 Exemplo Coeficiente de Correlacao Linear Apos obter estas medidas podemos calcular o coeficiente de correlacgao linear r para estes dados Observe que a ey tiys NEY 6400000 1436 07 15428 57 090 n 1828y 1316 667143 74 oO Esse valor indica uma forte associacao linear negativa ou inversa entre as varidveis Isto é quanto maior a quilometragem do carro menor o preco de venda Teste de hipoteses para o coeficiente de correlacao linear A magnitude do valor do coeficiente de correlacao linear esta diretamente ligada ao nıvel de relacionamento linear entre as variaveis Quao proximo de 1 ou 1 deve esta o r para que possamos considerar a relacao linear como razoavel Uma maneira de responder a esta pergunta e atraves de um teste de hipoteses UAEstCCTUFCG Correlacao e Regressao 1215 Teste de hipoteses para o coeficiente de correlacao linear As hipdteses a serem testadas sdo Ao p 0 Nao ha correlacAo linear significativa A p 0 Correlagao linear significativa Para amostras retiradas de uma populac4o para a qual r 0 podese provar que a estatistica a seguir tem distribuiao t de Student com n 2 graus de liberdade Tr na2 1 Vir M Dado 0 a 1 0 nivel de significancia do teste a regiao critica padronizada do teste é dada por RC 00 te U te 00 M Conclusao Se a estatistica T RC rejeitamos a hipdtese de p 0 ou seja podemos considerar o modelo linear razodvel para relacionar as varidveis x e y Isto quer dizer que y 89 62 O préximo passo sera estimar os parametros o e 3 do modelo Exemplo de Teste de hipoteses para o coeficiente de correlacao linear Exemplo Ainda considerando o exemplo anterior vamos testar se a relacao linear e adequada para explicar a relacao das variaveis Quilometragem e Preco Como n 14 e considerando α 5 temos a seguinte regiao crıtica RCp 2 179 2 179 Vimos tambem que r 0 90Substituindo este valor na expressao 1 com n 14 obtemos T 7 15 que pertence a RCplogo rejeitamos a hipotese de ρ 0ou seja parece razoavel supor uma relacao linear en tre as variaveis Quilometragem e Preco Este teste comprova aquilo que o diagrama de dispersao ja indicava UAEstCCTUFCG Correlacao e Regressao 1415 Bibliografia Estatıstica Basica 7a edicao Wilton O Bussab e Pedro A Morettin 2011 Editora Saraiva UAEstCCTUFCG Correlacao e Regressao 1515