·

Ciências Contábeis ·

Estatística 2

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Estatıstica II para Ciˆencias Contabeis Codigos MAD245 Turma B Oferecido pelo Departamento de metodos estatısticos DME Instituto de Matematica UFRJ Introducao a disciplina Email para contato luizadmeufrjbr Usaremos o Classroom para organizacao e trabalhos Codigo do Classroom o22bsst Bibliografia para revisao Bussab W O e Morettin A M Estatıstica Basica Editora Saraiva 2009 Tavares MEstatıstica Aplicada a Administracao CAPES 2021 Apostila Santos R Material Introdutorio sobre R Bibliografia de regressao linear NETER WASSERMAN KUTNER Applied linear statistical models DME IM UFRJ Estatıstica II 1 Organizacao do Curso Parte I Revisao Introducao Distribuicao Normal Esperanca e Variˆancia Nocoes de Inferˆencia Estimador Intervalo de Confianca Teste de Hipotese Associacao entre variaveis DME IM UFRJ Estatıstica II 2 Organizacao do Curso Parte II Regressao Linear Simples Pressupostos Modelagem Analise de Resıduos DME IM UFRJ Estatıstica II 3 Organizacao do Curso Parte III Regressao Linear Multipla Pressupostos Modelagem Analise de Resıduos DME IM UFRJ Estatıstica II 4 Avaliacoes As notas serao dadas por dois trabalhos uma para a P1 e outro para a P2 Datas de divulgacao e de entrega a definir Haverao atividades valendo ponto extra a definir DME IM UFRJ Estatıstica II 5 Regressao Linear Multipla DME IM UFRJ Estatıstica II 1 Regressao linear multipla ideias inicias Na pratica o uso de uma regressao simples Yi β0 β1Xi ϵi pode ser simplista demais Dificilmente fenˆomenos reais serao bem explicados pelo uso de uma unica covariavel Possivelmente as vendas semanais de uma loja poderia ser me lhor descritas com o uso de covariaveis alem da quantidade de clientes ex epoca do ano horario etc Em outras palavras poderıamos ver da seguinte forma Modelo 1 vendas β0 β1clientes Modelo 2 vendas β0 β1clientes β2epoca β3ano E natural imaginar que o modelo 2 seja mais informativo que o modelo 1 por agregar mais informacao no contexto da resposta DME IM UFRJ Estatıstica II 2 Regressao linear multipla formalizacao Na teoria de regressao linear a versao multipla e a mais usada Considere i 1 n sendo n o numero total de observacoes e p o numero de coeficientes de regressao O modelo de regressao linear multipla pode ser descrito como Yi β0 β1Xi1 β2Xi2 βp1Xip1 ϵi em que Yi e a variavel resposta da iesima observacao β0 βp1 sao os coeficientes de regressao Xi1 Xip1 sao as variaveis explicativas da iesima observacao ϵi e o erro aleatorio da iesima observacao DME IM UFRJ Estatıstica II 3 Regressao linear multipla suposicoes Primeiro de tudo e importante supor que todos os Xij com j 1 p 1 possuem uma relacao linear com Yi e sao in dependentes entre si Portanto atencao nao pode haver uma relacao entre as variaveis explicativas Alem disso tambem se considera que as variaveis explicativas sao conhecidas e portanto nao sao variaveis aleatorias Neste contexto pressupoese que os erros aleatorios ϵi sao inde pendentes e identicamente distribuıdos com distribuicao N0 σ2 Dessa forma temse que EYi β0 β1Xi1 βp1Xip1 VarYi σ2 ϵ Yi Nβ0 β1Xi1 βp1Xip1 σ2 DME IM UFRJ Estatıstica II 4 Regressao linear multipla interpretacao Assim como na regressao linear simples podemos interpretar os resultados do modelo O coeficiente β0 representa a media de Yi quando todas as variaveis explicativas sao 0 Ja os coeficientes β1 βp1 podemos interpretar da seguinte forma eles sao o aumento esperado em Yi quando a variavel explicativa aos quais estao associados aumenta em uma unidade e todas as outras variaveis independentes continuam constante Exemplo β1 e o aumento esperado em Yi quando Xi1 au menta em uma unidade e Xi2 Xip1 nao mudam DME IM UFRJ Estatıstica II 5 Regressao linear multipla significˆancia Os coeficientes β1 βp1 representam o efeito de sua respectiva variavel explicativa em Yi Podemos testar a significˆancia de uma variavel explicativa Xij em Yi a partir das hipoteses H0 βj 0 H1 βj 0 Se o pvalor for abaixo de 0 05 verificamos que o efeito de Xij em Yi e significativo entao devemos manter aquela variavel no modelo Caso contrario a variavel nao e significativa para expli car Yi e deve ser retirada do modelo De forma analoga podemos olhar para o intervalo de confianca de βj Se o intervalo contiver o 0 concluımos que Xij nao e significativa Caso contrario entao Xij e significativa OBS Se nenhum βj para j1p1 for significativo entao a regressao nao e significativa DME IM UFRJ Estatıstica II 6 Variaveis qualitativas em regressao Por vezes pode ser do interesse do pesquisador incluir variaveis qualitativas na modelagem Sera que o salario de funcionarios de uma empresa pode ser explicado pelo sexo do indivıduo O sexo e uma variavel qualitativa Entao como fazemos para incluılo no modelo Para incluir variaveis qualitativas nos modelos de regressao e ne cessario a criacao de variaveis indicadoras dummy que farao o papel de identificar a qual categoria daquela variavel o indivıduo pertence Para uma variavel qualitativa de k categorias e preciso criar k 1 variaveis indicadoras que assumem 0 ou 1 se o indivıduo esta naquela categoria DME IM UFRJ Estatıstica II 7 Vaiáveis qualitativas em regressão exemplo A variável sexo possui duas categorias feminino e masculino então precisamos apenas de uma variável indicadora Podemos definila como Xi11 se o iésimo indivíduo for homem 0 se o iésimo indivíduo for mulher Nesse caso o modelo de regressão com sexo sendo sua única variável explicativa seria Yiβ0β1Xi1ϵi ϵiN0σ² Esse modelo implicaria que β1 significa a diferença na média do salário do iésimo indivíduo quando ele é do sexo masculino Um coeficiente positivo significa que homens ganham mais do que as mulheres categoria de referência Vaiáveis qualitativas em regressão exemplo A variável nível de escolaridade possui cinco categorias Sem nível de instrução 0 Ensino Fundamental 1 Ensino Médio 2 Ensino Superior 3 e PósGraduação 4 Portanto é preciso criar quatro variáveis indicadoras Para j1k1 temse Xij1 se o iésimo indivíduo pertence à jésima categoria 0 caso contrário Nesse caso o modelo de regressão seria Yiβ0β1Xi1β2Xi2β3Xi3β4Xi4ϵi ϵiN0σ² Quando Xi1 Xi2 Xi3 e Xi4 forem iguais a 0 entendese que o indivíduo não possui nível de instrução categoria de referência As interpretações anteriores são válidas para este modelo e elas são sempre em relação à categoria de referência