·

Administração ·

Estatística 2

Envie sua pergunta para a IA e receba a resposta na hora

Fazer Pergunta

Texto de pré-visualização

UNIVERSIDADE FEDERAL DO MARANHÃO UFMA Fundação instituída nos termos da Lei nº 5152 de 21101966 São Luís Maranhão CENTRO DE CIÊNCIAS EXATAS E TECNOLOGIA CCET DEPARTAMENTO DE MATEMÁTICA DEMAT afonsofilhoufmabr Estatística II CONTEÚDOS PROGRAMÁTICOS OBJETIVOS ESPECÍFICOS PROCEDIMENTOS METODOLÓGICOS RECURSOS DIDÁTICOS PROCEDIMENTOS AVALIATIVOS CORRELAÇÃO E REGRESSÃO Explicar e exemplificar Correlação Linear Explicar e exemplificar Teste de Hipótese para existência de Correlação Linear Explicar e exemplificar Regressão Linear Explicar e exemplificar Teste de Hipótese para existência de Regressão Linear Explicar e exemplificar Intervalo de Previsão da Regressão Metodologia dialética Aula dialógica Notebook Apresentação de slides Será numa perspectiva processual através de critérios qualitativos frequência interação participação interesse compromisso habilidade atitude e competência comunicativa Na abordagem diagnóstica sondar os níveis de aprendizado dos alunos através da interação e competência comunicativa Na abordagem formativa acompanhar mediando o processo ensinoaprendizagem Na abordagem somativa atribuir critérios quantitativos aspectos da cientificidade compreensão análise e síntese dos conteúdos Plano de Aula REFERÊNCIA FONSECA Jairo Simon MARTINS Gilberto A TOLEDO Geraldo L Estatística Aplicada SP Atlas 1991 Correlação e Regressão Na prática procurase verificar se existe relação entre duas ou mais variáveis A verificação da existência e do grau de relação entre variáveis é objeto de estudo da Correlação Uma vez caracterizada a Correlação procurase descrever uma relação sob forma matemática através de uma função A estimação dos parâmetros dessa função matemática é objeto de estudo da Regressão Correlação Linear Simples Definição Uma correlação é uma relação entre duas variáveis Os dados podem ser representados por pares ordenados x y Sendo x a variável independente ou explanatória e y a variável dependente ou resposta Em um diagrama de dispersão os pares ordenados x y são colocados no gráfico como pontos em um plano coordenado A variável independente explanatória x é indicada no eixo horizontal e a variável dependente resposta y no eixo vertical Um Diagrama de Dispersão pode ser usado para averiguar sobre a existência de uma correlação linear linha reta entre duas variáveis Os Diagramas de Dispersão a seguir mostram alguns tipos de Correlação Medida de Correlação É dado pelo coeficiente de Correlação de Pearson Símbolo 𝜌 lêse rhô População e r lêse erre Amostra Na população o coeficiente 𝜌 mede a aderência ou a qualidade do ajuste à verdadeira reta através da qual procuramos relacionar as variáveis X e Y ou ainda o grau de relação linear existente entre elas Na amostra o coeficiente r calculado a partir de uma amostra de n pares de observações de X e de Y mede a quantidade de dispersão em torno da equação linear ajustada através do método dos mínimos quadrados ou o grau de relação das variáveis O r é portanto uma estimativa do parâmetro 𝜌 medindo os desvios em relação à linha calculada pelo método dos mínimos quadrados Coeficiente de Correlação Linear de Pearson 𝑟 𝐶𝑂𝑉 𝑋 𝑌 𝑆𝑥 𝑆𝑦 𝑛 σ 𝑋𝑌 σ 𝑋 σ 𝑌 𝑛 σ 𝑋2 σ 𝑋 2 𝑛 σ 𝑌2 σ 𝑌 2 𝐶𝑂𝑉 𝑋 𝑌 𝑐𝑜𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑜𝑢 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑎 𝑑𝑒 𝑋 𝑒 𝑌 𝑆𝑥 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 𝑑𝑎 𝑣𝑟𝑖á𝑣𝑒𝑙 𝑋 𝑆𝑦 𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 𝑑𝑎 𝑣𝑟𝑖á𝑣𝑒𝑙 𝑌 𝑛 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑝𝑎𝑟𝑒𝑠 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 Intervalo de variação de r O coeficiente de correlação r é uma medida cujo valor se situa no intervalo compreendido pelos valores 1 𝑟 1 Quando x e y têm uma correlação linear positiva forte r está próximo de 1 Quando x e y têm uma correlação linear negativa forte r está próximo de 1 Quando x e y têm correlação linear positiva perfeita ou correlação linear negativa perfeita r é igual a 1 ou 1 respectivamente Quando não há correlação linear r está próximo a 0 É importante lembrar que quando r está próximo de 0 não significa que não há relação entre x e y significa apenas que não há relação linear Exemplos de correlações e os respectivos valores do coeficiente r Y Renda R 100 X Poupança R1000 X2 Y2 XY 10 4 16 100 40 15 7 49 225 105 12 5 25 144 60 70 20 400 4900 1400 80 20 400 6400 1600 100 30 900 10000 3000 20 8 64 400 160 30 8 64 900 240 10 3 9 100 30 60 15 225 3600 900 ΣY 407 ΣX 120 ΣX2 2152 ΣY2 26769 ΣXY 7535 4 16 36 56 76 96 116 4 14 24 34 Renda Poupança Renda e Poupança de 10 famílias 𝑟 10 7535 120 407 10 2152 120 2 10 26769 407 2 0983 𝑟 𝑛 σ 𝑋𝑌 σ 𝑋 σ 𝑌 𝑛 σ 𝑋2 σ 𝑋 2 𝑛 σ 𝑌2 σ 𝑌 2 correlação linear positiva forte 1º Passo 2º Passo Fixar α Escolha da variável de Student t 3º Passo Com auxílio da Tabela t determine RA e RC 𝐻0 𝜌 0 𝑁ã𝑜 ℎá 𝑐𝑜𝑟𝑒𝑙𝑎çã𝑜 𝐻1 𝜌 0 𝐻á 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 4º Passo Cálculo da variável TESTE DE HIPÓTESE para o Coeficiente de Correlação populacional 𝝆 t 𝑟 1 𝑟2 𝑛 2 5º Passo Decisão Se t α 2 tc t α 2 Não se pode rejeitar H0 Se t t α 2 ou t t α 2 Re j eita se H0 1º Passo 2º Passo Fixar α 005 3º Passo Com auxílio da Tabela t determine RA e RC 𝐻0 𝜌 0 𝑁ã𝑜 ℎá 𝑐𝑜𝑟𝑒𝑙𝑎çã𝑜 𝐻1 𝜌 0 𝐻á 𝑐𝑜𝑟𝑟𝑒𝑙𝑎çã𝑜 4º Passo Cálculo da variável t 0983 1 09832 10 2 1514 5º Passo Decisão 1514 23060 Re j eita se H0 Do exemplo anterior r 0983 da amostra de 10 famílias Teste a hipótese para ρ com nível de significância de 005 Regressão Linear Simples Após verificar que a correlação linear entre duas variáveis é significativa o próximo passo é determinar a equação da reta que melhor modela os dados Essa reta é chamada de reta de regressão e sua equação pode ser usada para predizer os valores de y para um dado valor de x Uma reta de regressão também chamada de reta de melhor ajuste é a reta para a qual a soma dos quadrados dos resíduos é um mínimo A EQUAÇÃO DE UMA RETA DE REGRESSÃO A equação de uma reta de regressão para uma variável independente x e uma variável dependente y é 𝑌 𝑎 𝑏𝑥 Em que 𝑌 é o valor previsto de y para um dado valor de x A inclinação b e o intercepto em y a são dados por 𝑏 𝑆𝑋𝑌 𝑆𝑋𝑋 σ𝑋𝑌 σ𝑌σ𝑋 𝑛 σ𝑋2 σ𝑋2 𝑛 a 𝑌 𝑏 𝑋 σ 𝑌 𝑛 𝑏 σ 𝑋 𝑛 Em que ത𝑌 é a média dos valores de y no conjunto de dados e ത𝑋 é a média dos valores de x e n é o número de pares de dados A reta de regressão sempre passa pelo ponto x y VARIAÇÃO EM TORNO DA RETA DE REGRESSÃO VT Variação Total ou seja a soma dos quadrados dos desvios totais calculados em torno da média VR Variação Residual ou ao acaso ou não explicados ou seja a soma dos quadrados dos desvios nãoexplicados em torno da linha de regressão VE Variação Explicada ou seja a soma dos quadrados dos desvios explicados da linha de regressão em torno da média Frequentemente denominado Coeficiente de Determinação o poder explicativo da regressão tem por objetivo avaliar a qualidade do ajuste 𝑟2 𝑉𝑎𝑟𝑖𝑎çã𝑜 𝐸𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑉𝑎𝑟𝑖𝑎çã𝑜 𝑇𝑜𝑡𝑎𝑙 Quanto mais próximo de 1 estiver o valor do coeficiente de determinação melhor a qualidade do ajuste da função aos pontos do diagrama de dispersão e quanto mais próximo de zero pior será a qualidade do ajuste Podemos expressar O PODER EXPLICATIVO DO MODELO DE REGRESSÃO 𝑟2 𝑏2 𝑆𝑋𝑋 𝑆𝑌𝑌 0 𝑅2 1 𝑜𝑛𝑑𝑒 SYY σ𝑌2 σ𝑌2 𝑛 OBSERVAÇÃO Outra forma de calcular o coeficiente de correlação é extraindo a raiz quadrada do coeficiente de determinação 𝑟 𝑟2 Y Renda R 100 X Poupança R1000 X2 Y2 XY 10 4 16 100 40 15 7 49 225 105 12 5 25 144 60 70 20 400 4900 1400 80 20 400 6400 1600 100 30 900 10000 3000 20 8 64 400 160 30 8 64 900 240 10 3 9 100 30 60 15 225 3600 900 ΣY 407 ΣX 120 ΣX2 2152 ΣY2 26769 ΣXY 7535 Renda e Poupança de 10 famílias 4 16 36 56 76 96 116 0 5 10 15 20 25 30 35 Renda Poupança 𝑋 σ𝑋 𝑛 120 10 12 𝑌 σ𝑌 𝑛 407 10 407 𝑆𝑋𝑌 σ𝑋𝑌 σ𝑋σ𝑌 𝑛 7535 120 407 10 2651 𝑆𝑋𝑋 σ𝑋2 σ𝑋2 𝑛 2152 1202 10 712 𝑆𝑌𝑌 σ𝑌2 σ𝑌2 𝑛 26769 4072 10 1020410 𝑏 𝑆𝑋𝑌 𝑆𝑋𝑋 2651 712 372 a 𝑌 𝑏𝑋 407 372 12 394 𝑌 394 372 𝑋 é a reta estimada 𝑅2 𝑏2 𝑆𝑋𝑋 𝑆𝑌𝑌 3722 712 1020410 0966 ou 𝑅2 𝑏 𝑆𝑋𝑌 𝑆𝑌𝑌 100 372 2651 1020410 100 966 4 16 36 56 76 96 116 4 9 14 19 24 29 34 Renda Poupança 𝑌 394 372 𝑋 394 Este resultado indica que 966 das variações de Y renda pode ser explicadas por X poupança através da função linear que relaciona as duas variáveis Os restantes 34 da variação não são explicadas devido a outros fatores não considerados 1º Passo 2º Passo Fixar α Escolha da variável F com 1 grau de liberdade no numerador e n 2 graus de liberdade no denominador 3º Passo Com auxílio da Tabela F determine RA e RC 𝐻0 𝛽 0 𝑁ã𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 𝐻1 𝛽 0 𝐸𝑥𝑖𝑠𝑡𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 4º Passo Cálculo da variável pela Análise de Variância 𝐴 𝜋𝑟2 TESTE DE HIPÓTESE para a Existência de Regressão 5º Passo Decisão 𝛼 𝑌 𝛼 𝛽 𝑋 1º Passo 2º Passo Fixar α 005 com 1 grau de liberdade no numerador e 10 2 8 graus de liberdade no denominador 3º Passo Com auxílio da Tabela F determine RA e RC 𝐻0 𝛽 0 𝑁ã𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 𝐻1 𝛽 0 𝐸𝑥𝑖𝑠𝑡𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 4º Passo Cálculo da variável pela Análise de Variância Aplique o Teste F para existência de regressão do exemplo anterior sobre a Renda e Poupança das 10 famílias ao nível de significância de 5 5º Passo Decisão 𝛼 005 𝑌 𝛼 𝛽 𝑋 Intervalo de Confiança IC ou de previsão para y para um valor específico de x 𝑃 𝑌 𝑒 𝑌 𝑌 𝑒 1 𝛼 𝑒 𝑡 𝛼 2 𝑆𝑌𝑌 𝑏 𝑆𝑋𝑌 𝑛 2 1 1 𝑛 𝑛 𝑥 ത𝑋 2 𝑆𝑋𝑋 Usando os resultados do exemplo anterior construa um intervalo de previsão de 95 para a Renda quando a Poupança é de 25 mil reais 𝑃 𝑌 𝑒 𝑌 𝑌 𝑒 1 𝛼 𝑒 23060 102041 372 2651 10 2 1 1 10 10 25 12 2 712 2811 𝑃 9299606 2811 𝑌 9299606 2811 095 𝑌 394 372 𝑋 𝑌 394 372 25000 R 9299606 𝑃 𝑅 9296795 𝑌 𝑅 9302417 095 𝑒 𝑡 𝛼 2 𝑆𝑌𝑌 𝑏 𝑆𝑋𝑌 𝑛 2 1 1 𝑛 𝑛 𝑥 ത𝑋 2 𝑆𝑋𝑋