·

Engenharia Civil ·

Probabilidade e Estatística 1

Send your question to AI and receive an answer instantly

Ask Question

Preview text

PROBABILIDADE E ESTATÍSTICA Prof Dr Guilherme Augusto Pianezzer Considere um indivíduo interessado em aumentar sua massa muscular a partir de um incremento na quantidade de comida ingerida e decide participar de uma pesquisa científica de um novo remédio que objetiva aumentar seu apetite Após tomar uma determinada dose de remédio e ficar algumas horas em jejum o indivíduo se alimenta e tem a sua quantidade de comida ingerida registrada Vejamos se existe relação com o tempo em jejum após ingerir o medicamento e a dose de remédio administrada com a quantidade de comida ingerida REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA O modelo que estamos tentando tratar nesse momento referese a um modelo de regressão linear múltipla com duas variáveis explicativas ie tempo em jejum após ingerir medicamento e dose de remédio administrada para analisar uma variável resposta ie a quantidade de comida ingerida Como desejamos determinar o comportamento da variável resposta em função das duas variáveis explicativas podemos definir o modelo de regressão linear múltipla como da forma 𝒚 𝜶 𝜷𝒙𝟏 𝜸𝒙𝟐 𝝐 Note que nesse modelo 𝒚 representa a variável resposta 𝒙𝟏 𝒙𝟐 representam as duas variáveis explicativas e 𝝐 representa a variabilidade do modelo resultado das variáveis que não foram consideradas na explicação do fenômeno Nosso objetivo é determinar os parâmetros 𝜶 𝜷 𝜸 que configuram a linearidade do modelo REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Note que considerando 𝒙𝟏 𝒙𝟐 𝟎 percebemos que o parâmetro 𝜶 representa a resposta média obtida sem a influência dos parâmetros de controle Se mantivermos a variável 𝒙𝟐 fixa 𝜷 representa o quanto cada incremento na variável 𝒙𝟏 causa na variável 𝒚 para aquele nível de 𝒙𝟐 De forma similar se mantivermos a variável 𝒙𝟏 fixa 𝜸 representa o quanto cada incremento na variável 𝒙𝟐 causa na variável 𝒚 para aquele nível de 𝒙𝟏 Note que 𝜶 𝜷𝒙𝟏 𝜸𝒙𝟐 representa um plano denominado de superfície de resposta Note também que o modelo de regressão linear múltipla pode ser facilmente generalizado para mais de duas variáveis de forma que 𝒚 𝜶 𝜶𝟏𝒙𝟏 𝜶𝟐𝒙𝟐 𝜶𝒏𝒙𝒏 𝝐 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Para aplicar o modelo de regressão linear múltipla de forma adequada é necessário supor algumas condições necessárias Em primeiro lugar é importante confirmar que o erro possui uma distribuição 𝑵𝟎 𝝈𝟐 ou seja que a variável erro não possui viés Note que essa suposição é importante pois tendo viés na variável não considerada podemos afirmar que não estamos controlando todas as variáveis que são de fato adequadas para a explicação da variável resposta Nesse caso temse a importância de realizar um novo planejamento do experimento Em segundo lugar é importante que as variáveis 𝒙𝟏 𝒙𝟐 assumam valores fixos REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Desejamos discutir o efeito de diferentes doses de medicamento administrada e o tempo em jejum após ingerilo na quantidade de comida ingerida Dessa forma consideramos a variável 𝒙𝟏 como o tempo em jejum após ingerir o medicamento e a medimos em minutos Consideremos a variável 𝒙𝟐 como a dose de medicamento administrada e a medimos em mililitro Por fim consideramos a variável resposta 𝒚 como a quantidade de comida ingerida e a medimos em gramas Para essa análise fizemos um acompanhamento por 2 semanas realizando um total de 14 observações que estão descritas na Tabela 4 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Observação Tempo em jejum após ingerir medicamento 𝒎𝒊𝒏 Dose de medicamento administrada 𝒎𝒍 Quantidade de comida ingerida 𝒈 𝟏 𝟏𝟗𝟓 𝟒 𝟏 𝟎𝟎𝟒 𝟐 𝟐𝟓𝟓 𝟒 𝟏 𝟔𝟑𝟔 𝟑 𝟏𝟗𝟓 𝟒 𝟔 𝟖𝟓𝟐 𝟒 𝟐𝟓𝟓 𝟒 𝟔 𝟏 𝟓𝟎𝟔 𝟓 𝟐𝟐𝟓 𝟒 𝟐 𝟏 𝟐𝟕𝟐 𝟔 𝟐𝟐𝟓 𝟒 𝟏 𝟏 𝟐𝟕𝟎 𝟕 𝟐𝟐𝟓 𝟒 𝟔 𝟏 𝟐𝟔𝟗 𝟖 𝟏𝟗𝟓 𝟒 𝟑 𝟗𝟎𝟑 𝟗 𝟐𝟓𝟓 𝟒 𝟑 𝟏 𝟓𝟓𝟓 𝟏𝟎 𝟐𝟐𝟓 𝟒 𝟏 𝟐𝟔𝟎 𝟏𝟏 𝟐𝟐𝟓 𝟒 𝟕 𝟏 𝟏𝟒𝟔 𝟏𝟐 𝟐𝟐𝟓 𝟒 𝟑 𝟏 𝟐𝟕𝟔 𝟏𝟑 𝟐𝟐𝟓 𝟒 𝟕𝟐 𝟏 𝟐𝟐𝟓 𝟏𝟒 𝟐𝟑𝟎 𝟒 𝟑 𝟏 𝟑𝟐𝟏 Tabela 4 Quantidade de comida ingerida em função do tempo em jejum e da dose de medicamento administrada Fonte O autor 2020 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Assim como no modelo de regressão linear simples nosso objetivo é minimizar o quadrado do erro realizado pela estimativa Lembrese de que escolhemos utilizar o termo quadrático caso contrário o somatório resultaria em zero e não conseguiríamos analisálo adequadamente REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Assim a variação é dada por 𝑒𝑖 𝑦𝑖 𝑦𝑖 𝑒𝑖 𝑦𝑖 𝛼 𝛽𝑥1𝑖 𝛾𝑥2𝑖 Note que o somatório dos 𝑒𝑖 ao quadrado é dado por 𝐿 𝑖1 𝑛 𝑒𝑖 2 𝑖1 𝑛 𝑦𝑖 𝛼 𝛽𝑥1𝑖 𝛾𝑥2𝑖 2 Como gostaríamos de encontrar quais parâmetros 𝛼 𝛽 e 𝛾 minimizam 𝐿 devemos encontrar os pontos críticos dados por 𝐿 𝛼 0 𝐿 𝛽 0 𝐿 𝛾 0 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Assim derivando cada uma das expressões obtemos 𝐿 𝛼 2 𝑖1 𝑛 𝑦𝑖 𝛼 𝛽𝑥1𝑖 𝛾𝑥2𝑖 0 𝐿 𝛽 2 𝑖1 𝑛 𝑦𝑖 𝛼 𝛽𝑥1𝑖 𝛾𝑥2𝑖 𝑥1𝑖 0 𝐿 𝛾 2 𝑖1 𝑛 𝑦𝑖 𝛼 𝛽𝑥1𝑖 𝛾𝑥2𝑖 𝑥2𝑖 0 Ou seja 𝑖1 𝑛 𝑦𝑖 𝑛𝛼 𝛽 𝑖1 𝑛 𝑥1𝑖 𝛾 𝑖1 𝑛 𝑥2𝑖 𝑖1 𝑛 𝑦𝑖 𝑥1𝑖 𝛼 𝑖1 𝑛 𝑥1𝑖 𝛽 𝑖1 𝑛 𝑥1𝑖 2 𝛾 𝑖1 𝑛 𝑥1𝑖 𝑥2𝑖 𝑖1 𝑛 𝑦𝑖 𝑥2𝑖 𝛼 𝑖1 𝑛 𝑥2𝑖 𝛽 𝑖1 𝑛 𝑥1𝑖 𝑥2𝑖 𝛾 𝑖1 𝑛 𝑥2𝑖 2 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Para realizar a representação matricial definimos as seguintes matrizes 𝒀 𝒚𝟏 𝒚𝟐 𝒚𝒏 𝑿 𝟏 𝒙𝟏𝟏 𝒙𝟏𝟐 𝟏 𝒙𝟐𝟏 𝒙𝟐𝟐 𝟏 𝒙𝒏𝟏 𝒙𝒏𝟐 𝑨 𝜶 𝜷 𝜸 𝚬 𝝐𝟏 𝝐𝟐 𝝐𝒏 Note que a matriz 𝒀 representa a matriz contendo a resposta observada em cada situação A matriz 𝑿 guarda os valores medidos das variáveis explicativas 𝑨 representa a matriz com os parâmetros que precisam ser determinados no modelo enquanto 𝚬 representa a matriz contendo os erros de cada observação REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Assim o mesmo modelo discutido na seção anterior pode ser reescrito como 𝒀 𝑿𝑨 𝚬 Também desejamos aqui minimizar o erro quadrático de todas as observações Assim redefinimos 𝑳 como sendo 𝑳 𝒊𝟏 𝒏 𝒆𝒊 𝟐 𝚬𝑻 𝚬 𝒀 𝑿𝑨 𝑻 𝒀 𝑿𝑨 Desenvolvendo as propriedades de matriz transposta obtemos 𝑳 𝒀𝑻𝒀 𝒀𝑻𝑿𝑨 𝑨𝑻𝑿𝑻𝒀 𝑨𝑻𝑿𝑻𝑿𝑨 𝒀𝑻𝒀 𝟐𝑨𝑿𝑻𝒀 𝑨𝑿𝑻𝑿𝑨 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Na sequência novamente derivamos em relação a cada um dos parâmetros Na forma matricial escrevemos esse resultado de forma resumida como 𝑳 𝑨 𝟎 Ou seja 𝑳 𝑨 𝟐𝑿𝑻𝒀 𝟐𝑿𝑻𝑿𝑨 𝟎 Logo 𝑿𝑻𝑿𝑨 𝑿𝑻𝒀 Tendo inversa podemos escrever a matriz dos parâmetros como 𝑨 𝑿𝑻𝑿 𝟏𝑿𝑻𝒀 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA 𝒊 𝒙𝟏𝒊 𝒙𝟐𝒊 𝒚𝒊 𝒙𝟏𝒊 𝟐 𝒙𝟐𝒊 𝟐 𝒙𝟏𝒊 𝒙𝟐𝒊 𝒙𝟏𝒊 𝒚𝒊 𝒙𝟐𝒊 𝒚𝒊 𝟏 𝟏𝟗𝟓 𝟒 𝟏 𝟎𝟎𝟒 𝟑𝟖 𝟎𝟐𝟓 𝟏𝟔 𝟕𝟖𝟎 𝟏𝟗𝟓 𝟕𝟖𝟎 𝟒 𝟎𝟏𝟔 𝟐 𝟐𝟓𝟓 𝟒 𝟏 𝟔𝟑𝟔 𝟔𝟓 𝟎𝟐𝟓 𝟏𝟔 𝟏 𝟎𝟐𝟎 𝟒𝟏𝟕 𝟏𝟖𝟎 𝟔 𝟓𝟒𝟒 𝟑 𝟏𝟗𝟓 𝟒 𝟔 𝟖𝟓𝟐 𝟑𝟖 𝟎𝟐𝟓 𝟐𝟏 𝟏𝟔 𝟖𝟗𝟕 𝟏𝟔𝟔 𝟏𝟒𝟎𝟑 𝟗𝟏𝟗 𝟐 𝟒 𝟐𝟓𝟓 𝟒 𝟔 𝟏 𝟓𝟎𝟔 𝟔𝟓 𝟎𝟐𝟓 𝟐𝟏 𝟏𝟔 𝟏 𝟏𝟕𝟑 𝟑𝟖𝟒 𝟎𝟑𝟎𝟔 𝟗𝟐𝟕 𝟔 𝟓 𝟐𝟐𝟓 𝟒 𝟐 𝟏 𝟐𝟕𝟐 𝟓𝟎 𝟔𝟐𝟓 𝟏𝟕 𝟔𝟒 𝟗𝟒𝟓 𝟐𝟖𝟔 𝟐𝟎𝟎𝟓 𝟑𝟒𝟐 𝟒 𝟔 𝟐𝟐𝟓 𝟒 𝟏 𝟏 𝟐𝟕𝟎 𝟓𝟎 𝟔𝟐𝟓 𝟏𝟔 𝟖𝟏 𝟗𝟐𝟐 𝟓 𝟐𝟖𝟓 𝟕𝟓𝟎 𝟓 𝟐𝟎𝟕 𝟕 𝟐𝟐𝟓 𝟒 𝟔 𝟏 𝟐𝟔𝟗 𝟓𝟎 𝟔𝟐𝟓 𝟐𝟏 𝟏𝟔 𝟏𝟎𝟑 𝟓 𝟐𝟖𝟓 𝟓𝟐𝟓𝟓 𝟖𝟑𝟕 𝟒 𝟖 𝟏𝟗𝟓 𝟒 𝟑 𝟗𝟎𝟑 𝟑𝟖 𝟎𝟐𝟓 𝟏𝟖 𝟒𝟗 𝟖𝟑𝟖 𝟓 𝟏𝟕𝟔 𝟎𝟖𝟓𝟑 𝟖𝟖𝟐 𝟗 𝟗 𝟐𝟓𝟓 𝟒 𝟑 𝟏 𝟓𝟓𝟓 𝟔𝟓 𝟎𝟐𝟓 𝟏𝟖 𝟒𝟗 𝟏 𝟎𝟗𝟔 𝟓 𝟑𝟔𝟗 𝟓𝟐𝟓𝟔 𝟔𝟖𝟔 𝟓 𝟏𝟎 𝟐𝟐𝟓 𝟒 𝟏 𝟐𝟔𝟎 𝟓𝟎 𝟔𝟐𝟓 𝟏𝟔 𝟗𝟎𝟎 𝟐𝟖𝟑 𝟓𝟎𝟎 𝟓 𝟎𝟒𝟎 𝟏𝟏 𝟐𝟐𝟓 𝟒 𝟕 𝟏 𝟏𝟒𝟔 𝟓𝟎 𝟔𝟐𝟓 𝟐𝟐 𝟎𝟗 𝟏 𝟎𝟓𝟕 𝟓 𝟐𝟓𝟕 𝟖𝟓𝟎𝟓 𝟑𝟖𝟔 𝟐 𝟏𝟐 𝟐𝟐𝟓 𝟒 𝟑 𝟏 𝟐𝟕𝟔 𝟓𝟎 𝟔𝟐𝟓 𝟏𝟖 𝟒𝟗 𝟗𝟔𝟕 𝟓 𝟐𝟖𝟕 𝟏𝟎𝟎𝟓 𝟒𝟖𝟔 𝟖 𝟏𝟑 𝟐𝟐𝟓 𝟒 𝟕𝟐 𝟏 𝟐𝟐𝟓 𝟓𝟎 𝟔𝟐𝟓 𝟐𝟐 𝟐𝟕𝟖𝟒 𝟏 𝟎𝟔𝟐 𝟐𝟕𝟓 𝟔𝟐𝟓 𝟓 𝟕𝟖𝟐 𝟏𝟒 𝟐𝟑𝟎 𝟒 𝟑 𝟏 𝟑𝟐𝟏 𝟓𝟐 𝟗𝟎𝟎 𝟏𝟖 𝟒𝟗 𝟗𝟖𝟗 𝟑𝟎𝟑 𝟖𝟑𝟎𝟓 𝟔𝟖𝟎 𝟑 𝟑 𝟏𝟓𝟓 𝟔𝟎 𝟕𝟐 𝟏𝟕 𝟒𝟗𝟓 𝟕𝟏𝟔 𝟒𝟐𝟓 𝟐𝟔𝟒 𝟐𝟓𝟖𝟒 𝟏𝟑 𝟔𝟖𝟑 𝟓𝟒 𝟎𝟎𝟏 𝟏𝟐𝟎 𝟕𝟓 𝟕𝟑𝟖 𝟑 Fonte O autor 2020 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Note que encontramos os seguintes parâmetros 𝑛 14 𝑖1 𝑛 𝑦𝑖 17495 𝑖1 𝑛 𝑥𝑖1 3155 𝑖1 𝑛 𝑥2𝑖 6072 𝑖1 𝑛 𝑥𝑖1 2 716426 𝑖1 𝑛 𝑥2𝑖 2 2642584 𝑖1 𝑛 𝑥1𝑖 𝑥𝑖 136835 𝑖1 𝑛 𝑥1𝑖𝑦𝑖 1001120 𝑖1 𝑛 𝑥2𝑖𝑦2 757383 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Podemos utilizar esses dados para escrever o seguinte sistema de equações 𝑖1 𝑛 𝑦𝑖 𝑛𝛼 𝛽 𝑖1 𝑛 𝑥1𝑖 𝛾 𝑖1 𝑛 𝑥2𝑖 𝑖1 𝑛 𝑦𝑖 𝑥1𝑖 𝛼 𝑖1 𝑛 𝑥1𝑖 𝛽 𝑖1 𝑛 𝑥1𝑖 2 𝛾 𝑖1 𝑛 𝑥1𝑖 𝑥2𝑖 𝑖1 𝑛 𝑦𝑖 𝑥2𝑖 𝛼 𝑖1 𝑛 𝑥2𝑖 𝛽 𝑖1 𝑛 𝑥1𝑖 𝑥2𝑖 𝛾 𝑖1 𝑛 𝑥2𝑖 2 17495 14𝛼 3155𝛽 6072𝛾 4001120 3155𝛼 716425𝛽 136835𝛾 7573830 6072𝛼 1368350𝛽 2642584𝛾 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Na maior parte dos casos esse é um sistema possível e determinado Ao resolvêlo podemos encontrar 𝛼 52008 𝛽 1078 𝛾 15215 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Na forma matricial devemos escrever as matrizes 𝑿 e 𝒀 e determinar 𝑨 a partir de 𝑨 𝑿𝑻𝑿 𝟏𝑿𝑻𝒀 Temos no exemplo que 𝑿𝑻 𝑿 𝟏𝟒 𝟑 𝟏𝟓𝟓 𝟔𝟎 𝟕𝟐 𝟑 𝟏𝟓𝟓 𝟕𝟏𝟔 𝟒𝟐𝟓 𝟏𝟑 𝟔𝟖𝟑 𝟓 𝟔𝟎 𝟕𝟐 𝟏𝟑 𝟔𝟖𝟑 𝟓 𝟐𝟔𝟒 𝟐𝟔 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Podemos encontrar a matriz inversa Nesse caso temos que 𝑿𝑻 𝑿 𝟏 𝟑𝟎 𝟐𝟒𝟕𝟔𝟎 𝟎 𝟎𝟒𝟏𝟕𝟐 𝟒 𝟕𝟖𝟗𝟗𝟒 𝟎 𝟎𝟒𝟏𝟕𝟐 𝟎 𝟎𝟎𝟎𝟏𝟖 𝟎 𝟎𝟎𝟎𝟎𝟒 𝟒 𝟕𝟖𝟗𝟗𝟒 𝟎 𝟎𝟎𝟎𝟎𝟒 𝟏 𝟏𝟎𝟐𝟒𝟒 Além disso precisamos calcular a matriz 𝑿𝑻𝒀 que resulta em 𝑿𝑻𝒀 𝟏𝟕 𝟒𝟗𝟓 𝟒 𝟎𝟎𝟏 𝟏𝟐𝟎 𝟕𝟓 𝟕𝟑𝟖 𝟑 Dessa forma encontramos os parâmetros dados pela matriz A como 𝑿𝑻𝑿 𝟏𝑿𝑻𝒀 Assim 𝑨 𝟓𝟐𝟎 𝟎𝟖 𝟏𝟎 𝟕𝟖 𝟏𝟓𝟐 𝟏𝟓 Note que nosso modelo se torna 𝒚 𝟓𝟐𝟎 𝟎𝟖 𝟏𝟎 𝟕𝟖𝒙𝟏 𝟏𝟓𝟐 𝟏𝟓𝒙𝟐 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA Agora com o modelo de regressão linear múltipla determinado podemos utilizálo para realizar a previsão para a variável de resposta dado uma determinada combinação das variáveis explicativas A Tabela 6 apresenta os valores previstos para os dados do problema REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA 𝒊 𝒙𝟏𝒊 𝒙𝟐𝒊 𝒚𝒊 𝒚𝒊 𝒆𝒊 𝟏 195 4 1004 97342 3058 𝟐 255 4 1636 162022 1578 𝟑 195 46 852 88213 3013 𝟒 255 46 1506 152893 2293 𝟓 225 42 1272 126639 561 𝟔 225 41 1270 128160511605 𝟕 225 46 1269 120553 6347 𝟖 195 43 903 927775 24775 𝟗 255 43 1555 157457519575 𝟏𝟎 225 4 1260 129682 3682 𝟏𝟏 225 47 1146 119031544315 𝟏𝟐 225 43 1276 125117524825 𝟏𝟑 225 472 1225 118727237728 𝟏𝟒 230 43 1321 130507515925 Fonte O autor 2020 REGRESSÃO LINEAR SIMPLES E REGRESSÃO LINEAR MÚLTIPLA