·

Engenharia de Produção ·

Probabilidade e Estatística 2

Send your question to AI and receive an answer instantly

Ask Question

Preview text

1 EPRi10 Estatística para Engenharia de Produção Estatística para Engenharia de Produção Regressão Linear Simples Referência principal Montgomery e Runger 2009 Imagens obtidas das obras citadas e outras disponíveis na Internet 2 EPRi10 Estatística para Engenharia de Produção ANÁLISE DE REGRESSÃO é uma técnica estatística para modelar e investigar a relação entre duas ou mais variáveis Por exemplo o rendimento de um produto em um processo químico está relacionado à temperatura de operação do processo A análise de regressão pode ser usada para construir um modelo para prever o rendimento em um dado nível de temperatura Regressão Linear Simples RLS Variáveis Indicativas para Xs Discretos x x x x x x x x x x x x x x x Xi Y Xa Xb Xc Curvilínea Um X X Y Linear Simples Um X X Y Múltipla Dois ou mais Xs Y X2 X1 Logística Ys Discretos 1 0 yes X Curvilínear Dois ou mais Xs Y X 1 X 2 3 EPRi10 Estatística para Engenharia de Produção Número da Observação Nível de Hidrocarboneto x Pureza y 1 099 9001 2 102 8905 3 115 9143 4 129 9374 5 146 9673 6 136 9445 7 087 8759 8 123 9177 9 155 9942 10 140 9365 11 119 9354 12 115 9252 13 098 9056 14 101 8954 15 111 8985 16 120 9039 17 126 9325 18 132 9341 19 143 9498 20 095 8733 16 15 14 13 12 11 10 09 08 100 98 96 94 92 90 88 86 Hidrocarboneto Pureza Scatterplot of Pureza vs Hidrocarboneto EXEMPLO 1 Considere os dados da tabela abaixo onde y é a pureza do oxigênio produzido em um processo químico de destilação e x é a porcentagem de hidrocarbonetos presentes no condensador principal da unidade de destilação O diagrama de dispersão apresenta cada par xy como um ponto no sistema bidimensional de coordenadas A inspeção do diagrama indica que os pontos repousam aleatoriamente dispersos em torno de uma reta Regressão Linear Simples RLS 4 EPRi10 Estatística para Engenharia de Produção Apesar da tendência de se configurar uma reta a partir dos pontos xy evidentemente não é possível se construir exatamente uma reta Entretanto é razoável considerar que a média da variável aleatória Y esteja relacionada a x pela seguinte relação linear Nessa relação a interseção 𝛽0 e a inclinação 𝛽1 da linha reta são chamadas de coeficientes de regressão Enquanto a média de y é uma função linear de x o valor real observado y não cai exatamente na linha reta O Modelo Linear Probabilístico generalizado para o conjunto de dados considera portanto que o valor esperado de Y seja uma função linear de x mas que para um valor fixo de x o valor real de y seja determinado pela função do valor médio mais um termo de erro aleatório 𝐸 𝑌 𝑥 𝜇𝑌𝑥 𝛽0 𝛽1𝑥 𝑌 𝛽0 𝛽1𝑥 𝜀 Modelo de regressão linear simples possui apenas uma variável independente ou regressor Regressão Linear Simples RLS 16 15 14 13 12 11 10 09 08 100 98 96 94 92 90 88 86 Hidrocarboneto Pureza Scatterplot of Pureza vs Hidrocarboneto 5 EPRi10 Estatística para Engenharia de Produção 𝑌 𝛽0 𝛽1𝑥 𝜀 Nessa expressão 𝜀 é um erro aleatório com média 0 e variância 𝜎2 As estimativas de 𝛽0 e 𝛽1 devem resultar em uma reta que seja em algum sentido o melhor ajuste para os dados Gauss 17771855 propôs estimar esses parâmetros de modo a minimizar a soma dos quadrados dos desvios verticais Ao método deuse o nome de mínimos quadrados As estimativas de mínimos quadrados da interseção e da inclinação no modelo de regressão linear simples são መ𝛽0 ത𝑦 መ𝛽1 ҧ𝑥 መ𝛽1 σ𝑖1 𝑛 𝑦𝑖𝑥𝑖 σ𝑖1 𝑛 𝑦𝑖σ𝑖1 𝑛 𝑥𝑖 𝑛 σ𝑖1 𝑛 𝑥𝑖 2 σ𝑖1 𝑛 𝑥𝑖2 𝑛 ത𝑦 1 𝑛 𝑖1 𝑛 𝑦𝑖 ҧ𝑥 1 𝑛 𝑖1 𝑛 𝑥𝑖 Regressão Linear Simples RLS 6 EPRi10 Estatística para Engenharia de Produção Chamandose o numerador de 𝑆𝑥𝑦 e o denominador de 𝑆𝑥𝑥 têmse Consequentemente 𝑆𝑥𝑦 𝑖1 𝑛 𝑦𝑖𝑥𝑖 σ𝑖1 𝑛 𝑦𝑖 σ𝑖1 𝑛 𝑥𝑖 𝑛 𝑆𝑥𝑦 𝑖1 𝑛 𝑥𝑖 ҧ𝑥 𝑦𝑖 ത𝑦 𝑆𝑥𝑥 𝑖1 𝑛 𝑥𝑖 2 σ𝑖1 𝑛 𝑥𝑖2 𝑛 𝑆𝑥𝑥 𝑖1 𝑛 𝑥𝑖 ҧ𝑥 2 መ𝛽1 𝑆𝑥𝑦 𝑆𝑥𝑥 መ𝛽0 ത𝑦 መ𝛽1 ҧ𝑥 𝛽1 σ𝑖1 𝑛 𝑦𝑖𝑥𝑖 σ𝑖1 𝑛 𝑦𝑖σ𝑖1 𝑛 𝑥𝑖 𝑛 σ𝑖1 𝑛 𝑥𝑖 2 σ𝑖1 𝑛 𝑥𝑖2 𝑛 Regressão Linear Simples RLS Sxy Soma dos produtos cruzados dos desvios x e y Sxx Soma dos quadrados dos desvios em relação à x 7 EPRi10 Estatística para Engenharia de Produção Ajustaremos agora um modelo de regressão linear simples aos dados de pureza de oxigênio mencionado anteriormente Dados Consequentemente 𝑆𝑥𝑦 𝑖1 𝑛 𝑥𝑖𝑦𝑖 σ𝑖1 𝑛 𝑥𝑖 σ𝑖1 𝑛 𝑦𝑖 𝑛 2214657 23920 1843210 20 10177 𝑆𝑥𝑥 𝑖1 𝑛 𝑥𝑖 2 σ𝑖1 𝑛 𝑥𝑖 2 𝑛 29289 23920 2 20 0681 𝛽1 𝑆𝑥𝑦 𝑆𝑥𝑥 10177 0681 14948 𝛽0 ത𝑦 𝛽1 ҧ𝑥 92160 14947 1196 74283 𝑛 20 𝒚 𝟕𝟒 𝟐𝟖𝟑 𝟏𝟒 𝟗𝟒𝟖𝒙 𝑖1 20 𝑥𝑖 2 29289 𝑖1 20 𝑥𝑖𝑦𝑖 2214657 ത𝑦 92160 ҧ𝑥 1196 𝑖1 20 𝑦𝑖 1843210 𝑖1 20 𝑥𝑖 23920 Regressão Linear Simples RLS 8 EPRi10 Estatística para Engenharia de Produção Há um outro parâmetro desconhecido no modelo de regressão 𝜎2 ou a variância do termo do erro 𝜀 A estimativa da variância pois pode ser encontrado por 𝑆𝑄𝐸 𝑆𝑄𝑇 መ𝛽1𝑆𝑥𝑦 Em que 𝑆𝑄𝑇 σ𝑖1 𝑛 𝑦𝑖 2 𝑛ത𝑦2 é a soma total dos quadrados da variável resposta y Para o exemplo 𝑆𝑄𝑇 𝑖1 𝑛 𝑦𝑖 2 𝑛ത𝑦2 17004450 20 849356 17338 𝜎2 𝑆𝑄𝐸 𝑛 2 𝜎2 21261 20 2 1181 𝑆𝑄𝐸 𝑆𝑄𝑇 መ𝛽1𝑆𝑥𝑦 17338 14947 10177 21261 Regressão Linear Simples RLS 9 EPRi10 Estatística para Engenharia de Produção Intervalos de Confiança para a Inclinação e a Interseção Em adição às estimativas da inclinação e da interseção é possível obter estimativas do intervalo de confiança desses parâmetros A largura desses intervalos de confiança é uma medida da qualidade global da linha de regressão Se os termos do erro 𝜀𝑖 no modelo de regressão forem normal e independentemente distribuídos então መ𝛽1 𝛽1 𝜎2𝑆𝑥𝑥 e መ𝛽0 𝛽0 𝜎2 1 𝑛 ҧ𝑥2 𝑆𝑥𝑥 São ambos distribuídos como variáveis aleatórias t com n 2 graus de liberdade Regressão Linear Simples RLS 10 EPRi10 Estatística para Engenharia de Produção Intervalos de Confiança para a Inclinação e a Interseção O IC de 100 1 𝛼 para a inclinação e a interseção é portando dado por መ𝛽1 𝑡𝛼 2𝑛2 𝜎2 𝑆𝑥𝑥 𝛽1 መ𝛽1 𝑡𝛼 2𝑛2 𝜎2 𝑆𝑥𝑥 Para a inclinação Para a interseção መ𝛽0 𝑡𝛼 2𝑛2 𝜎2 1 𝑛 ҧ𝑥2 𝑆𝑥𝑥 𝛽0 መ𝛽0 𝑡𝛼 2𝑛2 𝜎2 1 𝑛 ҧ𝑥2 𝑆𝑥𝑥 Regressão Linear Simples RLS 11 EPRi10 Estatística para Engenharia de Produção Intervalos de Confiança para a Inclinação e a Interseção Para o EXEMPLO 1 da Pureza do Oxigênio encontraremos um IC bilateral de 95 para a inclinação da linha de regressão utilizando os dados já calculados መ𝛽1 14947 𝑆𝑥𝑥 0681 e 𝜎2 118 Assim መ𝛽1 𝑡002518 𝜎2 𝑆𝑥𝑥 𝛽1 መ𝛽1 𝑡002518 𝜎2 𝑆𝑥𝑥 14947 2101 118 0681 𝛽1 14947 2101 118 0681 12181 𝛽1 17713 Regressão Linear Simples RLS 12 EPRi10 Estatística para Engenharia de Produção Intervalos de Confiança para a Inclinação e a Interseção Para o EXEMPLO 1 da Pureza do Oxigênio encontraremos um IC bilateral de 95 para a intercessão da linha de regressão utilizando os dados já calculados መ𝛽0 74283 𝑆𝑥𝑥 0681 𝜎2 118 e ҧ𝑥 12 Assim 74283 2101 118 1 20 143 0681 𝛽0 74283 2101 118 1 20 143 0681 70477 𝛽0 78089 መ𝛽0 𝑡𝛼 2𝑛2 𝜎2 1 𝑛 ҧ𝑥2 𝑆𝑥𝑥 𝛽0 መ𝛽0 𝑡𝛼 2𝑛2 𝜎2 1 𝑛 ҧ𝑥2 𝑆𝑥𝑥 Regressão Linear Simples RLS 13 EPRi10 Estatística para Engenharia de Produção Intervalos de Confiança para a Resposta Média Um IC pode ser construído a partir da resposta média em um valor especificado de x como x0 Esse é um IC em torno de 𝐸 𝑌 𝑥0 𝜇𝑌𝑥0 sendo chamado de Intervalo de Confiança em Torno da Linha de Regressão Ƹ𝜇𝑌𝑥0 𝑡𝛼 2𝑛2 𝜎2 1 𝑛 𝑥0 ഥ𝑥 2 𝑆𝑥𝑥 𝜇𝑌𝑥0 Ƹ𝜇𝑌𝑥0 𝑡𝛼 2𝑛2 𝜎2 1 𝑛 𝑥0 ഥ𝑥 2 𝑆𝑥𝑥 O IC de 100 1 𝛼 para Resposta Média no valor 𝑥 𝑥0 como 𝜇𝑌𝑥0 é dado por Sendo Ƹ𝜇𝑌𝑥0 መ𝛽0 መ𝛽1𝑥0 calculado a partir do modelo ajustado de regressão A largura do IC para 𝜇𝑌𝑥0é uma função do valor especificado para 𝑥0 A largura do IC é mínima para 𝑥0 ഥ𝑥 e alargada à medida que 𝑥0 ഥ𝑥 aumenta Regressão Linear Simples RLS 14 EPRi10 Estatística para Engenharia de Produção Intervalos de Confiança para a Resposta Média IC para a Resposta Média da Pureza do Oxigênio Construiremos o IC bilateral de 95 em torno da resposta média para o EXEMPLO 1 O Modelo ajustado é Ƹ𝜇𝑌𝑥0 𝟕𝟒 𝟐𝟖𝟑 𝟏𝟒 𝟗𝟒𝟕𝒙𝟎 e o IC de 95 para 𝜇𝑌𝑥0 é dado por 𝜇𝑌𝑥0 𝑡𝛼 2𝑛2 𝜎2 1 𝑛 𝑥0 ഥ𝑥 2 𝑆𝑥𝑥 𝜇𝑌𝑥0 2101 118 1 20 𝑥0 11962 0681 Supondo que estejamos interessados em prever a pureza média do oxigênio quando 𝑥0 10 então Ƹ𝜇𝑌𝑥0 74283 14947𝑥0 74283 14947 1 8923 O IC de 95 é 8923 2101 118 1 20 10 11962 0681 𝟖𝟗 𝟐𝟑 𝟎 𝟕𝟓 Regressão Linear Simples RLS 15 EPRi10 Estatística para Engenharia de Produção Uma medida largamente usada para um modelo de regressão é a razão de soma dos quadrados 𝑹𝟐 É utilizado para julgar a adequação de um modelo de regressão 𝑅2 representa a quantidade de variabilidade nos dados explicada ou considerada pelo modelo de regressão É determinado por Para o EXEMPLO 1 o Coeficiente de Determinação é 𝑅2 𝑆𝑄𝑅 𝑆𝑄𝑇 1 𝑆𝑄𝐸 𝑆𝑄𝑇 𝑅2 1 𝑆𝑄𝐸 𝑆𝑄𝑇 1 21261 173380 0877 O modelo explica 877 da variabilidade dos dados Valores acima de 80 são considerados ótimos 𝑅2𝑎𝑑𝑗 é a porcentagem da variação explicada pelo seu modelo ajustada para o número de termos em seu modelo e o número de pontos de dados Regressão Linear Simples RLS 16 EPRi10 Estatística para Engenharia de Produção Exemplo 2 Um estudo foi realizado para avaliar os efeitos da temperatura ambiente x no consumo de energia elétrica y de uma indústria química Baseado nos dados amostrais determine a Faça um gráfico dos dados b Estime a inclinação e o intercepto em um modelo de regressão simples c A variância do modelo de regressão d Intervalo de confiança para a inclinação e Intervalo de confiança para a interseção f Intervalo de confiança para resposta no ponto x0 65ºF g Coeficiente de determinação R2 Regressão Linear Simples RLS Consumo de energia BTU y Temperatura ambiente ºF Consumo de energia BTU y Temperatura ambiente ºF 250 27 265 31 285 45 298 60 320 72 267 34 295 58 321 74 Considerar nível de significância de 5 17 EPRi10 Estatística para Engenharia de Produção EXERCÍCIOS Lista 04 Resolva os seguintes exercícios de Montgomery 2009 Regressão Linear Simples 111 ab 112 ab 113 ab 114 a 115 ab IC Regressão 1137 abc 1138 abc 1139 abc 1140 abc 1141 abc Regressão Linear Simples RLS