·

Administração ·

Estatística da Administração

Send your question to AI and receive an answer instantly

Ask Question

Preview text

Análise Quantitativa de Dados EXERCÍCIOS DE FIXAÇÃO 1 O salário inicial é considerado um indicador importante do sucesso no mercado de trabalho por vários programas de pósgraduação stricto sensu mestrado e doutorado Um dos fatores que influenciam o salário inicial de um profissional egresso de uma pósgraduação tem sido a pontuação no exame de seleção de alunos No caso da Administração o GMAT desempenha esse papel O salário inicial em R 100000 e a pontuação de 10 alunos recém graduados por uma conceituada Escola de Administração no Rio de Janeiro forneceu os seguintes dados planilha 03 Salário GMAT 40 600 33 510 40 550 35 500 28 480 28 500 34 520 30 500 32 530 31 490 Planilha 03 a Identifique qual é a variável explicativa independente e a variável resposta dependente b Faça um gráfico de dispersão para representar os dados c Verifique se o salário possui uma relação linear com a pontuação obtida no GMAT calcule o coeficiente de correlação d Proceda uma regressão linear e descreva a equação da reta e Interprete os coeficientes da reta de regressão e informe em que unidade de medida cada coeficiente está expresso f Quanto deverá receber um recémformado que tenha obtido 500 pontos no GMAT segundo a previsão da equação de regressão g Na amostra dois recém formados obtiveram 500 pontos no GMAT Um deles apresentou salário inicial de R 35000 enquanto o outro ganhava R 30000 Qual deles foi melhor previsto pelo modelo h Calcule e interprete o coeficiente de determinação do modelo 2 A indústria farmacêutica MIMI vende um remédio para combater resfriado Após dois anos de operação ela coletou as seguintes informações trimestrais Trimestre Vendas y 10000 Despesas c Propaganda x1 Temperatura Média do Trimestre x2 1 25 11 2 2 13 5 13 3 8 3 16 4 20 9 7 5 25 12 4 6 12 6 10 7 10 5 13 8 15 9 4 Planilha 04 a Faça um gráfico de dispersão x1 y e x2 y b Calcule os coeficientes de correlação entre vendas e despesas com propaganda e entre vendas e temperatura média do trimestre Interprete c Encontre as retas de regressão para vendas y com despesas com propaganda x1 e com as temperaturas médias x2 d Qual das duas retas você acha estatisticamente mais adequada para prever as vendas Por quê analise o coeficiente de determinação R2 e Qual a previsão de vendas para um trimestre em que a despesa de propaganda será de 8 E qual a previsão de vendas se a temperatura prevista for 10 3 Decisões sobre investimentos em ações são às vezes tomadas baseadas em estimativas da medida beta que avalia o risco sistemático associado a um dado portfolio Esta medida reflete a relação entre a taxa de retorno de um certo portfolio ou ação e a taxa média de retorno do mercado como um todo Sua denominação beta deriva do coeficiente angular de um modelo da regressão na qual a variável dependente é a taxa de retorno do portfolio e a variável independente é a taxa de retorno do mercado Ações ou portfolios com inclinação maior do que 1 são consideradas agressivas na medida em que suas taxas de retorno apresentam variações maiores do que as das taxas do mercado Por outro lado inclinações inferiores a 1 representam ações ou portfolios defensivos ou conservadores por apresentarem alterações nas taxas de retorno Ações ou portfolios com inclinações próximas a 1 indicam investimentos neutros Durante sete meses foram coletados dados sobre as taxas de retorno de uma ação e do mercado Os dados encontramse no quadro a seguir Meses Retorno da Ação Retorno do Mercado 1 120 72 2 13 00 3 25 21 4 186 119 5 90 53 6 38 12 7 100 47 Planilha 18 2 a Determine a equação da reta Y 0 1X e interprete o significado do coeficiente angular b O coeficiente de determinação do modelo Rquadrado é igual a 0995 Interprete esse valor 4 Fadiga emocional burnout é um sério problema que envolve pessoas que trabalham sob constante estado de pressão Análise de regressão foi utilizada para investigar a relação entre este problema e alguns aspectos extraídos da realidade organizacional do profissional para detalhes ver Journal of Applied Behavioral Science v 22 1986 A fadiga emocional foi medida por meio de um índice pontos construído a partir de questões extraídas do inventário de Maslach Uma das variáveis explicativas consideradas foi Contatos definida como o número de contatos semanais mantidos com pessoas pertencentes ao grupo de trabalho do respondente A tabela abaixo fornece os coeficientes da regressão tais como obtidos pelo Excel da série de 25 observações que compunham a amostra Resultados extraídos do Excel Coeficientes Interseção 29497 Variável X 8865 Com base nas informações acima a Identifique as variáveis explicativa e a variável resposta b Monte a equação de regressão interprete cada um dos coeficientes e diga em que medida cada um está expresso c Qual deverá ser o índice de fadiga emocional para uma pessoa que estabeleça 100 contatos semanais com pessoas do grupo de trabalho d Na amostra observouse uma pessoa estabelecendo 20 contatos semanais com pessoas do mesmo grupo de trabalho e o seu nível de fadiga emocional bateu 1625 pontos Calcule a diferença entre os valores estimados pelo modelo e o observado na amostra Como se define esta diferença O modelo está sub ou super estimando a observação e O que se pode dizer a respeito da associação entre as variáveis considerando o sinal da inclinação da reta de regressão e sabendose que o coeficiente de correlação é igual a 078 5 A fim de se avaliar a variável que melhor possa explicar o consumo de combustível nos Estados Unidos dados sobre o consumo de gasolina galões per capta por ano renda US1000 per capta por ano imposto UScentavos por galão e habilitados percentagem de pessoas com carteira de habilitação e extensão da malha rodoviária federal milhas foram coletadas para os 48 estados contíguos daquele país em 1971 Considere primeiramente o quadro relativo às estatísticas para cada modelo Estatísticas da Regressão Medidas Variáveis Independentes Imposto Habilitação Renda Malha R múltiplo 04512 0699 0245 0024 RQuadrado 02036 0488 0060 0001 Rquadrado ajustado 0186 0477 0039 0021 Erro padrão 10092 8088 10965 11306 3 Observações 48 48 48 48 A tabela abaixo apresenta os coeficientes linear e angular para cada modelo Coeficiente Variáveis Independentes Imposto Habilitação Renda Malha Interseção 98401 22731 77936 57256 Inclinação 5311 1410 0048 000076 a De acordo com o seu julgamento quais seriam as variáveis que possivelmente poderiam ser escolhidas para explicar as variações no consumo de combustível Explicite o critério utilizado para a sua escolha b Qual é a variável explicativa dentre as escolhidas no item anterior responsável pelo maior percentual de explicação da variação total do consumo de combustível A escolha baseada no coeficiente de determinação coincide com o do menor erro padrão do modelo Isso faz sentido Em que unidade está expresso o erro padrão c Interprete cada inclinação acima e diga em que unidade está expresso Algum deles chama a atenção Qual e por quê ESTUDO DE CASO PASTÉIS E PASTELÕES A Pastéis e Pastelões Ltda fabrica pastéis de forno a partir de dois ingredientes básicos massa semi pronta e recheio congelado A empresa pretende estabelecer um modelo para previsão de lucro operacional mensal que lhe permita estabelecer o preço dos pastéis que deve ser praticado pela empresa Desconsiderando a hipótese de alteração do tamanho e da qualidade dos pastéis a diretoria considera que o preço unitário do pastel e o preço médio praticado pela concorrência são os únicos fatores relevantes na determinação da demanda a qual se comporta segundo a seguinte equação qd 15000 5000x 5000y onde x é o preço da Pastéis e Pastelões e y é o preço médio dos pastéis vendidos pelos concorrentes Dados adicionais Preço médio praticado pela concorrência R 700 Custo unitário da massa R pastel R 130 Custo unitário do recheio R pastel R 200 Custo unitário do processo R pastel R 040 Custo fixo R 600000 a Monte uma planilha para calcular o lucro total considerando o preço como variável de decisão Resultados preliminares 4 O preço de R 400 não gera demanda suficiente para compensar a pequena margem de contribuição Custo dos ingredientes R 9900000 Custo do processo R 1200000 Custo fixo R 600000 Total R 11700000 Custo médio R 11700000 30000 R 390 Margem de contribuição R 400 R 390 R 010 Lucro total R 010 30000 R 300000 O preço de R 800 retrai muito a demanda O preço de R 600 é mais atrativo Mas é o ideal E se o preço fosse R 700 como se comportaria a demanda e o lucro b Uma auditoria constatou por meio de dados contábeis que o custo unitário do processo é variável de acordo com o número de pastéis produzidos ou seja se comporta de forma diferente da que o modelo havia assumido R 040 pastel Abaixo são apresentados os resultados da auditoria planilha 05 Como melhorar o modelo de previsão do lucro considerando os dados observados Nível de produção Custo de processo REAL Custo de processo MODELO 10000 320000 4000 12000 370000 4800 14000 450000 5600 16000 590000 6400 18000 710000 7200 20000 800000 8000 22000 970000 8800 24000 1120000 9600 26000 1400000 10400 28000 1630000 11200 30000 1940000 12000 Lista de Exercícios Correlação e Regressão Linear 1 Um nutricionista quer determinar se a quantidade de água consumida por dia por pessoas de mesmo peso e a mesma dieta pode ser usada para prever a perda de peso dos indivíduos Identifique a variável explicativa e a variável resposta 2 Uma empresa de seguros contrata um atuário para determinar se o número de horas de aulas de direção pode ser usado para prever o número de acidentes de trânsito por motorista Identifique a variável explicativa e a variável resposta 3 Os diagramas de dispersão abaixo mostram os resultados de uma pesquisa com 20 homens adultos com idades entre 24 e 35 anos selecionados aleatoriamente Usando a idade como variável explicativa relacione cada diagrama de dispersão com a descrição apropriada 5 I II III IV a a Idade e temperatura corporal em Fahrenheits Diagrama b Idade e balanço dos empréstimos estudantis Diagrama c Idade e renda anual Diagrama d Idade e altura Diagrama 4 Nos dois conjuntos de dados apresentados abaixo calcule o coeficiente de correlação r deixando a coluna 1 representar os valores de x e a coluna 2 os valores y Na sequência calcule o coeficiente de correlação r deixando a coluna 2 representar os valores x e a coluna 1 os valores y Que efeito tem a troca das variáveis explicativa e de resposta no coeficiente de correlação Coluna 1 16 25 39 45 49 64 70 Coluna 2 109 122 143 132 199 185 199 Coluna 1 0 1 2 3 3 5 5 5 6 7 Coluna 2 96 85 82 74 95 68 76 84 58 65 Planilha 08 5 Relacione a equação de regressão com o gráfico apropriado note que os eixos x e y estão interrompidos I II III IV a 104x 503 Gráfico b 1662x 8334 Gráfico c 000114x 253 Gráfico d 0667x 526 Gráfico 6 6 Correlacione as colunas de acordo com os conceitos apropriados 1 Linha de regressão a A diferença entre o valor y observado do ponto de dados e o valor y previsto na linha para o mesmo ponto de dados 2 Resíduos b 3 O valor y do ponto de dados correspondente a xi c A linha de melhor ajuste 4 O valor y para um ponto na linha de regressão correspondente a xi d yi 5 Inclinação e b0 6 Interseção y f 7 A média dos valores y g b1 8 O ponto pelo qual uma linha de regressão sempre passa h Para os exercícios 7 a 9 Encontre a equação da linha de regressão para os dados apresentados Depois construa um diagrama de dispersão dos dados e desenhe a linha de regressão use o recurso de adicionar linha de tendência do Excel Use a equação de regressão para prever o valor de y para cada um dos valores x fornecidos se o valor de x for adequado para a regressão um valor de x muito distante dos valores originais usados na regressão linear não é considerado adequado para estimativas 7 A idade em anos de sete crianças e o número de palavras que compõem o vocabulário Idade 3 4 4 5 6 2 3 Tamanho do vocabulário 1100 1300 1500 2100 2600 460 1200 Planilha 09 Calcule qual seria o tamanho do vocabulário estimado para a x 2 anos b x 3 anos c x 6 anos d x 12 anos 8 O número de horas que 13 alunos passaram estudando para um teste e a pontuação nele Horas gastas estudando 0 1 2 4 4 5 5 5 6 6 7 7 8 Pontuação no teste 40 41 51 48 64 69 73 75 68 93 84 90 95 Planilha 10 Calcule qual seria a pontuação estimada para cada número de horas abaixo a x 3 horas b x 65 horas 7 c x 13 horas d x 45 horas 9 O número de horas que 12 alunos passaram online durante o fim de semana e as pontuações que cada um conseguiu em um teste na segundafeira seguinte Horas gastas online 0 1 2 3 3 5 5 5 6 7 7 10 Pontuação no teste 96 85 82 74 95 68 76 84 58 65 75 50 Planilha 11 Calcule qual seria a pontuação estimada para cada número de horas online abaixo a x 4 horas b x 8 horas c x 9 horas d x 15 horas 10 Você trabalha para um analista de salários e reúne os dados apresentados na tabela abaixo A tabela mostra as idades de 13 engenheiros elétricos e seus salários anuais Idade em anos 22 25 29 34 39 43 48 53 56 61 64 67 69 Salário anual em milhares 535 563 598 631 659 697 736 758 781 803 794 763 724 Planilha 12 a Monte um diagrama de dispersão e avalie o tipo de correlação existente b Encontre uma equação da linha de regressão para os dados c O analista uso a linha de regressão que você encontrou para prever o salário anual de um engenheiro elétrico que tenha 74 anos de idade Essa previsão é válida 11 A empresa Cirelli produtora de pneumáticos com sede na cidade de São Paulo e filial no Rio de Janeiro realizou um estudo para avaliar a relação entre o custo de comercialização e a distância de mercados consumidores até sua sede Os dados são apresentados abaixo Custo 36 48 50 70 42 58 91 69 Distância km 50 240 150 350 100 175 485 335 Planilha 06 a Identifique as variáveis explicativa e resposta b Estime a equação da reta de regressão c A cidade X é um mercado consumidor importante para a empresa Cirelli Se a empresa vender seu pneu a partir da filial do Rio de Janeiro o custo estimado de venda é de 160 Sabendose que a distância entre São Paulo e a cidade X é de 250 km perguntase qual produto deve ser vendido o produzido no Rio de Janeiro ou o produzido em São Paulo 12 A tabela a seguir relaciona os custos de manutenção por hora e a idade de uma amostra de máquinas em meses Faça uma regressão linear e estime o custo para uma máquina de três anos e meio Idade 6 15 24 33 42 8 Custo 97 165 193 192 26 Planilha 07 13 O número de oferta de ações públicas iniciais emitidas em um período recente de 12 anos e o total de lucro dessas ofertas em milhões de reais é exibido na tabela Estime a equação da reta de regressão Interprete o valor da inclinação do intercepto e do coeficiente de determinação Número de emissões 412 461 687 483 317 487 385 81 70 68 186 169 Lucros 17784 28745 42572 32478 34585 65069 65628 34368 22136 10122 32380 28677 Planilha 15 14 A tabela abaixo mostra o espaço total em m2 de um espaço de varejo em shopping centers e suas vendas em bilhões de reais por 11 anos Estime a equação da reta de regressão Interprete o valor da inclinação do intercepto e do coeficiente de determinação Espaço total 50 51 52 53 55 56 57 58 59 60 61 Vendas 8938 9339 9800 10324 11053 11811 12217 12772 13392 14326 15304 Planilha 16 15 Decisões sobre investimentos em ações são às vezes tomadas baseadas em estimativas da medida beta que avalia o risco sistemático associado a um dado portfolio Esta medida reflete a relação entre a taxa de retorno de um certo portfolio ou ação e a taxa média de retorno do mercado como um todo Sua denominação beta deriva do coeficiente angular de um modelo da regressão na qual a variável resposta é a taxa de retorno do portfolio e a variável explicativa é a taxa de retorno do mercado Ações ou portfolios com inclinação maior do que 1 são consideradas agressivas na medida em que suas taxas de retorno apresentam variações maiores do que as das taxas do mercado Por outro lado inclinações inferiores a 1 representam ações ou portfolios defensivos ou conservadores por apresentarem alterações nas taxas de retorno Ações ou portfolios com inclinações próximas a 1 indicam investimentos neutros Durante sete meses foram coletados dados sobre as taxas de retorno de uma ação e do mercado Os dados encontramse no quadro abaixo Meses Retorno da Ação Retorno do Mercado 1 120 72 2 13 00 3 25 21 4 186 119 5 90 53 6 38 12 7 100 47 Planilha 17 a Determine a equação da reta da reta de regressão e interprete o significado do coeficiente angular b Calcule o coeficiente de determinação e interprete esse valor 9 Para os exercícios seguintes Construa um diagrama de dispersão identifique quaisquer valores discrepantes e determine se o ponto é influente Um ponto influente é um ponto no conjunto de dados que pode influenciar muito o gráfico de uma linha de regressão Um valor discrepante outlier pode ou não ser um ponto influente Para determinar se um ponto é influente encontre duas linhas de regressão uma incluindo todos os pontos no conjunto de dados e a outra excluindo o ponto influente possível Se a inclinação coeficiente b ou intercepto coeficiente a da linha de regressão mostra mudanças significantes o ponto pode ser considerado influente Um ponto influente pode ser removido de um conjunto de dados somente se houver uma justificativa apropriada 16 x 1 3 6 8 12 14 y 4 7 10 9 15 3 Planilha 13 17 x 5 6 9 10 14 17 19 44 y 32 33 28 26 25 23 23 8 Planilha 14 10 ESTUDO DE CASO PASTÉIS E PASTELÕES A Pastéis e Pastelões Ltda fabrica pastéis de forno a partir de dois ingredientes básicos massa semipronta e recheio congelado A empresa pretende estabelecer um modelo para previsão de lucro operacional mensal que lhe permita estabelecer o preço dos pastéis que deve ser praticado pela empresa Desconsiderando a hipótese de alteração do tamanho e da qualidade dos pastéis a diretoria considera que o preço unitário do pastel e o preço médio praticado pela concorrência são os únicos fatores relevantes na determinação da demanda a qual se comporta segundo a seguinte equação qd 15000 5000x 5000y onde x é o preço da Pastéis e Pastelões e y é o preço médio dos pastéis vendidos pelos concorrentes Dados adicionais Preço médio praticado pela concorrência R 700 Custo unitário da massa R pastel R 130 Custo unitário do recheio R pastel R 200 Custo unitário do processo R pastel R 040 Custo fixo R 600000 a Monte uma planilha para calcular o lucro total considerando o preço como variável de decisão Resultados preliminares O preço de R 400 não gera demanda suficiente para compensar a pequena margem de contribuição Custo dos ingredientes R 9900000 Custo do processo R 1200000 Custo fixo R 600000 Total R 11700000 Custo médio R 11700000 30000 R 390 Margem de contribuição R 400 R 390 R 010 Lucro total R 010 30000 R 300000 O preço de R 800 retrai muito a demanda O preço de R 600 é mais atrativo Mas é o ideal E se o preço fosse R 700 como se comportaria a demanda e o lucro Preço Quantidade Custo Receita Lucro 400 30000 11700000 12000000 300000 500 25000 9850000 12500000 2650000 600 20000 8000000 12000000 4000000 700 15000 6150000 10500000 4350000 800 10000 4300000 8000000 3700000 900 5000 2450000 4500000 2050000 Pela planilha pode se perceber que o preço que produz o maior lucro para empresa é o de R 700 obtendo um lucro 875 maior que o preço de R 600 e com uma quantidade demandada 25 menor Logo o melhor preço para a empresa é o de R 700 b Uma auditoria constatou por meio de dados contábeis que o custo unitário do processo é variável de acordo com o número de pastéis produzidos ou seja se comporta de forma diferente da que o modelo havia assumido R 040 pastel Abaixo são apresentados os resultados da auditoria planilha 05 Como melhorar o modelo de previsão do lucro considerando os dados observados Nível de produção Custo de processo REAL Custo de processo MODELO 10000 320000 4000 12000 370000 4800 14000 450000 5600 16000 590000 6400 18000 710000 7200 20000 800000 8000 22000 970000 8800 24000 1120000 9600 26000 1400000 10400 28000 1630000 11200 30000 1940000 12000 Utilizando o custo do processo real ao invés do custo do processo do modelo visto que o custo do processo do modelo está superestimado o custo deixando o produto com preços não muito competitivos quando a produção é menor que 20000 quando a produção é maior que 20000 o custo do processo é inferior ao custo real o que pode levar a empresa oferecer um preço menor levando a ter prejuízo EXERCÍCIOS DE FIXAÇÃO 1 O salário inicial é considerado um indicador importante do sucesso no mercado de trabalho por vários programas de pósgraduação stricto sensu mestrado e doutorado Um dos fatores que influenciam o salário inicial de um profissional egresso de uma pós graduação tem sido a pontuação no exame de seleção de alunos No caso da Administração o GMAT desempenha esse papel O salário inicial em R 100000 e a pontuação de 10 alunos recém graduados por uma conceituada Escola de Administração no Rio de Janeiro forneceu os seguintes dados planilha 03 Salário GMAT 40 600 33 510 40 550 35 500 28 480 28 500 34 520 30 500 32 530 31 490 Planilha 03 a Identifique qual é a variável explicativa independente e a variável resposta dependente RESPOSTA Variável explicativa X Pontuação obtida no GMAT Variável respostaY Salário de um recémformado b Faça um gráfico de dispersão para representar os dados 460 480 500 520 540 560 580 600 620 0 5 10 15 20 25 30 35 40 45 Gráfico de Dispersão c Verifique se o salário possui uma relação linear com a pontuação obtida no GMAT calcule o coeficiente de correlação RESOLUÇÃO ρ i1 n xix yiy i1 n xix 2 i1 n yiy 2 08368 O coeficiente de correlação de 08368 mostra que a correlação entre as variáveis é positiva e forte ou seja se uma variável aumenta a outra tende a aumentar também d Proceda uma regressão linear e descreva a equação da reta RESOLUÇÃO Observação GMAT Salário X2 XY 1 600 40 360000 24000 2 510 33 260100 16830 3 550 40 302500 22000 4 500 35 250000 17500 5 480 28 230400 13440 6 500 28 250000 14000 7 520 34 270400 17680 8 500 30 250000 15000 9 530 32 280900 16960 10 490 31 240100 15190 Soma 5180 331 2694400 172600 Média 518 331 β i1 n xi yin x y i1 n xi 2n x 2 01023 αyβ x199068 Logo a reta de regressão será Salárioi19906801023GMATϵi e Interprete os coeficientes da reta de regressão e informe em que unidade de medida cada coeficiente está expresso RESOLUÇÃO Para cada aumento em um ponto na nota do GMAT esperase um aumento de 1023 reais no salário do recémformado a variável GMAT é medida em unidade e a Salário é medida a cada 1000 reais f Quanto deverá receber um recémformado que tenha obtido 500 pontos no GMAT segundo a previsão da equação de regressão RESOLUÇÃO Salário19906801023500312581 O salário do recémformado que obteve 500 pontos no GMAT é de aproximadamente R 3125806 g Na amostra dois recém formados obtiveram 500 pontos no GMAT Um deles apresentou salário inicial de R 35000 enquanto o outro ganhava R 30000 Qual deles foi melhor previsto pelo modelo RESOLUÇÃO O que ganha R 3000000 visto que o modelo estimou um salário de R 3125806 h Calcule e interprete o coeficiente de determinação do modelo RESOLUÇÃO R 2ρ 208368 207002 O coeficiente de determinação foi de 07002 isso significa que as variações da variável GMAT consegue explicar cerca de 7002 das variações do salário do recémformado 2 A indústria farmacêutica MIMI vende um remédio para combater resfriado Após dois anos de operação ela coletou as seguintes informações trimestrais Trimestre Vendas y 10000 Despesas c Propaganda x1 Temperatura Média do Trimestre x2 1 25 11 2 2 13 5 13 3 8 3 16 4 20 9 7 5 25 12 4 6 12 6 10 7 10 5 13 8 15 9 4 Planilha 04 a Faça um gráfico de dispersão x1 y e x2 y 2 4 6 8 10 12 14 0 5 10 15 20 25 30 Gráfico de Dispersão Despesas com Propaganda Vendas 0 2 4 6 8 10 12 14 16 18 0 5 10 15 20 25 30 Gráfico de Dispersão Temperatura média Vendas b Calcule os coeficientes de correlação entre vendas e despesas com propaganda e entre vendas e temperatura média do trimestre Interprete RESOLUÇÃO ρ i1 n x1ix1 yiy i1 n x1ix1 2 i1 n yiy 2 09531 A correlação entre as vendas e as despesas com propaganda é positiva e forte isso significa que se uma aumenta a outra tende a aumentar também ρ i1 n x1ix1 yiy i1 n x1ix1 2 i1 n yiy 2 08755 A correlação entre a temperatura média no semestre e as vendas é negativa forte isso significa que se uma variável aumenta a outra tende a diminuir c Encontre as retas de regressão para vendas y com despesas com propaganda x1 e com as temperaturas médias x2 RESOLUÇÃO Trimestr e Despesas c Propagand a x1 Temperatur a Média do Trimestre x2 Venda s y 10000 x12 x1y 1 11 2 25 121 65 2 5 13 13 25 24 3 3 16 8 9 180 4 9 7 20 81 300 5 12 4 25 144 72 6 6 10 12 36 50 7 5 13 10 25 135 8 9 4 15 81 7680 Soma 60 69 128 522 8506 Média 75 8625 16 Modelo 1 β i1 n xi yin x y i1 n xi 2n x 2 1048056 αyβ x7700417 Vendasi77004171048056 Despesas com propagandaϵ i Modelo 2 β i1 n xi yin x y i1 n xi 2n x 2 11258 αyβ x257097 Vendasi25709711258Temperaturamédiaϵ i d Qual das duas retas você acha estatisticamente mais adequada para prever as vendas Por quê analise o coeficiente de determinação R2 RESOLUÇÃO Modelo 1 R 209083 Modelo 2 R 207666 Visto que o modelo 1 apresenta o maior coeficiente de determinação isso significa que consegue explicar mais as variações da variável resposta sendo assim o modelo 1 pode ser considerado o mais adequado e Qual a previsão de vendas para um trimestre em que a despesa de propaganda será de 8 E qual a previsão de vendas se a temperatura prevista for 10 RESOLUÇÃO Vendas 8 77004171048056 8684028 A previsão de vendas para um trimestre onde a despesas com propaganda será de 8 é de 684028 Vendas 10 25709711258 10144521 3 Decisões sobre investimentos em ações são às vezes tomadas baseadas em estimativas da medida beta que avalia o risco sistemático associado a um dado portfolio Esta medida reflete a relação entre a taxa de retorno de um certo portfolio ou ação e a taxa média de retorno do mercado como um todo Sua denominação beta deriva do coeficiente angular de um modelo da regressão na qual a variável dependente é a taxa de retorno do portfolio e a variável independente é a taxa de retorno do mercado Ações ou portfolios com inclinação maior do que 1 são consideradas agressivas na medida em que suas taxas de retorno apresentam variações maiores do que as das taxas do mercado Por outro lado inclinações inferiores a 1 representam ações ou portfolios defensivos ou conservadores por apresentarem alterações nas taxas de retorno Ações ou portfolios com inclinações próximas a 1 indicam investimentos neutros Durante sete meses foram coletados dados sobre as taxas de retorno de uma ação e do mercado Os dados encontramse no quadro a seguir Meses Retorno da Ação Retorno do Mercado 1 120 72 2 13 00 3 25 21 4 186 119 5 90 53 6 38 12 7 100 47 Planilha 18 a Determine a equação da reta Y 0 1X e interprete o significado do coeficiente angular RESOLUÇÃO Meses Retorno da Ação Retorno do Mercado X2 XY 1 12 72 5184 864 2 13 0 0 0 3 25 21 441 525 4 186 119 14161 22134 5 9 53 2809 477 6 38 12 144 456 7 10 47 2209 47 Soma 27 206 24948 41225 Média 38571 29429 β4122573857129429 24948729429 2 17621 α38571176212942913286 Retornodaaçãoi1328617621 Retorno do Mercadoϵi Para cada aumento em uma unidade no retorno do mercado esperase que o retorno da ação aumente cerca de 17621 unidades de medida b O coeficiente de determinação do modelo Rquadrado é igual a 0995 Interprete esse valor RESOLUÇÃO Um coeficiente de determinação igual a 0995 significa que as variações do retorno do mercado conseguem explicar cerca de 995 da variabilidade do retorno das ações 4 Fadiga emocional burnout é um sério problema que envolve pessoas que trabalham sob constante estado de pressão Análise de regressão foi utilizada para investigar a relação entre este problema e alguns aspectos extraídos da realidade organizacional do profissional para detalhes ver Journal of Applied Behavioral Science v 22 1986 A fadiga emocional foi medida por meio de um índice pontos construído a partir de questões extraídas do inventário de Maslach Uma das variáveis explicativas consideradas foi Contatos definida como o número de contatos semanais mantidos com pessoas pertencentes ao grupo de trabalho do respondente A tabela abaixo fornece os coeficientes da regressão tais como obtidos pelo Excel da série de 25 observações que compunham a amostra Resultados extraídos do Excel Coeficientes Interseção 29497 Variável X 8865 Com base nas informações acima a Identifique as variáveis explicativa e a variável resposta RESOLUÇÃO Variável explicativa X Contato Variável resposta Y Fadiga emocional b Monte a equação de regressão interprete cada um dos coeficientes e diga em que medida cada um está expresso RESOLUÇÃO burnout294978865Contatoϵ i O coeficiente de 29497 representa o intercepto da reta de regressão ou seja é o valor da variável resposta quando a variável explicativa é igual a zero Para cada aumento em uma unidade da variável contato estimase um aumento de 8865 na fadiga emocional a variável resposta é medida em pontos enquanto a variável explicativa é medida em quantidade c Qual deverá ser o índice de fadiga emocional para uma pessoa que estabeleça 100 contatos semanais com pessoas do grupo de trabalho RESOLUÇÃO burnout254978865100861003 O índice de fadiga será de aproximadamente 861003 d Na amostra observouse uma pessoa estabelecendo 20 contatos semanais com pessoas do mesmo grupo de trabalho e o seu nível de fadiga emocional bateu 1625 pontos Calcule a diferença entre os valores estimados pelo modelo e o observado na amostra Como se define esta diferença O modelo está sub ou super estimando a observação RESOLUÇÃO burnout25497886520151803 erro162515180310697 Pelo modelo uma pessoa que estabelece 20 contatos semanais com pessoas do mesmo grupo de trabalho obtém um nível de fadiga de 151803 a diferença do valor observado pelo valor estimado é chamado de erro residual e nesse caso foi de 10697 e aparentemente o modelo esta super estimado a observação e O que se pode dizer a respeito da associação entre as variáveis considerando o sinal da inclinação da reta de regressão e sabendose que o coeficiente de correlação é igual a 078 RESOLUÇÃO Que 78 das variações do nível de fadiga podem ser explicadas pelo contato semanal e que quando mais aumenta o contato semanal com pessoas do mesmo grupo de trabalho isso provoca um aumento no nível de fadiga emocional 5 A fim de se avaliar a variável que melhor possa explicar o consumo de combustível nos Estados Unidos dados sobre o consumo de gasolina galões per capta por ano renda US1000 per capta por ano imposto UScentavos por galão e habilitados percentagem de pessoas com carteira de habilitação e extensão da malha rodoviária federal milhas foram coletadas para os 48 estados contíguos daquele país em 1971 Considere primeiramente o quadro relativo às estatísticas para cada modelo Estatísticas da Regressão Medidas Variáveis Independentes Imposto Habilitação Renda Malha R múltiplo 04512 0699 0245 0024 RQuadrado 02036 0488 0060 0001 Rquadrado ajustado 0186 0477 0039 0021 Erro padrão 10092 8088 10965 11306 Observações 48 48 48 48 A tabela abaixo apresenta os coeficientes linear e angular para cada modelo Coeficiente Variáveis Independentes Imposto Habilitação Renda Malha Interseção 98401 22731 77936 57256 Inclinação 5311 1410 0048 000076 a De acordo com o seu julgamento quais seriam as variáveis que possivelmente poderiam ser escolhidas para explicar as variações no consumo de combustível Explicite o critério utilizado para a sua escolha RESOLUÇÃO As variáveis de Imposto e Habilitação pois são as que apresentam o maior coeficiente de determinação e a menor variação entre o R 2 e o R 2ajustado b Qual é a variável explicativa dentre as escolhidas no item anterior responsável pelo maior percentual de explicação da variação total do consumo de combustível A escolha baseada no coeficiente de determinação coincide com o do menor erro padrão do modelo Isso faz sentido Em que unidade está expresso o erro padrão RESOLUÇÃO É a variável Habitação que além de apresenta o maior coeficiente de determinação também apresenta o menor erro padrão o que faz sentido visto que o coeficiente de determinação indica o quanto a variável independente consegue explicar a variável resposta sendo assim quanto mais ela consegue explicar menos será o erro padrão O erro padrão está sendo medido em percentual c Interprete cada inclinação acima e diga em que unidade está expresso Algum deles chama a atenção Qual e por quê RESOLUÇÃO Para cada aumento em um centavo por galão de impostos o consumo de galões per capta de gasolina tende a cair cerca de 5311 e para cada aumento em um porcento de pessoas com habilitação o consumo de gasolina aumenta cerca de 1410 galões per capta por ano e para cada aumento em 1000 per capta por ano na renda o consumo de gasolina tende a cair cerca de 0048 galões per capta por ano e para cada aumento da malha ferroviária estimase um aumento de 0000076 em galões per capita por ano Analisando os efeitos das variáveis independentes na variável resposta não era esperado que um aumento na renda causaria uma diminuição no consumo de gasolina Lista de Exercícios Correlação e Regressão Linear 1 Um nutricionista quer determinar se a quantidade de água consumida por dia por pessoas de mesmo peso e a mesma dieta pode ser usada para prever a perda de peso dos indivíduos Identifique a variável explicativa e a variável resposta RESOLUÇÃO Variável explicativa quantidade diária de água consumida Variável resposta peso 2 Uma empresa de seguros contrata um atuário para determinar se o número de horas de aulas de direção pode ser usado para prever o número de acidentes de trânsito por motorista Identifique a variável explicativa e a variável resposta RESOLUÇÃO Variável explicativa número de horas de aulas de direção Variável resposta número de acidentes de trânsito 3 Os diagramas de dispersão abaixo mostram os resultados de uma pesquisa com 20 homens adultos com idades entre 24 e 35 anos selecionados aleatoriamente Usando a idade como variável explicativa relacione cada diagrama de dispersão com a descrição apropriada I II III IV a a Idade e temperatura corporal em Fahrenheits Diagrama 4 b Idade e balanço dos empréstimos estudantis Diagrama 3 c Idade e renda anual Diagrama 1 d Idade e altura Diagrama 2 4 Nos dois conjuntos de dados apresentados abaixo calcule o coeficiente de correlação r deixando a coluna 1 representar os valores de x e a coluna 2 os valores y Na sequência calcule o coeficiente de correlação r deixando a coluna 2 representar os valores x e a coluna 1 os valores y Que efeito tem a troca das variáveis explicativa e de resposta no coeficiente de correlação Coluna 1 16 25 39 45 49 64 70 Coluna 2 109 122 143 132 199 185 199 Coluna 1 0 1 2 3 3 5 5 5 6 7 Coluna 2 96 85 82 74 95 68 76 84 58 65 Dados 1 rcoluna 1 coluna2r coluna2coluna108835 Dados 2 rcoluna 1 coluna2r coluna2coluna107792 Para calcular o coeficiente de correlação a ordem de x e y não faz diferença 5 Relacione a equação de regressão com o gráfico apropriado note que os eixos x e y estão interrompidos I II III IV a 104x 503 Gráfico 3 b 1662x 8334 Gráfico 2 c 000114x 253 Gráfico 1 d 0667x 526 Gráfico 4 6 Correlacione as colunas de acordo com os conceitos apropriados 1 Linha de regressão a A diferença entre o valor y observado do ponto de dados e o valor y previsto na linha para o mesmo ponto de dados 2 Resíduos b 3 O valor y do ponto de dados correspondente a xi c A linha de melhor ajuste 4 O valor y para um ponto na linha de regressão correspondente a xi d yi 5 Inclinação e b0 6 Interseção y f 7 A média dos valores y g b1 8 O ponto pelo qual uma linha h de regressão sempre passa 1c 2a 3d 4b 5g 6e 7h 8f Para os exercícios 7 a 9 Encontre a equação da linha de regressão para os dados apresentados Depois construa um diagrama de dispersão dos dados e desenhe a linha de regressão use o recurso de adicionar linha de tendência do Excel Use a equação de regressão para prever o valor de y para cada um dos valores x fornecidos se o valor de x for adequado para a regressão um valor de x muito distante dos valores originais usados na regressão linear não é considerado adequado para estimativas 7 A idade em anos de sete crianças e o número de palavras que compõem o vocabulário Idade 3 4 4 5 6 2 3 Tamanho do vocabulário 1100 1300 1500 2100 2600 460 1200 Planilha 09 15 2 25 3 35 4 45 5 55 6 65 0 500 1000 1500 2000 2500 3000 Gráfico de Dispersão OBS Idade Tamanho do vocabulário X2 XY 1 3 1100 9 3300 2 4 1300 16 5200 3 4 1500 16 6000 4 5 2100 25 10500 5 6 2600 36 15600 6 2 460 4 920 7 3 1200 9 3600 Soma 27 10260 115 45120 Média 38571 1466 β45120738571 1466 115738571 2 5107895 α34205107895385715044737 Tamanho dovocabulárioi50447375107895idadeϵi Calcule qual seria o tamanho do vocabulário estimado para a x 2 anos Tamanho dovocabulárioi5044737510789525171053 b x 3 anos Tamanho dovocabulárioi50447375107895310278947 c x 6 anos Tamanho dovocabulárioi50447375107895625602032 d x 12 anos Tamanho dovocabulárioi50447375107895125625 8 O número de horas que 13 alunos passaram estudando para um teste e a pontuação nele Horas gastas estudando 0 1 2 4 4 5 5 5 6 6 7 7 8 Pontuação no teste 40 41 51 48 64 69 73 75 68 93 84 90 95 0 1 2 3 4 5 6 7 8 9 0 10 20 30 40 50 60 70 80 90 100 Gráfico de Dispersão Obs Horas de estudo Pontuaçã o no teste X2 XY 1 0 40 0 0 2 1 41 1 41 3 2 51 4 102 4 4 48 16 192 5 4 64 16 256 6 5 69 25 345 7 5 73 25 365 8 5 75 25 375 9 6 68 36 408 10 6 93 36 558 11 7 84 49 588 12 7 90 49 630 13 8 95 64 760 Soma 60 891 346 4620 Média 46154 685385 β4 6201346154 685385 3461346154 2 73497 α6853857349746154346169 Pontuação notestei34616973497horas deestudoϵ i Calcule qual seria a pontuação estimada para cada número de horas abaixo a x 3 horas Pontuação notestei346169734973713653 pontos b x 65 horas Pontuação notestei3461697349765823898 pontos c x 13 horas Pontuação notestei34616973497131301626 pontos d x 45 horas Pontuação notestei34616973497 45676904 pontos 9 O número de horas que 12 alunos passaram online durante o fim de semana e as pontuações que cada um conseguiu em um teste na segundafeira seguinte Horas gastas online 0 1 2 3 3 5 5 5 6 7 7 10 Pontuação no teste 96 85 82 74 95 68 76 84 58 65 75 50 Planilha 11 0 2 4 6 8 10 12 0 20 40 60 80 100 120 Gráfico de Dispersão Obs Horas gastas on line Pontuaçã o no teste X2 XY 1 0 96 0 0 2 1 85 1 85 3 2 82 4 164 4 3 74 9 222 5 3 95 9 285 6 5 68 25 340 7 5 76 25 380 8 5 84 25 420 9 6 58 36 348 10 7 65 49 455 11 7 75 49 525 12 10 50 100 500 Soma 54 908 332 3724 Média 45 756667 β372412 45756667 332124 5 2 40674 α75666773497 459397 Pontuação notestei34616973497horas onlineϵ i Calcule qual seria a pontuação estimada para cada número de horas online abaixo a x 4 horas Pontuação notestei34616973497 4777004 b x 8 horas Pontuação notestei346169734978614307 c x 9 horas Pontuação notestei346169734979573633 d x 15 horas Pontuação notestei3461697349715329588 10 Você trabalha para um analista de salários e reúne os dados apresentados na tabela abaixo A tabela mostra as idades de 13 engenheiros elétricos e seus salários anuais Idade em anos 22 25 29 34 39 43 48 53 56 61 64 67 69 Salário anual em milhares 535 563 598 631 659 697 736 758 781 803 794 763 724 Planilha 12 a Monte um diagrama de dispersão e avalie o tipo de correlação existente 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80 90 Diagrama de disperção Pelo diagrama de dispersão os dados apresentam ter uma correlação positiva forte b Encontre uma equação da linha de regressão para os dados Obs Idade em anos Salário anual em milhares X2 XY 1 22 535 484 1177 2 25 563 625 14075 3 29 598 841 17342 4 34 631 1156 21454 5 39 659 1521 25701 6 43 697 1849 29971 7 48 736 2304 35328 8 53 758 2809 40174 9 56 781 3136 43736 10 61 803 3721 48983 11 64 794 4096 50816 12 67 763 4489 51121 13 69 724 4761 49956 Soma 610 9042 31792 440427 Média 469231 695538 β44042713 469231595538 3179213 469231 2 05096 α69553805096 469231456423 A reta de regressão é Salárioi45642305096idadeϵ i c O analista uso a linha de regressão que você encontrou para prever o salário anual de um engenheiro elétrico que tenha 74 anos de idade Essa previsão é válida Salárioi4564230509674833520 11 A empresa Cirelli produtora de pneumáticos com sede na cidade de São Paulo e filial no Rio de Janeiro realizou um estudo para avaliar a relação entre o custo de comercialização e a distância de mercados consumidores até sua sede Os dados são apresentados abaixo Custo 36 48 50 70 42 58 91 69 Distância km 50 240 150 350 100 175 485 335 Planilha 06 a Identifique as variáveis explicativa e resposta RESOLUÇÃO Variável explicativa é a distância em km Variável resposta é o custo de comercialização b Estime a equação da reta de regressão Obs Custo Distância km X2 XY 1 36 50 2500 1800 2 48 240 57600 11520 3 50 150 22500 7500 4 70 350 122500 24500 5 42 100 10000 4200 6 58 175 30625 10150 7 91 485 235225 44135 8 69 335 112225 23115 Soma 464 1885 593175 126920 Média 58 235625 β126920858235625 5931758235625 2 01180 α5801180235625301877 A reta de regressão é Custoi30187701180 Distânciaϵ i c A cidade X é um mercado consumidor importante para a empresa Cirelli Se a empresa vender seu pneu a partir da filial do Rio de Janeiro o custo estimado de venda é de 160 Sabendose que a distância entre São Paulo e a cidade X é de 250 km perguntase qual produto deve ser vendido o produzido no Rio de Janeiro ou o produzido em São Paulo RESOLUÇÃO Custo301877011802505970 Como o curso de venda do produto produzido em São Paulo é menor sendo assim a cidade X deve vender os produtos produzido em São Paulo 12 A tabela a seguir relaciona os custos de manutenção por hora e a idade de uma amostra de máquinas em meses Faça uma regressão linear e estime o custo para uma máquina de três anos e meio Idade 6 15 24 33 42 Custo 97 165 193 192 26 Obs Idade Custo X2 XY 1 6 97 36 582 2 15 165 225 2475 3 24 193 576 4632 4 33 192 1089 6336 5 42 26 1764 1092 Soma 120 907 3690 24945 Média 24 1814 β 24945524 1814 3690524 2 03922 α18140392224100994 Custo 3510099403922351010 A estimativa de custo pelo modelo de regressão linear para uma máquina de 35 anos é de 1010 unidades de medidas 13 O número de oferta de ações públicas iniciais emitidas em um período recente de 12 anos e o total de lucro dessas ofertas em milhões de reais é exibido na tabela Estime a equação da reta de regressão Interprete o valor da inclinação do intercepto e do coeficiente de determinação Número de emissões 412 461 687 483 317 487 385 81 70 68 186 169 Lucros 17784 28745 42572 32478 34585 65069 65628 34368 22136 10122 32380 28677 Coeficiente s Erro padrão Stat t valorP 95 inferiore s 95 superiore s Inferior 950 Superior 950 Interseção 2184313 853445 6 255940 4 002840 2 282717 2 4085908 282717 2 408590 Variável X 1 40049 229972 7 174146 8 011221 8 111921 9129011 111921 912901 Estatística de regressão R múltiplo 048239 RQuadrado 02327 Rquadrado ajustado 015597 Erro padrão 1534991 Observações 12 O intercepto representa o valor da variável resposta quando a variável explicativa é zero ou seja o Lucro esperado para quando o número de emissões é nulo é de 2184313 milhões de reais e para cada aumento em uma unidade do número de emissões estima se um aumento de 40049 milhões de reais no lucro O coeficiente de determinação foi de 02327 isso significa que cerca de 2327 das variações do lucro são explicadas pelas variações do número de emissões 14 A tabela abaixo mostra o espaço total em m2 de um espaço de varejo em shopping centers e suas vendas em bilhões de reais por 11 anos Estime a equação da reta de regressão Interprete o valor da inclinação do intercepto e do coeficiente de determinação Espaço total 50 51 52 53 55 56 57 58 59 60 61 Vendas 8938 9339 9800 10324 11053 11811 12217 12772 13392 14326 15304 Coeficiente s Erro padrão Stat t valorP 95 inferiore s 95 superiore s Inferior 950 Superior 950 Interseção 188169 143788 4 130866 367E07 220697 155642 220697 155642 Variável X 1 5494483 257911 4 213037 6 52E09 491104 6 6077919 491104 6 607791 Estatística de regressão R múltiplo 099023 RQuadrado 0980555 Rquadrado ajustado 0978395 Erro padrão 3057588 Observações 11 O intercepto representa o valor da variável resposta quando a variável explicativa é zero ou seja as Vendas esperado para quando o espaço total é nulo é de 1882169 bilhões de reais e para cada aumento em uma unidade de metro quadrado do espaço total estimase um aumento de 54945 bilhões de reais nas vendas O coeficiente de determinação foi de 09806 isso significa que cerca de 9806 das variações das vendas são explicadas pelas variações do espaço total 15 Decisões sobre investimentos em ações são às vezes tomadas baseadas em estimativas da medida beta que avalia o risco sistemático associado a um dado portfolio Esta medida reflete a relação entre a taxa de retorno de um certo portfolio ou ação e a taxa média de retorno do mercado como um todo Sua denominação beta deriva do coeficiente angular de um modelo da regressão na qual a variável resposta é a taxa de retorno do portfolio e a variável explicativa é a taxa de retorno do mercado Ações ou portfolios com inclinação maior do que 1 são consideradas agressivas na medida em que suas taxas de retorno apresentam variações maiores do que as das taxas do mercado Por outro lado inclinações inferiores a 1 representam ações ou portfolios defensivos ou conservadores por apresentarem alterações nas taxas de retorno Ações ou portfolios com inclinações próximas a 1 indicam investimentos neutros Durante sete meses foram coletados dados sobre as taxas de retorno de uma ação e do mercado Os dados encontramse no quadro abaixo Meses Retorno da Ação Retorno do Mercado 1 120 72 2 13 00 3 25 21 4 186 119 5 90 53 6 38 12 7 100 47 Planilha 17 a Determine a equação da reta da reta de regressão e interprete o significado do coeficiente angular Meses Retorno da Ação Retorno do Mercado X2 XY 1 12 72 5184 864 2 13 0 0 0 3 25 21 441 525 4 186 119 14161 22134 5 9 53 2809 477 6 38 12 144 456 7 10 47 2209 47 Soma 27 206 24948 41225 Media 38571 29429 Retorno da Açãoi1328617621 Retorno do Mercadoϵ i Para cada aumento em um ponto percentual de retorno do mercado estimase um aumento de 17621 pontos percentuais no retorno da ação b Calcule o coeficiente de determinação e interprete esse valor R 2ρ 209952 Cerca de 9952 da variabilidade do retorno das ações é explicada pelas variações do retorno do mercado Para os exercícios seguintes Construa um diagrama de dispersão identifique quaisquer valores discrepantes e determine se o ponto é influente Um ponto influente é um ponto no conjunto de dados que pode influenciar muito o gráfico de uma linha de regressão Um valor discrepante outlier pode ou não ser um ponto influente Para determinar se um ponto é influente encontre duas linhas de regressão uma incluindo todos os pontos no conjunto de dados e a outra excluindo o ponto influente possível Se a inclinação coeficiente b ou intercepto coeficiente a da linha de regressão mostra mudanças significantes o ponto pode ser considerado influente Um ponto influente pode ser removido de um conjunto de dados somente se houver uma justificativa apropriada 16 x 1 3 6 8 12 14 y 4 7 10 9 15 3 Planilha 13 0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16 Diagrama de dirpersão Pelo diagrama de dispersão aparentemente há um outliers no conjunto de dados o ponto 143 Porém pelo BoxPlot dos dados não apresenta nenhum dado outliers 17 x 5 6 9 10 14 17 19 44 y 32 33 28 26 25 23 23 8 0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 Diagrama de dispersão Pelo diagrama de dispersão aparentemente há um outliers no conjunto de dados o ponto 448 Pelo BoxPlot podemos identificar que realmente há um dados outliers no conjunto de dados