·

Cursos Gerais ·

Métodos Quantitativos Aplicados

Send your question to AI and receive an answer instantly

Ask Question

Preview text

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE CASCAVEL CENTRO DE CIÊNCIAS SOCIAIS E APLICADAS CCSA PROGRAMA DE PÓSGRADUAÇÃO EM ADMINITRAÇÃO MESTRADO PROFISSIONAL Disciplina Métodos Quantitativos 1ºSemestre2023 Prof Jerry Johann 1 SEGUNDA AVALIAÇÃO DA DISCIPLINA Observações O trabalho pode ser realizado no máximo em dupla Os trabalhos copiados receberão nota zero Este trabalho deverá ser entregue na PLATAFORMA TEAMS em forma de relatório impreterivelmente até no máximo 09072023 A cada dia de atraso na entrega prevista acarretará na penalização de 2 pontos na avaliação Nomes 1 4 Buscando melhorar a qualidade do serviço uma empresa estuda o tempo de atraso na entrega dos pedidos recebidos Supondo que o tempo de atraso se encontra normalmente distribuído e conhecendo o tempo de atraso dos últimos 20 pedidos em dias foram determine 5 1 0 3 6 10 2 3 4 1 5 3 1 6 6 9 0 0 1 0 a Estime o atraso médio na entrega dos pedidos com intervalo de confiança de 95 Interprete o resultado b Se fosse conhecido que a população possui desvio padrão igual a 21 dias como ficaria a resposta do item a 2 4 Um analista de mercado obtém dados de uma amostra de 230 consumidores de um total de 1300 que adquiriram uma oferta especial As 230 pessoas gastaram na loja uma média de 9570 com um desvio padrão de 1730 Usando um intervalo de confiança de 95 estime a O intervalo de confiança para o valor médio de compras dos clientes deste mercado b Baseado nos resultados obtidos na letra a qual seria o provável intervalo de faturamento do mercado para os todos os clientes 3 5 O Departamento de Trânsito do Estado do Paraná pretende estimar a proporção de veículos fabricados nos últimos dez anos e cadastrados no estado que estejam emitindo monóxido de carbono acima dos níveis permitidos Responda as seguintes questões a No ano passado o Departamento de Trânsito vistoriou 3330 veículos dos quais 430 apresentaram irregularidade Encontre um intervalo de confiança para com coeficiente de confiança de 95 Interprete os resultados b Neste ano o Departamento de Trânsito também vistoriou 2350 veículos dos quais 380 apresentaram irregularidade Encontre um intervalo de confiança para com coeficiente de confiança de 95 Interprete os resultados c Comparando o intervalo em c com o intervalo em d você diria que a proporção de veículos irregulares mudou estatisticamente 4 3 Em uma grande área metropolitana em que estão localizados 550 postos de gasolina para uma amostra aleatória de 85 postos 65 comercializam um determinado óleo lubrificante que tem publicidade nacional Usando o Intervalo de Confiança de 95 a Estime a proporção de todos os postos de gasolina daquela área metropolitana que comercializam o óleo b Estime o número total de postos de serviços da área que comercializam o óleo lubrificante 5 5 A montadora de carros afirma que a média de consumo de seu novo modelo de carro popular é 1610 quilômetros por litro Se uma amostra aleatória de 18 carros do novo modelo teve em média 153 kmL com um desvio padrão igual a 27 kmL a Verificar a validade da afirmação realizada pela montadora de carros a 5 de significância por meio de um teste de hipóteses b Qual foi o poder do teste para este problema Discuta o que ele representa para a tomada de decisão c Para que o poder do teste fosse de 95 quantos automóveis deveriam ser avaliados amostralmente para esta inferência Discuta 6 3 A cronometragem de certa operação industrial forneceu os seguintes valores para diversas determinações dados em segundos conforme abaixo Podemos concluir que o tempo médio necessário para realizar essa operação é estatisticamente maior que 125 segundos ao nível de 1 de significância 142 149 133 129 132 139 125 140 128 138 130 124 138 131 130 147 134 7 5 A marca Z de um produto é responsável por 50 das vendas desse produto em um supermercado Uma campanha promocional foi contratada e os promotores garantem que a marca Z passará a ser responsável por uma porcentagem maior das vendas O dono do supermercado propõe entrevistar alguns clientes após o encerramento da campanha promocional e perguntar a cada um deles se ele usualmente compra a marca Z do produto Seja f a porcentagem de vendas do produto Z após a campanha adote 5 de significância a Estabeleça as hipóteses apropriadas b Quais são os significados dos erros tipo I e tipo II para o problema c Se entre 18 clientes entrevistados 10 responderam sim qual é a conclusão com base no nível descritivo d Se entre 324 clientes entrevistados 178 responderam sim qual é a conclusão com base no nível descritivo aproximado e Qual foi o poder do teste de hipóteses nos casos c e d Discuta isto considerando o que você apresentou na letra b 8 4 Suponha que para testar os resultados de um determinado tipo de treinamento tenha sido realizada uma experiência com uma amostra de 27 pessoas O objetivo da experiência é testar a hipótese de que com o referido treinamento 67 das pessoas melhoraram seus desempenhos a Se o número de pessoas que melhorou o desempenho for igual a 20 verificar a validade da hipótese ao nível de 5 de significância Conclua sobre o resultado encontrado b Qual foi o poder do teste para este problema Discuta o que ele representa para a tomada de decisão 9 3 No final da década de 80 existia uma disputa comercial entre os Estados Unidos EUA e o Japão De forma resumida autoridades dos EUA argumentavam que companhias japonesas praticavam preços menores nos EUA do que no Japão Segundo as autoridades americanas isto só era possível porque as práticas protecionistas do Japão impediam que bens produzidos nos EUA chegassem ao mercado japonês Para estudar este problema um economista obteve duas amostras aleatórias contendo 50 vendas nos EUA e 30 no UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE CASCAVEL CENTRO DE CIÊNCIAS SOCIAIS E APLICADAS CCSA PROGRAMA DE PÓSGRADUAÇÃO EM ADMINITRAÇÃO MESTRADO PROFISSIONAL Disciplina Métodos Quantitativos 1ºSemestre2023 Prof Jerry Johann 2 Japão para o mesmo período de tempo e o mesmo modelo de carro Os preços das vendas no Japão foram convertidos de Yens para Dólares Americanos pela taxa de câmbio para o período considerado Para as amostras consideradas foram obtidos preços médios de U 1154500 e U 1224300 e desvios padrões de U 198900 e U 184300 para os EUA e o Japão respectivamente Verifique por meio de um teste de hipóteses com 95 de confiança se o argumento dos EUA fazia ou não sentido 10 5 Para os dados da Tabela 1 verifique através de testes de hipótese a Se houve diferença estatística significativa com 95 de confiança entre os salários recebidos por estado civil b Se houve diferença estatística significativa com 99 de confiança entre a idade de acordo com o grau de instrução Tabela 1 Dados obtidos de uma amostragem com 36 pessoas Nº Estado Civil Grau de Instrução Nº de Filhos Salário x sal Mín Idade anos Região de Procedência 1 solteiro fundamental 0 40 26 outra 2 casado superior 1 46 32 outra 3 casado médio 2 53 36 interior 4 casado médio 0 57 20 interior 5 solteiro fundamental 0 63 40 capital 6 casado médio 0 67 28 outra 7 casado médio 0 69 41 outra 8 casado médio 0 74 43 capital 9 solteiro superior 1 76 34 outra 10 casado médio 0 74 23 interior 11 solteiro superior 2 81 33 interior 12 casado fundamental 0 85 27 outra 13 casado médio 0 87 37 capital 14 solteiro superior 3 90 44 outra 15 solteiro médio 0 91 30 outra 16 casado superior 0 94 38 interior 17 solteiro fundamental 1 98 31 interior 18 solteiro fundamental 2 98 39 capital 19 casado fundamental 0 105 25 capital 20 solteiro médio 0 108 37 capital 21 casado médio 1 111 30 interior 22 solteiro médio 0 116 34 interior 23 solteiro fundamental 0 120 41 capital 24 solteiro médio 0 128 26 capital 25 casado médio 2 132 32 outra 26 solteiro médio 2 136 35 outra 27 casado fundamental 2 139 46 interior 28 casado fundamental 0 147 29 interior 29 casado médio 3 147 40 capital 30 solteiro médio 2 160 35 capital 31 casado médio 2 162 31 outra 32 casado fundamental 1 166 36 interior 33 solteiro fundamental 3 173 43 capital 34 solteiro fundamental 1 188 33 outra 35 casado superior 2 195 48 outra 36 solteiro superior 3 200 42 interior Fonte BUSSAB E MORETTIN 2001 11 4 Um cientista de computação está investigando a utilidade de duas diferentes linguagens de programação LP1 e LP2 na melhoria das tarefas computacionais Doze programadores experientes familiarizados com ambas as linguagens codificaram uma função padrão nas duas linguagens LP1 e LP2 O tempo minutos foi registrado sendo os dados mostrados na tabela abaixo Há alguma indicação de que uma linguagem de programação seja preferível a 5 de significância Justifique sua resposta Programador 1 2 3 4 5 6 7 8 9 10 11 12 LP1 17 18 21 14 18 24 16 14 21 23 18 23 LP2 18 14 17 11 23 21 10 13 16 24 15 20 12 3 Dois tipos diferentes de máquinas de injeçãomoldagem são usados para formar peças de plásticos Uma peça é considerada defeituosa se ela tiver excesso de encolhimento ou se for descolorida Duas amostras aleatórias cada uma de tamanho 300 são selecionadas e 15 peças defeituosas são encontradas na amostra da máquina 1 enquanto 8 peças defeituosas são encontradas na amostra da máquina 2 É razoável concluir que ambas as máquinas produzam a mesma fração de peças defeituosas a 5 de significância 13 3 Um determinado município tem dez colégios com ensino fundamental A secretaria de educação deseja saber se o número de alunos reprovados nos diferentes colégios pode ser ou não considerado igual Para verificar isto levantou os dados junto aos colégios obtendose o número de reprovados apresentados abaixo Verifique se existe relação entre o número de alunos reprovados e os colégios do município ao nível de significância de 5 Colégios de Ensino Fundamental A B C D E F G H I J Nº alunos reprovados 10 8 12 13 6 8 10 15 20 17 UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE CASCAVEL CENTRO DE CIÊNCIAS SOCIAIS E APLICADAS CCSA PROGRAMA DE PÓSGRADUAÇÃO EM ADMINITRAÇÃO MESTRADO PROFISSIONAL Disciplina Métodos Quantitativos 1ºSemestre2023 Prof Jerry Johann 3 14 3 Desejase verificar se os processos de dedetização utilizados pelas companhias X Y Z tem associação com o tempo de duração da dedetização realizada Uma amostra de vários ambientes dedetizados foi colhida e anotouse a duração do efeito de dedetização conforme tabela abaixo Verifique então se existe associação entre as variáveis ao nível de 5 de significância Interprete o resultado Companhia Duração do efeito de dedetização Total 4 meses de 4 a 8 meses 8 meses X 64 120 16 200 Y 104 175 21 300 Z 27 48 5 80 Total 195 343 42 580 15 3 Verifique ao nível de 1 de significância se há associação entre o hábito de fumar e o gênero das pessoas para a amostra abaixo Aplique o teste estatístico apropriado e conclua a respeito dos resultados alcançados Justifique o uso do teste Sexo Condição Fumam Não Fumam Homens 8 2 Mulheres 4 9 16 3 Dois supermercados disputam a preferência dos consumidores de uma cidade O supermercado A realiza então uma campanha com distribuição de prêmios para aumentar o número de fregueses Um total de 100 consumidores foram acompanhados antes e depois da campanha onde se perguntou a cada um deles sobre a sua preferência Os resultados seguem abaixo Aplique o teste estatístico apropriado use α5 e conclua a respeito dos resultados alcançados Justifique o uso do teste Antes Depois TOTAL A B A 37 3 40 B 13 47 60 TOTAL 50 50 100 17 3 Verifique ao nível de 5 de significância se há associação entre o hábito de fumar e o gênero das pessoas para a amostra abaixo Aplique o teste estatístico apropriado e conclua a respeito dos resultados alcançados Justifique o uso do teste Sexo Condição Fumam Não Fumam Homens 7 3 Mulheres 3 6 18 4 Um estudo de uma seguradora objetiva avaliar se há uma associação entre as variáveis anos de serviço X e número de clientes Y de uma amostra de oito agentes dessa companhia de seguro Para tanto foram levantados os seguintes dados Agente A B C D E F G H I J X 2 3 4 5 4 6 7 8 8 10 Y 48 50 56 52 43 60 62 58 64 72 a Com o intuito de avaliar a associação entre as variáveis faça a1 análise dos pressupostos básicos de correlação entre dados quantitativos para decidir qual teste de correlação Pearson ou Spearman deve ser utilizado na análise bidimensional destes dados a2 diagrama de dispersão Conclua sobre a tendência dos dados a3 se necessário determine a correlação entre as variáveis e verifique se ela foi significativa a 5 de significância Justifique a escolha do teste de correlação 19 4 Um administrador de uma empresa de celulose deseja saber se é possível prever a altura de uma determinada espécie de árvore conhecendo o diâmetro do tronco medido a 2m do solo Os dados estão abaixo Diâmetro cm 23 35 74 79 84 99 109 157 244 320 409 655 Altura m 55 66 98 91 136 108 123 175 171 256 204 222 a Com o intuito de avaliar a associação entre as variáveis faça a1 análise dos pressupostos básicos de correlação entre dados quantitativos para decidir qual teste de correlação Pearson ou Spearman deve ser utilizado na análise bidimensional destes dados a2 diagrama de dispersão Conclua sobre a tendência dos dados a3 se necessário determine a correlação entre as variáveis e verifique se ela foi significativa a 5 de significância Justifique a escolha do teste de correlação 20 4 A cada ano os empregados de uma grande empresa são avaliados quanto ao nível de motivação sendo 1 não motivado e 50 maior nível de motivação A empresa deseja determinar se há relação entre o número de horastrabalho que o empregado perde UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE CASCAVEL CENTRO DE CIÊNCIAS SOCIAIS E APLICADAS CCSA PROGRAMA DE PÓSGRADUAÇÃO EM ADMINITRAÇÃO MESTRADO PROFISSIONAL Disciplina Métodos Quantitativos 1ºSemestre2023 Prof Jerry Johann 4 por ano HTP e o score motivacional Para ordenação considere os scores motivacionais do menor ao maior Uma amostra de 15 empregados revelou os dados abaixo Empregado 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 HTP 49 36 127 91 72 34 155 11 192 6 63 79 43 57 82 Score 39 42 10 25 22 35 15 48 7 45 29 21 36 49 31 a Com o intuito de avaliar a associação entre as variáveis faça a1 análise dos pressupostos básicos de correlação entre dados quantitativos para decidir qual teste de correlação Pearson ou Spearman deve ser utilizado na análise bidimensional destes dados a2 diagrama de dispersão Conclua sobre a tendência dos dados a3 se necessário determine a correlação entre as variáveis e verifique se ela foi significativa a 5 de significância Justifique a escolha do teste de correlação 21 4 Um pesquisador levantou dados em uma amostra de 20 terrenos registrando as seguintes características PT preço do terreno R 10000 A área m² GD grau de declividade 1 para o menor e 15 para o maior e VP vista panorâmica 1 para pobre e 20 para excelente PT 16 12 17 23 18 25 31 36 36 35 42 40 47 45 43 51 52 63 63 64 A 200 200 250 300 300 400 400 450 500 500 550 550 600 600 600 700 700 800 800 800 GD 1 8 7 2 12 15 3 1 10 10 5 9 2 7 11 10 8 3 2 1 VP 9 5 4 8 2 8 9 5 3 2 4 7 1 8 5 8 8 4 5 6 a Determine uma matriz de correlação de Pearson com seus pvalores Analise os resultados encontrados e indique qualis correlaçãoões foiram significativas Justifique b O pesquisador optou pelo uso do coeficiente de correlação de Pearson para analisar a relação entre as variáveis Você considera que para este conjunto de dados esta foi uma escolha adequada ou usaria outro coeficiente de correlação para análise de algumas ou todas as variáveis entre si Justifique 22 4 A Tabela 2 apresenta o tempo em unidades de milhões de ciclos até a perda de velocidade de cinco tipos de turbina de avião Foram considerados 10 motores para cada tipo de turbina Tabela 2 Tempo decorrido até a perda de velocidade de 5 tipos I II III IV V de turbinas de avião Tipo I 303 553 560 930 992 1251 1295 1521 1604 1684 Tipo II 319 426 447 453 467 469 578 679 937 1275 Tipo III 346 522 569 654 916 940 1019 1071 1258 1341 Tipo IV 588 674 690 698 721 814 859 980 1228 2546 Tipo V 643 997 1039 1355 1445 1472 1681 1839 2084 2151 a Faça a análise dos dados através da ANOVA a 5 de significância Caso necessário aplique o teste de comparação de medias apropriado a Conclua sobre os resultados alcançados 23 3 Um engenheiro está interessado em avaliara resistência à tensão de uma fibra sintética Suspeitase que a resistência esteja relacionada à percentagem do algodão na fibra Cinco níveis de percentagem de algodão são usados e 5 replicas são coletadas em ordem aleatória resultando nos dados da tabela abaixo de Algodão Obs 1 2 3 4 5 15 7 7 15 11 9 20 12 17 12 18 18 25 14 18 18 19 19 30 19 25 22 19 23 35 7 10 11 15 11 a Faça a análise dos dados através da ANOVA a 5 de significância Caso necessário aplique o teste Tukey b Conclua sobre os resultados alcançados 24 4 Na Tabela abaixo apresentamos o número de frutas comerciáveis de morangueiro obtidas no primeiro mês de coleta do ensaio O experimento foi executado visando verificar os efeitos de biorreguladores ácidos giberélicoGA3 e 3indolacéticoIAA e do nitrato de potássio KNO3 sobre o morangueiro cultivar CampinasIAC 2712 nas produções precoce e total e no tamanho da fruta Os UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE CASCAVEL CENTRO DE CIÊNCIAS SOCIAIS E APLICADAS CCSA PROGRAMA DE PÓSGRADUAÇÃO EM ADMINITRAÇÃO MESTRADO PROFISSIONAL Disciplina Métodos Quantitativos 1ºSemestre2023 Prof Jerry Johann 5 tratamentos aqui considerados foram Testemunha sem tratamento 100 ppm de ácido de giberélico 005 de nitrato de potássio e 100 ppm de 3indolacético Os tratamentos foram dispostos em 4 blocos casualizados Número de frutas comerciáveis por parcela 1575 m2 obtidas no primeiro mês de colheita Tratamentos Blocos I II III IV Controle ou T1 Testemunha 29 19 31 33 T2 GA3100 ppm 79 59 68 48 T3 KNO3005 41 37 30 34 T4 IAA100 ppm 43 29 47 15 b Faça a análise dos dados através da ANOVA a 5 de significância Caso necessário aplique um teste de comparação de medias apropriado c Conclua sobre os resultados alcançados 25 5 Para o exercício 19 a Encontre o modelo de regressão linear simples e interprete os parâmetros estimados do modelo b Avalie a qualidade do ajuste do modelo estimado com 5 de significância b1 Através da Análise de Variância ANOVA b2 Caso o modelo apresentado seja significativo realize testes de hipótese para os parâmetros e do modelo de regressão linear simples b3 Determine o coeficiente de determinação do modelo e o coeficiente de determinação corrigido Qual a interpretação dos coeficientes de determinação para o modelo de regressão encontrado d Estime através do modelo de regressão ajustado qual seria o número de clientes caso o agente tivesse 6 anos ou 85 anos de serviço 26 5 Imagine que você seja o administrador de uma indústria têxtil e esteja interessado em modelar o volume de madeira de cerejeiras a partir do diâmetro e altura das árvores Use α5 a Defina qual é a variável dependente e quais as variáveis independentes Posteriormente faça os 02 gráficos de dispersão destes dados Analise os gráficos quando a natureza e força da relação entre as variáveis Qual variável independente parece explicar melhor a variável dependente b Como você pensaria em prever o volume de uma árvore a partir do seu diâmetro Construa o modelo e avalie as suas propriedades globais ANOVA teste de hipótese para os coeficientes R² e R² ajustado c Repita o que fez na letra acima b trocando altura pelo diâmetro d Compare e comente sobre os resultados obtidos nas letras b e c e Numa reserva florestal como seria mais fácil prever o volume de uma árvore pelo diâmetro ou pela altura Por quê f Modele os dados com uma regressão múltipla Analise o modelo quanto a qualidade do ajuste ANOVA teste de hipótese para os coeficientes R² e R² ajustado g Na sua opinião qual modelo dos 3 que você fez o administrador deveria utilizar para predizer o volume de madeiras da área florestal Justifique sua decisão ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Diâmetrocm 32 33 34 40 41 41 43 42 43 43 43 44 44 45 46 49 50 51 53 53 54 54 56 61 62 66 67 69 69 68 79 Alturam 39 36 35 40 45 47 37 42 45 42 44 43 43 39 41 41 48 50 40 36 44 45 41 40 43 45 46 45 46 49 52 Volumem³ 39 38 39 63 74 77 64 72 79 75 81 79 79 75 86 98 11 12 11 97 12 13 12 15 16 19 20 21 21 21 30 Hipóteses H0 Não há associação entre o hábito de fumar e o gênero Ha Há associação entre o hábito de fumar e o gênero Para verificar se há uma associação entre duas variáveis categóricas geralmente se utiliza o teste QuiQuadrado Entretanto um pressuposto do teste é que as frequências esperadas sejam suficientemente grandes em geral pelo menos 5 No R temos 1 Cria a matriz de dados 2 dados matrixc8 2 4 9nrow 2 byrow T 3 rownamesdados cHomens Mulheres 4 colnamesdados cFumam Não Fumam 5 dados 6 7 Teste quiquadrado 8 chisqtestdados correct Fexpected 9 Fumam Não Fumam 10 Homens 5217391 4782609 11 Mulheres 6782609 6217391 12 Warning message 13 In chisqtestdados correct F 14 Aproximação do quiquadrado pode estar incorreta 15 Como temos casos em que a frequência esperada é baixa podemos utilizar o teste Exato de Fisher 1 Teste exato de Fisher 2 fishertestdados 3 4 Fishers Exact Test for Count Data 5 6 data dados 7 pvalue 003607 8 alternative hypothesis true odds ratio is not equal to 1 9 95 percent confidence interval 10 09868616 1125557919 11 sample estimates 12 odds ratio 13 8042442 Como valorp 00361 001 não se rejeita a hipótese nula ao nível de significância de 1 Dessa forma concluise que não existe associação significativa entre o gênero e o hábito de fumar Para verificar se há uma associação entre duas variáveis categóricas geralmente se utiliza o teste QuiQuadrado Hipóteses H0 Não há associação entre a preferência dos consumidores antes e depois da campanha Ha Há associação entre a preferência dos consumidores antes e depois da campanha 1 dados matrixc37 3 13 47 nrow 2 byrow T 2 rownamesdados cA B 3 colnamesdados cAntes Depois 4 dados 5 6 Realiza o teste quiquadrado 7 chisqtestdados correct F 8 9 Pearsons Chisquared test 10 11 data dados 12 Xsquared 48167 df 1 pvalue 3915e12 13 Como valorp 0 005 logo rejeitase a hipótese nula ao nível de significância de 5 Existe associação entre a preferência dos consumidores antes e após a campanha Hipóteses H0 Não há associação entre o hábito de fumar e o gênero Ha Há associação entre o hábito de fumar e o gênero Para verificar se há uma associação entre duas variáveis categóricas geralmente se utiliza o teste QuiQuadrado Entretanto um pressuposto do teste é que as frequências esperadas sejam suficientemente grandes em geral pelo menos 5 No R temos 1 Cria a matriz de dados 2 dados matrixc7 3 3 6 nrow 2 byrow T 3 rownamesdados cHomens Mulheres 4 colnamesdados cFumam Não Fumam 5 dados 7 Teste quiquadrado 8 chisqtestdados correct FALSEexpected 9 10 Fumam Não Fumam 11 Homens 5263158 4736842 12 Mulheres 4736842 4263158 13 Warning message 14 In chisqtestdados correct FALSE 15 Aproximação do quiquadrado pode estar incorreta Como temos casos em que a frequência esperada é baixa podemos utilizar o teste Exato de Fisher 1 Teste exato de Fisher 2 fishertestdados 3 4 Fishers Exact Test for Count Data 5 6 data dados 7 pvalue 01789 8 alternative hypothesis true odds ratio is not equal to 1 9 95 percent confidence interval 10 04905217 490609357 11 sample estimates 12 odds ratio 13 4267104 Como valorp 005 não se rejeita a hipótese nula ao nível de significância de 5 Não existe associação gênero e hábito de fumar a1 Normalidade H0 os dados seguem distribuição normal H1 os dados não seguem distribuição normal 1 Dados 2 anosservico c2 3 4 5 4 6 7 8 8 10 3 numclientes c48 50 56 52 43 60 62 58 64 72 4 5 shapirotestanosservico 6 7 ShapiroWilk normality test 8 9 data anosservico 10 W 096827 pvalue 08743 11 12 shapirotestnumclientes 13 14 ShapiroWilk normality test 15 16 data numclientes 17 W 099026 pvalue 09971 18 Para ambas as variáveis os dados seguem distribuição normal valorp 005 não se rejeita H0 Dessa forma podemos usar a correlação de Pearson a2 1 plotanosservico numclientes 2 xlab Anos de Serviço 3 ylab Número de clientes 4 main Gráfico de Dispersão Os dados parecem seguir tendência crescente Isto é quanto maior o número de anos de serviço maior tende a ser o número de clientes a3 H0 Não há correlação entre as variáveis Anos de Serviço X e Número de Clientes Y o coeficiente de correlação populacional é igual a zero ρ 0 H1 Há correlação entre as variáveis Anos de Serviço X e Número de Clientes Y o coeficiente de correlação populacional é diferente de zero ρ 0 1 Teste correlação 2 cortestanosservico numclientes method pearson 3 4 Pearsons productmoment correlation 5 6 data anosservico and numclientes 7 t 51573 df 8 pvalue 00008665 8 alternative hypothesis true correlation is not equal to 0 9 95 percent confidence interval 10 05517820 09705991 11 sample estimates 12 cor 13 08767952 Como valorp 00009 005 rejeitase a hipótese nula ao nível de significância de 5 Existe correlação linear significativa entre Anos de Serviço e Número de Clientes Considerase o teste de Pearson porque os dados seguem distribuição normal a1 Normalidade H0 os dados seguem distribuição normal H1 os dados não seguem distribuição normal 1 diametro c23 35 74 79 84 99 109 157 244 320 409 655 2 altura c55 66 98 91 136 108 123 175 171 256 204 222 6 Teste de normalidade ShapiroWilk 7 8 shapirotestdiametro 9 10 ShapiroWilk normality test 12 data diametro 13 W 081028 pvalue 001229 15 16 shapirotestaltura 17 18 ShapiroWilk normality test 20 data altura 21 W 095941 pvalue 07754 Apenas uma das variáveis tem distribuição normal valorp 005 ao nível de significância de 5 Dessa forma devese considerar a correlação de Spearman a2 1 Teste de linearidade Gráfico de dispersão 2 plotdiametro altura 3 xlab Diâmetro cm 4 ylab Altura m 5 main Gráfico de Dispersão O gráfico mostra tendência positiva quanto maior o diâmetro maior a altura a3 H0 Não há correlação entre as variáveis Diâmetro X e Altura Y o coeficiente de correlação populacional é igual a zero ρ 0 H1 Há correlação entre as variáveis Diâmetro X e Altura Y o coeficiente de correlação populacional é diferente de zero ρ 0 1 Teste de correlação 2 cortestdiametro altura method spearman 3 4 Spearmans rank correlation rho 5 6 data diametro and altura 7 S 16 pvalue 22e16 8 alternative hypothesis true rho is not equal to 0 9 sample estimates 10 rho 11 09440559 Como valorp 0 005 rejeitase a hipótese nula ao nível de significância de 5 Existe correlação significativa entre Diâmetro e Altura Considerase o teste de Spearman porque os dados não seguem distribuição normal a1 Normalidade H0 os dados seguem distribuição normal H1 os dados não seguem distribuição normal 1 Dados 2 htp c49 36 127 91 72 34 155 11 192 6 63 79 43 57 82 3 score c39 42 10 25 22 35 15 48 7 45 29 21 36 49 31 4 5 Teste de normalidade ShapiroWilk 6 shapirotesthtp 7 8 ShapiroWilk normality test 10 data htp 11 W 092262 pvalue 02112 14 shapirotestscore 15 16 ShapiroWilk normality test 18 data score 19 W 095834 pvalue 06636 Para ambas as variáveis os dados seguem distribuição normal valorp 005 não se rejeita H0 Dessa forma podemos usar a correlação de Pearson a2 1 Teste de linearidade Gráfico de dispersão 2 plotscore htp 3 xlab Score Motivacional 4 ylab HorasTrabalho Perdidas 5 main Gráfico de Dispersão O gráfico mostra uma tendência decrescente quanto maior o score motivacional menor a quantidade de horas de trabalho perdidas a3 1 cortestscore htp method pearson 2 3 Pearsons productmoment correlation 4 data score and htp 5 t 70163 df 13 pvalue 9117e06 6 alternative hypothesis true correlation is not equal to 0 7 95 percent confidence interval 8 09629525 06928503 9 sample estimates 10 cor 11 0889434 Como valorp 0 005 rejeitase a hipótese nula ao nível de significância de 5 Existe correlação linear significativa entre Score Motivacional e HorasTrabalho perdidas Considerase o teste de Pearson porque os dados seguem distribuição normal Hipóteses H0 Não há associação entre o hábito de fumar e o gênero Ha Há associação entre o hábito de fumar e o gênero Para verificar se há uma associação entre duas variáveis categóricas geralmente se utiliza o teste QuiQuadrado Entretanto um pressuposto do teste é que as frequências esperadas sejam suficientemente grandes em geral pelo menos 5 No R temos 1 Cria a matriz de dados 2 dados matrixc8 2 4 9nrow 2 byrow T 3 rownamesdados cHomens Mulheres 4 colnamesdados cFumam Não Fumam 5 dados 6 7 Teste quiquadrado 8 chisqtestdados correct Fexpected 9 Fumam Não Fumam 10 Homens 5217391 4782609 11 Mulheres 6782609 6217391 12 Warning message 13 In chisqtestdados correct F 14 Aproximação do quiquadrado pode estar incorreta 15 Como temos casos em que a frequência esperada é baixa podemos utilizar o teste Exato de Fisher 1 Teste exato de Fisher 2 fishertestdados 3 4 Fishers Exact Test for Count Data 5 6 data dados 7 pvalue 003607 8 alternative hypothesis true odds ratio is not equal to 1 9 95 percent confidence interval 10 09868616 1125557919 11 sample estimates 12 odds ratio 13 8042442 Como valorp 00361 001 não se rejeita a hipótese nula ao nível de significância de 1 Dessa forma concluise que não existe associação significativa entre o gênero e o hábito de fumar Para verificar se há uma associação entre duas variáveis categóricas geralmente se utiliza o teste QuiQuadrado Hipóteses H0 Não há associação entre a preferência dos consumidores antes e depois da campanha Ha Há associação entre a preferência dos consumidores antes e depois da campanha 1 dados matrixc37 3 13 47 nrow 2 byrow T 2 rownamesdados cA B 3 colnamesdados cAntes Depois 4 dados 5 6 Realiza o teste quiquadrado 7 chisqtestdados correct F 8 9 Pearsons Chisquared test 10 11 data dados 12 Xsquared 48167 df 1 pvalue 3915e12 13 Como valorp 0 005 logo rejeitase a hipótese nula ao nível de significância de 5 Existe associação entre a preferência dos consumidores antes e após a campanha Hipóteses H0 Não há associação entre o hábito de fumar e o gênero Ha Há associação entre o hábito de fumar e o gênero Para verificar se há uma associação entre duas variáveis categóricas geralmente se utiliza o teste QuiQuadrado Entretanto um pressuposto do teste é que as frequências esperadas sejam suficientemente grandes em geral pelo menos 5 No R temos 1 Cria a matriz de dados 2 dados matrixc7 3 3 6 nrow 2 byrow T 3 rownamesdados cHomens Mulheres 4 colnamesdados cFumam Não Fumam 5 dados 7 Teste quiquadrado 8 chisqtestdados correct FALSEexpected 9 10 Fumam Não Fumam 11 Homens 5263158 4736842 12 Mulheres 4736842 4263158 13 Warning message 14 In chisqtestdados correct FALSE 15 Aproximação do quiquadrado pode estar incorreta Como temos casos em que a frequência esperada é baixa podemos utilizar o teste Exato de Fisher 1 Teste exato de Fisher 2 fishertestdados 3 4 Fishers Exact Test for Count Data 5 6 data dados 7 pvalue 01789 8 alternative hypothesis true odds ratio is not equal to 1 9 95 percent confidence interval 10 04905217 490609357 11 sample estimates 12 odds ratio 13 4267104 Como valorp 005 não se rejeita a hipótese nula ao nível de significância de 5 Não existe associação gênero e hábito de fumar a1 Normalidade H0 os dados seguem distribuição normal H1 os dados não seguem distribuição normal 1 Dados 2 anosservico c2 3 4 5 4 6 7 8 8 10 3 numclientes c48 50 56 52 43 60 62 58 64 72 4 5 shapirotestanosservico 6 7 ShapiroWilk normality test 8 9 data anosservico 10 W 096827 pvalue 08743 11 12 shapirotestnumclientes 13 14 ShapiroWilk normality test 15 16 data numclientes 17 W 099026 pvalue 09971 18 Para ambas as variáveis os dados seguem distribuição normal valorp 005 não se rejeita H0 Dessa forma podemos usar a correlação de Pearson a2 1 plotanosservico numclientes 2 xlab Anos de Serviço 3 ylab Número de clientes 4 main Gráfico de Dispersão Os dados parecem seguir tendência crescente Isto é quanto maior o número de anos de serviço maior tende a ser o número de clientes a3 H0 Não há correlação entre as variáveis Anos de Serviço X e Número de Clientes Y o coeficiente de correlação populacional é igual a zero ρ 0 H1 Há correlação entre as variáveis Anos de Serviço X e Número de Clientes Y o coeficiente de correlação populacional é diferente de zero ρ 0 1 Teste correlação 2 cortestanosservico numclientes method pearson 3 4 Pearsons productmoment correlation 5 6 data anosservico and numclientes 7 t 51573 df 8 pvalue 00008665 8 alternative hypothesis true correlation is not equal to 0 9 95 percent confidence interval 10 05517820 09705991 11 sample estimates 12 cor 13 08767952 Como valorp 00009 005 rejeitase a hipótese nula ao nível de significância de 5 Existe correlação linear significativa entre Anos de Serviço e Número de Clientes Considerase o teste de Pearson porque os dados seguem distribuição normal a1 Normalidade H0 os dados seguem distribuição normal H1 os dados não seguem distribuição normal 1 diametro c23 35 74 79 84 99 109 157 244 320 409 655 2 altura c55 66 98 91 136 108 123 175 171 256 204 222 6 Teste de normalidade ShapiroWilk 7 8 shapirotestdiametro 9 10 ShapiroWilk normality test 12 data diametro 13 W 081028 pvalue 001229 15 16 shapirotestaltura 17 18 ShapiroWilk normality test 20 data altura 21 W 095941 pvalue 07754 Apenas uma das variáveis tem distribuição normal valorp 005 ao nível de significância de 5 Dessa forma devese considerar a correlação de Spearman a2 1 Teste de linearidade Gráfico de dispersão 2 plotdiametro altura 3 xlab Diâmetro cm 4 ylab Altura m 5 main Gráfico de Dispersão O gráfico mostra tendência positiva quanto maior o diâmetro maior a altura a3 H0 Não há correlação entre as variáveis Diâmetro X e Altura Y o coeficiente de correlação populacional é igual a zero ρ 0 H1 Há correlação entre as variáveis Diâmetro X e Altura Y o coeficiente de correlação populacional é diferente de zero ρ 0 1 Teste de correlação 2 cortestdiametro altura method spearman 3 4 Spearmans rank correlation rho 5 6 data diametro and altura 7 S 16 pvalue 22e16 8 alternative hypothesis true rho is not equal to 0 9 sample estimates 10 rho 11 09440559 Como valorp 0 005 rejeitase a hipótese nula ao nível de significância de 5 Existe correlação significativa entre Diâmetro e Altura Considerase o teste de Spearman porque os dados não seguem distribuição normal a1 Normalidade H0 os dados seguem distribuição normal H1 os dados não seguem distribuição normal 1 Dados 2 htp c49 36 127 91 72 34 155 11 192 6 63 79 43 57 82 3 score c39 42 10 25 22 35 15 48 7 45 29 21 36 49 31 4 5 Teste de normalidade ShapiroWilk 6 shapirotesthtp 7 8 ShapiroWilk normality test 10 data htp 11 W 092262 pvalue 02112 14 shapirotestscore 15 16 ShapiroWilk normality test 18 data score 19 W 095834 pvalue 06636 Para ambas as variáveis os dados seguem distribuição normal valorp 005 não se rejeita H0 Dessa forma podemos usar a correlação de Pearson a2 1 Teste de linearidade Gráfico de dispersão 2 plotscore htp 3 xlab Score Motivacional 4 ylab HorasTrabalho Perdidas 5 main Gráfico de Dispersão O gráfico mostra uma tendência decrescente quanto maior o score motivacional menor a quantidade de horas de trabalho perdidas a3 1 cortestscore htp method pearson 2 3 Pearsons productmoment correlation 4 data score and htp 5 t 70163 df 13 pvalue 9117e06 6 alternative hypothesis true correlation is not equal to 0 7 95 percent confidence interval 8 09629525 06928503 9 sample estimates 10 cor 11 0889434 Como valorp 0 005 rejeitase a hipótese nula ao nível de significância de 5 Existe correlação linear significativa entre Score Motivacional e HorasTrabalho perdidas Considerase o teste de Pearson porque os dados seguem distribuição normal