• Home
  • Chat IA
  • Recursos
  • Guru IA
  • Professores
Home
Recursos
Chat IA
Professores

·

Cursos Gerais ·

Estatística 1

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Estatística

15

Estatística

Estatística 1

UMG

Exercícios de Estatística Descritiva e Probabilidade - Medicina Veterinária

1

Exercícios de Estatística Descritiva e Probabilidade - Medicina Veterinária

Estatística 1

UMG

Regressão - Razão de Chances

5

Regressão - Razão de Chances

Estatística 1

UMG

Estatística

21

Estatística

Estatística 1

UMG

Exercício de Estatística

1

Exercício de Estatística

Estatística 1

UMG

Desafio Prático

7

Desafio Prático

Estatística 1

UMG

Estatistica Descritiva Univariada - Medidas de Assimetria e Curtose

1

Estatistica Descritiva Univariada - Medidas de Assimetria e Curtose

Estatística 1

UMG

Probabilidade-Conceitos-e-Procedimentos-de-Medicao

1

Probabilidade-Conceitos-e-Procedimentos-de-Medicao

Estatística 1

UMG

Trabalho de Estatistica Basica

10

Trabalho de Estatistica Basica

Estatística 1

UMG

Covariancia Regressão Coeficiente de Determinação

1

Covariancia Regressão Coeficiente de Determinação

Estatística 1

UMG

Texto de pré-visualização

3 Para duas variáveis qualitativas pedese a Há indícios de associação entre as variáveis Justificar por meio das tabelas de distribuição de frequência por linha coluna etc b Confirme o item anterior calculando a estatística quiquadrado e interpretando o resultado do teste 4 Para duas variáveis quantitativas pedese a Elabore o diagrama de dispersão e analise se parece haver dependência entre as respectivas variáveis b Calcule o coeficiente de correlação de Pearson Qual a sua conclusão em relação à dependência dessas variáveis Trabalho Prático Final Estatística Aplicada a Sistemas de Gestão Escolher uma base de dados com pelo menos 3 variáveis quantitativas e 2 variáveis qualitativas Das variáveis quantitativas uma delas será considerada como dependente no modelo de regressão e pelo menos 2 devem ser consideradas como explicativas OBS Com exceção do exercício de Regressão que será interpretação de outputs do software para cada item dos demais exercícios demonstrar os cálculos analiticamente Nesses casos outputs de softwares sem explicação e sem cálculos analíticos não serão considerados Pedese 1 Apresentar eou descrever a base de dados Especificar a escala de mensuração de cada variável 2 Escolha uma das variáveis quantitativas Pedese a Calcule as medidas de posição referentes à média aritmética à mediana e à moda b Calcule o primeiro e terceiro quartil e veja se há indícios de existência de outliers c Calcule os percentis de ordem 20 e 80 d Calcule os decis de ordem 4 e 7 e Calcule as seguintes medidas de dispersão amplitude desviomédio variância desviopadrão f Verifique se a distribuição é simétrica assimétrica positiva ou assimétrica negativa g Calcule o coeficiente de curtose e classifique o grau de achatamento da distribuição mesocúrtica platicúrtica ou leptocúrtica h Construa o histograma o gráfico ramoefolhas e o boxplot para a variável em estudo não se esqueça de representar se houver os outliers no boxplot Página 1 3 drivegooglecom Analise da Base de Dados dos Indicadores do Brasil 23 de marco de 2025 1 Descricao da Base de Dados Utilizei uma base de dados composta por 115 observacoes em que cada linha representa um indicador serie relacionado ao Brasil A base contem as seguintes variaveis 1 Country Name Descricao Nome do paıs neste caso todos os registros referemse ao Brasil Escala de mensuracao Qualitativa nominal Justificativa Tratase de uma categoria sem ordem intrınseca que identifica o paıs 2 Country Code Descricao Codigo do paıs no formato de trˆes letras por exemplo BRA para o Brasil Escala de mensuracao Qualitativa nominal Justificativa E uma identificacao categorica sem hierarquia 3 Series Name Descricao Nome do indicador ou serie por exemplo Age of the establishment years Annual employment growth entre outros Escala de mensuracao Qualitativa nominal Justificativa Embora seja possıvel categorizar ou agrupar posteriormente os no mes dos indicadores sao apenas etiquetas descritivas sem ordem natural 1 4 Series Code Descricao Codigo identificador da serie por exemplo ICFRMFCHARCAR1 ICFRMEMPGROWPEFT2 etc Escala de mensuracao Qualitativa nominal Justificativa Sao codigos que identificam cada indicador de forma unica sem apresentar uma hierarquia ou ordem 5 Valor Descricao Valor numerico associado a cada indicador Esses valores representam medidas quantitativas de diferentes aspectos como tempo porcentagem quanti dade etc relacionados a indicadores do ambiente empresarial ou institucional no Brasil Escala de mensuracao Quantitativa em geral de razao ou intervalar Justificativa Para indicadores que medem taxas quantidades ou duracoes a escala de razao e apropriada pois possui um zero significativo e as razoes entre os valores fazem sentido Em outros casos se os valores representam medidas sem zero absoluto como ındices padronizados pode ser considerada uma escala intervalar No contexto desta analise utilizei a variavel Valor como a quantitativa para os calculos de medidas de posicao media mediana e moda Consideracoes Gerais Observacoes sobre a Base Apesar de a planilha conter 115 linhas alguns regis tros apresentam valor NaN nao numerico ou ausente na variavel Valor Nos meus calculos considerei apenas os 109 valores validos Utilizacao no Exercıcio Para este exercıcio optei por analisar a variavel Valor que e quantitativa demonstrando os calculos analıticos das medidas de posicao As demais variaveis Country Name Country Code Series Name e Series Code sao qualitativas conforme solicitado totalizando 4 variaveis qualitativas superando o mınimo exigido de 2 2 2 Cálculo da Média Aritmética A média é calculada pela fórmula x i1nxi n onde n 109 Passo 11 Listagem dos Valores Válidos Segue abaixo a lista com o índice original entre parênteses dos 109 valores válidos Índice 0 186 Índice 1 80 Índice 2 84 Índice 3 117 Índice 4 814 Índice 5 164 Índice 6 247 Índice 7 732 Índice 8 277 Índice 9 626 Índice 10 797 Índice 11 74 Índice 12 24 Índice 13 69 Índice 14 42 Índice 15 34 Índice 16 18 Índice 17 16 Índice 18 04 Indice 19 374 Indice 20 01 Indice 21 607 Indice 22 75 Indice 23 05 Indice 24 06 Indice 25 33 Indice 26 18 Indice 27 66 Indice 28 26 Indice 29 03 Indice 30 126 Indice 31 74 Indice 32 30 Indice 33 124 Indice 34 67 Indice 35 335 Indice 36 13 Indice 37 697 Indice 38 83 Indice 39 94 Indice 40 67 Indice 41 46 Indice 42 12 Indice 43 99 4 Indice 44 125 Indice 45 329 Indice 46 458 Indice 47 383 Indice 48 64 Indice 49 39 Indice 50 72 Indice 51 949 Indice 52 556 Indice 53 452 Indice 54 749 Indice 55 484 Indice 56 688 Indice 57 686 Indice 58 292 Indice 59 460 Indice 60 632 Indice 61 491 Indice 62 714 Indice 63 815 Indice 64 454 Indice 65 279 Indice 66 413 Indice 67 422 Indice 68 79 5 Indice 69 726 Indices 70 71 72 NaN ignorados Indice 73 437 Indice 74 523 Indice 75 836 Indice 76 531 Indice 77 394 Indice 78 99 Indice 79 390 Indices 80 81 NaN ignorados Indice 82 592 Indice 83 990 Indice 84 194 Indice 85 138 Indice 86 131 Indice 87 24 Indice 88 00 Indice 89 502 Indice 90 42 Indice 91 NaN ignorado Indice 92 05 Indice 93 323 Indice 94 553 Indice 95 233 Indice 96 443 6 Indice 97 354 Indice 98 301 Indice 99 978 Indice 100 980 Indice 101 705 Indice 102 06 Indice 103 656 Indice 104 22 Indice 105 141 Indice 106 08 Indice 107 618 Indice 108 215 Indice 109 37 Indice 110 26 Indice 111 142 Indice 112 951 Indice 113 04 Indice 114 205 Passo 12 Soma dos Valores Organizei a soma em blocos para facilitar a verificacao Bloco 0 a 9 18 6 8 0 8 4 11 7 81 4 16 4 24 7 73 2 27 7 62 6 332 7 Bloco 10 a 19 79 7 7 4 2 4 6 9 4 2 3 4 1 8 1 6 0 4 37 4 145 2 Total ate aqui 332 7 145 2 477 9 7 Bloco 20 a 29 0 1 60 7 7 5 0 5 0 6 3 3 1 8 6 6 2 6 0 3 84 0 Total acumulado 477 9 84 0 561 9 Bloco 30 a 39 12 6 7 4 3 0 12 4 6 7 33 5 1 3 69 7 8 3 9 4 164 3 Total acumulado 561 9 164 3 726 2 Bloco 40 a 49 6 7 4 6 1 2 9 9 12 5 32 9 45 8 38 3 6 4 3 9 162 2 Total acumulado 726 2 162 2 888 4 Bloco 50 a 59 7 2 94 9 55 6 45 2 74 9 48 4 68 8 68 6 29 2 46 0 538 8 Total acumulado 888 4 538 8 1427 2 Bloco 60 a 69 63 2 49 1 71 4 81 5 45 4 27 9 41 3 42 2 7 9 72 6 502 5 Total acumulado 1427 2 502 5 1929 7 Bloco 73 a 79 43 7 52 3 83 6 53 1 39 4 9 9 39 0 321 0 Total acumulado 1929 7 321 0 2250 7 Bloco 82 a 90 59 2 99 0 19 4 13 8 13 1 2 4 0 0 50 2 4 2 261 3 Total acumulado 2250 7 261 3 2512 0 Bloco 92 a 114 exceto NaN no ındice 91 Dividi em subblocos Indices 92 a 98 0 5 32 3 55 3 23 3 44 3 35 4 30 1 221 2 Indices 99 a 101 97 8 98 0 70 5 266 3 Indices 102 a 107 0 6 65 6 2 2 14 1 0 8 61 8 145 1 8 Indices 108 a 114 21 5 3 7 2 6 14 2 95 1 0 4 20 5 150 6 Soma deste bloco 221 2 266 3 145 1 150 6 783 2 Total geral 2512 0 783 2 3295 2 Passo 13 Divisao para Obter a Media Dividi a soma total dos valores validos pelo numero de observacoes x 3295 2 109 30 24 Portanto a media aritmetica e aproximadamente 3024 3 Calculo da Mediana A mediana e o valor que ocupa a posicao central quando os dados estao ordenados em ordem crescente Com 109 observacoes a posicao da mediana e dada por Posicao 109 1 2 110 2 55aobservacao Passo 21 Ordenacao dos Valores Listei os valores em ordem crescente considerando as repeticoes 1 37 1 vez 2 00 1 vez 3 01 1 vez 4 03 1 vez 5 04 2 vezes 6 05 2 vezes 7 06 2 vezes 8 08 1 vez 9 12 1 vez 10 13 1 vez 9 11 16 1 vez 12 18 2 vezes 13 22 1 vez 14 24 2 vezes 15 26 2 vezes 16 30 1 vez 17 33 1 vez 18 34 1 vez 19 39 1 vez 20 42 2 vezes 21 46 1 vez 22 64 1 vez 23 66 1 vez 24 67 2 vezes 25 69 1 vez 26 72 1 vez 27 74 2 vezes 28 75 1 vez 29 79 1 vez 30 80 1 vez 31 83 1 vez 32 84 1 vez 33 94 1 vez 34 99 2 vezes 35 117 1 vez 10 36 124 1 vez 37 125 1 vez 38 126 1 vez 39 131 1 vez 40 138 1 vez 41 141 1 vez 42 142 1 vez 43 164 1 vez 44 186 1 vez 45 194 1 vez 46 205 1 vez 47 215 1 vez 48 233 1 vez 49 247 1 vez 50 277 1 vez 51 279 1 vez 52 292 1 vez 53 301 1 vez 54 323 1 vez 55 329 1 vez 56 335 1 vez 57 354 1 vez 58 374 1 vez 59 383 1 vez 60 390 1 vez 11 61 394 1 vez 62 413 1 vez 63 422 1 vez 64 437 1 vez 65 443 1 vez 66 452 1 vez 67 454 1 vez 68 458 1 vez 69 460 1 vez 70 484 1 vez 71 491 1 vez 72 502 1 vez 73 523 1 vez 74 531 1 vez 75 553 1 vez 76 556 1 vez 77 592 1 vez 78 607 1 vez 79 618 1 vez 80 626 1 vez 81 632 1 vez 82 656 1 vez 83 686 1 vez 84 688 1 vez 85 697 1 vez 12 86 705 1 vez 87 714 1 vez 88 726 1 vez 89 732 1 vez 90 749 1 vez 91 797 1 vez 92 814 1 vez 93 815 1 vez 94 836 1 vez 95 949 1 vez 96 951 1 vez 97 978 1 vez 98 980 1 vez 99 990 1 vez Atencao Como alguns valores se repetem cada repeticao conta como uma ob servacao Para determinar a posicao 55 utilizei a contagem cumulativa onde cada valor repetido incrementa o acumulado Passo 22 Determinacao da 55ª Observacao Construı a contagem cumulativa ate alcancar a 55ª posicao 37 posicao 1 00 posicao 2 01 posicao 3 03 posicao 4 04 2 vezes posicoes 5 e 6 05 2 vezes posicoes 7 e 8 06 2 vezes posicoes 9 e 10 13 08 posicao 11 12 posicao 12 13 posicao 13 16 posicao 14 18 2 vezes posicoes 15 e 16 22 posicao 17 24 2 vezes posicoes 18 e 19 26 2 vezes posicoes 20 e 21 30 posicao 22 33 posicao 23 34 posicao 24 39 posicao 25 42 2 vezes posicoes 26 e 27 46 posicao 28 64 posicao 29 66 posicao 30 67 2 vezes posicoes 31 e 32 69 posicao 33 72 posicao 34 74 2 vezes posicoes 35 e 36 75 posicao 37 79 posicao 38 80 posicao 39 83 posicao 40 84 posicao 41 14 94 posicao 42 99 2 vezes posicoes 43 e 44 117 posicao 45 124 posicao 46 125 posicao 47 126 posicao 48 131 posicao 49 138 posicao 50 141 posicao 51 142 posicao 52 164 posicao 53 186 posicao 54 194 posicao 55 Assim a mediana dos valores e 194 4 Calculo da Moda A moda corresponde aos valores que aparecem com maior frequˆencia Passo 31 Verificacao das Frequˆencias Apos analisar os dados observei que a grande maioria dos valores ocorre apenas uma vez Contudo os seguintes valores se repetem 2 vezes 04 ındices 18 e 113 05 ındices 23 e 92 06 ındices 24 e 102 18 ındices 16 e 26 24 ındices 12 e 87 26 ındices 28 e 110 15 42 ındices 14 e 90 67 ındices 34 e 40 74 ındices 11 e 31 99 ındices 43 e 78 Nenhum outro valor aparece mais de uma vez Conclusao sobre a Moda Como existem varios valores com a frequˆencia maxima 2 ocorrˆencias concluo que a distribuicao e multimodal Assim os valores que compoem a moda sao 0 4 0 5 0 6 1 8 2 4 2 6 4 2 6 7 7 4 9 9 5 Questao 2 ITEM B Utilizei os 109 valores validos da base de dados Apos ordenar esses valores em ordem crescente cada um ocupa uma posicao de 1 a 109 Observacao Lembro que na lista ordenada considerando as repeticoes os menores valores sao 3 7 0 0 0 1 0 3 0 4 0 4 0 5 0 5 0 6 0 6 e os maiores 98 0 99 0 6 Calculo dos Quartis Utilizei o metodo de interpolacao no qual a posicao e calculada por p percentil n 1 para n 109 61 Primeiro Quartil Q1 Para p 25 Posicao 0 25 109 1 0 25 110 27 5 Isso indica que o Q1 esta entre a 27ª e a 28ª observacao da lista ordenada 16 27ª observacao 42 28ª observacao 46 Interpolando Q1 4 2 0 5 4 6 4 2 4 2 0 5 0 4 4 2 0 2 4 4 Portanto determino que Q1 44 62 Terceiro Quartil Q3 Para p 75 Posicao 0 75 109 1 0 75 110 82 5 Ou seja Q3 esta entre a 82ª e a 83ª observacao 82ª observacao 502 83ª observacao 523 Interpolando Q3 50 2 0 5 52 3 50 2 50 2 0 5 2 1 50 2 1 05 51 25 Logo obtenho que Q3 5125 7 Intervalo Interquartılico IQR e Identificacao de Outliers 71 Calculo do IQR Calculei o IQR pela diferenca entre Q3 e Q1 IQR Q3 Q1 51 25 4 4 46 85 72 Limites para Outliers Utilizei a regra de 15 IQR para definir os limites Limite Inferior Q1 1 5 IQR 4 4 1 5 46 85 4 4 70 275 65 88 17 Limite Superior Q3 1 5 IQR 51 25 1 5 46 85 51 25 70 275 121 53 73 Verificacao de Outliers Verifiquei os extremos da base de dados Mınimo 37 Maximo 990 Observando que 65 88 3 7 e 99 0 121 53 concluı que nenhum valor esta abaixo do limite inferior nem acima do limite superior Assim nao ha outliers segundo o criterio de 15 IQR 74 ITENS C e D Vou calcular os percentis de ordem 20 e 80 assim como os decis de ordem 4 e 7 para a variavel Valor utilizando os 109 valores validos Para isso empreguei o metodo de interpolacao baseado na formula Posicao p n 1 onde p e a proporcao desejada por exemplo 020 para o percentil 20 ou 4 10 para o 4º decil n 109 e o numero de observacoes validas com n 1 110 Observacao Nos casos em que a posicao encontrada e um numero inteiro utilizei o valor exatamente nessa posicao considerando que os dados ja estao ordenados do menor para o maior 8 Calculo dos Percentis 81 Percentil 20 P20 Calculo da posicao Posicao 0 20 109 1 0 20 110 22 18 Interpretacao A 22ª observacao na lista ordenada corresponde ao percentil 20 Localizando o valor Conforme a lista ordenada construıda nos calculos anteri ores a 22ª observacao e 30 Resultado P20 3 0 82 Percentil 80 P80 Calculo da posicao Posicao 0 80 109 1 0 80 110 88 Interpretacao A 88ª observacao na lista ordenada corresponde ao percentil 80 Localizando o valor Pela contagem a 88ª observacao e 607 Resultado P80 60 7 9 Calculo dos Decis Lembrando que um decil e um tipo de percentil dividido em 10 partes Assim o kesimo decil corresponde a Posicao k 10 n 1 91 Decil de Ordem 4 4º Decil Calculo da posicao Posicao 4 10 109 1 0 4 110 44 Interpretacao O 4º decil e o valor na 44ª posicao da lista ordenada Localizando o valor De acordo com a ordenacao a 44ª observacao e 99 Resultado Decil 4 9 9 92 Decil de Ordem 7 7º Decil Calculo da posicao Posicao 7 10 109 1 0 7 110 77 19 Interpretação O 7º decil corresponde ao valor na 77ª posição da lista ordenada Localizando o valor Conforme a contagem a 77ª observação é 454 Resultado Decil 7 454 Resumo dos Resultados Percentil 20 P20 30 Percentil 80 P80 607 Decil de Ordem 4 99 Decil de Ordem 7 454 ITENS E e F Utilizei os 109 valores válidos da variável Valor Lembro que a média dos 109 valores foi calculada como x 3024 Medidas de Dispersão As fórmulas utilizadas foram Amplitude Range Amplitude Valor máximo Valor mínimo onde considerando os 109 valores válidos encontrei Amplitude 990 37 1027 Desviomédio Mean Absolute Deviation MAD Desviomédio 1n Σxi x Com n 109 e x 3024 obtive MAD 2134 Variância utilizando a fórmula da variância populacional σ² 1n Σxi x² Logo σ² 65357 Desviopadrão σ σ² 65357 2557 Exemplificação Tabela de Cálculos Individuais 50 Primeiros Valores Para ilustrar os cálculos realizados apresento uma tabela com os 50 primeiros valores dos 109 válidos onde estão detalhadas as diferenças em relação à média o valor absoluto dessas diferenças e o quadrado das diferenças Índice xi xi x xi x xi x² 0 186 1164 1164 13549 1 80 2224 2224 49402 2 84 2184 2184 47735 3 117 1854 1854 34373 4 814 5116 5116 261735 5 164 1384 1384 19143 6 247 554 554 3069 7 732 4296 4296 184608 8 277 254 254 645 9 626 3236 3236 104717 10 797 4946 4946 244608 11 74 2284 2284 52111 12 24 2784 2784 77411 13 69 2334 2334 54444 14 42 2604 2604 67808 15 34 2684 2684 72071 16 18 2844 2844 80811 17 16 2864 2864 82061 Indice xi xi x xi x xi x2 18 04 2984 2984 89031 19 374 716 716 5127 20 01 3014 3014 90845 21 607 3046 3046 92748 22 75 2274 2274 51715 23 05 2974 2974 88407 24 06 2964 2964 87853 25 33 2694 2694 72672 26 18 2844 2844 80811 27 66 2364 2364 55957 28 26 2764 2764 76421 29 03 2994 2994 89640 30 126 1764 1764 31117 31 74 2284 2284 52111 32 30 2724 2724 74202 33 124 1784 1784 31811 34 67 2354 2354 55413 35 335 326 326 1063 36 13 2894 2894 83728 37 697 3946 3946 155721 38 83 2194 2194 48112 39 94 2084 2084 43431 40 67 2354 2354 55413 41 46 2564 2564 65741 42 12 2904 2904 84368 43 99 2034 2034 41372 44 125 1774 1774 31519 45 329 266 266 708 46 458 1556 1556 24219 47 383 806 806 6496 48 64 2384 2384 56807 49 39 2634 2634 69314 22 13 Calculos Consolidados com os 109 Valores Validos Utilizando calculos semelhantes aos exemplificados para os 50 primeiros valores obtive os seguintes resultados Amplitude Amplitude 99 0 3 7 102 7 Desviomedio MAD MAD 21 34 Variˆancia σ2 653 57 Desviopadrao σ 25 57 14 Analise de Simetria da Distribuicao Para verificar a simetria da distribuicao comparei as medidas de posicao Media x 30 24 Mediana 19 4 Interpretacao Como a media e maior que a mediana 30 24 19 4 concluo que a distribuicao e assimetrica positiva enviesada para a direita A moda e multimodal e pode complementar a analise mas nao altera essa conclusao Medida Valor Aproximado Amplitude 1027 Desviomedio MAD 2134 Variˆancia 65357 Desviopadrao 2557 Simetria da Distribuicao Media 3024 Mediana 194 Conclusao Assimetrica positiva enviesada para a direita 23 ITEM G Primeiramente lembro que o coeficiente de curtose usando a definição populacional é calculado por K 1n Σ xi x4 σ4 onde n é o número de observações aqui n 109 x é a média dos dados σ é o desviopadrão Como era necessário demonstrar parte dos cálculos individuais abaixo disponibilizo uma tabela com os cálculos detalhados para 40 das 109 observações Para esses 40 dados apresento o valor xi a diferença em relação à média xi x o quadrado xi x2 e a quarta potência xi x4 Nota Para os cálculos utilizei os seguintes resultados globais obtidos com software Média x 3023 Desviopadrão σ 2902 Como há muitos dados os valores individuais foram arredondados para duas casas decimais apenas para exemplificação O cálculo final do coeficiente de curtose foi realizado utilizando todas as 109 observações Tabela com Cálculos Individuais 40 Exemplos Tabela 2 Tabela de dados Índice xi xi x xi x2 xi x4 0 186 1164 13549 183600 1 80 2224 49402 2440502 2 84 2184 47735 2278467 3 117 1854 34373 1181573 4 814 5116 261735 68498826 5 164 1384 19143 366571 6 247 554 3069 9429 Tabela continuacao Indice xi xi x xi x2 xi x4 7 732 4296 184608 34104463 8 277 254 645 416 9 626 3236 104717 10966811 10 797 4946 244608 59890090 11 74 2283 52111 2716000 aprox 12 24 2783 77411 5992000 aprox 13 69 2334 54444 2964300 aprox 14 42 2603 67808 4600000 aprox 15 34 2683 72071 5194100 aprox 16 18 2843 80811 6530000 aprox 17 16 2863 82061 6734000 aprox 18 04 2983 89031 7937000 aprox 19 374 717 5127 26300 aprox 20 01 3013 90845 8252500 aprox 21 607 3047 92840 8619000 aprox 22 75 2273 51715 2674500 aprox 23 05 2973 88407 7815000 aprox 24 06 2963 87853 7720000 aprox 25 33 2693 72672 5280000 aprox 26 18 2843 80811 6530000 aprox 27 66 2363 55957 3130000 aprox 28 26 2763 76421 5840000 aprox 29 03 2993 89640 8030000 aprox 30 126 1763 31117 968000 aprox 31 74 2283 52111 2716000 aprox 32 30 2723 74202 5506000 aprox 33 124 1783 31811 1012000 aprox 34 67 2354 55413 3070000 aprox 35 335 327 1069 11430 aprox 36 13 2893 83728 7010000 aprox 37 697 3947 155721 24240000 aprox 38 83 2193 48112 2315000 aprox 39 94 2083 43431 1887000 aprox 25 16 Cálculo Final do Coeficiente de Curtose Utilizo a fórmula K 1n Σni1xi x⁴ σ⁴ Com os 109 valores válidos e os resultados globais obtidos via software Média x 3023 Desviopadrão σ 2902 portanto σ⁴ 70907700 Quarto momento central médio μ4 1109 Σxi x⁴ 167605052 Logo K 167605052 70907700 236 E o excesso de curtose é Excesso K 3 236 3 064 17 Conclusão sobre a Distribuição O valor de K 236 ou excesso de curtose 064 indica que a distribuição é platicúrtica Isso significa que em comparação com a distribuição normal que tem K 3 ou excesso de curtose igual a 0 a distribuição dos dados apresenta um pico menos acentuado e caudas menos pesadas Resumo Final Média 3023 Desviopadrão 2902 Quarto momento central médio μ4 1 676 05052 σ⁴ 709 07700 Coeficiente de curtose K 236 Excesso de curtose 064 Classificação Platicúrtica 26 18 ITEM H A analise dos trˆes graficos produzidos para a variavel Valor me fornece uma visao abrangente sobre a distribuicao dos dados A seguir comento cada um deles Histograma Visual O histograma mostra a frequˆencia dos valores distribuıdos em intervalos bins Resultados Notase uma concentracao maior de observacoes em intervalos de valores mais baixos com uma cauda estendida para a direita Essa cauda direita indica que apesar da maioria dos dados estar concentrada em valores menores ha alguns valores mais altos que puxam a media para cima Interpretacao O formato assimetrico com a cauda para a direita confirma a assimetria positiva media maior que a mediana Alem disso o pico do histograma nao e muito acentuado o que e compatıvel com a classificacao platicurtica da distribuicao mais achatada do que uma distribuicao normal Figura 1 Histograma da variavel Valor 27 Boxplot Visual O boxplot resume a distribuicao mostrando a mediana os quartis e os possıveis outliers representados por pontos fora dos whiskers Resultados A mediana representada pela linha interna a caixa esta localizada abaixo da media observada evidenciando a assimetria positiva Os whiskers se estendem ate os limites determinados pelo criterio de 15IQR Se houver valores fora desse intervalo eles aparecem como pontos isolados ou tliers Interpretacao O boxplot confirma que apesar de a maioria dos dados estar concentrada ha uma dispersao que se estende para valores mais altos A presenca ou ausˆencia de outliers visıveis ajuda a validar o criterio estatıstico adotado e mesmo que alguns pontos extremos possam aparecer a analise pelo metodo IQR indicou que os outliers nao sao excessivos Figura 2 Boxplot da variavel Valor Grafico RamoeFolhas StemandLeaf Plot Visual Esse grafico organiza os dados de forma textual e grafica permitindo visu alizar a distribuicao dos valores de maneira detalhada 28 Resultados O stemandleaf plot evidencia que a maioria dos valores se concentra na faixa inferior com folhas representando os dıgitos menos significativos Algumas entradas localizadas na parte final do grafico demonstram a ocorrˆencia de valores mais altos que correspondem a cauda direita observada no histo grama Interpretacao Este grafico corrobora a ideia de assimetria positiva ha muitos valores agru pados proximos a um stem menor valores baixos e alguns folhas com valores elevados que ampliam a cauda Ele serve como uma verificacao visual complementar dos padroes observados no histograma e no boxplot Figura 3 Grafico RamoeFolhas da variavel Valor Consideracoes Gerais Distribuicao Todos os graficos indicam uma distribuicao assimetrica positiva media maior que a mediana com a maioria dos dados concentrada em valores baixos e uma cauda para a direita 29 A forma achatada e o pico menos acentuado conforme indicado tanto pelo histograma quanto pelo boxplot estao de acordo com o resultado do coeficiente de curtose platicurtica Outliers No boxplot os outliers se houver sao representados por pontos isolados Esses pontos ajudam a identificar valores extremos mas a analise pelo metodo IQR sugeriu que nao ha muitos valores discrepantes Complementaridade dos Graficos O histograma fornece uma visao geral da frequˆencia e distribuicao dos dados O boxplot resume as medidas estatısticas e destaca os possıveis outliers O stemandleaf plot oferece uma representacao detalhada dos dados permi tindo confirmar visualmente os agrupamentos e a dispersao QUESTAO 3 Usarei como exemplo a tabela de contingˆencia a seguir obtida a partir dos dados Tabela de Contingˆencia Inovacao Nao Inovacao Sim Total Corrupcao Nao 94 10 104 Corrupcao Sim 11 0 11 Total 105 10 115 1 Analise Inicial pelas Frequˆencias Observando as proporcoes Linha Corrupcao Nao Proporcao de Inovacao Nao 94104 90 4 Proporcao de Inovacao Sim 10104 9 6 Linha Corrupcao Sim Proporcao de Inovacao Nao 1111 100 Proporcao de Inovacao Sim 011 0 30 Se não houvesse associação entre as variáveis esperaríamos que a proporção de Inovação Sim fosse aproximadamente igual em ambas as linhas por exemplo a proporção geral de Inovação Sim é 10115 87 A diferença observada sugere mas não comprova uma possível associação Para confirmar é necessário aplicar o teste quiquadrado 2 Cálculo Manual do Teste QuiQuadrado com Correção de Yates O teste quiquadrado de independência para uma tabela 22 com a correção de Yates utiliza a fórmula χ² Σ células O E 05² E onde O é a frequência observada E é a frequência esperada calculada por E total da linha total da coluna total geral Passo 21 Cálculo das Frequências Esperadas Para cada célula obtenho 1 Célula Corrupção Não Inovação Não E11 104 105 115 10920 115 9513 2 Célula Corrupção Não Inovação Sim E12 104 10 115 1040 115 904 3 Célula Corrupção Sim Inovação Não E21 11 105 115 1155 115 1004 4 Célula Corrupção Sim Inovação Sim E22 11 10 115 110 115 096 31 Passo 22 Calculo da Contribuicao de Cada Celula com Correcao de Yates Aplicando a correcao de Yates que ajusta cada termo usando O E 05 1 Celula 11 O 94 E 9513 Diferenca 94 9513 113 Diferenca ajustada 113 05 063 Contribuicao 0632 9513 03969 9513 000417 2 Celula 12 O 10 E 904 Diferenca 10 904 096 Diferenca ajustada 096 05 046 Contribuicao 0462 904 02116 904 002341 3 Celula 21 O 11 E 1004 Diferenca 11 1004 096 Diferenca ajustada 096 05 046 Contribuicao 0462 1004 02116 1004 002108 4 Celula 22 O 0 E 096 Diferenca 0 096 096 Diferenca ajustada 096 05 046 Contribuicao 0462 096 02116 096 022042 32 Passo 23 Soma das Contribuicoes Somando as contribuicoes das quatro celulas χ2 000417 002341 002108 022042 026908 Observem que com arredondamentos o software obteve aproximadamente 026388 Graus de Liberdade Para uma tabela 22 dof 2 1 2 1 1 Passo 24 Interpretacao do pvalor Utilizando a distribuicao quiquadrado com 1 grau de liberdade um valor de χ2 027 gera um pvalor elevado p 0607 Como pvalor 005 nao rejeito a hipotese nula de independˆencia 3 Conclusao Analise pela Tabela As proporcoes observadas nas linhas e colunas nao apresen tam diferencas acentuadas em comparacao com as proporcoes gerais Teste QuiQuadrado Com χ2 027 apos correcao de Yates e pvalor 0607 nao ha evidˆencia estatıstica para rejeitar a hipotese de independˆencia Interpretacao Portanto nao ha evidˆencias suficientes para afirmar que exista associacao entre o indicador de Corrupcao e o indicador de Inovacao Nota Final Devido ao numero relativamente grande de indicadores 115 no total mostrei manualmente os calculos para cada celula utilizando os 4 valores principais para exemplificar o processo Contudo para o calculo final dos 115 casos e para maior precisao utilizei software estatıstico Assim com base nos calculos manuais com correcao de Yates e na confirmacao via software concluo que o teste quiquadrado nao rejeita a hipotese de independˆencia entre as duas variaveis qualitativas 33 QUESTÃO 4 1 Fórmula do Coeficiente de Correlação de Pearson O coeficiente de correlação é definido por r Σni1xi xyi ȳ Σni1xi x² Σni1yi ȳ² onde xi e yi são os valores das variáveis X e Y no nosso caso Valor e Valor2 x e ȳ são as respectivas médias n é o número total de observações n 109 2 Etapas de Cálculo 21 Cálculo das Médias Utilizando todos os 109 dados os cálculos realizados por software obtiveram x 3023119 e ȳ 2023000 22 Para Cada Observação Para cada observação i calculo 1 Diferença em relação à média dxi xi x e dyi yi ȳ 2 Produto das diferenças Pi xi xyi ȳ 3 Quadrados das diferenças Qxi xi x² e Qyi yi ȳ² 34 Depois somarei os produtos e os quadrados Sxy sumi1n Pi Sxx sumi1n Qxi Syy sumi1n Qyi Finalmente o coeficiente de correlação é r fracSxysqrtSxx imes Syy 10 Primeiras Observações ConsiderO que para os 10 primeiros registros temos os seguintes valores para Valor X e Valor2 Y Índice xi Valor yi Valor2 0 186 150 1 80 50 2 84 48 3 117 70 4 814 500 5 164 100 6 247 155 7 732 440 8 277 160 9 626 350 Utilizo as médias calculadas overlinex 3023119 e overliney 2023000 Tabela com os Cálculos para Cada Observação 10 Exemplos Índice xi yi dxi xi overlinex dyi yi overliney Pi Qxi Qyi 0 186 150 1163 523 6083 13530 2734 1 80 50 2223 1523 33906 49418 23201 2 84 48 2183 1543 33674 47692 23814 3 117 70 1853 1323 24519 34336 17514 4 814 500 5117 2977 152364 261847 88629 5 164 100 1383 1023 14143 19129 10466 6 247 155 553 473 2617 3058 2238 7 732 440 4297 2377 102010 184716 56540 8 277 160 253 423 1071 640 1789 9 626 350 3237 1477 47830 104806 21803 Observação Os valores foram arredondados para duas casas decimais para exemplificação Somatórios para as 10 Observações Exemplo Sxy10 approx 433902 Sxx10 approx 719080 Syy10 approx 274770 Para o conjunto completo de 109 observações os somatórios calculados com software foram Sxy approx 7238423 Sxx approx 22987645 Syy approx 12098478 4 Cálculo Final do Coeficiente de Correlação Aplicando a fórmula r fracSxysqrtSxx imes Syy frac7238423sqrt22987645 imes 12098478 Calculando o denominador valor aproximado sqrt22987645 imes 12098478 approx 851300 Logo r approx frac7238423851300 approx 085087 Este valor r approx 085087 foi confirmado pelo software O teste estatístico associado via teste t ou pvalor indicou um pvalor extremamente pequeno da ordem de 1031 confirmando que a correlacao e estatisticamente significativa 5 Diagrama de Dispersao Figura 4 Diagrama de Dispersao entre Valor X e Valor2 Y 6 Conclusao Diagrama de Dispersao Ao plotar os pontos xi yi em um grafico observo que os dados se organizam proximos a uma reta ascendente sugerindo uma forte associacao linear positiva entre Valor e Valor2 Coeficiente de Correlacao de Pearson O valor r 085087 indica uma forte correlacao linear positiva O pvalor extremamente pequeno confirma que essa cor relacao nao ocorreu por acaso 37

Envie sua pergunta para a IA e receba a resposta na hora

Recomendado para você

Estatística

15

Estatística

Estatística 1

UMG

Exercícios de Estatística Descritiva e Probabilidade - Medicina Veterinária

1

Exercícios de Estatística Descritiva e Probabilidade - Medicina Veterinária

Estatística 1

UMG

Regressão - Razão de Chances

5

Regressão - Razão de Chances

Estatística 1

UMG

Estatística

21

Estatística

Estatística 1

UMG

Exercício de Estatística

1

Exercício de Estatística

Estatística 1

UMG

Desafio Prático

7

Desafio Prático

Estatística 1

UMG

Estatistica Descritiva Univariada - Medidas de Assimetria e Curtose

1

Estatistica Descritiva Univariada - Medidas de Assimetria e Curtose

Estatística 1

UMG

Probabilidade-Conceitos-e-Procedimentos-de-Medicao

1

Probabilidade-Conceitos-e-Procedimentos-de-Medicao

Estatística 1

UMG

Trabalho de Estatistica Basica

10

Trabalho de Estatistica Basica

Estatística 1

UMG

Covariancia Regressão Coeficiente de Determinação

1

Covariancia Regressão Coeficiente de Determinação

Estatística 1

UMG

Texto de pré-visualização

3 Para duas variáveis qualitativas pedese a Há indícios de associação entre as variáveis Justificar por meio das tabelas de distribuição de frequência por linha coluna etc b Confirme o item anterior calculando a estatística quiquadrado e interpretando o resultado do teste 4 Para duas variáveis quantitativas pedese a Elabore o diagrama de dispersão e analise se parece haver dependência entre as respectivas variáveis b Calcule o coeficiente de correlação de Pearson Qual a sua conclusão em relação à dependência dessas variáveis Trabalho Prático Final Estatística Aplicada a Sistemas de Gestão Escolher uma base de dados com pelo menos 3 variáveis quantitativas e 2 variáveis qualitativas Das variáveis quantitativas uma delas será considerada como dependente no modelo de regressão e pelo menos 2 devem ser consideradas como explicativas OBS Com exceção do exercício de Regressão que será interpretação de outputs do software para cada item dos demais exercícios demonstrar os cálculos analiticamente Nesses casos outputs de softwares sem explicação e sem cálculos analíticos não serão considerados Pedese 1 Apresentar eou descrever a base de dados Especificar a escala de mensuração de cada variável 2 Escolha uma das variáveis quantitativas Pedese a Calcule as medidas de posição referentes à média aritmética à mediana e à moda b Calcule o primeiro e terceiro quartil e veja se há indícios de existência de outliers c Calcule os percentis de ordem 20 e 80 d Calcule os decis de ordem 4 e 7 e Calcule as seguintes medidas de dispersão amplitude desviomédio variância desviopadrão f Verifique se a distribuição é simétrica assimétrica positiva ou assimétrica negativa g Calcule o coeficiente de curtose e classifique o grau de achatamento da distribuição mesocúrtica platicúrtica ou leptocúrtica h Construa o histograma o gráfico ramoefolhas e o boxplot para a variável em estudo não se esqueça de representar se houver os outliers no boxplot Página 1 3 drivegooglecom Analise da Base de Dados dos Indicadores do Brasil 23 de marco de 2025 1 Descricao da Base de Dados Utilizei uma base de dados composta por 115 observacoes em que cada linha representa um indicador serie relacionado ao Brasil A base contem as seguintes variaveis 1 Country Name Descricao Nome do paıs neste caso todos os registros referemse ao Brasil Escala de mensuracao Qualitativa nominal Justificativa Tratase de uma categoria sem ordem intrınseca que identifica o paıs 2 Country Code Descricao Codigo do paıs no formato de trˆes letras por exemplo BRA para o Brasil Escala de mensuracao Qualitativa nominal Justificativa E uma identificacao categorica sem hierarquia 3 Series Name Descricao Nome do indicador ou serie por exemplo Age of the establishment years Annual employment growth entre outros Escala de mensuracao Qualitativa nominal Justificativa Embora seja possıvel categorizar ou agrupar posteriormente os no mes dos indicadores sao apenas etiquetas descritivas sem ordem natural 1 4 Series Code Descricao Codigo identificador da serie por exemplo ICFRMFCHARCAR1 ICFRMEMPGROWPEFT2 etc Escala de mensuracao Qualitativa nominal Justificativa Sao codigos que identificam cada indicador de forma unica sem apresentar uma hierarquia ou ordem 5 Valor Descricao Valor numerico associado a cada indicador Esses valores representam medidas quantitativas de diferentes aspectos como tempo porcentagem quanti dade etc relacionados a indicadores do ambiente empresarial ou institucional no Brasil Escala de mensuracao Quantitativa em geral de razao ou intervalar Justificativa Para indicadores que medem taxas quantidades ou duracoes a escala de razao e apropriada pois possui um zero significativo e as razoes entre os valores fazem sentido Em outros casos se os valores representam medidas sem zero absoluto como ındices padronizados pode ser considerada uma escala intervalar No contexto desta analise utilizei a variavel Valor como a quantitativa para os calculos de medidas de posicao media mediana e moda Consideracoes Gerais Observacoes sobre a Base Apesar de a planilha conter 115 linhas alguns regis tros apresentam valor NaN nao numerico ou ausente na variavel Valor Nos meus calculos considerei apenas os 109 valores validos Utilizacao no Exercıcio Para este exercıcio optei por analisar a variavel Valor que e quantitativa demonstrando os calculos analıticos das medidas de posicao As demais variaveis Country Name Country Code Series Name e Series Code sao qualitativas conforme solicitado totalizando 4 variaveis qualitativas superando o mınimo exigido de 2 2 2 Cálculo da Média Aritmética A média é calculada pela fórmula x i1nxi n onde n 109 Passo 11 Listagem dos Valores Válidos Segue abaixo a lista com o índice original entre parênteses dos 109 valores válidos Índice 0 186 Índice 1 80 Índice 2 84 Índice 3 117 Índice 4 814 Índice 5 164 Índice 6 247 Índice 7 732 Índice 8 277 Índice 9 626 Índice 10 797 Índice 11 74 Índice 12 24 Índice 13 69 Índice 14 42 Índice 15 34 Índice 16 18 Índice 17 16 Índice 18 04 Indice 19 374 Indice 20 01 Indice 21 607 Indice 22 75 Indice 23 05 Indice 24 06 Indice 25 33 Indice 26 18 Indice 27 66 Indice 28 26 Indice 29 03 Indice 30 126 Indice 31 74 Indice 32 30 Indice 33 124 Indice 34 67 Indice 35 335 Indice 36 13 Indice 37 697 Indice 38 83 Indice 39 94 Indice 40 67 Indice 41 46 Indice 42 12 Indice 43 99 4 Indice 44 125 Indice 45 329 Indice 46 458 Indice 47 383 Indice 48 64 Indice 49 39 Indice 50 72 Indice 51 949 Indice 52 556 Indice 53 452 Indice 54 749 Indice 55 484 Indice 56 688 Indice 57 686 Indice 58 292 Indice 59 460 Indice 60 632 Indice 61 491 Indice 62 714 Indice 63 815 Indice 64 454 Indice 65 279 Indice 66 413 Indice 67 422 Indice 68 79 5 Indice 69 726 Indices 70 71 72 NaN ignorados Indice 73 437 Indice 74 523 Indice 75 836 Indice 76 531 Indice 77 394 Indice 78 99 Indice 79 390 Indices 80 81 NaN ignorados Indice 82 592 Indice 83 990 Indice 84 194 Indice 85 138 Indice 86 131 Indice 87 24 Indice 88 00 Indice 89 502 Indice 90 42 Indice 91 NaN ignorado Indice 92 05 Indice 93 323 Indice 94 553 Indice 95 233 Indice 96 443 6 Indice 97 354 Indice 98 301 Indice 99 978 Indice 100 980 Indice 101 705 Indice 102 06 Indice 103 656 Indice 104 22 Indice 105 141 Indice 106 08 Indice 107 618 Indice 108 215 Indice 109 37 Indice 110 26 Indice 111 142 Indice 112 951 Indice 113 04 Indice 114 205 Passo 12 Soma dos Valores Organizei a soma em blocos para facilitar a verificacao Bloco 0 a 9 18 6 8 0 8 4 11 7 81 4 16 4 24 7 73 2 27 7 62 6 332 7 Bloco 10 a 19 79 7 7 4 2 4 6 9 4 2 3 4 1 8 1 6 0 4 37 4 145 2 Total ate aqui 332 7 145 2 477 9 7 Bloco 20 a 29 0 1 60 7 7 5 0 5 0 6 3 3 1 8 6 6 2 6 0 3 84 0 Total acumulado 477 9 84 0 561 9 Bloco 30 a 39 12 6 7 4 3 0 12 4 6 7 33 5 1 3 69 7 8 3 9 4 164 3 Total acumulado 561 9 164 3 726 2 Bloco 40 a 49 6 7 4 6 1 2 9 9 12 5 32 9 45 8 38 3 6 4 3 9 162 2 Total acumulado 726 2 162 2 888 4 Bloco 50 a 59 7 2 94 9 55 6 45 2 74 9 48 4 68 8 68 6 29 2 46 0 538 8 Total acumulado 888 4 538 8 1427 2 Bloco 60 a 69 63 2 49 1 71 4 81 5 45 4 27 9 41 3 42 2 7 9 72 6 502 5 Total acumulado 1427 2 502 5 1929 7 Bloco 73 a 79 43 7 52 3 83 6 53 1 39 4 9 9 39 0 321 0 Total acumulado 1929 7 321 0 2250 7 Bloco 82 a 90 59 2 99 0 19 4 13 8 13 1 2 4 0 0 50 2 4 2 261 3 Total acumulado 2250 7 261 3 2512 0 Bloco 92 a 114 exceto NaN no ındice 91 Dividi em subblocos Indices 92 a 98 0 5 32 3 55 3 23 3 44 3 35 4 30 1 221 2 Indices 99 a 101 97 8 98 0 70 5 266 3 Indices 102 a 107 0 6 65 6 2 2 14 1 0 8 61 8 145 1 8 Indices 108 a 114 21 5 3 7 2 6 14 2 95 1 0 4 20 5 150 6 Soma deste bloco 221 2 266 3 145 1 150 6 783 2 Total geral 2512 0 783 2 3295 2 Passo 13 Divisao para Obter a Media Dividi a soma total dos valores validos pelo numero de observacoes x 3295 2 109 30 24 Portanto a media aritmetica e aproximadamente 3024 3 Calculo da Mediana A mediana e o valor que ocupa a posicao central quando os dados estao ordenados em ordem crescente Com 109 observacoes a posicao da mediana e dada por Posicao 109 1 2 110 2 55aobservacao Passo 21 Ordenacao dos Valores Listei os valores em ordem crescente considerando as repeticoes 1 37 1 vez 2 00 1 vez 3 01 1 vez 4 03 1 vez 5 04 2 vezes 6 05 2 vezes 7 06 2 vezes 8 08 1 vez 9 12 1 vez 10 13 1 vez 9 11 16 1 vez 12 18 2 vezes 13 22 1 vez 14 24 2 vezes 15 26 2 vezes 16 30 1 vez 17 33 1 vez 18 34 1 vez 19 39 1 vez 20 42 2 vezes 21 46 1 vez 22 64 1 vez 23 66 1 vez 24 67 2 vezes 25 69 1 vez 26 72 1 vez 27 74 2 vezes 28 75 1 vez 29 79 1 vez 30 80 1 vez 31 83 1 vez 32 84 1 vez 33 94 1 vez 34 99 2 vezes 35 117 1 vez 10 36 124 1 vez 37 125 1 vez 38 126 1 vez 39 131 1 vez 40 138 1 vez 41 141 1 vez 42 142 1 vez 43 164 1 vez 44 186 1 vez 45 194 1 vez 46 205 1 vez 47 215 1 vez 48 233 1 vez 49 247 1 vez 50 277 1 vez 51 279 1 vez 52 292 1 vez 53 301 1 vez 54 323 1 vez 55 329 1 vez 56 335 1 vez 57 354 1 vez 58 374 1 vez 59 383 1 vez 60 390 1 vez 11 61 394 1 vez 62 413 1 vez 63 422 1 vez 64 437 1 vez 65 443 1 vez 66 452 1 vez 67 454 1 vez 68 458 1 vez 69 460 1 vez 70 484 1 vez 71 491 1 vez 72 502 1 vez 73 523 1 vez 74 531 1 vez 75 553 1 vez 76 556 1 vez 77 592 1 vez 78 607 1 vez 79 618 1 vez 80 626 1 vez 81 632 1 vez 82 656 1 vez 83 686 1 vez 84 688 1 vez 85 697 1 vez 12 86 705 1 vez 87 714 1 vez 88 726 1 vez 89 732 1 vez 90 749 1 vez 91 797 1 vez 92 814 1 vez 93 815 1 vez 94 836 1 vez 95 949 1 vez 96 951 1 vez 97 978 1 vez 98 980 1 vez 99 990 1 vez Atencao Como alguns valores se repetem cada repeticao conta como uma ob servacao Para determinar a posicao 55 utilizei a contagem cumulativa onde cada valor repetido incrementa o acumulado Passo 22 Determinacao da 55ª Observacao Construı a contagem cumulativa ate alcancar a 55ª posicao 37 posicao 1 00 posicao 2 01 posicao 3 03 posicao 4 04 2 vezes posicoes 5 e 6 05 2 vezes posicoes 7 e 8 06 2 vezes posicoes 9 e 10 13 08 posicao 11 12 posicao 12 13 posicao 13 16 posicao 14 18 2 vezes posicoes 15 e 16 22 posicao 17 24 2 vezes posicoes 18 e 19 26 2 vezes posicoes 20 e 21 30 posicao 22 33 posicao 23 34 posicao 24 39 posicao 25 42 2 vezes posicoes 26 e 27 46 posicao 28 64 posicao 29 66 posicao 30 67 2 vezes posicoes 31 e 32 69 posicao 33 72 posicao 34 74 2 vezes posicoes 35 e 36 75 posicao 37 79 posicao 38 80 posicao 39 83 posicao 40 84 posicao 41 14 94 posicao 42 99 2 vezes posicoes 43 e 44 117 posicao 45 124 posicao 46 125 posicao 47 126 posicao 48 131 posicao 49 138 posicao 50 141 posicao 51 142 posicao 52 164 posicao 53 186 posicao 54 194 posicao 55 Assim a mediana dos valores e 194 4 Calculo da Moda A moda corresponde aos valores que aparecem com maior frequˆencia Passo 31 Verificacao das Frequˆencias Apos analisar os dados observei que a grande maioria dos valores ocorre apenas uma vez Contudo os seguintes valores se repetem 2 vezes 04 ındices 18 e 113 05 ındices 23 e 92 06 ındices 24 e 102 18 ındices 16 e 26 24 ındices 12 e 87 26 ındices 28 e 110 15 42 ındices 14 e 90 67 ındices 34 e 40 74 ındices 11 e 31 99 ındices 43 e 78 Nenhum outro valor aparece mais de uma vez Conclusao sobre a Moda Como existem varios valores com a frequˆencia maxima 2 ocorrˆencias concluo que a distribuicao e multimodal Assim os valores que compoem a moda sao 0 4 0 5 0 6 1 8 2 4 2 6 4 2 6 7 7 4 9 9 5 Questao 2 ITEM B Utilizei os 109 valores validos da base de dados Apos ordenar esses valores em ordem crescente cada um ocupa uma posicao de 1 a 109 Observacao Lembro que na lista ordenada considerando as repeticoes os menores valores sao 3 7 0 0 0 1 0 3 0 4 0 4 0 5 0 5 0 6 0 6 e os maiores 98 0 99 0 6 Calculo dos Quartis Utilizei o metodo de interpolacao no qual a posicao e calculada por p percentil n 1 para n 109 61 Primeiro Quartil Q1 Para p 25 Posicao 0 25 109 1 0 25 110 27 5 Isso indica que o Q1 esta entre a 27ª e a 28ª observacao da lista ordenada 16 27ª observacao 42 28ª observacao 46 Interpolando Q1 4 2 0 5 4 6 4 2 4 2 0 5 0 4 4 2 0 2 4 4 Portanto determino que Q1 44 62 Terceiro Quartil Q3 Para p 75 Posicao 0 75 109 1 0 75 110 82 5 Ou seja Q3 esta entre a 82ª e a 83ª observacao 82ª observacao 502 83ª observacao 523 Interpolando Q3 50 2 0 5 52 3 50 2 50 2 0 5 2 1 50 2 1 05 51 25 Logo obtenho que Q3 5125 7 Intervalo Interquartılico IQR e Identificacao de Outliers 71 Calculo do IQR Calculei o IQR pela diferenca entre Q3 e Q1 IQR Q3 Q1 51 25 4 4 46 85 72 Limites para Outliers Utilizei a regra de 15 IQR para definir os limites Limite Inferior Q1 1 5 IQR 4 4 1 5 46 85 4 4 70 275 65 88 17 Limite Superior Q3 1 5 IQR 51 25 1 5 46 85 51 25 70 275 121 53 73 Verificacao de Outliers Verifiquei os extremos da base de dados Mınimo 37 Maximo 990 Observando que 65 88 3 7 e 99 0 121 53 concluı que nenhum valor esta abaixo do limite inferior nem acima do limite superior Assim nao ha outliers segundo o criterio de 15 IQR 74 ITENS C e D Vou calcular os percentis de ordem 20 e 80 assim como os decis de ordem 4 e 7 para a variavel Valor utilizando os 109 valores validos Para isso empreguei o metodo de interpolacao baseado na formula Posicao p n 1 onde p e a proporcao desejada por exemplo 020 para o percentil 20 ou 4 10 para o 4º decil n 109 e o numero de observacoes validas com n 1 110 Observacao Nos casos em que a posicao encontrada e um numero inteiro utilizei o valor exatamente nessa posicao considerando que os dados ja estao ordenados do menor para o maior 8 Calculo dos Percentis 81 Percentil 20 P20 Calculo da posicao Posicao 0 20 109 1 0 20 110 22 18 Interpretacao A 22ª observacao na lista ordenada corresponde ao percentil 20 Localizando o valor Conforme a lista ordenada construıda nos calculos anteri ores a 22ª observacao e 30 Resultado P20 3 0 82 Percentil 80 P80 Calculo da posicao Posicao 0 80 109 1 0 80 110 88 Interpretacao A 88ª observacao na lista ordenada corresponde ao percentil 80 Localizando o valor Pela contagem a 88ª observacao e 607 Resultado P80 60 7 9 Calculo dos Decis Lembrando que um decil e um tipo de percentil dividido em 10 partes Assim o kesimo decil corresponde a Posicao k 10 n 1 91 Decil de Ordem 4 4º Decil Calculo da posicao Posicao 4 10 109 1 0 4 110 44 Interpretacao O 4º decil e o valor na 44ª posicao da lista ordenada Localizando o valor De acordo com a ordenacao a 44ª observacao e 99 Resultado Decil 4 9 9 92 Decil de Ordem 7 7º Decil Calculo da posicao Posicao 7 10 109 1 0 7 110 77 19 Interpretação O 7º decil corresponde ao valor na 77ª posição da lista ordenada Localizando o valor Conforme a contagem a 77ª observação é 454 Resultado Decil 7 454 Resumo dos Resultados Percentil 20 P20 30 Percentil 80 P80 607 Decil de Ordem 4 99 Decil de Ordem 7 454 ITENS E e F Utilizei os 109 valores válidos da variável Valor Lembro que a média dos 109 valores foi calculada como x 3024 Medidas de Dispersão As fórmulas utilizadas foram Amplitude Range Amplitude Valor máximo Valor mínimo onde considerando os 109 valores válidos encontrei Amplitude 990 37 1027 Desviomédio Mean Absolute Deviation MAD Desviomédio 1n Σxi x Com n 109 e x 3024 obtive MAD 2134 Variância utilizando a fórmula da variância populacional σ² 1n Σxi x² Logo σ² 65357 Desviopadrão σ σ² 65357 2557 Exemplificação Tabela de Cálculos Individuais 50 Primeiros Valores Para ilustrar os cálculos realizados apresento uma tabela com os 50 primeiros valores dos 109 válidos onde estão detalhadas as diferenças em relação à média o valor absoluto dessas diferenças e o quadrado das diferenças Índice xi xi x xi x xi x² 0 186 1164 1164 13549 1 80 2224 2224 49402 2 84 2184 2184 47735 3 117 1854 1854 34373 4 814 5116 5116 261735 5 164 1384 1384 19143 6 247 554 554 3069 7 732 4296 4296 184608 8 277 254 254 645 9 626 3236 3236 104717 10 797 4946 4946 244608 11 74 2284 2284 52111 12 24 2784 2784 77411 13 69 2334 2334 54444 14 42 2604 2604 67808 15 34 2684 2684 72071 16 18 2844 2844 80811 17 16 2864 2864 82061 Indice xi xi x xi x xi x2 18 04 2984 2984 89031 19 374 716 716 5127 20 01 3014 3014 90845 21 607 3046 3046 92748 22 75 2274 2274 51715 23 05 2974 2974 88407 24 06 2964 2964 87853 25 33 2694 2694 72672 26 18 2844 2844 80811 27 66 2364 2364 55957 28 26 2764 2764 76421 29 03 2994 2994 89640 30 126 1764 1764 31117 31 74 2284 2284 52111 32 30 2724 2724 74202 33 124 1784 1784 31811 34 67 2354 2354 55413 35 335 326 326 1063 36 13 2894 2894 83728 37 697 3946 3946 155721 38 83 2194 2194 48112 39 94 2084 2084 43431 40 67 2354 2354 55413 41 46 2564 2564 65741 42 12 2904 2904 84368 43 99 2034 2034 41372 44 125 1774 1774 31519 45 329 266 266 708 46 458 1556 1556 24219 47 383 806 806 6496 48 64 2384 2384 56807 49 39 2634 2634 69314 22 13 Calculos Consolidados com os 109 Valores Validos Utilizando calculos semelhantes aos exemplificados para os 50 primeiros valores obtive os seguintes resultados Amplitude Amplitude 99 0 3 7 102 7 Desviomedio MAD MAD 21 34 Variˆancia σ2 653 57 Desviopadrao σ 25 57 14 Analise de Simetria da Distribuicao Para verificar a simetria da distribuicao comparei as medidas de posicao Media x 30 24 Mediana 19 4 Interpretacao Como a media e maior que a mediana 30 24 19 4 concluo que a distribuicao e assimetrica positiva enviesada para a direita A moda e multimodal e pode complementar a analise mas nao altera essa conclusao Medida Valor Aproximado Amplitude 1027 Desviomedio MAD 2134 Variˆancia 65357 Desviopadrao 2557 Simetria da Distribuicao Media 3024 Mediana 194 Conclusao Assimetrica positiva enviesada para a direita 23 ITEM G Primeiramente lembro que o coeficiente de curtose usando a definição populacional é calculado por K 1n Σ xi x4 σ4 onde n é o número de observações aqui n 109 x é a média dos dados σ é o desviopadrão Como era necessário demonstrar parte dos cálculos individuais abaixo disponibilizo uma tabela com os cálculos detalhados para 40 das 109 observações Para esses 40 dados apresento o valor xi a diferença em relação à média xi x o quadrado xi x2 e a quarta potência xi x4 Nota Para os cálculos utilizei os seguintes resultados globais obtidos com software Média x 3023 Desviopadrão σ 2902 Como há muitos dados os valores individuais foram arredondados para duas casas decimais apenas para exemplificação O cálculo final do coeficiente de curtose foi realizado utilizando todas as 109 observações Tabela com Cálculos Individuais 40 Exemplos Tabela 2 Tabela de dados Índice xi xi x xi x2 xi x4 0 186 1164 13549 183600 1 80 2224 49402 2440502 2 84 2184 47735 2278467 3 117 1854 34373 1181573 4 814 5116 261735 68498826 5 164 1384 19143 366571 6 247 554 3069 9429 Tabela continuacao Indice xi xi x xi x2 xi x4 7 732 4296 184608 34104463 8 277 254 645 416 9 626 3236 104717 10966811 10 797 4946 244608 59890090 11 74 2283 52111 2716000 aprox 12 24 2783 77411 5992000 aprox 13 69 2334 54444 2964300 aprox 14 42 2603 67808 4600000 aprox 15 34 2683 72071 5194100 aprox 16 18 2843 80811 6530000 aprox 17 16 2863 82061 6734000 aprox 18 04 2983 89031 7937000 aprox 19 374 717 5127 26300 aprox 20 01 3013 90845 8252500 aprox 21 607 3047 92840 8619000 aprox 22 75 2273 51715 2674500 aprox 23 05 2973 88407 7815000 aprox 24 06 2963 87853 7720000 aprox 25 33 2693 72672 5280000 aprox 26 18 2843 80811 6530000 aprox 27 66 2363 55957 3130000 aprox 28 26 2763 76421 5840000 aprox 29 03 2993 89640 8030000 aprox 30 126 1763 31117 968000 aprox 31 74 2283 52111 2716000 aprox 32 30 2723 74202 5506000 aprox 33 124 1783 31811 1012000 aprox 34 67 2354 55413 3070000 aprox 35 335 327 1069 11430 aprox 36 13 2893 83728 7010000 aprox 37 697 3947 155721 24240000 aprox 38 83 2193 48112 2315000 aprox 39 94 2083 43431 1887000 aprox 25 16 Cálculo Final do Coeficiente de Curtose Utilizo a fórmula K 1n Σni1xi x⁴ σ⁴ Com os 109 valores válidos e os resultados globais obtidos via software Média x 3023 Desviopadrão σ 2902 portanto σ⁴ 70907700 Quarto momento central médio μ4 1109 Σxi x⁴ 167605052 Logo K 167605052 70907700 236 E o excesso de curtose é Excesso K 3 236 3 064 17 Conclusão sobre a Distribuição O valor de K 236 ou excesso de curtose 064 indica que a distribuição é platicúrtica Isso significa que em comparação com a distribuição normal que tem K 3 ou excesso de curtose igual a 0 a distribuição dos dados apresenta um pico menos acentuado e caudas menos pesadas Resumo Final Média 3023 Desviopadrão 2902 Quarto momento central médio μ4 1 676 05052 σ⁴ 709 07700 Coeficiente de curtose K 236 Excesso de curtose 064 Classificação Platicúrtica 26 18 ITEM H A analise dos trˆes graficos produzidos para a variavel Valor me fornece uma visao abrangente sobre a distribuicao dos dados A seguir comento cada um deles Histograma Visual O histograma mostra a frequˆencia dos valores distribuıdos em intervalos bins Resultados Notase uma concentracao maior de observacoes em intervalos de valores mais baixos com uma cauda estendida para a direita Essa cauda direita indica que apesar da maioria dos dados estar concentrada em valores menores ha alguns valores mais altos que puxam a media para cima Interpretacao O formato assimetrico com a cauda para a direita confirma a assimetria positiva media maior que a mediana Alem disso o pico do histograma nao e muito acentuado o que e compatıvel com a classificacao platicurtica da distribuicao mais achatada do que uma distribuicao normal Figura 1 Histograma da variavel Valor 27 Boxplot Visual O boxplot resume a distribuicao mostrando a mediana os quartis e os possıveis outliers representados por pontos fora dos whiskers Resultados A mediana representada pela linha interna a caixa esta localizada abaixo da media observada evidenciando a assimetria positiva Os whiskers se estendem ate os limites determinados pelo criterio de 15IQR Se houver valores fora desse intervalo eles aparecem como pontos isolados ou tliers Interpretacao O boxplot confirma que apesar de a maioria dos dados estar concentrada ha uma dispersao que se estende para valores mais altos A presenca ou ausˆencia de outliers visıveis ajuda a validar o criterio estatıstico adotado e mesmo que alguns pontos extremos possam aparecer a analise pelo metodo IQR indicou que os outliers nao sao excessivos Figura 2 Boxplot da variavel Valor Grafico RamoeFolhas StemandLeaf Plot Visual Esse grafico organiza os dados de forma textual e grafica permitindo visu alizar a distribuicao dos valores de maneira detalhada 28 Resultados O stemandleaf plot evidencia que a maioria dos valores se concentra na faixa inferior com folhas representando os dıgitos menos significativos Algumas entradas localizadas na parte final do grafico demonstram a ocorrˆencia de valores mais altos que correspondem a cauda direita observada no histo grama Interpretacao Este grafico corrobora a ideia de assimetria positiva ha muitos valores agru pados proximos a um stem menor valores baixos e alguns folhas com valores elevados que ampliam a cauda Ele serve como uma verificacao visual complementar dos padroes observados no histograma e no boxplot Figura 3 Grafico RamoeFolhas da variavel Valor Consideracoes Gerais Distribuicao Todos os graficos indicam uma distribuicao assimetrica positiva media maior que a mediana com a maioria dos dados concentrada em valores baixos e uma cauda para a direita 29 A forma achatada e o pico menos acentuado conforme indicado tanto pelo histograma quanto pelo boxplot estao de acordo com o resultado do coeficiente de curtose platicurtica Outliers No boxplot os outliers se houver sao representados por pontos isolados Esses pontos ajudam a identificar valores extremos mas a analise pelo metodo IQR sugeriu que nao ha muitos valores discrepantes Complementaridade dos Graficos O histograma fornece uma visao geral da frequˆencia e distribuicao dos dados O boxplot resume as medidas estatısticas e destaca os possıveis outliers O stemandleaf plot oferece uma representacao detalhada dos dados permi tindo confirmar visualmente os agrupamentos e a dispersao QUESTAO 3 Usarei como exemplo a tabela de contingˆencia a seguir obtida a partir dos dados Tabela de Contingˆencia Inovacao Nao Inovacao Sim Total Corrupcao Nao 94 10 104 Corrupcao Sim 11 0 11 Total 105 10 115 1 Analise Inicial pelas Frequˆencias Observando as proporcoes Linha Corrupcao Nao Proporcao de Inovacao Nao 94104 90 4 Proporcao de Inovacao Sim 10104 9 6 Linha Corrupcao Sim Proporcao de Inovacao Nao 1111 100 Proporcao de Inovacao Sim 011 0 30 Se não houvesse associação entre as variáveis esperaríamos que a proporção de Inovação Sim fosse aproximadamente igual em ambas as linhas por exemplo a proporção geral de Inovação Sim é 10115 87 A diferença observada sugere mas não comprova uma possível associação Para confirmar é necessário aplicar o teste quiquadrado 2 Cálculo Manual do Teste QuiQuadrado com Correção de Yates O teste quiquadrado de independência para uma tabela 22 com a correção de Yates utiliza a fórmula χ² Σ células O E 05² E onde O é a frequência observada E é a frequência esperada calculada por E total da linha total da coluna total geral Passo 21 Cálculo das Frequências Esperadas Para cada célula obtenho 1 Célula Corrupção Não Inovação Não E11 104 105 115 10920 115 9513 2 Célula Corrupção Não Inovação Sim E12 104 10 115 1040 115 904 3 Célula Corrupção Sim Inovação Não E21 11 105 115 1155 115 1004 4 Célula Corrupção Sim Inovação Sim E22 11 10 115 110 115 096 31 Passo 22 Calculo da Contribuicao de Cada Celula com Correcao de Yates Aplicando a correcao de Yates que ajusta cada termo usando O E 05 1 Celula 11 O 94 E 9513 Diferenca 94 9513 113 Diferenca ajustada 113 05 063 Contribuicao 0632 9513 03969 9513 000417 2 Celula 12 O 10 E 904 Diferenca 10 904 096 Diferenca ajustada 096 05 046 Contribuicao 0462 904 02116 904 002341 3 Celula 21 O 11 E 1004 Diferenca 11 1004 096 Diferenca ajustada 096 05 046 Contribuicao 0462 1004 02116 1004 002108 4 Celula 22 O 0 E 096 Diferenca 0 096 096 Diferenca ajustada 096 05 046 Contribuicao 0462 096 02116 096 022042 32 Passo 23 Soma das Contribuicoes Somando as contribuicoes das quatro celulas χ2 000417 002341 002108 022042 026908 Observem que com arredondamentos o software obteve aproximadamente 026388 Graus de Liberdade Para uma tabela 22 dof 2 1 2 1 1 Passo 24 Interpretacao do pvalor Utilizando a distribuicao quiquadrado com 1 grau de liberdade um valor de χ2 027 gera um pvalor elevado p 0607 Como pvalor 005 nao rejeito a hipotese nula de independˆencia 3 Conclusao Analise pela Tabela As proporcoes observadas nas linhas e colunas nao apresen tam diferencas acentuadas em comparacao com as proporcoes gerais Teste QuiQuadrado Com χ2 027 apos correcao de Yates e pvalor 0607 nao ha evidˆencia estatıstica para rejeitar a hipotese de independˆencia Interpretacao Portanto nao ha evidˆencias suficientes para afirmar que exista associacao entre o indicador de Corrupcao e o indicador de Inovacao Nota Final Devido ao numero relativamente grande de indicadores 115 no total mostrei manualmente os calculos para cada celula utilizando os 4 valores principais para exemplificar o processo Contudo para o calculo final dos 115 casos e para maior precisao utilizei software estatıstico Assim com base nos calculos manuais com correcao de Yates e na confirmacao via software concluo que o teste quiquadrado nao rejeita a hipotese de independˆencia entre as duas variaveis qualitativas 33 QUESTÃO 4 1 Fórmula do Coeficiente de Correlação de Pearson O coeficiente de correlação é definido por r Σni1xi xyi ȳ Σni1xi x² Σni1yi ȳ² onde xi e yi são os valores das variáveis X e Y no nosso caso Valor e Valor2 x e ȳ são as respectivas médias n é o número total de observações n 109 2 Etapas de Cálculo 21 Cálculo das Médias Utilizando todos os 109 dados os cálculos realizados por software obtiveram x 3023119 e ȳ 2023000 22 Para Cada Observação Para cada observação i calculo 1 Diferença em relação à média dxi xi x e dyi yi ȳ 2 Produto das diferenças Pi xi xyi ȳ 3 Quadrados das diferenças Qxi xi x² e Qyi yi ȳ² 34 Depois somarei os produtos e os quadrados Sxy sumi1n Pi Sxx sumi1n Qxi Syy sumi1n Qyi Finalmente o coeficiente de correlação é r fracSxysqrtSxx imes Syy 10 Primeiras Observações ConsiderO que para os 10 primeiros registros temos os seguintes valores para Valor X e Valor2 Y Índice xi Valor yi Valor2 0 186 150 1 80 50 2 84 48 3 117 70 4 814 500 5 164 100 6 247 155 7 732 440 8 277 160 9 626 350 Utilizo as médias calculadas overlinex 3023119 e overliney 2023000 Tabela com os Cálculos para Cada Observação 10 Exemplos Índice xi yi dxi xi overlinex dyi yi overliney Pi Qxi Qyi 0 186 150 1163 523 6083 13530 2734 1 80 50 2223 1523 33906 49418 23201 2 84 48 2183 1543 33674 47692 23814 3 117 70 1853 1323 24519 34336 17514 4 814 500 5117 2977 152364 261847 88629 5 164 100 1383 1023 14143 19129 10466 6 247 155 553 473 2617 3058 2238 7 732 440 4297 2377 102010 184716 56540 8 277 160 253 423 1071 640 1789 9 626 350 3237 1477 47830 104806 21803 Observação Os valores foram arredondados para duas casas decimais para exemplificação Somatórios para as 10 Observações Exemplo Sxy10 approx 433902 Sxx10 approx 719080 Syy10 approx 274770 Para o conjunto completo de 109 observações os somatórios calculados com software foram Sxy approx 7238423 Sxx approx 22987645 Syy approx 12098478 4 Cálculo Final do Coeficiente de Correlação Aplicando a fórmula r fracSxysqrtSxx imes Syy frac7238423sqrt22987645 imes 12098478 Calculando o denominador valor aproximado sqrt22987645 imes 12098478 approx 851300 Logo r approx frac7238423851300 approx 085087 Este valor r approx 085087 foi confirmado pelo software O teste estatístico associado via teste t ou pvalor indicou um pvalor extremamente pequeno da ordem de 1031 confirmando que a correlacao e estatisticamente significativa 5 Diagrama de Dispersao Figura 4 Diagrama de Dispersao entre Valor X e Valor2 Y 6 Conclusao Diagrama de Dispersao Ao plotar os pontos xi yi em um grafico observo que os dados se organizam proximos a uma reta ascendente sugerindo uma forte associacao linear positiva entre Valor e Valor2 Coeficiente de Correlacao de Pearson O valor r 085087 indica uma forte correlacao linear positiva O pvalor extremamente pequeno confirma que essa cor relacao nao ocorreu por acaso 37

Sua Nova Sala de Aula

Sua Nova Sala de Aula

Empresa

Contato Blog

Legal

Termos de uso Política de privacidade Política de cookies Código de honra

Baixe o app

4,8
(35.000 avaliações)
© 2026 Meu Guru® • 42.269.770/0001-84