3
Estatística 1
UFPR
1
Estatística 1
UFPR
7
Estatística 1
UFPR
1
Estatística 1
UFPR
2
Estatística 1
UFPR
7
Estatística 1
UFPR
8
Estatística 1
UFPR
22
Estatística 1
UFPR
6
Estatística 1
UFPR
5
Estatística 1
UFPR
Texto de pré-visualização
Trabalho sobre inferˆencia estatıstica Disciplina Introducao a Estatıstica Curso de Geografia UFPR Professor Jose Jairo Aplicacao a dados reais Objetivo Este trabalho tem como objetivo aplicar conceitos de inferˆencia estatıstica a partir da analise de dados reais Esperase que os alunos desenvolvam habilidades de coleta organizacao des cricao e analise inferencial dos dados Instrucoes 1 Forme grupos de ate 3 integrantes 2 Escolha um tema de interesse e colete um conjunto de dados de variaveis quantitativas com no mınimo 25 observacoes Ex Temperatura media anual nas capitais ou estados do Brasil 3 Realize uma analise estatıstica contendo Estatıstica descritiva media mediana moda desvio padrao etc Graficos histograma ou outros que julgarem pertinentes 4 Realize uma analise de inferˆencia estatıstica Calculo da estimativa pontual media e desvio padrao Construcao de um intervalo de confianca para a media nıvel de confianca 95 Realizacao de um teste de hipotese para a media formular H0 e H1 calcular a estatıstica de teste determinar o pvalor e concluir 5 Redija um relatorio contendo Introducao Metodologia Analise Descritiva Inferˆencia Estatıstica Conclusao e Referˆencias Prazo de entrega 280625 Observacao O trabalho pode ser feito manualmente em planilhas ExcelLibreOffice ou com auxılio de softwares estatısticos como R ou outros 1 Orientacoes para o Relatorio O relatorio final deve ser organizado com os seguintes topicos 1 Introducao Apresente o tema escolhido e a motivacao para a escolha dos dados Explique com suas proprias palavras a diferenca entre Estatıstica Descritiva que permite resumir e descrever os dados observados por meio de medidas e graficos Inferˆencia Estatıstica que permite fazer conclusoes ou previsoes sobre a populacao a partir da analise da amostra utilizando estimativas e testes de hipoteses Relacione como essas duas abordagens estao sendo aplicadas no trabalho que sera desenvolvido Descreva os objetivos do trabalho 2 Metodologia Explique como os dados foram coletados ou obtidos Descreva a variavel ou variaveis analisadas 3 Analise Descritiva dos Dados Apresente as principais medidas descritivas media mediana moda se aplicavel desvio padrao mınimo maximo e quartis Inclua ao menos dois graficos ex histograma grafico de barras boxplot Comente os principais padroes ou caracterısticas dos dados 4 Analise de Inferˆencia Estatıstica Estimativa Pontual apresente a media e o desvio padrao da amostra como esti mativas dos parˆametros da populacao Intervalo de Confianca construa um intervalo de confianca para a media da variavel nıvel de confianca 95 Teste de Hipoteses realize um teste de hipotese para a media populacional Defina a hipotese nula H0 e a hipotese alternativa H1 Calcule a estatıstica de teste Determine o valor crıtico ou o pvalor Conclua se rejeita ou nao a hipotese nula explicando o resultado 5 Conclusao Retome os objetivos e apresente uma sıntese dos principais resultados Faca reflexoes sobre os resultados obtidos e possıveis limitacoes do trabalho 6 Referˆencias Informe as fontes dos dados e eventuais materiais teoricos utilizados 2 Introdução Em um contexto empresarial cada vez mais orientado por dados a capacidade de extrair insights significativos de informações aparentemente corriqueiras pode representar a diferença entre decisões acertadas e estratégias equivocadas Os dados aqui analisados compilados em um banco de 40 observações de vendas de uma loja fictícia a Lojinha XYZ foram meticulosamente estruturados para simular um cenário realista de transações comerciais abrangendo variáveis como ID do cliente idade valor da compra R e nível de satisfação escala de 1 a 5 Origem dos Dados Uma Simulação com Propósitos Didáticos Apesar de fictícios esses dados foram gerados para replicar padrões encontrados em pequenos varejos onde Idade dos clientes 2055 anos foi distribuída de forma a cobrir diferentes faixas etárias refletindo a diversidade demográfica típica de um comércio local Valores de compra R40R310 variam intencionalmente para capturar desde transações pequenas possivelmente de itens pontuais até compras mais vultosas como aquisições de maior valor agregado Níveis de satisfação 15 seguem uma distribuição não aleatória com maior concentração nas notas altas 4 e 5 simulando um viés comum em pesquisas de satisfação clientes insatisfeitos tendem a ser minoria mas sua existência é crítica para identificar pontos de melhoria A escolha por dados simulados em vez de reais justificase pela flexibilidade pedagógica eles permitem isolar variáveis de confusão como sazonalidade ou efeitos de marketing e focar em técnicas estatísticas básicas como análise descritiva visualização e correlações simples Tabela 1 Dados coletados da Lojinha XYZ I D Idad e ValorCompra R Satisfação 15 1 25 1505 4 2 32 8999 3 3 45 220 5 4 28 7525 2 5 50 31075 5 6 22 459 1 7 35 180 4 8 40 955 3 9 29 120 4 1 0 55 2753 5 1 1 31 658 2 1 2 27 140 4 1 3 38 2005 5 1 4 42 11025 3 1 5 23 50 1 1 6 47 24075 5 1 7 33 859 2 1 8 26 160 4 1 9 39 1955 5 2 0 44 10525 3 2 24 55 1 1 2 2 51 2603 5 2 3 30 708 2 2 4 36 130 4 2 5 41 2105 5 2 6 28 9025 3 2 7 21 60 1 2 8 49 23075 5 2 9 34 809 2 3 0 37 170 4 3 1 43 1855 5 3 2 46 10025 3 3 3 20 40 1 3 4 52 2903 5 3 5 31 758 2 3 6 27 125 4 3 7 48 2505 5 3 8 29 11525 3 3 9 53 300 5 4 0 35 659 2 Estatísticas descritivas A estatística descritiva é fundamental para resumir e interpretar conjuntos de dados de forma objetiva transformando informações brutas em insights acionáveis Neste trabalho ela permite caracterizar o perfil dos clientes da Lojinha XYZ por meio de medidas de tendência central média mediana moda dispersão desvio padrão variância e forma da distribuição assimetria curtose Essas métricas revelam padrões essenciais como a concentração etária dos consumidores a variabilidade nos valores gastos e a polarização nas avaliações de satisfação Ao quantificar essas características a estatística descritiva não apenas sintetiza o comportamento das variáveis analisadas mas também fornece bases sólidas para decisões estratégicas como segmentação de público e identificação de oportunidades de melhoria no atendimento Tabela 2 Estatística descritiva da Idade dos clientes Idade Média 3615 Erro padrão 1573233645 Mediana 35 Modo 28 Desvio padrão 9950003221 Variância da amostra 990025641 Curtose 1079770294 Assimetria 0228083306 Intervalo 35 Mínimo 20 Máximo 55 Soma 1446 Contagem 40 A distribuição etária dos clientes da Lojinha XYZ apresenta uma média de 3615 anos com uma mediana de 35 anos indicando uma distribuição relativamente simétrica corroborada pelo baixo valor de assimetria 023 A moda de 28 anos revela que essa é a idade mais frequente embora não seja significativamente diferente da média e mediana O desvio padrão de aproximadamente 995 anos e o intervalo de 35 anos entre 20 e 55 anos mostram uma dispersão moderada sugerindo que a loja atende a um público etariamente diversificado sem concentração extrema em nenhuma faixa específica A curtose negativa 108 indica uma distribuição mais achatada platicúrtica em comparação com uma normal o que significa que há uma menor concentração de idades próximas à média e uma maior presença de valores nas caudas da distribuição Esses resultados sugerem que embora a maioria dos clientes esteja na faixa dos 30 a 40 anos a loja também atrai um público significativo de jovens 2030 anos e pessoas mais velhas 4055 anos possivelmente refletindo estratégias de marketing ou uma variedade de produtos que atendem a diferentes gerações A ausência de outliers extremos com idades mínima e máxima dentro de limites razoáveis reforça a consistência dos dados para análises posteriores como segmentação por faixa etária ou correlação com outros comportamentos de compra Tabela 3 Estatística descritiva do valor de compra ValorCompra R Média 145603 5 Erro padrão 125504 3 Mediana 1225 Modo ND Desvio padrão 793758 9 Variância da amostra 630053 3 Curtose 084664 Assimetria 058757 2 Intervalo 27075 Mínimo 40 Máximo 31075 Soma 582414 Contagem 40 Os dados revelam que o valor médio das compras na Lojinha XYZ é de R14560 com uma mediana de R12250 indicando uma assimetria positiva 059 ou seja a distribuição é levemente alongada para a direita com presença de compras de alto valor que elevam a média acima da mediana O desvio padrão de R7938 e a amplitude de R27075 entre R4000 e R31075 demonstram uma variabilidade significativa nos valores gastos pelos clientes sugerindo diferentes perfis de consumo desde compras pequenas possivelmente de itens pontuais até transações mais vultosas A curtose negativa 085 confirma que a distribuição é mais achatada que uma normal com caudas menos pesadas mas ainda assim com alguns valores extremos na faixa superior acima de R250 A ausência de uma moda única ND reforça a diversidade nos padrões de gasto sem um valor de compra claramente dominante Esses insights podem indicar oportunidades para segmentação de clientes por exemplo identificar quem realiza compras acima da média potenciais candidatos para programas de fidelidade ou analisar se os valores mais altos estão ligados a satisfação elevada ou paradoxalmente a expectativas não atendidas A presença de outliers positivos merece investigação adicional para entender se correspondem a compras sazonais de alto ticket ou a erros de registro Tabela 4 Estatísticas descritivas do nível de astisfação dos clientes Satisfação 15 Média 3425 Erro padrão 022613 7 Mediana 4 Modo 5 Desvio padrão 143021 4 Variância da amostra 204551 3 Curtose 122339 Assimetria 036704 Intervalo 4 Mínimo 1 Máximo 5 Soma 137 Contagem 40 Os dados de satisfação revelam um cenário interessante enquanto a média de 343 sugere uma avaliação moderadamente positiva a mediana 4 e principalmente a moda 5 a nota mais frequente indicam que a maioria dos clientes tende a dar avaliações altas A assimetria negativa 037 confirma esta tendência mostrando que a distribuição está levemente inclinada para as notas mais elevadas Contudo o alto desvio padrão 143 quase 42 da amplitude total da escala revela uma significativa variação nas respostas com presença importante tanto de avaliações máximas 5 quanto mínimas 1 Esta distribuição bimodal com picos nas extremidades fica evidente pela curtose negativa 122 que mostra um histograma mais achatado que o normal sugerindo a existência de dois grupos distintos clientes muito satisfeitos notas 45 e um grupo menor porém relevante de clientes insatisfeitos notas 12 Esta polarização merece atenção especial pois enquanto 575 das avaliações são 4 ou 5 ainda há 225 de notas baixas 12 que podem indicar problemas específicos em determinados aspectos do serviço ou produto Esses resultados sugerem que a loja está conseguindo satisfazer bem a maioria de seus clientes mas enfrenta desafios pontuais que geram insatisfação em uma parcela significativa Uma análise cruzada com outras variáveis como valor gasto ou idade poderia ajudar a identificar os fatores por trás desta divergência nas avaliações Tabela de distribuição de frequências e histogramas A distribuição de idades dos clientes da Lojinha XYZ apresenta um padrão relativamente equilibrado entre as faixas etárias com leve concentração nos grupos mais jovens A classe 2530 anos destacase como a mais frequente 8 clientes seguida pelas faixas 3035 e 3540 6 clientes cada indicando que a loja atrai principalmente adultos jovens e em idade economicamente ativa As demais categorias 2025 4045 4550 e 5055 apresentam frequências idênticas 5 clientes cada sugerindo uma distribuição uniforme nas extremidades O histograma correspondente com intervalos de 5 anos provavelmente revelaria uma forma próxima à distribuição normal porém com ligeiro desvio para a esquerda devido à maior frequência na faixa de 2530 anos Essa distribuição reflete um público diversificado sem predominância marcante de nenhuma geração específica o que pode ser vantajoso para estratégias de marketing abrangentes A ausência de picos extremos ou intervalos vazios reforça a consistência dos dados e a representatividade da amostra para análises posteriores Figura 1 Histograma da distribuição das idade dos clientes A distribuição dos valores gastos pelos clientes revela uma concentração expressiva nas faixas mais baixas 325 das compras estão entre R40 e R90 e 225 entre R90 e R140 totalizando 55 das transações abaixo de R140 O histograma correspondente apresentaria um pico inicial acentuado na primeira classe 4090 seguido por um declínio gradual nas faixas superiores caracterizando uma distribuição assimétrica positiva cauda alongada à direita Apenas 75 das compras ultrapassam R290 indicando que transações de alto valor são menos frequentes Essa estrutura sugere que a loja atende principalmente a demandas de baixo a médio ticket com oportunidades para estratégias de upsell ou fidelização nos segmentos que realizam compras acima de R190 30 do total A presença de valores extremos até R340 merece investigação adicional para identificar se correspondem a compras sazonais de clientes premium ou a outliers A análise reforça a importância de segmentar ações comerciais conforme o perfil de gastos dos clientes Figura 2 Histograma da distribuição do valor das compras dos clientes A distribuição das avaliações de satisfação dos clientes em uma escala de 1 a 5 revela um cenário marcado por contrastes significativos A nota 5 emerge como a mais frequente representando 325 das avaliações 13 clientes seguida pela nota 4 com 20 8 clientes indicando que mais da metade dos consumidores 525 atribuiu classificações positivas No entanto chama atenção a expressiva parcela de 30 de clientes 12 indivíduos que conferiu notas 1 ou 2 demonstrando insatisfação considerável As notas intermediárias 3 correspondem a 175 7 clientes atuando como um elemento de transição nesta distribuição assimétrica negativa A análise das frequências acumuladas mostra que 475 dos clientes atribuíram notas iguais ou inferiores a 3 enquanto 675 deram notas até 4 evidenciando que a satisfação plena nota 5 é um diferencial alcançado por aproximadamente um terço da base de clientes Este padrão de distribuição visualizado em um histograma apresentaria um pico acentuado na extremidade superior nota 5 um declínio gradual em direção às notas médias e uma cauda esquerda relevante nas classificações mais baixas Os resultados sugerem que embora a empresa atenda bem a maioria de seus clientes existe uma minoria significativa cujas expectativas não estão sendo plenamente atendidas indicando oportunidades específicas para melhorias operacionais e no atendimento ao cliente A presença de 20 de avaliações no nível 4 consideradas boas mas não excelentes representa uma oportunidade estratégica para elevar esses clientes ao patamar de máxima satisfação através de ajustes pontuais na experiência de compra Figura 3 Histograma do nível de satisfação dos clientes Intervalos de confiança Para a idade dos clientes EP995 40 1573 ME19615733083 IC 3307 anos 3923 anos Com 95 de confiança a verdadeira média populacional da idade dos clientes da Lojinha XYZ está entre 3307 e 3923 anos Esse intervalo reflete a variabilidade amostral e sugere que a faixa etária predominante dos clientes é adulta 3040 anos Para o valor da compra EP 7938 40 1255 ME 196 1255 2460 IC R12100 R17020 Com 95 de confiança podemos afirmar que o verdadeiro valor médio das compras na população está entre R12100 e R17020 Esse intervalo Reflete a considerável variabilidade nos valores de compra alto desvio padrão mostra que a média amostral de R14560 é uma estimativa razoavelmente precisa indica que a maioria das transações provavelmente está abaixo de R20000 Para o nível de satisfação dos clientes EP 143 40 0226 ME 196 0226 0443 IC 2982 3868 Com 95 de confiança podemos afirmar que A verdadeira satisfação média populacional está entre 298 e 387 a amplitude relativamente estreita 089 pontos indica boa precisão da estimativa o intervalo está ligeiramente deslocado para a parte superior da escala próximo de 4 Teste de Hipótese para as médias O teste de hipótese para a média é um método estatístico que permite avaliar se a média de uma população μ é igual a um valor específico μ₀ proposto por uma hipótese usando dados amostrais Funciona como um julgamento científico partimos de uma suposição inicial hipótese nula H₀ μ μ₀ e verificamos se a evidência dos dados média amostral X é forte o suficiente para rejeitála em favor de uma alternativa H₁ μ μ₀ ou outras variações Calculamos uma estatística de teste como o t ou z que mede quantos erros padrão Ẍ está distante de μ₀ Se essa diferença for improvável sob H₀ comparando com um valor crítico ou via valorp rejeitamos H₀ No exemplo da idade dos clientes Ẍ3615 vs μ₀35 o teste mostrou que a diferença de 115 anos poderia facilmente ocorrer por acaso p0469 não justificando rejeitar a hipótese de que a média populacional seja 35 anos É essencial em pesquisas para validar afirmações como o tempo médio de atendimento é 10 minutos ou a renda média aumentou Idades Hipóteses H₀ μ35 anos H₁ μ35 anos Estatística de teste t 3615 35 995 40 115 1573 0731 Valor crítico t₀₀₂₅₃₉ 2023 Decisão Como 0731 2023 não rejeitamos H₀ Valorp p 2 Pt 0731 0469 005 Conclusão Não há evidências estatísticas p 0469 005 para rejeitar a hipótese nula de que a idade média dos clientes é igual a 35 anos ao nível de significância de 5 A diferença observada 3615 vs 35 não é estatisticamente significativa Valor da compra Hipóteses H₀ μ R12000 H₁ μ R12000 Estatística de teste t14560120 7938 40 2560 1255 204 Valor crítico t 0025 392023 Decisão Como 2042023 rejeitamos H 0 Valorp p2 P t204 0048005 Conclusão Há evidências estatísticas p 0048 005 para afirmar que o valor médio das compras difere significativamente de R 12000 ao nível de 5 de significância A média observada R 14560 sugere que os clientes gastam em média mais que o valor de referência testado Nível de satisfação dos clientes Hipóteses H 0 μ3 H 1 μ3 Estatística de teste t34253 1430 40 0425 0226 188 Valor crítico t 0025 392023 Decisão Como 1882023 não rejeitamos H 0 Valorp p2 P t188 0067005 Conclusão Não há evidências estatísticas p 0067 005 para rejeitar a hipótese nula A diferença observada entre a média amostral 343 e o valor de referência 30 pode ser atribuída ao acaso Interpretação prática A satisfação dos clientes não difere significativamente da neutralidade escore 3 ao nível de 5 de significância Os três testes de hipótese indicam resultados distintos quanto à significância estatística Não houve evidências suficientes para rejeitar a hipótese de que a idade média dos clientes é igual a 35 anos p 0469 nem de que a satisfação média difere do escore neutro de 30 p 0067 sugerindo que as diferenças observadas nesses casos podem ser atribuídas ao acaso Por outro lado foi encontrada evidência estatística significativa p 0048 de que o valor médio das compras difere de R 12000 com média observada de R 14560 indicando que os clientes tendem a gastar mais que o valor de referência testado Conclusão Com base na análise estatística realizada sobre os dados de uma loja foi possível extrair informações relevantes acerca do perfil dos clientes seus hábitos de consumo e seu nível de satisfação Inicialmente as estatísticas descritivas revelam que a idade média dos clientes é de aproximadamente 3615 anos com distribuição relativamente simétrica assimetria 023 e curtose negativa indicando uma distribuição mais achatada em relação à normal A dispersão medida pelo desvio padrão 995 sugere uma variabilidade moderada na idade dos clientes No que se refere ao valor médio das compras observouse uma média de R 14560 consideravelmente superior à mediana R 12250 o que aliado à assimetria positiva 059 aponta para a presença de alguns valores altos que puxam a média para cima uma característica típica de distribuição assimétrica à direita O desvio padrão elevado R 7938 reforça a alta dispersão nos valores de compra entre os clientes Em relação à satisfação a média foi de 343 numa escala de 1 a 5 com a mediana em 4 e o modo em 5 sugerindo uma tendência mais otimista apesar da assimetria levemente negativa 037 o que indica uma inclinação discreta para valores abaixo da média As análises inferenciais complementaram a investigação o teste de hipótese para idade não rejeitou a hipótese nula p 0469 o que indica que a idade média dos clientes não difere significativamente de 35 anos Por outro lado o valor médio das compras apresentou uma diferença estatisticamente significativa em relação ao valor de referência de R 12000 p 0048 sugerindo que os clientes gastam em média mais do que o esperado Quanto à satisfação embora a média observada 343 seja numericamente superior à neutralidade ponto 3 a diferença não foi estatisticamente significativa p 0067 o que nos leva a concluir que a percepção de satisfação dos clientes não difere de um nível neutro de forma confiável do ponto de vista estatístico Por fim os histogramas elaborados corroboraram visualmente as tendências observadas nas análises descritivas e reforçaram a interpretação geral de que embora existam indícios de variação e comportamento distinto em alguns aspectos apenas o padrão de consumo se mostrou estatisticamente distinto do valor de referência evidenciando a importância de focar estratégias comerciais nesse ponto
3
Estatística 1
UFPR
1
Estatística 1
UFPR
7
Estatística 1
UFPR
1
Estatística 1
UFPR
2
Estatística 1
UFPR
7
Estatística 1
UFPR
8
Estatística 1
UFPR
22
Estatística 1
UFPR
6
Estatística 1
UFPR
5
Estatística 1
UFPR
Texto de pré-visualização
Trabalho sobre inferˆencia estatıstica Disciplina Introducao a Estatıstica Curso de Geografia UFPR Professor Jose Jairo Aplicacao a dados reais Objetivo Este trabalho tem como objetivo aplicar conceitos de inferˆencia estatıstica a partir da analise de dados reais Esperase que os alunos desenvolvam habilidades de coleta organizacao des cricao e analise inferencial dos dados Instrucoes 1 Forme grupos de ate 3 integrantes 2 Escolha um tema de interesse e colete um conjunto de dados de variaveis quantitativas com no mınimo 25 observacoes Ex Temperatura media anual nas capitais ou estados do Brasil 3 Realize uma analise estatıstica contendo Estatıstica descritiva media mediana moda desvio padrao etc Graficos histograma ou outros que julgarem pertinentes 4 Realize uma analise de inferˆencia estatıstica Calculo da estimativa pontual media e desvio padrao Construcao de um intervalo de confianca para a media nıvel de confianca 95 Realizacao de um teste de hipotese para a media formular H0 e H1 calcular a estatıstica de teste determinar o pvalor e concluir 5 Redija um relatorio contendo Introducao Metodologia Analise Descritiva Inferˆencia Estatıstica Conclusao e Referˆencias Prazo de entrega 280625 Observacao O trabalho pode ser feito manualmente em planilhas ExcelLibreOffice ou com auxılio de softwares estatısticos como R ou outros 1 Orientacoes para o Relatorio O relatorio final deve ser organizado com os seguintes topicos 1 Introducao Apresente o tema escolhido e a motivacao para a escolha dos dados Explique com suas proprias palavras a diferenca entre Estatıstica Descritiva que permite resumir e descrever os dados observados por meio de medidas e graficos Inferˆencia Estatıstica que permite fazer conclusoes ou previsoes sobre a populacao a partir da analise da amostra utilizando estimativas e testes de hipoteses Relacione como essas duas abordagens estao sendo aplicadas no trabalho que sera desenvolvido Descreva os objetivos do trabalho 2 Metodologia Explique como os dados foram coletados ou obtidos Descreva a variavel ou variaveis analisadas 3 Analise Descritiva dos Dados Apresente as principais medidas descritivas media mediana moda se aplicavel desvio padrao mınimo maximo e quartis Inclua ao menos dois graficos ex histograma grafico de barras boxplot Comente os principais padroes ou caracterısticas dos dados 4 Analise de Inferˆencia Estatıstica Estimativa Pontual apresente a media e o desvio padrao da amostra como esti mativas dos parˆametros da populacao Intervalo de Confianca construa um intervalo de confianca para a media da variavel nıvel de confianca 95 Teste de Hipoteses realize um teste de hipotese para a media populacional Defina a hipotese nula H0 e a hipotese alternativa H1 Calcule a estatıstica de teste Determine o valor crıtico ou o pvalor Conclua se rejeita ou nao a hipotese nula explicando o resultado 5 Conclusao Retome os objetivos e apresente uma sıntese dos principais resultados Faca reflexoes sobre os resultados obtidos e possıveis limitacoes do trabalho 6 Referˆencias Informe as fontes dos dados e eventuais materiais teoricos utilizados 2 Introdução Em um contexto empresarial cada vez mais orientado por dados a capacidade de extrair insights significativos de informações aparentemente corriqueiras pode representar a diferença entre decisões acertadas e estratégias equivocadas Os dados aqui analisados compilados em um banco de 40 observações de vendas de uma loja fictícia a Lojinha XYZ foram meticulosamente estruturados para simular um cenário realista de transações comerciais abrangendo variáveis como ID do cliente idade valor da compra R e nível de satisfação escala de 1 a 5 Origem dos Dados Uma Simulação com Propósitos Didáticos Apesar de fictícios esses dados foram gerados para replicar padrões encontrados em pequenos varejos onde Idade dos clientes 2055 anos foi distribuída de forma a cobrir diferentes faixas etárias refletindo a diversidade demográfica típica de um comércio local Valores de compra R40R310 variam intencionalmente para capturar desde transações pequenas possivelmente de itens pontuais até compras mais vultosas como aquisições de maior valor agregado Níveis de satisfação 15 seguem uma distribuição não aleatória com maior concentração nas notas altas 4 e 5 simulando um viés comum em pesquisas de satisfação clientes insatisfeitos tendem a ser minoria mas sua existência é crítica para identificar pontos de melhoria A escolha por dados simulados em vez de reais justificase pela flexibilidade pedagógica eles permitem isolar variáveis de confusão como sazonalidade ou efeitos de marketing e focar em técnicas estatísticas básicas como análise descritiva visualização e correlações simples Tabela 1 Dados coletados da Lojinha XYZ I D Idad e ValorCompra R Satisfação 15 1 25 1505 4 2 32 8999 3 3 45 220 5 4 28 7525 2 5 50 31075 5 6 22 459 1 7 35 180 4 8 40 955 3 9 29 120 4 1 0 55 2753 5 1 1 31 658 2 1 2 27 140 4 1 3 38 2005 5 1 4 42 11025 3 1 5 23 50 1 1 6 47 24075 5 1 7 33 859 2 1 8 26 160 4 1 9 39 1955 5 2 0 44 10525 3 2 24 55 1 1 2 2 51 2603 5 2 3 30 708 2 2 4 36 130 4 2 5 41 2105 5 2 6 28 9025 3 2 7 21 60 1 2 8 49 23075 5 2 9 34 809 2 3 0 37 170 4 3 1 43 1855 5 3 2 46 10025 3 3 3 20 40 1 3 4 52 2903 5 3 5 31 758 2 3 6 27 125 4 3 7 48 2505 5 3 8 29 11525 3 3 9 53 300 5 4 0 35 659 2 Estatísticas descritivas A estatística descritiva é fundamental para resumir e interpretar conjuntos de dados de forma objetiva transformando informações brutas em insights acionáveis Neste trabalho ela permite caracterizar o perfil dos clientes da Lojinha XYZ por meio de medidas de tendência central média mediana moda dispersão desvio padrão variância e forma da distribuição assimetria curtose Essas métricas revelam padrões essenciais como a concentração etária dos consumidores a variabilidade nos valores gastos e a polarização nas avaliações de satisfação Ao quantificar essas características a estatística descritiva não apenas sintetiza o comportamento das variáveis analisadas mas também fornece bases sólidas para decisões estratégicas como segmentação de público e identificação de oportunidades de melhoria no atendimento Tabela 2 Estatística descritiva da Idade dos clientes Idade Média 3615 Erro padrão 1573233645 Mediana 35 Modo 28 Desvio padrão 9950003221 Variância da amostra 990025641 Curtose 1079770294 Assimetria 0228083306 Intervalo 35 Mínimo 20 Máximo 55 Soma 1446 Contagem 40 A distribuição etária dos clientes da Lojinha XYZ apresenta uma média de 3615 anos com uma mediana de 35 anos indicando uma distribuição relativamente simétrica corroborada pelo baixo valor de assimetria 023 A moda de 28 anos revela que essa é a idade mais frequente embora não seja significativamente diferente da média e mediana O desvio padrão de aproximadamente 995 anos e o intervalo de 35 anos entre 20 e 55 anos mostram uma dispersão moderada sugerindo que a loja atende a um público etariamente diversificado sem concentração extrema em nenhuma faixa específica A curtose negativa 108 indica uma distribuição mais achatada platicúrtica em comparação com uma normal o que significa que há uma menor concentração de idades próximas à média e uma maior presença de valores nas caudas da distribuição Esses resultados sugerem que embora a maioria dos clientes esteja na faixa dos 30 a 40 anos a loja também atrai um público significativo de jovens 2030 anos e pessoas mais velhas 4055 anos possivelmente refletindo estratégias de marketing ou uma variedade de produtos que atendem a diferentes gerações A ausência de outliers extremos com idades mínima e máxima dentro de limites razoáveis reforça a consistência dos dados para análises posteriores como segmentação por faixa etária ou correlação com outros comportamentos de compra Tabela 3 Estatística descritiva do valor de compra ValorCompra R Média 145603 5 Erro padrão 125504 3 Mediana 1225 Modo ND Desvio padrão 793758 9 Variância da amostra 630053 3 Curtose 084664 Assimetria 058757 2 Intervalo 27075 Mínimo 40 Máximo 31075 Soma 582414 Contagem 40 Os dados revelam que o valor médio das compras na Lojinha XYZ é de R14560 com uma mediana de R12250 indicando uma assimetria positiva 059 ou seja a distribuição é levemente alongada para a direita com presença de compras de alto valor que elevam a média acima da mediana O desvio padrão de R7938 e a amplitude de R27075 entre R4000 e R31075 demonstram uma variabilidade significativa nos valores gastos pelos clientes sugerindo diferentes perfis de consumo desde compras pequenas possivelmente de itens pontuais até transações mais vultosas A curtose negativa 085 confirma que a distribuição é mais achatada que uma normal com caudas menos pesadas mas ainda assim com alguns valores extremos na faixa superior acima de R250 A ausência de uma moda única ND reforça a diversidade nos padrões de gasto sem um valor de compra claramente dominante Esses insights podem indicar oportunidades para segmentação de clientes por exemplo identificar quem realiza compras acima da média potenciais candidatos para programas de fidelidade ou analisar se os valores mais altos estão ligados a satisfação elevada ou paradoxalmente a expectativas não atendidas A presença de outliers positivos merece investigação adicional para entender se correspondem a compras sazonais de alto ticket ou a erros de registro Tabela 4 Estatísticas descritivas do nível de astisfação dos clientes Satisfação 15 Média 3425 Erro padrão 022613 7 Mediana 4 Modo 5 Desvio padrão 143021 4 Variância da amostra 204551 3 Curtose 122339 Assimetria 036704 Intervalo 4 Mínimo 1 Máximo 5 Soma 137 Contagem 40 Os dados de satisfação revelam um cenário interessante enquanto a média de 343 sugere uma avaliação moderadamente positiva a mediana 4 e principalmente a moda 5 a nota mais frequente indicam que a maioria dos clientes tende a dar avaliações altas A assimetria negativa 037 confirma esta tendência mostrando que a distribuição está levemente inclinada para as notas mais elevadas Contudo o alto desvio padrão 143 quase 42 da amplitude total da escala revela uma significativa variação nas respostas com presença importante tanto de avaliações máximas 5 quanto mínimas 1 Esta distribuição bimodal com picos nas extremidades fica evidente pela curtose negativa 122 que mostra um histograma mais achatado que o normal sugerindo a existência de dois grupos distintos clientes muito satisfeitos notas 45 e um grupo menor porém relevante de clientes insatisfeitos notas 12 Esta polarização merece atenção especial pois enquanto 575 das avaliações são 4 ou 5 ainda há 225 de notas baixas 12 que podem indicar problemas específicos em determinados aspectos do serviço ou produto Esses resultados sugerem que a loja está conseguindo satisfazer bem a maioria de seus clientes mas enfrenta desafios pontuais que geram insatisfação em uma parcela significativa Uma análise cruzada com outras variáveis como valor gasto ou idade poderia ajudar a identificar os fatores por trás desta divergência nas avaliações Tabela de distribuição de frequências e histogramas A distribuição de idades dos clientes da Lojinha XYZ apresenta um padrão relativamente equilibrado entre as faixas etárias com leve concentração nos grupos mais jovens A classe 2530 anos destacase como a mais frequente 8 clientes seguida pelas faixas 3035 e 3540 6 clientes cada indicando que a loja atrai principalmente adultos jovens e em idade economicamente ativa As demais categorias 2025 4045 4550 e 5055 apresentam frequências idênticas 5 clientes cada sugerindo uma distribuição uniforme nas extremidades O histograma correspondente com intervalos de 5 anos provavelmente revelaria uma forma próxima à distribuição normal porém com ligeiro desvio para a esquerda devido à maior frequência na faixa de 2530 anos Essa distribuição reflete um público diversificado sem predominância marcante de nenhuma geração específica o que pode ser vantajoso para estratégias de marketing abrangentes A ausência de picos extremos ou intervalos vazios reforça a consistência dos dados e a representatividade da amostra para análises posteriores Figura 1 Histograma da distribuição das idade dos clientes A distribuição dos valores gastos pelos clientes revela uma concentração expressiva nas faixas mais baixas 325 das compras estão entre R40 e R90 e 225 entre R90 e R140 totalizando 55 das transações abaixo de R140 O histograma correspondente apresentaria um pico inicial acentuado na primeira classe 4090 seguido por um declínio gradual nas faixas superiores caracterizando uma distribuição assimétrica positiva cauda alongada à direita Apenas 75 das compras ultrapassam R290 indicando que transações de alto valor são menos frequentes Essa estrutura sugere que a loja atende principalmente a demandas de baixo a médio ticket com oportunidades para estratégias de upsell ou fidelização nos segmentos que realizam compras acima de R190 30 do total A presença de valores extremos até R340 merece investigação adicional para identificar se correspondem a compras sazonais de clientes premium ou a outliers A análise reforça a importância de segmentar ações comerciais conforme o perfil de gastos dos clientes Figura 2 Histograma da distribuição do valor das compras dos clientes A distribuição das avaliações de satisfação dos clientes em uma escala de 1 a 5 revela um cenário marcado por contrastes significativos A nota 5 emerge como a mais frequente representando 325 das avaliações 13 clientes seguida pela nota 4 com 20 8 clientes indicando que mais da metade dos consumidores 525 atribuiu classificações positivas No entanto chama atenção a expressiva parcela de 30 de clientes 12 indivíduos que conferiu notas 1 ou 2 demonstrando insatisfação considerável As notas intermediárias 3 correspondem a 175 7 clientes atuando como um elemento de transição nesta distribuição assimétrica negativa A análise das frequências acumuladas mostra que 475 dos clientes atribuíram notas iguais ou inferiores a 3 enquanto 675 deram notas até 4 evidenciando que a satisfação plena nota 5 é um diferencial alcançado por aproximadamente um terço da base de clientes Este padrão de distribuição visualizado em um histograma apresentaria um pico acentuado na extremidade superior nota 5 um declínio gradual em direção às notas médias e uma cauda esquerda relevante nas classificações mais baixas Os resultados sugerem que embora a empresa atenda bem a maioria de seus clientes existe uma minoria significativa cujas expectativas não estão sendo plenamente atendidas indicando oportunidades específicas para melhorias operacionais e no atendimento ao cliente A presença de 20 de avaliações no nível 4 consideradas boas mas não excelentes representa uma oportunidade estratégica para elevar esses clientes ao patamar de máxima satisfação através de ajustes pontuais na experiência de compra Figura 3 Histograma do nível de satisfação dos clientes Intervalos de confiança Para a idade dos clientes EP995 40 1573 ME19615733083 IC 3307 anos 3923 anos Com 95 de confiança a verdadeira média populacional da idade dos clientes da Lojinha XYZ está entre 3307 e 3923 anos Esse intervalo reflete a variabilidade amostral e sugere que a faixa etária predominante dos clientes é adulta 3040 anos Para o valor da compra EP 7938 40 1255 ME 196 1255 2460 IC R12100 R17020 Com 95 de confiança podemos afirmar que o verdadeiro valor médio das compras na população está entre R12100 e R17020 Esse intervalo Reflete a considerável variabilidade nos valores de compra alto desvio padrão mostra que a média amostral de R14560 é uma estimativa razoavelmente precisa indica que a maioria das transações provavelmente está abaixo de R20000 Para o nível de satisfação dos clientes EP 143 40 0226 ME 196 0226 0443 IC 2982 3868 Com 95 de confiança podemos afirmar que A verdadeira satisfação média populacional está entre 298 e 387 a amplitude relativamente estreita 089 pontos indica boa precisão da estimativa o intervalo está ligeiramente deslocado para a parte superior da escala próximo de 4 Teste de Hipótese para as médias O teste de hipótese para a média é um método estatístico que permite avaliar se a média de uma população μ é igual a um valor específico μ₀ proposto por uma hipótese usando dados amostrais Funciona como um julgamento científico partimos de uma suposição inicial hipótese nula H₀ μ μ₀ e verificamos se a evidência dos dados média amostral X é forte o suficiente para rejeitála em favor de uma alternativa H₁ μ μ₀ ou outras variações Calculamos uma estatística de teste como o t ou z que mede quantos erros padrão Ẍ está distante de μ₀ Se essa diferença for improvável sob H₀ comparando com um valor crítico ou via valorp rejeitamos H₀ No exemplo da idade dos clientes Ẍ3615 vs μ₀35 o teste mostrou que a diferença de 115 anos poderia facilmente ocorrer por acaso p0469 não justificando rejeitar a hipótese de que a média populacional seja 35 anos É essencial em pesquisas para validar afirmações como o tempo médio de atendimento é 10 minutos ou a renda média aumentou Idades Hipóteses H₀ μ35 anos H₁ μ35 anos Estatística de teste t 3615 35 995 40 115 1573 0731 Valor crítico t₀₀₂₅₃₉ 2023 Decisão Como 0731 2023 não rejeitamos H₀ Valorp p 2 Pt 0731 0469 005 Conclusão Não há evidências estatísticas p 0469 005 para rejeitar a hipótese nula de que a idade média dos clientes é igual a 35 anos ao nível de significância de 5 A diferença observada 3615 vs 35 não é estatisticamente significativa Valor da compra Hipóteses H₀ μ R12000 H₁ μ R12000 Estatística de teste t14560120 7938 40 2560 1255 204 Valor crítico t 0025 392023 Decisão Como 2042023 rejeitamos H 0 Valorp p2 P t204 0048005 Conclusão Há evidências estatísticas p 0048 005 para afirmar que o valor médio das compras difere significativamente de R 12000 ao nível de 5 de significância A média observada R 14560 sugere que os clientes gastam em média mais que o valor de referência testado Nível de satisfação dos clientes Hipóteses H 0 μ3 H 1 μ3 Estatística de teste t34253 1430 40 0425 0226 188 Valor crítico t 0025 392023 Decisão Como 1882023 não rejeitamos H 0 Valorp p2 P t188 0067005 Conclusão Não há evidências estatísticas p 0067 005 para rejeitar a hipótese nula A diferença observada entre a média amostral 343 e o valor de referência 30 pode ser atribuída ao acaso Interpretação prática A satisfação dos clientes não difere significativamente da neutralidade escore 3 ao nível de 5 de significância Os três testes de hipótese indicam resultados distintos quanto à significância estatística Não houve evidências suficientes para rejeitar a hipótese de que a idade média dos clientes é igual a 35 anos p 0469 nem de que a satisfação média difere do escore neutro de 30 p 0067 sugerindo que as diferenças observadas nesses casos podem ser atribuídas ao acaso Por outro lado foi encontrada evidência estatística significativa p 0048 de que o valor médio das compras difere de R 12000 com média observada de R 14560 indicando que os clientes tendem a gastar mais que o valor de referência testado Conclusão Com base na análise estatística realizada sobre os dados de uma loja foi possível extrair informações relevantes acerca do perfil dos clientes seus hábitos de consumo e seu nível de satisfação Inicialmente as estatísticas descritivas revelam que a idade média dos clientes é de aproximadamente 3615 anos com distribuição relativamente simétrica assimetria 023 e curtose negativa indicando uma distribuição mais achatada em relação à normal A dispersão medida pelo desvio padrão 995 sugere uma variabilidade moderada na idade dos clientes No que se refere ao valor médio das compras observouse uma média de R 14560 consideravelmente superior à mediana R 12250 o que aliado à assimetria positiva 059 aponta para a presença de alguns valores altos que puxam a média para cima uma característica típica de distribuição assimétrica à direita O desvio padrão elevado R 7938 reforça a alta dispersão nos valores de compra entre os clientes Em relação à satisfação a média foi de 343 numa escala de 1 a 5 com a mediana em 4 e o modo em 5 sugerindo uma tendência mais otimista apesar da assimetria levemente negativa 037 o que indica uma inclinação discreta para valores abaixo da média As análises inferenciais complementaram a investigação o teste de hipótese para idade não rejeitou a hipótese nula p 0469 o que indica que a idade média dos clientes não difere significativamente de 35 anos Por outro lado o valor médio das compras apresentou uma diferença estatisticamente significativa em relação ao valor de referência de R 12000 p 0048 sugerindo que os clientes gastam em média mais do que o esperado Quanto à satisfação embora a média observada 343 seja numericamente superior à neutralidade ponto 3 a diferença não foi estatisticamente significativa p 0067 o que nos leva a concluir que a percepção de satisfação dos clientes não difere de um nível neutro de forma confiável do ponto de vista estatístico Por fim os histogramas elaborados corroboraram visualmente as tendências observadas nas análises descritivas e reforçaram a interpretação geral de que embora existam indícios de variação e comportamento distinto em alguns aspectos apenas o padrão de consumo se mostrou estatisticamente distinto do valor de referência evidenciando a importância de focar estratégias comerciais nesse ponto