4
Estatística 1
UFU
1
Estatística 1
UFU
5
Estatística 1
UFU
1
Estatística 1
UFU
1
Estatística 1
UFU
1
Estatística 1
UFU
20
Estatística 1
UFU
33
Estatística
UFU
1
Estatística 1
UFU
7
Estatística 1
UFU
Texto de pré-visualização
Trabalho Análise Estatísti O trabalho tem por objetivo a aplicação de técnicas estatísticas a um conjunto de dados fazendo uso de ferramentas computacionais na análise dos resultados O trabalho deve ser realizado em grupo de até 5 alunos e consistirá de análise de dados e apresentação de relatório Uma grande transportadora sediada em São PauloSP contratou seu grupo para avaliar suas práticas administrativas A empresa forneceu um banco de dados com os registros das suas últimas 5000 operações contendo as seguintes variáveis Peso da encomenda em kg Tempo gasto para levar a encomenda até o destino em horas Modalidade de transporte ferroviário aéreo rodoviário marítimofluvial ou multimodal dois ou mais dos tipos anteriores Região de destino norte nordeste centrooeste sul e sudeste Opinião do cliente sobre o serviço prestado excelente bom regular ruim péssimo Os administradores da transportadora estão interessados nas seguintes informações 1 Os clientes estão satisfeitos com os serviços prestados pela transportadora 2 Qual é a principal região de destino das operações da transportadora 3 Como está a distribuição das operações da empresa em termos de modalidade de transporte 4 Seria interessante ter informações análise estatística descritiva medidas resumo medidas de variabilidade gráfico de sua distribuição etc sobre o peso das encomendas transportadas 5 Seria também interessante ter informações análise estatística descritiva sobre o tempo gasto para transportar as encomendas 6 Será que existe relação entre a modalidade de transporte e região de destino da encomenda 7 Será que existe relação entre a modalidade de transporte e a opinião do cliente sobre o serviço prestado 8 Será que existe relação entre a região de destino e a opinião do cliente 9 Será que existe relação entre a opinião do cliente sobre o serviço e o tempo para entregar a encomenda 10 Será que existe relação entre a região de destino e o tempo para entregar a encomenda 11 Será que existe relação entre o peso da encomenda e o tempo para entregar a encomenda 12 Encomendas com menos de 800 kg não são do interesse da empresa não compensam os custos envolvidos Com base nos dados será que a empresa está atingindo este objetivo Se o objetivo não estiver sendo atingido o que poderia deveria ser feito sugerido para que ele seja atingido 13 Uma das principais preocupações da empresa é entregar as encomendas em no máximo 80 horas Será que este objetivo está sendo atingido Se o objetivo não estiver sendo atingido o que poderia deveria ser feito sugerido para que ele seja atingido 14 Para oferecer um serviço diferenciado a empresa quer concentrar no máximo 40 de suas operações em transporte rodoviário Este objetivo está sendo atingido Se o objetivo não estiver sendo atingindo o que poderia deveria ser feito sugerido para que ele seja atingido 15 Uma das diretrizes da empresa é conseguir pelo menos 50 de opiniões como excelente e bom para seus serviços em todas as regiões A empresa está conseguindo obter tal taxa Se o objetivo não estiver sendo atingindo o que poderia deveria ser feito sugerido para que ele seja atingido Com base no conjunto de dados Arquivo Transportadora em anexo escreva os resultados de seu trabalho O relatório deve ser claro objetivo e sucinto contendo no máximo 12 páginas Evite termos redundantes e comentários desnecessários Use gráficos e tabelas para representar os resultados veja as normas para confecção de gráficos e tabelas na Apostila de Estatística Descritiva Lembrese que os gráficos e as tabelas devem ser simples e claros O relatório técnico referente à análise de dados deve conter Introdução definição do problema motivação para o estudo do problema se couber objetivo que se pretende alcançar Materiais e métodos definição do conjunto de dados ferramentas e técnicas estatísticas utilizadas software usado etc Análise de dados e resultados gráficos tabelas interpretação dos resultados etc Observação todo gráfico e tabela colocado no texto deve ser referenciado e comentado Os gráficos e tabelas devem ser formatados de acordo com a Apostila de Estatística Descritiva Conclusão ou considerações finais Referências bibliográficas livros apostilas etc Consultados Apêndice se for o caso Layout de Impressão Títulos Editar Compartilha r Ler em Voz Alta Relatório Diagnóstico Completo de Operações e Metas Estratégicas Sumário Este relatório apresenta um diagnóstico aprofundado e integrado das operações da transportadora fundamentado na análise estatística de um robusto conjunto de dados de 5000 registros de entrega Constatase que a empresa não obstante sua escala enfrenta desafios estratégicos de grande magnitude evidenciados por um notável desalinhamento entre suas metas corporativas e sua performance operacional efetiva O estudo revela que a satisfação do cliente embora aparente ser heterogênea em uma avaliação superficial oculta uma severa crise na qualidade dos serviços em mercados regionais de suma importância As investigações estatísticas comprovam com elevado grau de confiança que tal insatisfação é uma decorrência direta de ineficiências operacionais notavelmente o tempo excessivo de entrega em determinadas rotas A organização falha em atingir quatro de suas cinco principais metas estratégicas que englobam tempo de entrega diversificação da matriz de transporte e de forma mais crítica o índice mínimo de satisfação em três de suas cinco regiões de atuação A identificação de uma forte correlação positiva entre o peso das encomendas e o tempo de trânsito adiciona uma camada de complexidade a ser endereçada no planejamento logístico Diante deste cenário a recomendação estratégica central e mais premente consiste na implementação de planos de ação focados na otimização de processos das regiões Norte CentroOeste e Sudeste com vistas à redução do tempo de entrega como principal vetor para a recuperação da satisfação do cliente e o consequente alinhamento aos objetivos globais da companhia 1 Introdução O presente documento oferece a mais completa análise das operações da transportadora realizada até o momento consolidando os resultados de quinze investigações analíticas sequenciais em um único relatório coeso O problema fulcral que motivou este estudo foi a percepção por parte da administração de um possível desalinhamento entre as metas estratégicas da empresa e seus resultados operacionais bem como a necessidade de uma compreensão aprofundada dos fatores que influenciam a satisfação do cliente O propósito fundamental deste trabalho é portanto fornecer um diagnóstico preciso e baseado em evidências que não apenas descreva o estado atual da operação mas que também elucide as relações de causa e efeito entre as variáveis logísticas e a performance do negócio Para a consecução de tal desiderato a análise propõese a responder a um conjunto detalhado de quinze perguntas que abrangem desde o perfil geral das operações até a avaliação rigorosa de indicadoreschave de desempenho KPIs culminando em recomendações estratégicas aptas a nortear a tomada de decisão futura 2 Materiais e Métodos O presente estudo foi conduzido a partir de uma abordagem quantitativa com a utilização de um conjunto de dados secundários fornecidos em formato de planilha eletrônica Microsoft Excel xlsx A base de dados consolidada continha um total de 5000 registros onde cada registro representava uma operação de entrega individual As variáveis de interesse para a análise contidas neste conjunto de dados foram definidas e classificadas da seguinte forma Região variável categórica nominal representando as cinco grandes regiões do Brasil Modalidade variável categórica nominal descrevendo o meio de transporte utilizado Opinião variável categórica ordinal capturando a satisfação do cliente em cinco níveis de Péssimo a Excelente Peso variável numérica contínua expressa em quilogramas e Tempo variável numérica contínua expressa em horas Toda a manipulação análise e visualização dos dados foram realizadas no ambiente computacional estatístico R em sua versão 4xx Para a execução das tarefas foram empregados pacotes especializados que estendem as funcionalidades básicas do software O pacote readxl foi utilizado para a importação inicial dos dados da planilha A subsequente manipulação limpeza e sumarização dos dados foram efetuadas de maneira eficiente com o auxílio do pacote dplyr uma ferramenta central do ecossistema Tidyverse A criação de todas as visualizações gráficas de alta qualidade como os histogramas gráficos de barras boxplots e gráficos de dispersão foi realizada através do pacote ggplot2 conhecido por sua gramática de gráficos flexível e poderosa O pacote knitr foi utilizado para a formatação de tabelas de forma clara e legível Os procedimentos analíticos foram estruturados em etapas sequenciais Inicialmente foi realizada uma análise estatística descritiva para caracterizar o perfil das variáveis e obter uma compreensão geral dos dados Posteriormente para investigar as relações entre as variáveis e responder às perguntas de negócio foram aplicadas técnicas de estatística inferencial A associação entre variáveis categóricas como Região e Opinião foi avaliada pelo Teste QuiQuadrado de Independência Para comparar as médias de uma variável contínua entre diferentes grupos categóricos como o Tempo de entrega por Região foi empregada a Análise de Variância ANOVA A relação linear entre as duas variáveis contínuas Peso e Tempo foi quantificada e testada através do Teste de Correlação de Pearson Para todos os testes de hipóteses foi adotado um nível de significância alfa de 005 sendo este o limiar para a rejeição da hipótese nula 3 Análise de Dados e Resultados Nesta seção os resultados de cada uma das quinze investigações analíticas são apresentados individualmente detalhando a metodologia o código R utilizado os dados observados e a interpretação aprofundada de cada achado Pergunta 1 Os clientes estão satisfeitos com os serviços prestados pela transportadora Código para gerar a tabela de frequência e o gráfico de barras da Opinião tabelaopiniao dados countOpinião sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelaopiniao caption Frequência de Opinião dos Clientes Gera o gráfico em uma nova janela windows print ggplottabelaopiniao aesx reorderOpinião n y n fill Opinião geombarstat identity geomtextaeslabel paste0n Percentual vjust 05 labstitle Distribuição da Opinião dos Clientes x Opinião y Quantidade thememinimal readlinepromptO gráfico foi gerado Pressione Enter no console para continuar Para responder a esta questão foi realizada uma análise de frequência sobre as 5000 avaliações de serviço contidas no conjunto de dados Os resultados quantitativos revelaram a seguinte distribuição 1718 avaliações 3436 foram classificadas como Bom 1349 2698 como Ruim 792 1584 como Regular 575 1150 como Péssimo e 566 1132 como Excelente A interpretação destes números evidencia uma polarização no sentimento dos clientes Embora Bom seja a categoria mais frequente a soma das avaliações explicitamente negativas Ruim e Péssimo alcança 3848 um volume substancial que se aproxima do total de avaliações positivas Excelente e Bom combinadas que é de 4568 Este cenário denota uma experiência de serviço inconsistente e um risco considerável à retenção de clientes e à reputação da marca A visualização desta acentuada divisão é fundamental para a compreensão do problema Fonte Próprio Autor 2025 Pergunta 2 Qual é a principal região de destino das operações da transportadora Código para gerar a tabela de frequência das Regiões tabelaregiao dados countRegião sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelaregiao caption Frequência de Entregas por Região A metodologia utilizada foi uma análise de frequência das entregas por região A contagem revelou que as operações estão primariamente concentradas na Região Sudeste com 1576 entregas representando 3152 do total A Região Sul figura como o segundo maior mercado com 1246 operações 2492 Juntas estas duas regiões somam mais de 56 de todo o volume de negócios As demais regiões CentroOeste 1720 Nordeste 1608 e Norte 1028 completam a distribuição A interpretação destes dados indica um foco geográfico claro o que pode gerar eficiências de escala mas também concentra o risco operacional no eixo Sul Sudeste Pergunta 3 Como está a distribuição das operações em termos de modalidade de transporte Código para gerar a tabela de frequência das Modalidades tabelamodalidade dados countModalidade sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelamodalidade caption Frequência de Entregas por Modalidade Através de uma análise de frequência a distribuição das 5000 operações por modalidade foi quantificada O modal Rodoviário demonstrou ser predominante respondendo por 2555 operações ou 5110 do total O modal Aéreo é o segundo mais utilizado com 901 operações 1802 seguido pelo Marítimofluvial com 731 operações 1462 A forte dependência do modal rodoviário superando a metade de todas as operações representa um risco estratégico significativo expondo a empresa aulnerabilidades intrínsecas a este setor como flutuações de custos e instabilidades logísticas Pergunta 4 Qual o perfil do peso das encomendas transportadas Código para gerar as estatísticas descritivas e o histograma do Peso pesostats asdataframetsummarydadosPeso printkablepesostats caption Estatísticas Descritivas Peso kg catDesvio Padrão do Peso sddadosPeso Gera o gráfico em uma nova janela windows histdadosPeso main Histograma de Distribuição do Peso xlab Peso kg ylab Frequência col lightblue border white readlinepromptO gráfico foi gerado Pressione Enter no console para continuar Foi conduzida uma análise de estatística descritiva sobre a variável Peso Os resultados indicam que a operação lida com cargas pesadas e de perfil notavelmente homogêneo O peso médio observado foi de 10005 kg com uma mediana de 10010 kg e um desvio padrão de 998 kg A proximidade entre média e mediana confirma uma distribuição simétrica sem valores extremos que distorçam a tendência central A faixa de operação vai de um mínimo de 649 kg a um máximo de 1375 kg A previsibilidade do perfil de carga constitui um ponto forte da operação como pode ser visualizado no histograma de distribuição Fonte Próprio Autor 2025 Pergunta 5 Qual o perfil do tempo gasto para transportar as encomendas Código para gerar as estatísticas descritivas e o histograma do Tempo tempostats asdataframetsummarydadosTempo printkabletempostats caption Estatísticas Descritivas Tempo h catDesvio Padrão do Tempo sddadosTempo Gera o gráfico em uma nova janela windows histdadosTempo main Histograma de Distribuição do Tempo xlab Tempo h ylab Frequência col lightgreen border white readlinepromptO gráfico foi gerado Pressione Enter no console para continuar Utilizando a mesma metodologia de estatística descritiva para a variável Tempo a análise revelou uma operação consistente em seus prazos em cenários normais O tempo médio de entrega foi de 718 horas com uma mediana quase idêntica de 719 horas e um baixo desvio padrão de 99 horas Este resultado sugere alta previsibilidade No entanto o tempo máximo registrado de 1125 horas é um outlier importante indicando que embora consistente a operação não se mostra imune a falhas que resultam em atrasos significativos O histograma correspondente ilustra a forte concentração dos tempos de entrega Fonte Próprio Autor 2025 Pergunta 6 Será que existe relação entre a modalidade de transporte e a região de destino da encomenda Código para gerar a tabela de contingência e o teste QuiQuadrado tabelamodreg tabledadosModalidade dadosRegião testequimodreg chisqtesttabelamodreg printtestequimodreg Para investigar a associação entre estas duas variáveis categóricas foi aplicado o Teste QuiQuadrado de Independência O resultado do teste foi estatisticamente significativo χ²16 76208 p 0001 indicando que a escolha da modalidade não é aleatória mas sim dependente da região de destino Isso sugere que a empresa emprega uma estratégia logística adaptada utilizando modais mais apropriados para cada contexto geográfico como uma maior utilização do modal fluvial na região Norte Pergunta 7 Será que existe relação entre a modalidade de transporte e a opinião do cliente sobre o serviço prestado Código para gerar a tabela de contingência e o teste QuiQuadrado tabelamodop tabledadosModalidade dadosOpinião testequimodop chisqtesttabelamodop printtestequimodop Novamente o Teste QuiQuadrado foi utilizado e o resultado foi altamente significativo χ²16 14531 p 0001 A conclusão é que a modalidade de transporte tem um impacto direto e profundo na satisfação do cliente A análise das frequências observadas demonstra que os modais Aéreo e Ferroviário estão associados a uma qualidade de serviço percebida muito superior enquanto as operações Marítimofluvial e Multimodal constituem as principais fontes de atrito e avaliações desfavoráveis Pergunta 8 Será que existe relação entre a região de destino e a opinião do cliente Código para gerar a tabela de contingência e o teste QuiQuadrado tabelaregop tabledadosRegião dadosOpinião testequiregop chisqtesttabelaregop printtestequiregop A aplicação do Teste QuiQuadrado nesta questão produziu um resultado extremamente significativo χ²16 18482 p 0001 comprovando que a experiência do cliente não é uniforme em todo o Brasil A disparidade regional é acentuada com as regiões Nordeste e Sul apresentando uma performance de satisfação muito superior em comparação com a experiência predominantemente negativa observada nas regiões Norte CentroOeste e Sudeste Pergunta 9 Será que existe relação entre a opinião do cliente sobre o serviço e o tempo para entregar a encomenda Código para realizar o teste ANOVA e gerar o boxplot testeanovatempoop aovTempo Opinião data dados summarytesteanovatempoop Gera o gráfico em uma nova janela windows print ggplotdados aesx Opinião y Tempo fill Opinião geomboxplot labstitle Distribuição do Tempo de Entrega por Opinião do Cliente y Tempo h thememinimal readlinepromptO gráfico foi gerado Pressione Enter no console para continuar Para comparar a média da variável contínua Tempo entre os diferentes grupos de Opinião foi utilizada a Análise de Variância ANOVA O resultado foi conclusivo e de altíssima significância F4 4995 3777 p 0001 Esta constatação representa um dos achados centrais do estudo o tempo de entrega constitui um dos principais vetores da satisfação do cliente Os tempos médios de entrega para avaliações Excelente e Bom são estatisticamente mais baixos do que para as avaliações Regular Ruim e Péssimo A visualização desta relação é crucial Fonte Próprio Autor 2025 Este gráfico gerado pelo código R correspondente é essencial pois deve mostrar cinco caixas uma para cada nível de opinião que ilustram um padrão claro as caixas se tornam progressivamente mais altas indicando tempos maiores à medida que a avaliação do cliente piora Pergunta 10 Será que existe relação entre a região de destino e o tempo para entregar a encomenda Código para realizar o teste ANOVA e gerar o boxplot testeanovatemporeg aovTempo Região data dados summarytesteanovatemporeg Gera o gráfico em uma nova janela windows print ggplotdados aesx Região y Tempo fill Região geomboxplot labstitle Distribuição do Tempo de Entrega por Região y Tempo h thememinimal readlinepromptO gráfico foi gerado Pressione Enter no console para continuar A mesma técnica de ANOVA foi aplicada para comparar o tempo médio de entrega entre as cinco regiões O teste confirmou com alta significância F4 4995 3514 p 0001 que a performance logística não é homogênea em todo o território Ao conectar este resultado com o da pergunta anterior o diagnóstico é corroborado as regiões com os piores índices de satisfação são de fato aquelas onde a empresa opera de forma mais lenta O gráfico de boxplot regional expõe essa diferença de performance de forma inequívoca Fonte Próprio Autor 2025 Este gráfico gerado pelo código R correspondente deve comparar visualmente os tempos de entrega nas cinco regiões mostrando distribuições visivelmente mais altas e dispersas para as regiões Norte e CentroOeste em comparação com as demais Pergunta 11 Será que existe relação entre o peso da encomenda e o tempo para entregar a encomenda Código para realizar o teste de correlação e gerar o gráfico de dispersão testecorrpesotempo cortestdadosPeso dadosTempo printtestecorrpesotempo Gera o gráfico em uma nova janela windows print ggplotdados aesx Peso y Tempo geompointalpha 04 geomsmoothmethod lm col red labstitle Relação entre Peso da Encomenda e Tempo de Entrega x Peso kg y Tempo h thememinimal readlinepromptO gráfico foi gerado Pressione Enter no console para continuar A relação entre estas duas variáveis contínuas foi investigada pelo Teste de Correlação de Pearson O resultado foi um coeficiente de correlação r de 070 com um pvalor virtualmente zero p 0001 indicando uma correlação positiva forte e estatisticamente significativa A interpretação dos resultados indica que encomendas mais pesadas sistematicamente levam mais tempo para serem entregues Esta regra operacional deve ser integrada ao planejamento logístico para evitar falhas em Acordos de Nível de Serviço SLAs A tendência linear é perfeitamente visível no gráfico de dispersão Fonte Próprio Autor 2025 Este gráfico gerado pelo código R correspondente é a prova visual desta relação mostrando uma nuvem de pontos que se inclina claramente para cima e para a direita com a linha de tendência confirmando o padrão positivo Pergunta 12 A empresa está atingindo o objetivo de não ter encomendas com menos de 800 kg Código para verificar a meta de peso mínimo encomendasleves dados filterPeso 800 numleves nrowencomendasleves percentualleves roundnumleves nrowdados 100 2 catNúmero de encomendas com menos de 800 kg numleves catPercentual do total percentualleves A metodologia consistiu em filtrar e contar o número de registros onde a variável Peso era inferior a 800 A análise identificou 97 operações ou 194 do total que violam esta diretriz Portanto a meta não está sendo atingida Embora o percentual seja baixo ele representa uma falha processual e uma perda de receita potencial pois essas cargas podem não compensar os custos fixos da operação Pergunta 13 A empresa está cumprindo a meta de entregar em no máximo 80 horas Código para verificar a meta de tempo máximo entregasatrasadas dados filterTempo 80 numatrasadas nrowentregasatrasadas percentualatrasadas roundnumatrasadas nrowdados 100 2 catNúmero de encomendas que excederam 80 horas numatrasadas catPercentual do total percentualatrasadas Através da filtragem e contagem dos registros onde o Tempo excedia 80 horas constatouse que a meta não está sendo cumprida de forma consistente Um total de 1027 entregas o que corresponde a 2054 da amostragem ultrapassou o prazo máximo definido Este volume expressivo de atrasos afetando um em cada cinco clientes constitui um fator crítico que impacta diretamente a satisfação Pergunta 14 A empresa está atingindo a meta de usar o transporte rodoviário em no máximo 40 das operações Código para verificar a meta de participação do modal rodoviário distmodal dados countModalidade mutatePercentual roundn sumn 100 2 percentualrodoviario distmodal filterModalidade Rodoviário pullPercentual printkabledistmodal caption Distribuição de Operações por Modalidade Uma análise de frequência da variável Modalidade foi realizada para verificar este KPI O resultado demonstrou que o modal Rodoviário representa 511 do total das operações Portanto a meta estratégica de diversificação da matriz logística que visava limitar essa dependência a 40 não está sendo atingida com um excedente de 111 pontos percentuais Pergunta 15 A empresa está conseguindo 50 de opiniões Excelente ou Bom em todas as regiões Código para verificar a meta de satisfação por região satisfacaoporregiao dados groupbyRegião summarise TotalAvaliacoes n AvaliacoesPositivas sumOpinião in cExcelente Bom PercentualPositivo roundAvaliacoesPositivas TotalAvaliacoes 100 2 arrangedescPercentualPositivo printkablesatisfacaoporregiao caption Percentual de Satisfação por Região Para avaliar esta meta complexa os dados foram agrupados por Região e foi calculado o percentual de avaliações positivas Excelente Bom para cada uma A análise revelou que a meta não está sendo atingida na maioria dos mercados Apenas as regiões Nordeste 838 e Sul 617 cumprem o objetivo As regiões Sudeste 390 CentroOeste 213 e de forma mais alarmante a região Norte apenas 84 estão significativamente abaixo do mínimo de 50 de satisfação 4 Conclusão e Recomendações Estratégicas A análise integrada e aprofundada dos dados posiciona a empresa em uma encruzilhada estratégica Por um lado possui operações de grande escala e previsíveis em cenários ideais Por outro sofre de ineficiências operacionais localizadas que causam um impacto devastador e em cascata sobre o cumprimento de metas e mais importante sobre a percepção de valor pelo cliente A estratégia definida pela administração não está sendo refletida na execução do dia a dia Para reverter este quadro e realinhar a operação aos seus objetivos recomendase um plano de ação focado e sequencial A prioridade absoluta e imediata deve ser a criação de uma forçatarefa de Recuperação Regional com autonomia e recursos para intervir nas operações das regiões Norte CentroOeste e Sudeste O mandato exclusivo desta equipe deve ser o diagnóstico em campo e a execução de um plano de ação de 90 dias focado obsessivamente na redução do tempo de ciclo das entregas Esta é a ação de maior alavancagem pois incide diretamente sobre a causaraiz da insatisfação do cliente e por consequência endereça o cumprimento de múltiplas metas simultaneamente A médio prazo a empresa deve empreender um redesenho estratégico de sua oferta de serviço e de sua matriz logística Isso envolve abandonar o modelo de prazo único e implementar SLAs inteligentes que considerem as variáveis de região e peso para fornecer estimativas realistas aos clientes Em paralelo uma nova política comercial deve ser criada para ativamente incentivar o uso de modais de melhor performance como o Aéreo e o Ferroviário transformandoos em produtos premium e alinhando os interesses comerciais com a busca por maior qualidade e o cumprimento da meta de diversificação Finalmente como ação fundamental e contínua a cultura da empresa deve evoluir para uma gestão orientada por dados Este relatório não deve ser um evento isolado mas o protótipo de uma ferramenta de gestão contínua A implementação de dashboards acessíveis aos gestores monitorando em tempo real os KPIs aqui discutidos permitirá a identificação de desvios no momento em que ocorrem habilitando uma gestão proativa e prevenindo que desafios operacionais se transformem em crises estratégicas como a que foi identificada neste estudo Referências Bibliográficas A metodologia estatística e as ferramentas computacionais empregadas neste trabalho são fundamentadas em literatura e documentação consolidadas na área As principais fontes que serviram de base para a condução da análise bem como as citações formais para o software utilizado incluem publicações de referência em estatística e ciência de dados A seguir são listadas as principais referências consultadas e pertinentes a este estudo Morettin P A Bussab W O 2017 Estatística Básica 10ª ed São Paulo Saraiva Educação Wickham H 2016 ggplot2 Elegant Graphics for Data Analysis SpringerVerlag New York Wickham H François R Henry L Müller K 2023 dplyr A Grammar of Data Manipulation R package version 112 R Core Team 2023 R A Language and Environment for Statistical Computing R Foundation for Statistical Computing Vienna Austria 6 Apêndice Com o intuito de garantir a total transparência reprodutibilidade e possibilidade de auditoria dos resultados apresentados neste relatório os materiais suplementares relevantes são fornecidos a seguir Esta seção contém os recursos computacionais completos que foram desenvolvidos e utilizados para realizar todas as análises descritas no capítulo de Materiais e Métodos e cujos resultados foram discutidos ao longo do trabalho Apêndice A Script R Completo para Análise Neste apêndice é apresentado na íntegra o códigofonte escrito na linguagem R O script está consolidado e estruturado para realizar todas as análises em uma única execução desde o carregamento das bibliotecas e importação dos dados até a execução de cada um dos testes estatísticos e a geração de todas as figuras e tabelas contidas neste documento ANÁLISE COMPLETA DE DADOS E METAS DA TRANSPORTADORA VERSÃO FINAL E INTEGRADA ETAPA 1 CONFIGURAÇÃO DO AMBIENTE catIniciando o script de análise completa catVerificando e carregando bibliotecas necessárias Lista de pacotes necessários para a análise pacotes creadxl dplyr ggplot2 knitr Verifica quais pacotes não estão instalados instalar pacotespacotes in installedpackages Package Instala os pacotes que estiverem faltando iflengthinstalar catInstalando os seguintes pacotes necessários instalar installpackagesinstalar Carrega todos os pacotes necessários libraryreadxl librarydplyr libraryggplot2 libraryknitr catBibliotecas carregadas com sucesso cat ETAPA 2 LEITURA E CARREGAMENTO DOS DADOS catLendo o arquivo de dados da transportadora caminho DadosTransportadora3a34b0578a6e182134509c49a5d659adxlsx if fileexistscaminho stopERRO O arquivo caminho não foi encontrado Verifique o caminho e o nome do arquivo dados readexcelcaminho sheet Plan1 catArquivo lido com sucesso Total de registros nrowdados cat ETAPA 3 EXECUÇÃO DAS ANÁLISES PERGUNTA A PERGUNTA catIniciando a análise detalhada dos dados Pergunta 1 Satisfação dos clientes cat Análise da Pergunta 1 Satisfação dos Clientes tabelaopiniao dados countOpinião sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelaopiniao caption Frequência de Opinião dos Clientes windows printggplottabelaopiniao aesx reorderOpinião n y n fill Opinião geombarstat identity geomtextaeslabel paste0n Percentual vjust 05 labstitle Distribuição da Opinião dos Clientes x Opinião y Quantidade readlinepromptPressione Enter para continuar cat Pergunta 2 Principal região de destino cat Análise da Pergunta 2 Principal Região de Destino tabelaregiao dados countRegião sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelaregiao caption Frequência de Entregas por Região cat Pergunta 3 Distribuição por modalidade cat Análise da Pergunta 3 Distribuição por Modalidade tabelamodalidade dados countModalidade sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelamodalidade caption Frequência de Entregas por Modalidade cat Pergunta 4 Perfil do peso cat Análise da Pergunta 4 Perfil do Peso das Encomendas printkableasdataframetsummarydadosPeso caption Estatísticas Descritivas Peso kg catDesvio Padrão do Peso sddadosPeso windows histdadosPeso main Histograma de Distribuição do Peso xlab Peso kg ylab Frequência col lightblue border white readlinepromptPressione Enter para continuar cat Pergunta 5 Perfil do tempo cat Análise da Pergunta 5 Perfil do Tempo de Entrega printkableasdataframetsummarydadosTempo caption Estatísticas Descritivas Tempo h catDesvio Padrão do Tempo sddadosTempo windows histdadosTempo main Histograma de Distribuição do Tempo xlab Tempo h ylab Frequência col lightgreen border white readlinepromptPressione Enter para continuar cat Pergunta 6 Relação Modalidade x Região cat Análise da Pergunta 6 Relação Modalidade vs Região tabelamodreg tabledadosModalidade dadosRegião printchisqtesttabelamodreg cat Pergunta 7 Relação Modalidade x Opinião cat Análise da Pergunta 7 Relação Modalidade vs Opinião tabelamodop tabledadosModalidade dadosOpinião printchisqtesttabelamodop cat Pergunta 8 Relação Região x Opinião cat Análise da Pergunta 8 Relação Região vs Opinião tabelaregop tabledadosRegião dadosOpinião printchisqtesttabelaregop cat Pergunta 9 Relação Opinião x Tempo cat Análise da Pergunta 9 Relação Opinião vs Tempo testeanovatempoop aovTempo Opinião data dados printsummarytesteanovatempoop windows printggplotdados aesx Opinião y Tempo fill Opinião geomboxplot labstitle Distribuição do Tempo por Opinião readlinepromptPressione Enter para continuar cat Pergunta 10 Relação Região x Tempo cat Análise da Pergunta 10 Relação Região vs Tempo testeanovatemporeg aovTempo Região data dados printsummarytesteanovatemporeg windows printggplotdados aesx Região y Tempo fill Região geomboxplot labstitle Distribuição do Tempo por Região readlinepromptPressione Enter para continuar cat Pergunta 11 Relação Peso x Tempo cat Análise da Pergunta 11 Relação Peso vs Tempo testecorrpesotempo cortestdadosPeso dadosTempo printtestecorrpesotempo windows printggplotdados aesx Peso y Tempo geompointalpha 04 geomsmoothmethod lm col red labstitle Relação entre Peso e Tempo readlinepromptPressione Enter para continuar cat Pergunta 12 Meta de peso mínimo cat Análise da Pergunta 12 Meta de Peso Mínimo 800kg encomendasleves dados filterPeso 800 catNúmero de encomendas com menos de 800 kg nrowencomendasleves catPercentual do total roundnrowencomendasleves nrowdados 100 2 n Pergunta 13 Meta de tempo máximo cat Análise da Pergunta 13 Meta de Tempo Máximo 80h entregasatrasadas dados filterTempo 80 catNúmero de encomendas que excederam 80 horas nrowentregasatrasadas n catPercentual do total roundnrowentregasatrasadas nrowdados 100 2 n Pergunta 14 Meta de participação do modal rodoviário cat Análise da Pergunta 14 Meta de Participação do Rodoviário 40 distmodal dados countModalidade mutatePercentual roundn sumn 100 2 printkabledistmodal caption Distribuição de Operações por Modalidade cat Pergunta 15 Meta de satisfação por região cat Análise da Pergunta 15 Meta de Satisfação por Região 50 Positiva satisfacaoporregiao dados groupbyRegião summarise TotalAvaliacoes n AvaliacoesPositivas sumOpinião in cExcelente Bom PercentualPositivo roundAvaliacoesPositivas TotalAvaliacoes 100 2 arrangedescPercentualPositivo printkablesatisfacaoporregiao caption Percentual de Satisfação por Região cat cat cat Análise completa concluída com sucesso cat
4
Estatística 1
UFU
1
Estatística 1
UFU
5
Estatística 1
UFU
1
Estatística 1
UFU
1
Estatística 1
UFU
1
Estatística 1
UFU
20
Estatística 1
UFU
33
Estatística
UFU
1
Estatística 1
UFU
7
Estatística 1
UFU
Texto de pré-visualização
Trabalho Análise Estatísti O trabalho tem por objetivo a aplicação de técnicas estatísticas a um conjunto de dados fazendo uso de ferramentas computacionais na análise dos resultados O trabalho deve ser realizado em grupo de até 5 alunos e consistirá de análise de dados e apresentação de relatório Uma grande transportadora sediada em São PauloSP contratou seu grupo para avaliar suas práticas administrativas A empresa forneceu um banco de dados com os registros das suas últimas 5000 operações contendo as seguintes variáveis Peso da encomenda em kg Tempo gasto para levar a encomenda até o destino em horas Modalidade de transporte ferroviário aéreo rodoviário marítimofluvial ou multimodal dois ou mais dos tipos anteriores Região de destino norte nordeste centrooeste sul e sudeste Opinião do cliente sobre o serviço prestado excelente bom regular ruim péssimo Os administradores da transportadora estão interessados nas seguintes informações 1 Os clientes estão satisfeitos com os serviços prestados pela transportadora 2 Qual é a principal região de destino das operações da transportadora 3 Como está a distribuição das operações da empresa em termos de modalidade de transporte 4 Seria interessante ter informações análise estatística descritiva medidas resumo medidas de variabilidade gráfico de sua distribuição etc sobre o peso das encomendas transportadas 5 Seria também interessante ter informações análise estatística descritiva sobre o tempo gasto para transportar as encomendas 6 Será que existe relação entre a modalidade de transporte e região de destino da encomenda 7 Será que existe relação entre a modalidade de transporte e a opinião do cliente sobre o serviço prestado 8 Será que existe relação entre a região de destino e a opinião do cliente 9 Será que existe relação entre a opinião do cliente sobre o serviço e o tempo para entregar a encomenda 10 Será que existe relação entre a região de destino e o tempo para entregar a encomenda 11 Será que existe relação entre o peso da encomenda e o tempo para entregar a encomenda 12 Encomendas com menos de 800 kg não são do interesse da empresa não compensam os custos envolvidos Com base nos dados será que a empresa está atingindo este objetivo Se o objetivo não estiver sendo atingido o que poderia deveria ser feito sugerido para que ele seja atingido 13 Uma das principais preocupações da empresa é entregar as encomendas em no máximo 80 horas Será que este objetivo está sendo atingido Se o objetivo não estiver sendo atingido o que poderia deveria ser feito sugerido para que ele seja atingido 14 Para oferecer um serviço diferenciado a empresa quer concentrar no máximo 40 de suas operações em transporte rodoviário Este objetivo está sendo atingido Se o objetivo não estiver sendo atingindo o que poderia deveria ser feito sugerido para que ele seja atingido 15 Uma das diretrizes da empresa é conseguir pelo menos 50 de opiniões como excelente e bom para seus serviços em todas as regiões A empresa está conseguindo obter tal taxa Se o objetivo não estiver sendo atingindo o que poderia deveria ser feito sugerido para que ele seja atingido Com base no conjunto de dados Arquivo Transportadora em anexo escreva os resultados de seu trabalho O relatório deve ser claro objetivo e sucinto contendo no máximo 12 páginas Evite termos redundantes e comentários desnecessários Use gráficos e tabelas para representar os resultados veja as normas para confecção de gráficos e tabelas na Apostila de Estatística Descritiva Lembrese que os gráficos e as tabelas devem ser simples e claros O relatório técnico referente à análise de dados deve conter Introdução definição do problema motivação para o estudo do problema se couber objetivo que se pretende alcançar Materiais e métodos definição do conjunto de dados ferramentas e técnicas estatísticas utilizadas software usado etc Análise de dados e resultados gráficos tabelas interpretação dos resultados etc Observação todo gráfico e tabela colocado no texto deve ser referenciado e comentado Os gráficos e tabelas devem ser formatados de acordo com a Apostila de Estatística Descritiva Conclusão ou considerações finais Referências bibliográficas livros apostilas etc Consultados Apêndice se for o caso Layout de Impressão Títulos Editar Compartilha r Ler em Voz Alta Relatório Diagnóstico Completo de Operações e Metas Estratégicas Sumário Este relatório apresenta um diagnóstico aprofundado e integrado das operações da transportadora fundamentado na análise estatística de um robusto conjunto de dados de 5000 registros de entrega Constatase que a empresa não obstante sua escala enfrenta desafios estratégicos de grande magnitude evidenciados por um notável desalinhamento entre suas metas corporativas e sua performance operacional efetiva O estudo revela que a satisfação do cliente embora aparente ser heterogênea em uma avaliação superficial oculta uma severa crise na qualidade dos serviços em mercados regionais de suma importância As investigações estatísticas comprovam com elevado grau de confiança que tal insatisfação é uma decorrência direta de ineficiências operacionais notavelmente o tempo excessivo de entrega em determinadas rotas A organização falha em atingir quatro de suas cinco principais metas estratégicas que englobam tempo de entrega diversificação da matriz de transporte e de forma mais crítica o índice mínimo de satisfação em três de suas cinco regiões de atuação A identificação de uma forte correlação positiva entre o peso das encomendas e o tempo de trânsito adiciona uma camada de complexidade a ser endereçada no planejamento logístico Diante deste cenário a recomendação estratégica central e mais premente consiste na implementação de planos de ação focados na otimização de processos das regiões Norte CentroOeste e Sudeste com vistas à redução do tempo de entrega como principal vetor para a recuperação da satisfação do cliente e o consequente alinhamento aos objetivos globais da companhia 1 Introdução O presente documento oferece a mais completa análise das operações da transportadora realizada até o momento consolidando os resultados de quinze investigações analíticas sequenciais em um único relatório coeso O problema fulcral que motivou este estudo foi a percepção por parte da administração de um possível desalinhamento entre as metas estratégicas da empresa e seus resultados operacionais bem como a necessidade de uma compreensão aprofundada dos fatores que influenciam a satisfação do cliente O propósito fundamental deste trabalho é portanto fornecer um diagnóstico preciso e baseado em evidências que não apenas descreva o estado atual da operação mas que também elucide as relações de causa e efeito entre as variáveis logísticas e a performance do negócio Para a consecução de tal desiderato a análise propõese a responder a um conjunto detalhado de quinze perguntas que abrangem desde o perfil geral das operações até a avaliação rigorosa de indicadoreschave de desempenho KPIs culminando em recomendações estratégicas aptas a nortear a tomada de decisão futura 2 Materiais e Métodos O presente estudo foi conduzido a partir de uma abordagem quantitativa com a utilização de um conjunto de dados secundários fornecidos em formato de planilha eletrônica Microsoft Excel xlsx A base de dados consolidada continha um total de 5000 registros onde cada registro representava uma operação de entrega individual As variáveis de interesse para a análise contidas neste conjunto de dados foram definidas e classificadas da seguinte forma Região variável categórica nominal representando as cinco grandes regiões do Brasil Modalidade variável categórica nominal descrevendo o meio de transporte utilizado Opinião variável categórica ordinal capturando a satisfação do cliente em cinco níveis de Péssimo a Excelente Peso variável numérica contínua expressa em quilogramas e Tempo variável numérica contínua expressa em horas Toda a manipulação análise e visualização dos dados foram realizadas no ambiente computacional estatístico R em sua versão 4xx Para a execução das tarefas foram empregados pacotes especializados que estendem as funcionalidades básicas do software O pacote readxl foi utilizado para a importação inicial dos dados da planilha A subsequente manipulação limpeza e sumarização dos dados foram efetuadas de maneira eficiente com o auxílio do pacote dplyr uma ferramenta central do ecossistema Tidyverse A criação de todas as visualizações gráficas de alta qualidade como os histogramas gráficos de barras boxplots e gráficos de dispersão foi realizada através do pacote ggplot2 conhecido por sua gramática de gráficos flexível e poderosa O pacote knitr foi utilizado para a formatação de tabelas de forma clara e legível Os procedimentos analíticos foram estruturados em etapas sequenciais Inicialmente foi realizada uma análise estatística descritiva para caracterizar o perfil das variáveis e obter uma compreensão geral dos dados Posteriormente para investigar as relações entre as variáveis e responder às perguntas de negócio foram aplicadas técnicas de estatística inferencial A associação entre variáveis categóricas como Região e Opinião foi avaliada pelo Teste QuiQuadrado de Independência Para comparar as médias de uma variável contínua entre diferentes grupos categóricos como o Tempo de entrega por Região foi empregada a Análise de Variância ANOVA A relação linear entre as duas variáveis contínuas Peso e Tempo foi quantificada e testada através do Teste de Correlação de Pearson Para todos os testes de hipóteses foi adotado um nível de significância alfa de 005 sendo este o limiar para a rejeição da hipótese nula 3 Análise de Dados e Resultados Nesta seção os resultados de cada uma das quinze investigações analíticas são apresentados individualmente detalhando a metodologia o código R utilizado os dados observados e a interpretação aprofundada de cada achado Pergunta 1 Os clientes estão satisfeitos com os serviços prestados pela transportadora Código para gerar a tabela de frequência e o gráfico de barras da Opinião tabelaopiniao dados countOpinião sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelaopiniao caption Frequência de Opinião dos Clientes Gera o gráfico em uma nova janela windows print ggplottabelaopiniao aesx reorderOpinião n y n fill Opinião geombarstat identity geomtextaeslabel paste0n Percentual vjust 05 labstitle Distribuição da Opinião dos Clientes x Opinião y Quantidade thememinimal readlinepromptO gráfico foi gerado Pressione Enter no console para continuar Para responder a esta questão foi realizada uma análise de frequência sobre as 5000 avaliações de serviço contidas no conjunto de dados Os resultados quantitativos revelaram a seguinte distribuição 1718 avaliações 3436 foram classificadas como Bom 1349 2698 como Ruim 792 1584 como Regular 575 1150 como Péssimo e 566 1132 como Excelente A interpretação destes números evidencia uma polarização no sentimento dos clientes Embora Bom seja a categoria mais frequente a soma das avaliações explicitamente negativas Ruim e Péssimo alcança 3848 um volume substancial que se aproxima do total de avaliações positivas Excelente e Bom combinadas que é de 4568 Este cenário denota uma experiência de serviço inconsistente e um risco considerável à retenção de clientes e à reputação da marca A visualização desta acentuada divisão é fundamental para a compreensão do problema Fonte Próprio Autor 2025 Pergunta 2 Qual é a principal região de destino das operações da transportadora Código para gerar a tabela de frequência das Regiões tabelaregiao dados countRegião sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelaregiao caption Frequência de Entregas por Região A metodologia utilizada foi uma análise de frequência das entregas por região A contagem revelou que as operações estão primariamente concentradas na Região Sudeste com 1576 entregas representando 3152 do total A Região Sul figura como o segundo maior mercado com 1246 operações 2492 Juntas estas duas regiões somam mais de 56 de todo o volume de negócios As demais regiões CentroOeste 1720 Nordeste 1608 e Norte 1028 completam a distribuição A interpretação destes dados indica um foco geográfico claro o que pode gerar eficiências de escala mas também concentra o risco operacional no eixo Sul Sudeste Pergunta 3 Como está a distribuição das operações em termos de modalidade de transporte Código para gerar a tabela de frequência das Modalidades tabelamodalidade dados countModalidade sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelamodalidade caption Frequência de Entregas por Modalidade Através de uma análise de frequência a distribuição das 5000 operações por modalidade foi quantificada O modal Rodoviário demonstrou ser predominante respondendo por 2555 operações ou 5110 do total O modal Aéreo é o segundo mais utilizado com 901 operações 1802 seguido pelo Marítimofluvial com 731 operações 1462 A forte dependência do modal rodoviário superando a metade de todas as operações representa um risco estratégico significativo expondo a empresa aulnerabilidades intrínsecas a este setor como flutuações de custos e instabilidades logísticas Pergunta 4 Qual o perfil do peso das encomendas transportadas Código para gerar as estatísticas descritivas e o histograma do Peso pesostats asdataframetsummarydadosPeso printkablepesostats caption Estatísticas Descritivas Peso kg catDesvio Padrão do Peso sddadosPeso Gera o gráfico em uma nova janela windows histdadosPeso main Histograma de Distribuição do Peso xlab Peso kg ylab Frequência col lightblue border white readlinepromptO gráfico foi gerado Pressione Enter no console para continuar Foi conduzida uma análise de estatística descritiva sobre a variável Peso Os resultados indicam que a operação lida com cargas pesadas e de perfil notavelmente homogêneo O peso médio observado foi de 10005 kg com uma mediana de 10010 kg e um desvio padrão de 998 kg A proximidade entre média e mediana confirma uma distribuição simétrica sem valores extremos que distorçam a tendência central A faixa de operação vai de um mínimo de 649 kg a um máximo de 1375 kg A previsibilidade do perfil de carga constitui um ponto forte da operação como pode ser visualizado no histograma de distribuição Fonte Próprio Autor 2025 Pergunta 5 Qual o perfil do tempo gasto para transportar as encomendas Código para gerar as estatísticas descritivas e o histograma do Tempo tempostats asdataframetsummarydadosTempo printkabletempostats caption Estatísticas Descritivas Tempo h catDesvio Padrão do Tempo sddadosTempo Gera o gráfico em uma nova janela windows histdadosTempo main Histograma de Distribuição do Tempo xlab Tempo h ylab Frequência col lightgreen border white readlinepromptO gráfico foi gerado Pressione Enter no console para continuar Utilizando a mesma metodologia de estatística descritiva para a variável Tempo a análise revelou uma operação consistente em seus prazos em cenários normais O tempo médio de entrega foi de 718 horas com uma mediana quase idêntica de 719 horas e um baixo desvio padrão de 99 horas Este resultado sugere alta previsibilidade No entanto o tempo máximo registrado de 1125 horas é um outlier importante indicando que embora consistente a operação não se mostra imune a falhas que resultam em atrasos significativos O histograma correspondente ilustra a forte concentração dos tempos de entrega Fonte Próprio Autor 2025 Pergunta 6 Será que existe relação entre a modalidade de transporte e a região de destino da encomenda Código para gerar a tabela de contingência e o teste QuiQuadrado tabelamodreg tabledadosModalidade dadosRegião testequimodreg chisqtesttabelamodreg printtestequimodreg Para investigar a associação entre estas duas variáveis categóricas foi aplicado o Teste QuiQuadrado de Independência O resultado do teste foi estatisticamente significativo χ²16 76208 p 0001 indicando que a escolha da modalidade não é aleatória mas sim dependente da região de destino Isso sugere que a empresa emprega uma estratégia logística adaptada utilizando modais mais apropriados para cada contexto geográfico como uma maior utilização do modal fluvial na região Norte Pergunta 7 Será que existe relação entre a modalidade de transporte e a opinião do cliente sobre o serviço prestado Código para gerar a tabela de contingência e o teste QuiQuadrado tabelamodop tabledadosModalidade dadosOpinião testequimodop chisqtesttabelamodop printtestequimodop Novamente o Teste QuiQuadrado foi utilizado e o resultado foi altamente significativo χ²16 14531 p 0001 A conclusão é que a modalidade de transporte tem um impacto direto e profundo na satisfação do cliente A análise das frequências observadas demonstra que os modais Aéreo e Ferroviário estão associados a uma qualidade de serviço percebida muito superior enquanto as operações Marítimofluvial e Multimodal constituem as principais fontes de atrito e avaliações desfavoráveis Pergunta 8 Será que existe relação entre a região de destino e a opinião do cliente Código para gerar a tabela de contingência e o teste QuiQuadrado tabelaregop tabledadosRegião dadosOpinião testequiregop chisqtesttabelaregop printtestequiregop A aplicação do Teste QuiQuadrado nesta questão produziu um resultado extremamente significativo χ²16 18482 p 0001 comprovando que a experiência do cliente não é uniforme em todo o Brasil A disparidade regional é acentuada com as regiões Nordeste e Sul apresentando uma performance de satisfação muito superior em comparação com a experiência predominantemente negativa observada nas regiões Norte CentroOeste e Sudeste Pergunta 9 Será que existe relação entre a opinião do cliente sobre o serviço e o tempo para entregar a encomenda Código para realizar o teste ANOVA e gerar o boxplot testeanovatempoop aovTempo Opinião data dados summarytesteanovatempoop Gera o gráfico em uma nova janela windows print ggplotdados aesx Opinião y Tempo fill Opinião geomboxplot labstitle Distribuição do Tempo de Entrega por Opinião do Cliente y Tempo h thememinimal readlinepromptO gráfico foi gerado Pressione Enter no console para continuar Para comparar a média da variável contínua Tempo entre os diferentes grupos de Opinião foi utilizada a Análise de Variância ANOVA O resultado foi conclusivo e de altíssima significância F4 4995 3777 p 0001 Esta constatação representa um dos achados centrais do estudo o tempo de entrega constitui um dos principais vetores da satisfação do cliente Os tempos médios de entrega para avaliações Excelente e Bom são estatisticamente mais baixos do que para as avaliações Regular Ruim e Péssimo A visualização desta relação é crucial Fonte Próprio Autor 2025 Este gráfico gerado pelo código R correspondente é essencial pois deve mostrar cinco caixas uma para cada nível de opinião que ilustram um padrão claro as caixas se tornam progressivamente mais altas indicando tempos maiores à medida que a avaliação do cliente piora Pergunta 10 Será que existe relação entre a região de destino e o tempo para entregar a encomenda Código para realizar o teste ANOVA e gerar o boxplot testeanovatemporeg aovTempo Região data dados summarytesteanovatemporeg Gera o gráfico em uma nova janela windows print ggplotdados aesx Região y Tempo fill Região geomboxplot labstitle Distribuição do Tempo de Entrega por Região y Tempo h thememinimal readlinepromptO gráfico foi gerado Pressione Enter no console para continuar A mesma técnica de ANOVA foi aplicada para comparar o tempo médio de entrega entre as cinco regiões O teste confirmou com alta significância F4 4995 3514 p 0001 que a performance logística não é homogênea em todo o território Ao conectar este resultado com o da pergunta anterior o diagnóstico é corroborado as regiões com os piores índices de satisfação são de fato aquelas onde a empresa opera de forma mais lenta O gráfico de boxplot regional expõe essa diferença de performance de forma inequívoca Fonte Próprio Autor 2025 Este gráfico gerado pelo código R correspondente deve comparar visualmente os tempos de entrega nas cinco regiões mostrando distribuições visivelmente mais altas e dispersas para as regiões Norte e CentroOeste em comparação com as demais Pergunta 11 Será que existe relação entre o peso da encomenda e o tempo para entregar a encomenda Código para realizar o teste de correlação e gerar o gráfico de dispersão testecorrpesotempo cortestdadosPeso dadosTempo printtestecorrpesotempo Gera o gráfico em uma nova janela windows print ggplotdados aesx Peso y Tempo geompointalpha 04 geomsmoothmethod lm col red labstitle Relação entre Peso da Encomenda e Tempo de Entrega x Peso kg y Tempo h thememinimal readlinepromptO gráfico foi gerado Pressione Enter no console para continuar A relação entre estas duas variáveis contínuas foi investigada pelo Teste de Correlação de Pearson O resultado foi um coeficiente de correlação r de 070 com um pvalor virtualmente zero p 0001 indicando uma correlação positiva forte e estatisticamente significativa A interpretação dos resultados indica que encomendas mais pesadas sistematicamente levam mais tempo para serem entregues Esta regra operacional deve ser integrada ao planejamento logístico para evitar falhas em Acordos de Nível de Serviço SLAs A tendência linear é perfeitamente visível no gráfico de dispersão Fonte Próprio Autor 2025 Este gráfico gerado pelo código R correspondente é a prova visual desta relação mostrando uma nuvem de pontos que se inclina claramente para cima e para a direita com a linha de tendência confirmando o padrão positivo Pergunta 12 A empresa está atingindo o objetivo de não ter encomendas com menos de 800 kg Código para verificar a meta de peso mínimo encomendasleves dados filterPeso 800 numleves nrowencomendasleves percentualleves roundnumleves nrowdados 100 2 catNúmero de encomendas com menos de 800 kg numleves catPercentual do total percentualleves A metodologia consistiu em filtrar e contar o número de registros onde a variável Peso era inferior a 800 A análise identificou 97 operações ou 194 do total que violam esta diretriz Portanto a meta não está sendo atingida Embora o percentual seja baixo ele representa uma falha processual e uma perda de receita potencial pois essas cargas podem não compensar os custos fixos da operação Pergunta 13 A empresa está cumprindo a meta de entregar em no máximo 80 horas Código para verificar a meta de tempo máximo entregasatrasadas dados filterTempo 80 numatrasadas nrowentregasatrasadas percentualatrasadas roundnumatrasadas nrowdados 100 2 catNúmero de encomendas que excederam 80 horas numatrasadas catPercentual do total percentualatrasadas Através da filtragem e contagem dos registros onde o Tempo excedia 80 horas constatouse que a meta não está sendo cumprida de forma consistente Um total de 1027 entregas o que corresponde a 2054 da amostragem ultrapassou o prazo máximo definido Este volume expressivo de atrasos afetando um em cada cinco clientes constitui um fator crítico que impacta diretamente a satisfação Pergunta 14 A empresa está atingindo a meta de usar o transporte rodoviário em no máximo 40 das operações Código para verificar a meta de participação do modal rodoviário distmodal dados countModalidade mutatePercentual roundn sumn 100 2 percentualrodoviario distmodal filterModalidade Rodoviário pullPercentual printkabledistmodal caption Distribuição de Operações por Modalidade Uma análise de frequência da variável Modalidade foi realizada para verificar este KPI O resultado demonstrou que o modal Rodoviário representa 511 do total das operações Portanto a meta estratégica de diversificação da matriz logística que visava limitar essa dependência a 40 não está sendo atingida com um excedente de 111 pontos percentuais Pergunta 15 A empresa está conseguindo 50 de opiniões Excelente ou Bom em todas as regiões Código para verificar a meta de satisfação por região satisfacaoporregiao dados groupbyRegião summarise TotalAvaliacoes n AvaliacoesPositivas sumOpinião in cExcelente Bom PercentualPositivo roundAvaliacoesPositivas TotalAvaliacoes 100 2 arrangedescPercentualPositivo printkablesatisfacaoporregiao caption Percentual de Satisfação por Região Para avaliar esta meta complexa os dados foram agrupados por Região e foi calculado o percentual de avaliações positivas Excelente Bom para cada uma A análise revelou que a meta não está sendo atingida na maioria dos mercados Apenas as regiões Nordeste 838 e Sul 617 cumprem o objetivo As regiões Sudeste 390 CentroOeste 213 e de forma mais alarmante a região Norte apenas 84 estão significativamente abaixo do mínimo de 50 de satisfação 4 Conclusão e Recomendações Estratégicas A análise integrada e aprofundada dos dados posiciona a empresa em uma encruzilhada estratégica Por um lado possui operações de grande escala e previsíveis em cenários ideais Por outro sofre de ineficiências operacionais localizadas que causam um impacto devastador e em cascata sobre o cumprimento de metas e mais importante sobre a percepção de valor pelo cliente A estratégia definida pela administração não está sendo refletida na execução do dia a dia Para reverter este quadro e realinhar a operação aos seus objetivos recomendase um plano de ação focado e sequencial A prioridade absoluta e imediata deve ser a criação de uma forçatarefa de Recuperação Regional com autonomia e recursos para intervir nas operações das regiões Norte CentroOeste e Sudeste O mandato exclusivo desta equipe deve ser o diagnóstico em campo e a execução de um plano de ação de 90 dias focado obsessivamente na redução do tempo de ciclo das entregas Esta é a ação de maior alavancagem pois incide diretamente sobre a causaraiz da insatisfação do cliente e por consequência endereça o cumprimento de múltiplas metas simultaneamente A médio prazo a empresa deve empreender um redesenho estratégico de sua oferta de serviço e de sua matriz logística Isso envolve abandonar o modelo de prazo único e implementar SLAs inteligentes que considerem as variáveis de região e peso para fornecer estimativas realistas aos clientes Em paralelo uma nova política comercial deve ser criada para ativamente incentivar o uso de modais de melhor performance como o Aéreo e o Ferroviário transformandoos em produtos premium e alinhando os interesses comerciais com a busca por maior qualidade e o cumprimento da meta de diversificação Finalmente como ação fundamental e contínua a cultura da empresa deve evoluir para uma gestão orientada por dados Este relatório não deve ser um evento isolado mas o protótipo de uma ferramenta de gestão contínua A implementação de dashboards acessíveis aos gestores monitorando em tempo real os KPIs aqui discutidos permitirá a identificação de desvios no momento em que ocorrem habilitando uma gestão proativa e prevenindo que desafios operacionais se transformem em crises estratégicas como a que foi identificada neste estudo Referências Bibliográficas A metodologia estatística e as ferramentas computacionais empregadas neste trabalho são fundamentadas em literatura e documentação consolidadas na área As principais fontes que serviram de base para a condução da análise bem como as citações formais para o software utilizado incluem publicações de referência em estatística e ciência de dados A seguir são listadas as principais referências consultadas e pertinentes a este estudo Morettin P A Bussab W O 2017 Estatística Básica 10ª ed São Paulo Saraiva Educação Wickham H 2016 ggplot2 Elegant Graphics for Data Analysis SpringerVerlag New York Wickham H François R Henry L Müller K 2023 dplyr A Grammar of Data Manipulation R package version 112 R Core Team 2023 R A Language and Environment for Statistical Computing R Foundation for Statistical Computing Vienna Austria 6 Apêndice Com o intuito de garantir a total transparência reprodutibilidade e possibilidade de auditoria dos resultados apresentados neste relatório os materiais suplementares relevantes são fornecidos a seguir Esta seção contém os recursos computacionais completos que foram desenvolvidos e utilizados para realizar todas as análises descritas no capítulo de Materiais e Métodos e cujos resultados foram discutidos ao longo do trabalho Apêndice A Script R Completo para Análise Neste apêndice é apresentado na íntegra o códigofonte escrito na linguagem R O script está consolidado e estruturado para realizar todas as análises em uma única execução desde o carregamento das bibliotecas e importação dos dados até a execução de cada um dos testes estatísticos e a geração de todas as figuras e tabelas contidas neste documento ANÁLISE COMPLETA DE DADOS E METAS DA TRANSPORTADORA VERSÃO FINAL E INTEGRADA ETAPA 1 CONFIGURAÇÃO DO AMBIENTE catIniciando o script de análise completa catVerificando e carregando bibliotecas necessárias Lista de pacotes necessários para a análise pacotes creadxl dplyr ggplot2 knitr Verifica quais pacotes não estão instalados instalar pacotespacotes in installedpackages Package Instala os pacotes que estiverem faltando iflengthinstalar catInstalando os seguintes pacotes necessários instalar installpackagesinstalar Carrega todos os pacotes necessários libraryreadxl librarydplyr libraryggplot2 libraryknitr catBibliotecas carregadas com sucesso cat ETAPA 2 LEITURA E CARREGAMENTO DOS DADOS catLendo o arquivo de dados da transportadora caminho DadosTransportadora3a34b0578a6e182134509c49a5d659adxlsx if fileexistscaminho stopERRO O arquivo caminho não foi encontrado Verifique o caminho e o nome do arquivo dados readexcelcaminho sheet Plan1 catArquivo lido com sucesso Total de registros nrowdados cat ETAPA 3 EXECUÇÃO DAS ANÁLISES PERGUNTA A PERGUNTA catIniciando a análise detalhada dos dados Pergunta 1 Satisfação dos clientes cat Análise da Pergunta 1 Satisfação dos Clientes tabelaopiniao dados countOpinião sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelaopiniao caption Frequência de Opinião dos Clientes windows printggplottabelaopiniao aesx reorderOpinião n y n fill Opinião geombarstat identity geomtextaeslabel paste0n Percentual vjust 05 labstitle Distribuição da Opinião dos Clientes x Opinião y Quantidade readlinepromptPressione Enter para continuar cat Pergunta 2 Principal região de destino cat Análise da Pergunta 2 Principal Região de Destino tabelaregiao dados countRegião sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelaregiao caption Frequência de Entregas por Região cat Pergunta 3 Distribuição por modalidade cat Análise da Pergunta 3 Distribuição por Modalidade tabelamodalidade dados countModalidade sort TRUE mutatePercentual roundn sumn 100 2 printkabletabelamodalidade caption Frequência de Entregas por Modalidade cat Pergunta 4 Perfil do peso cat Análise da Pergunta 4 Perfil do Peso das Encomendas printkableasdataframetsummarydadosPeso caption Estatísticas Descritivas Peso kg catDesvio Padrão do Peso sddadosPeso windows histdadosPeso main Histograma de Distribuição do Peso xlab Peso kg ylab Frequência col lightblue border white readlinepromptPressione Enter para continuar cat Pergunta 5 Perfil do tempo cat Análise da Pergunta 5 Perfil do Tempo de Entrega printkableasdataframetsummarydadosTempo caption Estatísticas Descritivas Tempo h catDesvio Padrão do Tempo sddadosTempo windows histdadosTempo main Histograma de Distribuição do Tempo xlab Tempo h ylab Frequência col lightgreen border white readlinepromptPressione Enter para continuar cat Pergunta 6 Relação Modalidade x Região cat Análise da Pergunta 6 Relação Modalidade vs Região tabelamodreg tabledadosModalidade dadosRegião printchisqtesttabelamodreg cat Pergunta 7 Relação Modalidade x Opinião cat Análise da Pergunta 7 Relação Modalidade vs Opinião tabelamodop tabledadosModalidade dadosOpinião printchisqtesttabelamodop cat Pergunta 8 Relação Região x Opinião cat Análise da Pergunta 8 Relação Região vs Opinião tabelaregop tabledadosRegião dadosOpinião printchisqtesttabelaregop cat Pergunta 9 Relação Opinião x Tempo cat Análise da Pergunta 9 Relação Opinião vs Tempo testeanovatempoop aovTempo Opinião data dados printsummarytesteanovatempoop windows printggplotdados aesx Opinião y Tempo fill Opinião geomboxplot labstitle Distribuição do Tempo por Opinião readlinepromptPressione Enter para continuar cat Pergunta 10 Relação Região x Tempo cat Análise da Pergunta 10 Relação Região vs Tempo testeanovatemporeg aovTempo Região data dados printsummarytesteanovatemporeg windows printggplotdados aesx Região y Tempo fill Região geomboxplot labstitle Distribuição do Tempo por Região readlinepromptPressione Enter para continuar cat Pergunta 11 Relação Peso x Tempo cat Análise da Pergunta 11 Relação Peso vs Tempo testecorrpesotempo cortestdadosPeso dadosTempo printtestecorrpesotempo windows printggplotdados aesx Peso y Tempo geompointalpha 04 geomsmoothmethod lm col red labstitle Relação entre Peso e Tempo readlinepromptPressione Enter para continuar cat Pergunta 12 Meta de peso mínimo cat Análise da Pergunta 12 Meta de Peso Mínimo 800kg encomendasleves dados filterPeso 800 catNúmero de encomendas com menos de 800 kg nrowencomendasleves catPercentual do total roundnrowencomendasleves nrowdados 100 2 n Pergunta 13 Meta de tempo máximo cat Análise da Pergunta 13 Meta de Tempo Máximo 80h entregasatrasadas dados filterTempo 80 catNúmero de encomendas que excederam 80 horas nrowentregasatrasadas n catPercentual do total roundnrowentregasatrasadas nrowdados 100 2 n Pergunta 14 Meta de participação do modal rodoviário cat Análise da Pergunta 14 Meta de Participação do Rodoviário 40 distmodal dados countModalidade mutatePercentual roundn sumn 100 2 printkabledistmodal caption Distribuição de Operações por Modalidade cat Pergunta 15 Meta de satisfação por região cat Análise da Pergunta 15 Meta de Satisfação por Região 50 Positiva satisfacaoporregiao dados groupbyRegião summarise TotalAvaliacoes n AvaliacoesPositivas sumOpinião in cExcelente Bom PercentualPositivo roundAvaliacoesPositivas TotalAvaliacoes 100 2 arrangedescPercentualPositivo printkablesatisfacaoporregiao caption Percentual de Satisfação por Região cat cat cat Análise completa concluída com sucesso cat