6
Estatística 1
PUC
6
Estatística 1
PUC
6
Estatística 1
PUC
12
Estatística 1
PUC
1
Estatística 1
PUC
6
Estatística 1
PUC
22
Estatística 1
PUC
1
Estatística 1
PUC
7
Estatística 1
UFOP
Texto de pré-visualização
ESTATÍSTICA E ANÁLISE DE DADOS 2º SEM 2025 Professores Alexandre Monteiro Andrea Hamazaki Bia Leite Cintia Scrich Thais Borges PROJETO 2 SPRINT 1 No Projeto 2 utilizaremos as ferramentas da Inferência Estatística para análise de dados e tomada de decisão O texto abaixo descreve os critérios que serão avaliados na Sprint 1 a partir de dados distribuídos normalmente Os trechos destacados em azul referemse às informações específicas relacionadas à situação considerada e que deverão ser adequadosadaptados de acordo com os dados fornecidos para cada grupo A Empresa Grande Rede realiza vendas pela internet e verificou que muitos pedidos não são finalizados Ou seja o cliente inicia o processo de preenchimento do formulário mas não o envia e desse modo a compra não é efetuada Quando o preenchimento do formulário é iniciado mas não finalizado o departamento de vendas realiza uma pesquisa com o cliente para tentar identificar qual foi o motivo da não efetivação da compra Dentre os motivos apresentados destacouse a alegação de que o tempo necessário para o preenchimento do formulário é muito extenso Pesquisas apontam que grande parte dos clientes desiste da compra quando estão conectados entre 10 e 15 minutos Mediante essas informações o departamento de vendas coletou o tempo gasto para o preenchimento do formulário Os dados estão disponíveis na Planilha 1 Com base nas informações acima pedese Critério 1 05 ponto Represente graficamente os dados da Planilha 1 histograma e boxplot Critério 205 ponto Obtenha a média e desvio padrão para a variável considerada OBS No exemplo acima estamos encontrando a média e o desvio para o tempo gasto no preenchimento do formulário da Empresa Grande Rede Critério 3075 ponto Usando os testes de normalidade abordados em aula verifique se a distribuição é normal Critério 4075 ponto Encontre a probabilidade de estar compreendido no intervalo ab e contextualize o resultado Considere os valores de a e b baseados em valores de referência do problema estudado Em caso de dúvidas sobre os valores 𝑎 e 𝑏 escolhidos pelo grupo consulte o docente nas aulas de mentoria do projeto OBS No exemplo acima estamos encontrando a quantidade de clientes que levam entre 10 e 15 minutos para finalizar o preenchimento do formulário Critério 5 075 ponto Determine o valor máximo para que uma observação esteja entre as 20 menores e o valor mínimo para que uma observação esteja entre as 30 maiores Contextualize os valores encontrados de acordo com os dados da planilha OBS No exemplo acima encontramos o tempo máximo gasto no preenchimento do formulário para os 20 clientes que mais rapidamente finalizaram a compra e o tempo mínimo para os 30 clientes que levaram mais tempo para finalizar a compra Critério 6 Com base na variável considerada esboce um breve texto que descreva uma situação apresentando um objetivo uma pergunta que envolva uma tomada de decisão Essa situação deve prever alguma ação que possa ser avaliada mediante uma nova coleta de dados e possibilite a comparação dos dois cenários antes e depois da ação O objetivo deve estar devidamente explicitado veja trecho em negrito no texto ilustrativo abaixo Após a realização da ação nova coleta foi feita e os dados referentes a uma amostra aleatória de tamanho 100 estão apresentados na Planilha 2 Critério 61 Formulação da questão 20 pontos Preocupado com a queda nas vendas o CEO solicitou que o Departamento de Marketing Digital realizasse um estudo para estabelecer qual o tempo máximo aceitável pelo cliente para preencher um formulário de compras O estudo realizado pelo Gerente de Tráfego revelou que usualmente um cliente considera razoável permanecer no site para preencher o formulário e finalizar a compra se todo o processo for finalizado idealmente em até 5 minutos No entanto considerando a relevância da compra tolerase um tempo de até 12 minutos Frequentemente se o tempo extrapolar esse limite de 5 minutos o cliente tende a desistir da compra Com base nessas informações a empresa decidiu reformular as perguntas e o modelo do formulário com o objetivo de reduzir o tempo necessário para o preenchimento do mesmo Após essa intervenção novo levantamento com 100 clientes forneceu os dados na Planilha 2 Neste caso Situação queda nas vendas e pesquisa do Departamento de Marketing Ação Alteração do formulário Objetivo reduzir o tempo necessário para o preenchimento do formulário Critério 62 05 ponto Represente graficamente os dados da Planilha 2 histograma e boxplot Critério 63 05 ponto Considerando a Planilha 2 obtenha a média e desvio padrão para a variável analisada Critério 64 075 ponto Baseado no objetivo proposto escolha um intervalo adequado que possa auxiliar a análise dos dados enuncie a pergunta e calcule a quantidade de dados no mesmo OBS Para o exemplo acima Encontre a quantidade clientes que levam entre 5 e 12 minutos para preencher e finalizar o formulário Critério 7 2 pontos Comparando os resultados obtidos A inferência estatística fornece ferramentas robustas que permitem analisar os dados e a tomar decisões Esse assunto será tratado posteriormente e explorado na próxima sprint Antes de utilizarmos essas ferramentas podemos fazer uma análise preliminar observando os resultados Com base neste estudo formule uma pergunta que reflita a investigação sobre a existência de indícios que sugiram uma mudança estatística significativa entre os dados originais Planilha 1 e da amostra Planilha 2 No exemplo considerado Com base neste estudo há indícios para supor que a modificação no formulário foi eficiente Estabeleça dois critérios que possibilitem uma comparação preliminar e que justifiquem sua resposta No exemplo considerado Critério 1 Comparação entre as proporções de clientes que levaram até 5 minutos para preencher o formulário Este foi o valor do tempo máximo indicado como ideal Critério 2 Comparação entre as proporções de clientes que levaram entre 5 e 12 minutos que são os tempos indicados como ideal e tolerável respectivamente Qualidade da entrega 10 ponto vide rubricas ESTATÍSTICA E ANÁLISE DE DADOS 2º SEM 2025 Professores Alexandre Monteiro Andrea Hamazaki Bia Leite Cintia Scrich Thais Borges EXPLORANDO A DISTRIBUIÇÃO NORMAL PYTHON Carregamento do arquivo do Excel No lado esquerdo clicar em arquivos e depois na seta para fazer o upload Após baixar o arquivo o nome será exibido 1 Importando as bibliotecas do Python 2 Leitura do arquivo de dados Para utilizar o notebook com os seus dados é necessário alterar o nome do arquivo do Excel conforme ilustrado abaixo Após digitar o nome do seu arquivo o notebook armazena os dados na variável arquivo e todos os comandos serão executados com os dados do seu arquivo Defina também a variável coluna especificando qual o nome dado na planilha para a variável que será analisada 3 Armazenamento dos dados Leitura e armazenamento dos dados no python é necessário definir uma variável para armazenar os dados do arquivo no exemplo escolhemos df Ao digitar df na linha seguinte a tabela armazenada é exibida 4 Gerar o histograma e o boxplot para variável contínua 41 Representação do histograma com a curva normal Para montar o histograma basta fazer 42 Boxplot 5 Cálculo da Média Mediana e do Desvio Padrão Veja os comandos necessários nos notebooks já disponibilizados no Projeto 1 6 Testes de Normalidade 61 Análise do Histograma 611 Comparar média e mediana 612 Calcular a proporção de dados nos intervalos 𝜇 𝜎 𝜇 𝜎 𝜇 2𝜎 𝜇 2𝜎 e 𝜇 3𝜎 𝜇 3𝜎 Definindo os limites de cada intervalo Calculando a quantidade de dados em cada intervalo Calculando a proporção de dados em cada intervalo 62 Análise do Boxplot Verificar a simetria 𝑀𝑒𝑑 𝑄1 𝑄3 𝑀𝑒𝑑 Utilizar os comandos já apresentados nos notebooks disponibilizados para o Projeto 1 63 Gráfico QQ 7 Calculando a Probabilidade em Intervalos Comandos para calcular a probabilidade da variável com distribuição normal assumir valores num intervalo Nos comandos abaixo locmédia e scaledesvio padrão Tempo de resposta de um sensor biomédico Tempo de resposta em segundos de um sensor de glicose implantável até estabilizar a leitura após o contato com o fluido intersticial Essa medida é essencial para avaliar o desempenho do dispositivo e sua adequação para monitoramento contínuo Projeto 2 Sprint 1 Introdução A empresa observou desistências no preenchimento do formulário de compras identificando o tempo excessivo de preenchimento como fator relevante O objetivo deste relatório é analisar os tempos de preenchimento antes e após uma intervenção utilizando ferramentas de Inferência Estatística Critério 1 Representação Gráfica Planilha 1 Critério 2 Média e Desvio Padrão Planilha 1 Média 849 Desvio Padrão 136 n 300 Critério 3 Teste de Normalidade ShapiroWilk p 03056 DAgostino K² p 00823 Critério 4 Probabilidade no intervalo 10 15 Proporção empírica 01100 Probabilidade modelo Normal 01335 Critério 5 Percentis 20 mais rápidos 736 min 30 mais lentos 916 min Critério 6 Situação Ação e Objetivo A empresa modificou o formulário visando reduzir o tempo de preenchimento Critério 63 Média e Desvio Padrão Planilha 2 Média 804 Desvio Padrão 156 n 100 Critério 64 Intervalo 5 12 Proporção empírica 09800 Probabilidade modelo Normal 09682 Critério 7 Comparação e Interpretação A média diminuiu de 849 para 804 indicando uma redução no tempo após a intervenção Além disso a proporção de preenchimentos dentro do intervalo ideal aumentou Estes resultados sugerem que a modificação do formulário foi potencialmente eficaz Conclusão Com base nos resultados há evidências preliminares de que a intervenção contribuiu para reduzir o tempo de preenchimento melhorando a experiência do cliente
6
Estatística 1
PUC
6
Estatística 1
PUC
6
Estatística 1
PUC
12
Estatística 1
PUC
1
Estatística 1
PUC
6
Estatística 1
PUC
22
Estatística 1
PUC
1
Estatística 1
PUC
7
Estatística 1
UFOP
Texto de pré-visualização
ESTATÍSTICA E ANÁLISE DE DADOS 2º SEM 2025 Professores Alexandre Monteiro Andrea Hamazaki Bia Leite Cintia Scrich Thais Borges PROJETO 2 SPRINT 1 No Projeto 2 utilizaremos as ferramentas da Inferência Estatística para análise de dados e tomada de decisão O texto abaixo descreve os critérios que serão avaliados na Sprint 1 a partir de dados distribuídos normalmente Os trechos destacados em azul referemse às informações específicas relacionadas à situação considerada e que deverão ser adequadosadaptados de acordo com os dados fornecidos para cada grupo A Empresa Grande Rede realiza vendas pela internet e verificou que muitos pedidos não são finalizados Ou seja o cliente inicia o processo de preenchimento do formulário mas não o envia e desse modo a compra não é efetuada Quando o preenchimento do formulário é iniciado mas não finalizado o departamento de vendas realiza uma pesquisa com o cliente para tentar identificar qual foi o motivo da não efetivação da compra Dentre os motivos apresentados destacouse a alegação de que o tempo necessário para o preenchimento do formulário é muito extenso Pesquisas apontam que grande parte dos clientes desiste da compra quando estão conectados entre 10 e 15 minutos Mediante essas informações o departamento de vendas coletou o tempo gasto para o preenchimento do formulário Os dados estão disponíveis na Planilha 1 Com base nas informações acima pedese Critério 1 05 ponto Represente graficamente os dados da Planilha 1 histograma e boxplot Critério 205 ponto Obtenha a média e desvio padrão para a variável considerada OBS No exemplo acima estamos encontrando a média e o desvio para o tempo gasto no preenchimento do formulário da Empresa Grande Rede Critério 3075 ponto Usando os testes de normalidade abordados em aula verifique se a distribuição é normal Critério 4075 ponto Encontre a probabilidade de estar compreendido no intervalo ab e contextualize o resultado Considere os valores de a e b baseados em valores de referência do problema estudado Em caso de dúvidas sobre os valores 𝑎 e 𝑏 escolhidos pelo grupo consulte o docente nas aulas de mentoria do projeto OBS No exemplo acima estamos encontrando a quantidade de clientes que levam entre 10 e 15 minutos para finalizar o preenchimento do formulário Critério 5 075 ponto Determine o valor máximo para que uma observação esteja entre as 20 menores e o valor mínimo para que uma observação esteja entre as 30 maiores Contextualize os valores encontrados de acordo com os dados da planilha OBS No exemplo acima encontramos o tempo máximo gasto no preenchimento do formulário para os 20 clientes que mais rapidamente finalizaram a compra e o tempo mínimo para os 30 clientes que levaram mais tempo para finalizar a compra Critério 6 Com base na variável considerada esboce um breve texto que descreva uma situação apresentando um objetivo uma pergunta que envolva uma tomada de decisão Essa situação deve prever alguma ação que possa ser avaliada mediante uma nova coleta de dados e possibilite a comparação dos dois cenários antes e depois da ação O objetivo deve estar devidamente explicitado veja trecho em negrito no texto ilustrativo abaixo Após a realização da ação nova coleta foi feita e os dados referentes a uma amostra aleatória de tamanho 100 estão apresentados na Planilha 2 Critério 61 Formulação da questão 20 pontos Preocupado com a queda nas vendas o CEO solicitou que o Departamento de Marketing Digital realizasse um estudo para estabelecer qual o tempo máximo aceitável pelo cliente para preencher um formulário de compras O estudo realizado pelo Gerente de Tráfego revelou que usualmente um cliente considera razoável permanecer no site para preencher o formulário e finalizar a compra se todo o processo for finalizado idealmente em até 5 minutos No entanto considerando a relevância da compra tolerase um tempo de até 12 minutos Frequentemente se o tempo extrapolar esse limite de 5 minutos o cliente tende a desistir da compra Com base nessas informações a empresa decidiu reformular as perguntas e o modelo do formulário com o objetivo de reduzir o tempo necessário para o preenchimento do mesmo Após essa intervenção novo levantamento com 100 clientes forneceu os dados na Planilha 2 Neste caso Situação queda nas vendas e pesquisa do Departamento de Marketing Ação Alteração do formulário Objetivo reduzir o tempo necessário para o preenchimento do formulário Critério 62 05 ponto Represente graficamente os dados da Planilha 2 histograma e boxplot Critério 63 05 ponto Considerando a Planilha 2 obtenha a média e desvio padrão para a variável analisada Critério 64 075 ponto Baseado no objetivo proposto escolha um intervalo adequado que possa auxiliar a análise dos dados enuncie a pergunta e calcule a quantidade de dados no mesmo OBS Para o exemplo acima Encontre a quantidade clientes que levam entre 5 e 12 minutos para preencher e finalizar o formulário Critério 7 2 pontos Comparando os resultados obtidos A inferência estatística fornece ferramentas robustas que permitem analisar os dados e a tomar decisões Esse assunto será tratado posteriormente e explorado na próxima sprint Antes de utilizarmos essas ferramentas podemos fazer uma análise preliminar observando os resultados Com base neste estudo formule uma pergunta que reflita a investigação sobre a existência de indícios que sugiram uma mudança estatística significativa entre os dados originais Planilha 1 e da amostra Planilha 2 No exemplo considerado Com base neste estudo há indícios para supor que a modificação no formulário foi eficiente Estabeleça dois critérios que possibilitem uma comparação preliminar e que justifiquem sua resposta No exemplo considerado Critério 1 Comparação entre as proporções de clientes que levaram até 5 minutos para preencher o formulário Este foi o valor do tempo máximo indicado como ideal Critério 2 Comparação entre as proporções de clientes que levaram entre 5 e 12 minutos que são os tempos indicados como ideal e tolerável respectivamente Qualidade da entrega 10 ponto vide rubricas ESTATÍSTICA E ANÁLISE DE DADOS 2º SEM 2025 Professores Alexandre Monteiro Andrea Hamazaki Bia Leite Cintia Scrich Thais Borges EXPLORANDO A DISTRIBUIÇÃO NORMAL PYTHON Carregamento do arquivo do Excel No lado esquerdo clicar em arquivos e depois na seta para fazer o upload Após baixar o arquivo o nome será exibido 1 Importando as bibliotecas do Python 2 Leitura do arquivo de dados Para utilizar o notebook com os seus dados é necessário alterar o nome do arquivo do Excel conforme ilustrado abaixo Após digitar o nome do seu arquivo o notebook armazena os dados na variável arquivo e todos os comandos serão executados com os dados do seu arquivo Defina também a variável coluna especificando qual o nome dado na planilha para a variável que será analisada 3 Armazenamento dos dados Leitura e armazenamento dos dados no python é necessário definir uma variável para armazenar os dados do arquivo no exemplo escolhemos df Ao digitar df na linha seguinte a tabela armazenada é exibida 4 Gerar o histograma e o boxplot para variável contínua 41 Representação do histograma com a curva normal Para montar o histograma basta fazer 42 Boxplot 5 Cálculo da Média Mediana e do Desvio Padrão Veja os comandos necessários nos notebooks já disponibilizados no Projeto 1 6 Testes de Normalidade 61 Análise do Histograma 611 Comparar média e mediana 612 Calcular a proporção de dados nos intervalos 𝜇 𝜎 𝜇 𝜎 𝜇 2𝜎 𝜇 2𝜎 e 𝜇 3𝜎 𝜇 3𝜎 Definindo os limites de cada intervalo Calculando a quantidade de dados em cada intervalo Calculando a proporção de dados em cada intervalo 62 Análise do Boxplot Verificar a simetria 𝑀𝑒𝑑 𝑄1 𝑄3 𝑀𝑒𝑑 Utilizar os comandos já apresentados nos notebooks disponibilizados para o Projeto 1 63 Gráfico QQ 7 Calculando a Probabilidade em Intervalos Comandos para calcular a probabilidade da variável com distribuição normal assumir valores num intervalo Nos comandos abaixo locmédia e scaledesvio padrão Tempo de resposta de um sensor biomédico Tempo de resposta em segundos de um sensor de glicose implantável até estabilizar a leitura após o contato com o fluido intersticial Essa medida é essencial para avaliar o desempenho do dispositivo e sua adequação para monitoramento contínuo Projeto 2 Sprint 1 Introdução A empresa observou desistências no preenchimento do formulário de compras identificando o tempo excessivo de preenchimento como fator relevante O objetivo deste relatório é analisar os tempos de preenchimento antes e após uma intervenção utilizando ferramentas de Inferência Estatística Critério 1 Representação Gráfica Planilha 1 Critério 2 Média e Desvio Padrão Planilha 1 Média 849 Desvio Padrão 136 n 300 Critério 3 Teste de Normalidade ShapiroWilk p 03056 DAgostino K² p 00823 Critério 4 Probabilidade no intervalo 10 15 Proporção empírica 01100 Probabilidade modelo Normal 01335 Critério 5 Percentis 20 mais rápidos 736 min 30 mais lentos 916 min Critério 6 Situação Ação e Objetivo A empresa modificou o formulário visando reduzir o tempo de preenchimento Critério 63 Média e Desvio Padrão Planilha 2 Média 804 Desvio Padrão 156 n 100 Critério 64 Intervalo 5 12 Proporção empírica 09800 Probabilidade modelo Normal 09682 Critério 7 Comparação e Interpretação A média diminuiu de 849 para 804 indicando uma redução no tempo após a intervenção Além disso a proporção de preenchimentos dentro do intervalo ideal aumentou Estes resultados sugerem que a modificação do formulário foi potencialmente eficaz Conclusão Com base nos resultados há evidências preliminares de que a intervenção contribuiu para reduzir o tempo de preenchimento melhorando a experiência do cliente