·
Engenharia Elétrica ·
Outros
Envie sua pergunta para a IA e receba a resposta na hora
Texto de pré-visualização
Análise de dados 20231 Profª Patrizia Aula 05 Gráficos estatísticos Box Plot Diagrama de caixa Estatística Exploratória Gráficos Tradicionalmente uma análise descritiva dos dados se limita a calcular algumas medidas de posição e variabilidade como média e variância por exemplo Os principais gráficos são Histograma e polígono de frequência Barras Gráfico de pontos Gráfico de setores Gráfico de linhas Box Plot Diagrama de caixa Histograma As áreas dos retângulos são proporcionais às frequências e o polígono utiliza os pontos médios das classes Os retângulos são proporcionais às frequências e o polígono utiliza os pontos médios das classes O histograma alisado é obtido quando o intervalo da classe é diminuído suficientemente para que uma curva contínua possa ser traçada Tal curva é muito útil para ilustrar rapidamente qual o tipo de comportamento que se espera para a distribuição de uma dada variável Polígono de frequência Um polígono de frequência é um gráfico de linha em que as frequências são colocadas sobre perpendiculares levantadas nos pontos médios Podese também obtêlos ligandose os pontos médios dos topos dos retângulos de um histograma estatura faixa f fr F2 Fr3 150 154 4 100 4 100 154 158 9 225 13 325 158 162 12 300 25 625 162 166 9 225 34 850 166 170 3 75 37 925 170 174 3 75 40 1000 total 40 1 Polígono de frequência acumulada O polígono de frequência acumulada é traçado marcandose as frequências acumuladas sobre perpendiculares ao eixo horizontal levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe Cálculo das Classes Fórmula de Sturges 𝑘 1 33 log10 𝑁 Método da Raiz 𝑘 𝑁 Onde 𝑁 é o número de elementos diferentes na amostra na maioria dos casos 𝑁 𝑛 Temos ainda Intervalo da classe ℎ ℎ 𝐻𝑘 Ponto médio da classe 𝑥𝑖 Ponto médio entre o limite inferior e o limite superior da classe Classes As classes são uma maneira de condensar o número muitas vezes grande de elementos diferentes de uma amostra Imagine construir uma tabela para 3000 valores diferentes Os requisitos para uma boa definição de classes em um conjunto de dados são As classes devem abranger todas as observações O extremo superior de uma classe é o extremo inferior da classe subsequente simbologia intervalo fechado à esquerda e aberto à direita No Excel o histograma automático é feito com o intervalo Cada valor observado deve enquadrarse em apenas uma classe k 25 de um modo geral sendo k o número de classes As unidades das classes devem ser as mesmas dos dados Gráficos em barras em colunas Gráficos menos comuns As distribuições não envolvem classes ou são qualitativos Gráfico de Pontos Gráficos menos comuns atualmente Utilizado para pequenas quantidades de elementos Ramoefolhas Gráficos menos comuns atualmente Alternativo ao gráfico de barras o RamoeFolhas é uma boa prática sempre que possível ao se iniciar uma análise de dados Temos aqui RamoeFolhas Exemplo A ingestão diária média per capita em gramas de proteínas para 33 países desenvolvidos é 81 113 108 74 79 78 90 93 105 109 93 106 103 100 100 100 101 101 101 95 90 94 90 91 92 93 87 89 78 89 85 94 86 Construção do ramoefolhas Gráfico de Pontos Gráficos menos comuns atualmente Utilizado para pequenas quantidades de elementos Quartis Q1 Q2 e Q3 São valores dados a partir do conjunto de observações ordenado em ordem crescente que dividem a distribuição em quatro partes iguais O primeiro quartil Q1 é o número que deixa 25 das observações abaixo e 75 acima enquanto que o terceiro quartil Q3 deixa 75 das observações abaixo e 25 acima Já Q2 é a mediana deixa 50 das observações abaixo e 50 das observações acima Boxplot Diagrama de caixa Fonte Entendendo Estatística Descritiva by Henrique Braga Medium Boxplot O boxplot gráfico de caixa é um gráfico utilizado para avaliar a distribuição empírica dos dados O boxplot é formado pelo primeiro e terceiro quartil e pela mediana As hastes inferiores e superiores se estendem respectivamente do quartil inferior até o menor valor não inferior ao limite inferior e do quartil superior até o maior valor não superior ao limite superior Limite Superior Limite Inferior 𝑄3 𝑄2 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝑄1 BoxPlot e Cálculo dos Quartis Resumo dos 5 números Mínimo primeiro quartil mediana terceiro quartil e máximo Etapa 1 Ordene os dados em um ROL do menos para o maior Etapa 2 Encontre a mediana Q2 Etapa 3 Encontre os Q1 e Q3 O Q1 é a mediana dos dados à esquerda da mediana e o Q3 é a mediana dos dados à direita da mediana Etapa 4 Encontre o Mínimo e o Máximo Boxplot e Outliers Se quiser considerar Outliers Os limites são calculados da forma abaixo Limite Inferior 𝐿𝐼 𝑄1 15𝑄3 𝑄1 Limite Superior 𝐿𝑆 𝑄3 15𝑄3 𝑄1 O boxplot pode ser utilizado para uma comparação visual entre dois ou mais grupos Por exemplo duas ou mais caixas são colocadas lado a lado e se compara a variabilidade entre elas a mediana e assim por diante Exemplo1 Considere que uma amostra de dez caixas de uvas tenha os seguintes pesos em gramas 29 28 25 38 37 35 35 30 29 34 Faça um boxplot dos dados sem considerar outliers Exemplo1 resolução ROL 25 28 29 29 30 34 35 35 37 38 Mínimo 25 e Máximo 38 Mediana Q2 3034 2 32 25 28 29 29 30 32 34 35 35 37 38 Primeiro quartil Q1 25 28 29 29 30 Terceiro quartil Q3 34 35 35 37 38 Exemplo2 Considere os seguintes dados 14 11 13 8 11 12 11 11 9 Faça um boxplot dos dados sem considerar outliers Exemplo3 Considere os seguintes dados 1 1 6 13 13 14 14 14 15 15 16 18 18 18 19 Faça um boxplot dos dados excluindo os outliers
Envie sua pergunta para a IA e receba a resposta na hora
Texto de pré-visualização
Análise de dados 20231 Profª Patrizia Aula 05 Gráficos estatísticos Box Plot Diagrama de caixa Estatística Exploratória Gráficos Tradicionalmente uma análise descritiva dos dados se limita a calcular algumas medidas de posição e variabilidade como média e variância por exemplo Os principais gráficos são Histograma e polígono de frequência Barras Gráfico de pontos Gráfico de setores Gráfico de linhas Box Plot Diagrama de caixa Histograma As áreas dos retângulos são proporcionais às frequências e o polígono utiliza os pontos médios das classes Os retângulos são proporcionais às frequências e o polígono utiliza os pontos médios das classes O histograma alisado é obtido quando o intervalo da classe é diminuído suficientemente para que uma curva contínua possa ser traçada Tal curva é muito útil para ilustrar rapidamente qual o tipo de comportamento que se espera para a distribuição de uma dada variável Polígono de frequência Um polígono de frequência é um gráfico de linha em que as frequências são colocadas sobre perpendiculares levantadas nos pontos médios Podese também obtêlos ligandose os pontos médios dos topos dos retângulos de um histograma estatura faixa f fr F2 Fr3 150 154 4 100 4 100 154 158 9 225 13 325 158 162 12 300 25 625 162 166 9 225 34 850 166 170 3 75 37 925 170 174 3 75 40 1000 total 40 1 Polígono de frequência acumulada O polígono de frequência acumulada é traçado marcandose as frequências acumuladas sobre perpendiculares ao eixo horizontal levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe Cálculo das Classes Fórmula de Sturges 𝑘 1 33 log10 𝑁 Método da Raiz 𝑘 𝑁 Onde 𝑁 é o número de elementos diferentes na amostra na maioria dos casos 𝑁 𝑛 Temos ainda Intervalo da classe ℎ ℎ 𝐻𝑘 Ponto médio da classe 𝑥𝑖 Ponto médio entre o limite inferior e o limite superior da classe Classes As classes são uma maneira de condensar o número muitas vezes grande de elementos diferentes de uma amostra Imagine construir uma tabela para 3000 valores diferentes Os requisitos para uma boa definição de classes em um conjunto de dados são As classes devem abranger todas as observações O extremo superior de uma classe é o extremo inferior da classe subsequente simbologia intervalo fechado à esquerda e aberto à direita No Excel o histograma automático é feito com o intervalo Cada valor observado deve enquadrarse em apenas uma classe k 25 de um modo geral sendo k o número de classes As unidades das classes devem ser as mesmas dos dados Gráficos em barras em colunas Gráficos menos comuns As distribuições não envolvem classes ou são qualitativos Gráfico de Pontos Gráficos menos comuns atualmente Utilizado para pequenas quantidades de elementos Ramoefolhas Gráficos menos comuns atualmente Alternativo ao gráfico de barras o RamoeFolhas é uma boa prática sempre que possível ao se iniciar uma análise de dados Temos aqui RamoeFolhas Exemplo A ingestão diária média per capita em gramas de proteínas para 33 países desenvolvidos é 81 113 108 74 79 78 90 93 105 109 93 106 103 100 100 100 101 101 101 95 90 94 90 91 92 93 87 89 78 89 85 94 86 Construção do ramoefolhas Gráfico de Pontos Gráficos menos comuns atualmente Utilizado para pequenas quantidades de elementos Quartis Q1 Q2 e Q3 São valores dados a partir do conjunto de observações ordenado em ordem crescente que dividem a distribuição em quatro partes iguais O primeiro quartil Q1 é o número que deixa 25 das observações abaixo e 75 acima enquanto que o terceiro quartil Q3 deixa 75 das observações abaixo e 25 acima Já Q2 é a mediana deixa 50 das observações abaixo e 50 das observações acima Boxplot Diagrama de caixa Fonte Entendendo Estatística Descritiva by Henrique Braga Medium Boxplot O boxplot gráfico de caixa é um gráfico utilizado para avaliar a distribuição empírica dos dados O boxplot é formado pelo primeiro e terceiro quartil e pela mediana As hastes inferiores e superiores se estendem respectivamente do quartil inferior até o menor valor não inferior ao limite inferior e do quartil superior até o maior valor não superior ao limite superior Limite Superior Limite Inferior 𝑄3 𝑄2 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝑄1 BoxPlot e Cálculo dos Quartis Resumo dos 5 números Mínimo primeiro quartil mediana terceiro quartil e máximo Etapa 1 Ordene os dados em um ROL do menos para o maior Etapa 2 Encontre a mediana Q2 Etapa 3 Encontre os Q1 e Q3 O Q1 é a mediana dos dados à esquerda da mediana e o Q3 é a mediana dos dados à direita da mediana Etapa 4 Encontre o Mínimo e o Máximo Boxplot e Outliers Se quiser considerar Outliers Os limites são calculados da forma abaixo Limite Inferior 𝐿𝐼 𝑄1 15𝑄3 𝑄1 Limite Superior 𝐿𝑆 𝑄3 15𝑄3 𝑄1 O boxplot pode ser utilizado para uma comparação visual entre dois ou mais grupos Por exemplo duas ou mais caixas são colocadas lado a lado e se compara a variabilidade entre elas a mediana e assim por diante Exemplo1 Considere que uma amostra de dez caixas de uvas tenha os seguintes pesos em gramas 29 28 25 38 37 35 35 30 29 34 Faça um boxplot dos dados sem considerar outliers Exemplo1 resolução ROL 25 28 29 29 30 34 35 35 37 38 Mínimo 25 e Máximo 38 Mediana Q2 3034 2 32 25 28 29 29 30 32 34 35 35 37 38 Primeiro quartil Q1 25 28 29 29 30 Terceiro quartil Q3 34 35 35 37 38 Exemplo2 Considere os seguintes dados 14 11 13 8 11 12 11 11 9 Faça um boxplot dos dados sem considerar outliers Exemplo3 Considere os seguintes dados 1 1 6 13 13 14 14 14 15 15 16 18 18 18 19 Faça um boxplot dos dados excluindo os outliers