O boxplot, ou gráfico de bigode, é uma ferramenta visual poderosa para a análise de distribuições de dados. Ele oferece uma maneira clara de visualizar e comparar características estatísticas de uma variável quantitativa em relação a categorias qualitativas. Vamos resumir os principais elementos que um boxplot proporciona:
-
Mediana: Representada por uma linha dentro da caixa, a mediana indica o valor central da distribuição. Metade dos dados está abaixo desse ponto, e a outra metade está acima.
-
Quartis:
- Q1 (Primeiro Quartil): Marca o ponto abaixo do qual 25% dos dados se encontram.
- Q3 (Terceiro Quartil): Marca o ponto abaixo do qual 75% dos dados se encontram.
-
Intervalo Interquartil (IQR): É a diferença entre Q3 e Q1, mostrando a dispersão central dos dados. O IQR é usado para avaliar a variabilidade dos dados.
-
Bigodes: Linhas que se estendem da caixa até 1,5 vezes o IQR. Elas indicam a extensão dos dados fora do intervalo interquartil. Valores além dessa extensão são considerados outliers.
-
Outliers: São valores que se encontram fora do alcance esperado, representados como pontos individuais além dos bigodes. Outliers podem indicar anomalias ou erros nos dados.
-
Simetria da Distribuição: A posição da mediana dentro da caixa e a extensão dos bigodes podem sugerir se a distribuição é simétrica ou assimétrica. Uma distribuição assimétrica pode ter uma cauda mais longa de um