gráfico boxplot (ou gráfico de bigode) é uma ferramenta visual útil para analisar distribuições de dados de uma variável quantitativa (como uma medida numérica) em relação a uma variável qualitativa (como categorias ou grupos). Ele resume informações essenciais sobre os dados, permitindo visualizar:
- Mediana (linha no meio da caixa): Representa o valor central da distribuição dos dados. A mediana divide a população em duas partes iguais, com 50% dos valores abaixo e 50% acima.
2 . Quartis (limites da caixa): A caixa é dividida em quatro partes:
Q1 (primeiro quartil): Valor abaixo do qual 25% dos dados estão localizados.
Q3 (terceiro quartil): Valor abaixo do qual 75% dos dados estão localizados.
- Intervalo Interquartil (IQR): A distância entre o Q3 e o Q1, que indica a dispersão central dos dados.
- Bigodes (linhas que saem da caixa): Representam a extensão dos dados fora do intervalo interquartil, geralmente até 1,5 vezes o IQR. Qualquer valor além dessa extensão é considerado um outlier (ponto fora da distribuição normal).
- Outliers: Valores que estão fora do intervalo esperado. Eles são representados como pontos individuais fora dos bigodes. Outliers podem indicar dados extremos ou erros de medição.
- Distribuição simétrica ou assimétrica: A forma da caixa e a posição da mediana podem indicar se os dados estão distribuídos de maneira simétrica ou assimétrica (por exemplo, uma cauda longa de um lado da mediana).
Quando se usa um boxplot para comparar duas ou mais variáveis qualitativas, pode-se observar:
Diferenças de mediana entre os grupos.
Variações na dispersão (amplitude dos bigodes e tamanho da caixa) entre os grupos.
Identificação de outliers em diferentes categorias ou grupos.
Essas informações ajudam a identificar padrões de variabilidade e a verificar se há diferenças significativas entre as variáveis comparadas.