Se você se interessa por ciências de dados, inteligência artificial ou apenas um entusiasta em programação, certamente irá precisar, em algum momento, plotar gráficos com Python.
Nesse artigo iremos aprender a plotar gráficos com Python. De início, veremos 3 tipos de gráficos bem frequentes e importantes: histogramas, curvas e boxplot.
Para isso, iremos usar a famosa biblioteca matplotlib. Essa biblioteca é uma das mais famosas quando se trata de plotar gráficos com Python.
Veja aqui o por que Python é uma linguagem ótima para IA!.
Como plotar gráficos com Python: Curvas
No nosso dia a dia vemos gráficos de curvas frequentemente. Seja na escola ou faculdade, com o desenho de funções no plano cartesiano, ou até mesmo na televisão, com a série temporal do histórico de novos casos de covid no brasil.
Vamos aprender a fazer isso em python com um exemplo. Supomos que queremos plotar o gráfico da função polinomial f(x) = x3 – 2x2 +7 . Para isso, precisamos definir o intervalo do eixo x que nós queremos observar, afinal, essa função é infinita e temos que escolher para onde queremos observá-la.
Além disso, devemos obter vários valores contidos nesse intervalo, espaçados uniformemente. Esses são os valores que iremos fazer as operações e obter a curva no final. Tudo ficará mais claro no código abaixo:
#importando biblioteca numpy
import numpy as np
# Definindo conjunto de 1000 valores de x entre 0 e 3
x = np.linspace(0,3,1000)
# definindo vetor y nas mesmas dimensões que o vetor x
y = np.array(x.shape)
#definindo y, ou seja, aplicando x na função f(x) = x^3 - 2x^2 + 7
y = x*x*x - 2*x*x + 7
Após isso, basta usar a biblioteca matplotlib.pyplot e fazer a plotagem, utilizando os dados X e Y obtidos anteriormente, e usando alguns parâmetros configuráveis. Fazemos isso no código abaixo:
#importando biblioteca matplotlib
import matplotlib.pyplot as plt
#tamanho da figura
plt.figure(figsize = (10,6))
#define X, Y, tipo de marcador(nenhum nesse caso) e cor
plt.plot(x,y, marker = '', color = 'green')
#define título
plt.title('Gráfico f(x)')
#define nome a mostrar no eixo x
plt.xlabel('Eixo x')
#define nome a mostrar no eixo y
plt.ylabel('Eixo y')
#faz a plotagem
plt.show()
A saída desse código é a figura do gráfico que queríamos:
Se quisermos mudar as cores, a forma dos pontos, e outros parâmetros, basta mudá-los para os desejados.
Como plotar gráficos com python: Histogramas
Histogramas são muito importantes, principalmente no contexto de análise de dados e inteligência artificial. Um histograma nada mais é que um gráfico de barras, onde a altura de cada barra representa o número de vezes que determinado valor foi observado.
Vamos aprender com um exemplo. Vamos supor que joguemos um dado dez vezes seguidas, e os valores da face superior foram: [5,4,5,5,6,3,8,2,6,5]. Para plotarmos o histograma desses valores, basta ter uma variável com alguns valores, como no codigo abaixo:
#importando biblioteca numpy
import numpy as np
#definindo valores
x = np.array([5,4,5,5,6,3,8,2,6,5])
E, em seguida, realizar a plotagem, de forma semelhante do tópico anterior. Fazendo a plotagem, temos o codigo:
#importando biblioteca matplotlib
import matplotlib.pyplot as plt
#tamanho da figura
plt.figure(figsize = (10,6))
#define X e o histograma
plt.hist(x, color = 'red')
#define título
plt.title('Histograma')
#define nome a mostrar no eixo x
plt.xlabel('Valores')
#define nome a mostrar no eixo y
plt.ylabel('Frequências')
#faz a plotagem
plt.show()
O resultado do código acima você pode conferir abaixo:
Como plotar gráficos com python: BoxPlot
O boxplot é um gráfico mais técnico, porém, ele é muito útil para que você entenda a distribuição dos seus dados. Com ele, podemos ver o intervalo em que se encontram os quartis do nosso conjunto de dados.
Mas o que são quartis? Imagine que você tem uma sequência de valores, esse é o seu conjunto de dados. Colocaremos esses valores em ordem crescente, um acima do outro. O primeiro quartil desse conjunto de dados são os primeiros 25% dos dados, do menor para o maior.
Já o segundo quartil são os proximos 25% dos dados logo acima do primeiro quartil, e assim vai até o quarto quartil, que são os 25% valores mais altos do nosso conjunto de dados.
Podemos representar isso com um boxplot. Com ele, conseguiremos observar de cara onde estão os quartis dos nossos dados. Além disso, os dados outliers também são representados no boxplot. Esses dados são valores muito mais alto ou muito mais baixo que os seus dados, geralmente associados a medições incorretas.
Vamos agora fazer o gráfico. Supondo que temos o conjunto de medições de temperatura de uma sala durante o dia, armazenaremos em uma variável, como no codigo abaixo:
#importando biblioteca numpy
import numpy as np
#definindo valores de temperatura
x = np.array([20.0,22.3,22.0,21.3,20.4,23.5,28])
Podemos fazer o gráfico boxplot apenas com a variável que armazena os nossos dados. De forma similar aos outros codigos, iremos fazer o plot do boxplot:
#importando biblioteca matplotlib
import matplotlib.pyplot as plt
#tamanho da figura
plt.figure(figsize = (10,6))
#define X e o boxplot
plt.boxplot(x)
#define título
plt.title('BoxPlot')
#faz a plotagem
plt.show()
Observando a saída:
Vemos que a “bolinha” mostrada é um valor muito mais alto que os dados normalmente são, provavelmente é uma falha do sensor que estava medindo a temperatura da sala.
Com isso, finalizamos esse artigo de como plotar gráficos com python. Vale a pena ler a documentação da biblioteca matplotlib para conhecer possíveis formas de personalização, e outros tipos de gráficos. Até logo!
Referências
https://www.dtidigital.com.br/blog/como-gerar-graficos-em-python/