Article image
Emmanuel Andrade
Emmanuel Andrade21/06/2023 09:14
Compartilhe

Matplotlib: Dando vida aos dados em Python

    Se você é um entusiasta dos dados você muito provavelmente precisará representá-los de maneira visualmente agradável. Dentre as vária bibliotecas que tem no Python para representação e visualização de gráficos a partir de dados há a biblioteca Matplotlib! É sem sombra de dúvidas a mais conhecida (e provavelmente a mais utilizada!). Neste artigo, eu trago uma visão geral sobre a Matplotlib, dando exemplos de como criar gráficos que podem ser úteis para você. Simbora!

    O que é a Matplotlib?

    A Matplotlib é uma biblioteca de visualização de dados em Python, que oferece uma vasta gama de recursos para criar gráficos estáticos, animações, gráficos 3D e muito mais. Ela é amplamente utilizada por cientistas de dados, engenheiros, pesquisadores e programadores em geral, pois oferece uma interface simples e flexível para visualização de dados.

    Como utilizar esta ferramenta?

    Para começar a utilizar a Matplotlib, primeiro precisamos instalá-la. Você pode fazer isso facilmente utilizando o gerenciador de pacotes do Python, o pip. Abra o seu terminal e execute o seguinte comando:

    pip install matplotlib
    

    Após a instalação, podemos importar a biblioteca em nosso código Python da seguinte maneira:

    import matplotlib.pyplot as plt
    

    Agora estamos prontos para criar nossos gráficos!

    Alguns exemplos de tipos de gráficos que podem ser gerados pela Matplotlib serão apresentados a seguir.

    Gráfico de Linha:

    O gráfico de linha é uma forma comum de visualizar a tendência de dados ao longo do tempo ou em uma sequência ordenada. Vamos supor que estamos acompanhando o crescimento de uma planta ao longo de 10 dias. Aqui está um exemplo de código para plotar um gráfico de linha com dados fictícios:

    dias = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
    
    crescimento = [2, 5, 9, 12, 15, 17, 20, 22, 25, 28]
    
    
    
    
    plt.plot(dias, crescimento)
    
    plt.title("Crescimento da Planta")
    
    plt.xlabel("Dias")
    
    plt.ylabel("Altura (cm)")
    
    plt.show()
    

    Resultado:

    image

    Neste exemplo, utilizamos a função plot para criar o gráfico de linha, passando os valores dos eixos x (dias) e y (crescimento). Em seguida, utilizamos as funções title, xlabel e ylabel para adicionar um título ao gráfico e etiquetas aos eixos x e y, respectivamente.

    O método plot da biblioteca Matplotlib possui vários parâmetros que podem ser utilizados para personalizar a aparência do gráfico. Aqui estão alguns dos parâmetros mais comumente utilizados:

    • x: Valores para o eixo x do gráfico.
    • y: Valores para o eixo y do gráfico.
    • color (ou c): Define a cor da linha.
    • linestyle (ou ls): Define o estilo da linha (por exemplo, '-', '--', '-.', ':').
    • linewidth (ou lw): Define a largura da linha.
    • marker: Define o estilo do marcador nos pontos de dados.
    • markersize (ou ms): Define o tamanho dos marcadores.
    • label: Define o rótulo da linha.
    • alpha: Define a transparência da linha (valor entre 0 e 1).
    • markerfacecolor (ou mfc): Define a cor da face do marcador.
    • markeredgecolor (ou mec): Define a cor da borda do marcador.
    • markeredgewidth (ou mew): Define a largura da borda do marcador.

    Esses são apenas alguns dos parâmetros disponíveis no método plot. É importante destacar que a Matplotlib oferece uma ampla gama de opções de personalização, permitindo criar gráficos visualmente atraentes e personalizados de acordo com suas necessidades e preferências.

    Gráfico de Barras:

    O gráfico de barras é uma forma eficaz de comparar categorias diferentes. Vamos supor que queremos comparar as vendas de três produtos em um determinado mês. Aqui está um exemplo de código para criar um gráfico de barras com dados fictícios:

    produtos = ["Produto A", "Produto B", "Produto C"]
    
    vendas = [150, 200, 120]
    
    
    
    
    plt.bar(produtos, vendas)
    
    plt.title("Vendas Mensais")
    
    plt.xlabel("Produtos")
    
    plt.ylabel("Quantidade Vendida")
    
    plt.show()
    

    Resultado:

    image

    Neste exemplo, utilizamos a função bar para criar o gráfico de barras, passando os nomes dos produtos como categorias e as quantidades vendidas como alturas das barras. Em seguida, utilizamos as mesmas funções title, xlabel e ylabel para adicionar o título, rótulos dos eixos x e y, respectivamente.

    O método bar da biblioteca Matplotlib também possui vários parâmetros que podem ser utilizados para personalizar o gráfico de barras. Aqui estão alguns dos parâmetros mais comuns:

    • x: Posições das barras no eixo x.
    • height: Altura das barras.
    • width: Largura das barras.
    • bottom: Posição inicial das barras no eixo y.
    • align: Alinhamento das barras ('center', 'edge').
    • color: Cor das barras.
    • edgecolor: Cor das bordas das barras.
    • linewidth: Largura das bordas das barras.
    • tick_label: Rótulos para as barras no eixo x.
    • alpha: Transparência das barras (valor entre 0 e 1).

    Gráfico de Pizza:

    O gráfico de pizza é uma forma divertida de mostrar a distribuição de uma variável em relação a um todo. Vamos supor que queremos visualizar a porcentagem de cada tipo de pizza consumida em uma festa. Aqui está um exemplo de código para criar um gráfico de pizza com dados fictícios:

    tipos_pizza = ["Calabresa", "Margherita", "Pepperoni", "Quatro Queijos"]
    
    percentuais = [35, 20, 30, 15]
    
    
    
    
    plt.pie(percentuais, labels=tipos_pizza, autopct='%1.1f%%')
    
    plt.title("Preferência de Pizza")
    
    plt.show()
    

    Resultado:

    image

    Neste exemplo, utilizamos a função pie para criar o gráfico de pizza, passando os percentuais de cada tipo de pizza e os rótulos correspondentes. Utilizamos o parâmetro autopct para exibir as porcentagens nas fatias do gráfico. Em seguida, utilizamos a função title para adicionar um título ao gráfico.

    O método pie da biblioteca Matplotlib possui vários parâmetros que podem ser utilizados para personalizar o gráfico de pizza. Aqui estão alguns dos parâmetros mais comuns:

    • x: Valores dos setores do gráfico de pizza.
    • labels: Rótulos dos setores do gráfico de pizza.
    • explode: Destaque de um ou mais setores.
    • colors: Cores dos setores.
    • autopct: Formatação das porcentagens exibidas nos setores.
    • shadow: Exibição de sombras nos setores.
    • startangle: Ângulo inicial de rotação dos setores.
    • counterclock: Direção de desenho dos setores (sentido horário ou anti-horário).
    • wedgeprops: Propriedades das fatias do gráfico de pizza (cor da borda, largura da borda, etc.).
    • textprops: Propriedades do texto dos rótulos dos setores.

    Vantagens e Desvantagens da Matplotlib

    A Matplotlib possui várias vantagens que a tornam uma escolha popular para visualização de dados, porém há desvantagens também quando comparada com outras ferramentas.

    Vantagens:

    • Ampla variedade de gráficos: A Matplotlib oferece uma ampla gama de tipos de gráficos, desde gráficos simples até gráficos 3D avançados, permitindo representar diferentes tipos de dados de forma eficaz.
    • Controle total sobre a aparência: A biblioteca oferece um alto nível de controle sobre a aparência dos gráficos, permitindo personalizar cores, estilos, legendas, rótulos e outros elementos visuais.
    • Integração com outras bibliotecas: A Matplotlib pode ser facilmente combinada com outras bibliotecas populares, como NumPy e Pandas, para análise e visualização de dados mais complexos.

    Desvantagens:

    • Curva de aprendizado inicial: A Matplotlib possui uma curva de aprendizado inicial um pouco íngreme, especialmente para usuários iniciantes. Comandos e parâmetros específicos podem exigir alguma prática para serem dominados.
    • Código extenso para tarefas simples: Em comparação com outras bibliotecas de visualização de dados, a Matplotlib pode exigir mais linhas de código para realizar tarefas simples, o que pode tornar os scripts mais extensos.

    Apesar das desvantagens, a Matplotlib continua sendo uma escolha versátil e flexível para visualização de dados em Python.

    Em resumo:

    A Matplotlib é uma biblioteca bastante útil, que permite criar visualizações de dados bastante estruturadas e informativas. Neste artigo, vimos alguns dos gráficos mais populares que podem ser gerados usando a Matplotlib e discutimos suas vantagens e desvantagens em comparação com outras bibliotecas. Agora é a sua vez de explorar a Matplotlib e criar seus próprios gráficos, dar vida aos seus dados!

    #python #matplotlib #pyplot #gráficos #storytelling #data #datascience #dataexploration #dashboard #bi #businessintelligence #

    Compartilhe
    Comentários (2)
    Jefter Alexandre
    Jefter Alexandre - 21/06/2023 20:05

    Bom artigo!

    RG

    Robert Guerra - 21/06/2023 16:21

    Matplotlib é Sensacional!!!