LL

Lizza Leguizamon05/07/2026 17:52
Share

Como criei minha primeira análise de dados em Python: descobrindo o melhor vendedor do mês

    Por um estudante em construção — e sem vergonha de admitir isso

    Um pouco de contexto

    Em 2016, eu estudava Análise de Sistemas. Aprendi lógica de programação, tive contato com Java, entendi como pensar em código. Parecia que a área de TI seria meu caminho.

    Só que a vida não segue roteiro. Me afastei da área por anos — e quando decidi voltar, o mundo tech tinha mudado bastante.

    Tive que começar quase do zero. Não completamente, porque a base de raciocínio lógico ainda estava lá, mas tecnicamente? Muito coisa nova pra aprender.

    Foi nesse contexto de retorno e atualização que me deparei com análise de dados. Nunca tinha aberto um Jupyter Notebook. Pandas pra mim era só um urso fofo. NumPy era um nome estranho em tutoriais que eu ainda não entendia.

    Aí resolvi parar de só assistir e colocar a mão na massa.

    O desafio que me propus foi simples: analisar dados de vendas e descobrir quem foi o melhor vendedor do mês — com gráficos, rankings e tudo mais.

    Parece básico? É. E foi exatamente isso que precisava para começar.

    As ferramentas que usei

    • Python — a linguagem base
    • Pandas — para manipular e analisar os dados
    • NumPy — para cálculos numéricos
    • Matplotlib / Seaborn — para criar os gráficos
    • Google Colab — para rodar tudo sem precisar instalar nada

    Se você também está começando, o Google Colab é seu melhor amigo. É gratuito, roda no navegador e não exige configuração nenhuma.

    O que eu fiz, passo a passo

    1. Carreguei os dados

    Comecei com uma tabela simples em CSV com colunas como: vendedor, produto, quantidade, valor_total e data.

    import pandas as pd
    
    df = pd.read_csv('vendas.csv')
    df.head()
    

    Esse df.head() foi uma das primeiras coisas que aprendi — ele mostra as primeiras linhas do seu DataFrame. Parece bobo, mas foi o momento em que os dados "ganharam vida" pra mim.

    2. Limpei os dados

    Dados reais nunca são perfeitos. Tinha linhas vazias, valores duplicados, datas com formato inconsistente.

    # Remover linhas com valores nulos
    df.dropna(inplace=True)
    
    # Remover duplicatas
    df.drop_duplicates(inplace=True)
    
    # Converter coluna de data
    df['data'] = pd.to_datetime(df['data'])
    

    Essa etapa me ensinou que limpeza de dados é mais da metade do trabalho. Não é a parte mais glamourosa, mas é onde você entende de verdade o que tem nas mãos.

    3. Agrupei as vendas por vendedor

    Com os dados limpos, agrupei o total vendido por cada vendedor no mês:

    ranking = df.groupby('vendedor')['valor_total'].sum().sort_values(ascending=False)
    print(ranking)
    

    Saiu um ranking direto no terminal. Simples assim. E foi muito satisfatório ver o nome do melhor vendedor aparecer no topo.

    4. Criei os gráficos

    Aqui foi onde me diverti mais. Usei o Matplotlib para um gráfico de barras e o Seaborn para deixar mais bonito:

    import matplotlib.pyplot as plt
    import seaborn as sns
    
    plt.figure(figsize=(10, 6))
    sns.barplot(x=ranking.values, y=ranking.index, palette='viridis')
    plt.title('Ranking de Vendedores do Mês')
    plt.xlabel('Total Vendido (R$)')
    plt.ylabel('Vendedor')
    plt.tight_layout()
    plt.show()
    

    Ver um gráfico gerado pelo meu próprio código foi um dos momentos mais motivadores desse começo de jornada.

    O que aprendi com esse projeto

    Tecnicamente:

    • Como importar e explorar dados com Pandas
    • A importância da limpeza antes de qualquer análise
    • Como usar groupby para agregar informações
    • Como criar visualizações simples e eficazes

    Na prática:

    • Projeto pequeno não é projeto ruim. É por onde você começa.
    • Errar faz parte — eu quebrei o código umas dez vezes antes de funcionar
    • Documentação do Pandas é sua amiga (mesmo que assuste no começo)

    Próximos passos

    Agora quero ir além:

    • Adicionar filtros por período (semana, trimestre)
    • Calcular métricas como ticket médio por vendedor
    • Explorar bibliotecas como Plotly para gráficos interativos
    • Aprender sobre limpeza de dados mais avançada com expressões regulares

    Conclusão

    Esse projeto não foi nada revolucionário. Não usei machine learning, não treinei nenhum modelo, não fiz nada que um analista experiente acharia impressionante.

    Mas foi meu. Eu pensei no problema, busquei as ferramentas, errei, corrigi e entreguei um resultado.

    E é isso que importa no começo: fazer. Mesmo que simples, mesmo que imperfeito.

    Se você também está começando, espero que esse artigo te mostre que dá pra criar algo útil desde cedo — e que compartilhar o processo é tão valioso quanto o resultado final.

    Estou documentando minha jornada de aprendizado aqui na DIO. Se você também está nessa fase, bora trocar ideia nos comentários! 🚀

    Share
    Comments (0)