Como criei minha primeira análise de dados em Python: descobrindo o melhor vendedor do mês

Por um estudante em construção — e sem vergonha de admitir isso

Um pouco de contexto

Em 2016, eu estudava Análise de Sistemas. Aprendi lógica de programação, tive contato com Java, entendi como pensar em código. Parecia que a área de TI seria meu caminho.

Só que a vida não segue roteiro. Me afastei da área por anos — e quando decidi voltar, o mundo tech tinha mudado bastante.

Tive que começar quase do zero. Não completamente, porque a base de raciocínio lógico ainda estava lá, mas tecnicamente? Muito coisa nova pra aprender.

Foi nesse contexto de retorno e atualização que me deparei com análise de dados. Nunca tinha aberto um Jupyter Notebook. Pandas pra mim era só um urso fofo. NumPy era um nome estranho em tutoriais que eu ainda não entendia.

Aí resolvi parar de só assistir e colocar a mão na massa.

O desafio que me propus foi simples: analisar dados de vendas e descobrir quem foi o melhor vendedor do mês — com gráficos, rankings e tudo mais.

Parece básico? É. E foi exatamente isso que precisava para começar.

As ferramentas que usei

Python — a linguagem base
Pandas — para manipular e analisar os dados
NumPy — para cálculos numéricos
Matplotlib / Seaborn — para criar os gráficos
Google Colab — para rodar tudo sem precisar instalar nada

Se você também está começando, o Google Colab é seu melhor amigo. É gratuito, roda no navegador e não exige configuração nenhuma.

O que eu fiz, passo a passo

1. Carreguei os dados

Comecei com uma tabela simples em CSV com colunas como: vendedor, produto, quantidade, valor_total e data.

import pandas as pd

df = pd.read_csv('vendas.csv')
df.head()

Esse df.head() foi uma das primeiras coisas que aprendi — ele mostra as primeiras linhas do seu DataFrame. Parece bobo, mas foi o momento em que os dados "ganharam vida" pra mim.

2. Limpei os dados

Dados reais nunca são perfeitos. Tinha linhas vazias, valores duplicados, datas com formato inconsistente.

# Remover linhas com valores nulos
df.dropna(inplace=True)

# Remover duplicatas
df.drop_duplicates(inplace=True)

# Converter coluna de data
df['data'] = pd.to_datetime(df['data'])

Essa etapa me ensinou que limpeza de dados é mais da metade do trabalho. Não é a parte mais glamourosa, mas é onde você entende de verdade o que tem nas mãos.

3. Agrupei as vendas por vendedor

Com os dados limpos, agrupei o total vendido por cada vendedor no mês:

ranking = df.groupby('vendedor')['valor_total'].sum().sort_values(ascending=False)
print(ranking)

Saiu um ranking direto no terminal. Simples assim. E foi muito satisfatório ver o nome do melhor vendedor aparecer no topo.

4. Criei os gráficos

Aqui foi onde me diverti mais. Usei o Matplotlib para um gráfico de barras e o Seaborn para deixar mais bonito:

import matplotlib.pyplot as plt
import seaborn as sns

plt.figure(figsize=(10, 6))
sns.barplot(x=ranking.values, y=ranking.index, palette='viridis')
plt.title('Ranking de Vendedores do Mês')
plt.xlabel('Total Vendido (R$)')
plt.ylabel('Vendedor')
plt.tight_layout()
plt.show()

Ver um gráfico gerado pelo meu próprio código foi um dos momentos mais motivadores desse começo de jornada.

O que aprendi com esse projeto

Tecnicamente:

Como importar e explorar dados com Pandas
A importância da limpeza antes de qualquer análise
Como usar groupby para agregar informações
Como criar visualizações simples e eficazes

Na prática:

Projeto pequeno não é projeto ruim. É por onde você começa.
Errar faz parte — eu quebrei o código umas dez vezes antes de funcionar
Documentação do Pandas é sua amiga (mesmo que assuste no começo)

Próximos passos

Agora quero ir além:

Adicionar filtros por período (semana, trimestre)
Calcular métricas como ticket médio por vendedor
Explorar bibliotecas como Plotly para gráficos interativos
Aprender sobre limpeza de dados mais avançada com expressões regulares

Conclusão

Esse projeto não foi nada revolucionário. Não usei machine learning, não treinei nenhum modelo, não fiz nada que um analista experiente acharia impressionante.

Mas foi meu. Eu pensei no problema, busquei as ferramentas, errei, corrigi e entreguei um resultado.

E é isso que importa no começo: fazer. Mesmo que simples, mesmo que imperfeito.

Se você também está começando, espero que esse artigo te mostre que dá pra criar algo útil desde cedo — e que compartilhar o processo é tão valioso quanto o resultado final.

Estou documentando minha jornada de aprendizado aqui na DIO. Se você também está nessa fase, bora trocar ideia nos comentários! 🚀