Como criei minha primeira análise de dados em Python: descobrindo o melhor vendedor do mês
Por um estudante em construção — e sem vergonha de admitir isso
Um pouco de contexto
Em 2016, eu estudava Análise de Sistemas. Aprendi lógica de programação, tive contato com Java, entendi como pensar em código. Parecia que a área de TI seria meu caminho.
Só que a vida não segue roteiro. Me afastei da área por anos — e quando decidi voltar, o mundo tech tinha mudado bastante.
Tive que começar quase do zero. Não completamente, porque a base de raciocínio lógico ainda estava lá, mas tecnicamente? Muito coisa nova pra aprender.
Foi nesse contexto de retorno e atualização que me deparei com análise de dados. Nunca tinha aberto um Jupyter Notebook. Pandas pra mim era só um urso fofo. NumPy era um nome estranho em tutoriais que eu ainda não entendia.
Aí resolvi parar de só assistir e colocar a mão na massa.
O desafio que me propus foi simples: analisar dados de vendas e descobrir quem foi o melhor vendedor do mês — com gráficos, rankings e tudo mais.
Parece básico? É. E foi exatamente isso que precisava para começar.
As ferramentas que usei
- Python — a linguagem base
- Pandas — para manipular e analisar os dados
- NumPy — para cálculos numéricos
- Matplotlib / Seaborn — para criar os gráficos
- Google Colab — para rodar tudo sem precisar instalar nada
Se você também está começando, o Google Colab é seu melhor amigo. É gratuito, roda no navegador e não exige configuração nenhuma.
O que eu fiz, passo a passo
1. Carreguei os dados
Comecei com uma tabela simples em CSV com colunas como: vendedor, produto, quantidade, valor_total e data.
import pandas as pd
df = pd.read_csv('vendas.csv')
df.head()
Esse df.head() foi uma das primeiras coisas que aprendi — ele mostra as primeiras linhas do seu DataFrame. Parece bobo, mas foi o momento em que os dados "ganharam vida" pra mim.
2. Limpei os dados
Dados reais nunca são perfeitos. Tinha linhas vazias, valores duplicados, datas com formato inconsistente.
# Remover linhas com valores nulos
df.dropna(inplace=True)
# Remover duplicatas
df.drop_duplicates(inplace=True)
# Converter coluna de data
df['data'] = pd.to_datetime(df['data'])
Essa etapa me ensinou que limpeza de dados é mais da metade do trabalho. Não é a parte mais glamourosa, mas é onde você entende de verdade o que tem nas mãos.
3. Agrupei as vendas por vendedor
Com os dados limpos, agrupei o total vendido por cada vendedor no mês:
ranking = df.groupby('vendedor')['valor_total'].sum().sort_values(ascending=False)
print(ranking)
Saiu um ranking direto no terminal. Simples assim. E foi muito satisfatório ver o nome do melhor vendedor aparecer no topo.
4. Criei os gráficos
Aqui foi onde me diverti mais. Usei o Matplotlib para um gráfico de barras e o Seaborn para deixar mais bonito:
import matplotlib.pyplot as plt
import seaborn as sns
plt.figure(figsize=(10, 6))
sns.barplot(x=ranking.values, y=ranking.index, palette='viridis')
plt.title('Ranking de Vendedores do Mês')
plt.xlabel('Total Vendido (R$)')
plt.ylabel('Vendedor')
plt.tight_layout()
plt.show()
Ver um gráfico gerado pelo meu próprio código foi um dos momentos mais motivadores desse começo de jornada.
O que aprendi com esse projeto
Tecnicamente:
- Como importar e explorar dados com Pandas
- A importância da limpeza antes de qualquer análise
- Como usar
groupbypara agregar informações - Como criar visualizações simples e eficazes
Na prática:
- Projeto pequeno não é projeto ruim. É por onde você começa.
- Errar faz parte — eu quebrei o código umas dez vezes antes de funcionar
- Documentação do Pandas é sua amiga (mesmo que assuste no começo)
Próximos passos
Agora quero ir além:
- Adicionar filtros por período (semana, trimestre)
- Calcular métricas como ticket médio por vendedor
- Explorar bibliotecas como Plotly para gráficos interativos
- Aprender sobre limpeza de dados mais avançada com expressões regulares
Conclusão
Esse projeto não foi nada revolucionário. Não usei machine learning, não treinei nenhum modelo, não fiz nada que um analista experiente acharia impressionante.
Mas foi meu. Eu pensei no problema, busquei as ferramentas, errei, corrigi e entreguei um resultado.
E é isso que importa no começo: fazer. Mesmo que simples, mesmo que imperfeito.
Se você também está começando, espero que esse artigo te mostre que dá pra criar algo útil desde cedo — e que compartilhar o processo é tão valioso quanto o resultado final.

