Article image

AM

Ana Melo29/04/2024 19:23
Compartilhe

Iniciando com Pandas

  • #Data
  • #Python

Pandas é uma biblioteca open source amplamente utilizada por conta dos seus diversos benefícios e características, tais como: simplicidade, rapidez e flexibilidade. 

Ao contrário do que muitos pensam, O nome “Pandas” não faz referência ao mamífero, e sim advém de “Panel Data”, que traduzido para o português é “Dados em Painel”. 

Essa biblioteca pode ser utilizada para análise e limpeza de dados, queries em BDs, visualização de dados, entre outros. 

Outro ponto a se considerar, é que Pandas funciona muito bem quando usada em conjunto com outras bibliotecas, como Numpy e Scipy. 

 

Primeiros passos 

- Instalação  

A instalação pode ser feita pelo PIP, que é o sistema de gerenciamento do Python, ou pelo Anaconda (no meu caso, achei mais simples pelo Anaconda, por já vir embutido outras bibliotecas). 

** Farei um artigo específico sobre o Anaconda, para não misturar informações aqui** 

- Criando uma Serie 

Series em Pandas se referem a um array unidimensional, ou seja, com apenas uma coluna. 

OBS: O index (índice) sempre estará presente, até mesmo em uma Serie! 

Em um primeiro momento, opte por criar uma simples Serie para se familiarizar com a biblioteca através do código abaixo, que foi feito pela IDE Spyder

image 

 

Esse será o resultado no terminal: 

image 

A primeira coluna se refere ao índice, e a segunda são os valores que nós criamos. 

- Criando um DataFrame 

Um DataFrame se refere a um array com mais de uma dimensão, ou seja, mais de uma coluna. A sua criação pode parecer um pouco complicada vista de primeira, porém com a prática tudo se torna mais fácil: 

image 

Neste exemplo, optei por mudar os índices para exemplificar que isso também é possível, caso o usuário queira. Abaixo, está a saída dos dados: 

image 

Posteriormente, criarei conteúdo acerca de Análise de dados utilizando outras bibliotecas. 

Espero que tenham gostado, deixem comentários com a opinião de vocês ou dúvidas! 

Github: https://github.com/An4PDM 

Linkedin: https://www.linkedin.com/in/ana-paula-santos-de-melo-3105b82b7/ 

Compartilhe
Comentários (2)

AM

Ana Melo - 30/04/2024 10:20

Obrigada pela dica, Carlos!


Carlos Lima
Carlos Lima - 29/04/2024 20:34

Olá Ana, obrigado por compartilhar. Se me permite uma sugestão, codar em ferramentas como o Google Colabs poderia ser uma opção melhor, por conta da disposição dos dados, fica melhor para visualizar. Parabéns pela iniciativa :)