Article image
Rafael Freitas
Rafael Freitas13/05/2024 15:30
Compartilhe

Dominando a Indexação e Seleção de Dados no Pandas: Tudo o que você precisa saber!

  • #Python

Introdução

Quando trabalhamos com conjuntos de dados em ciência de dados, a indexação é fundamental para acessar e manipular informações de forma eficiente. No contexto da biblioteca Pandas, a indexação refere-se à capacidade de identificar e acessar elementos específicos em um DataFrame ou uma Series. Essa técnica permite que você localize e trabalhe com dados de maneira precisa e organizada.

image

A indexação por rótulos (loc) permite acessar dados utilizando etiquetas de linhas e colunas, enquanto a indexação por posição (iloc) utiliza índices numéricos para acesso. Vejamos um exemplo:

import pandas as pd

# Criando um DataFrame de exemplo
data = {'Nome': ['João', 'Maria', 'Carlos'],
      'Idade': [25, 30, 35],
      'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte']}
df = pd.DataFrame(data)

# Indexação por rótulos (loc)
print(df.loc[0, 'Nome'])  
# Saída: João

# Indexação por posição (iloc)
print(df.iloc[0, 2])
# Saída: São Paulo

image

A indexação booleana permite selecionar dados com base em condições lógicas. Por exemplo:

# Selecionando dados onde a idade é maior que 30
print(df[df['Idade'] > 30])  
# Saída: Carlos    35    Belo Horizonte

image

A indexação por atributo (at) permite acessar um único valor utilizando rótulos de linha e coluna, enquanto a indexação por posição (iat) é similar ao iloc, mas mais eficiente para acesso a um único elemento.

# Indexação por atributo (at)
print(df.at[0, 'Cidade'])  
# Saída: São Paulo

# Indexação por posição (iat)
print(df.iat[2, 0])  
# Saída: Carlos

image

Curtiu esse conteúdo ? Ele foi gerado por inteligência artificial, mas foi revisado por alguém 100% Humano.

⚒️Ferramentas de produção:

Imagens: Lexica.Art

Conteúdo gerado por: ChatGPT + Gemini

Revisões Humanas: Rafael Freitas

#Pandas #CienciaDeDados #AnaliseDeDados

Compartilhe
Comentários (0)