Dominando a Indexação e Seleção de Dados no Pandas: Tudo o que você precisa saber!
- #Python
Introdução
Quando trabalhamos com conjuntos de dados em ciência de dados, a indexação é fundamental para acessar e manipular informações de forma eficiente. No contexto da biblioteca Pandas, a indexação refere-se à capacidade de identificar e acessar elementos específicos em um DataFrame ou uma Series. Essa técnica permite que você localize e trabalhe com dados de maneira precisa e organizada.
A indexação por rótulos (loc) permite acessar dados utilizando etiquetas de linhas e colunas, enquanto a indexação por posição (iloc) utiliza índices numéricos para acesso. Vejamos um exemplo:
import pandas as pd
# Criando um DataFrame de exemplo
data = {'Nome': ['João', 'Maria', 'Carlos'],
'Idade': [25, 30, 35],
'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte']}
df = pd.DataFrame(data)
# Indexação por rótulos (loc)
print(df.loc[0, 'Nome'])
# Saída: João
# Indexação por posição (iloc)
print(df.iloc[0, 2])
# Saída: São Paulo
A indexação booleana permite selecionar dados com base em condições lógicas. Por exemplo:
# Selecionando dados onde a idade é maior que 30
print(df[df['Idade'] > 30])
# Saída: Carlos 35 Belo Horizonte
A indexação por atributo (at) permite acessar um único valor utilizando rótulos de linha e coluna, enquanto a indexação por posição (iat) é similar ao iloc, mas mais eficiente para acesso a um único elemento.
# Indexação por atributo (at)
print(df.at[0, 'Cidade'])
# Saída: São Paulo
# Indexação por posição (iat)
print(df.iat[2, 0])
# Saída: Carlos
Curtiu esse conteúdo ? Ele foi gerado por inteligência artificial, mas foi revisado por alguém 100% Humano.
⚒️Ferramentas de produção:
Imagens: Lexica.Art
Conteúdo gerado por: ChatGPT + Gemini
Revisões Humanas: Rafael Freitas
#Pandas #CienciaDeDados #AnaliseDeDados