Matrizes em Python: Tipos, Fórmulas e Saídas com analogias AWS
- #AWS
- #Python
Aprenda como manipular matrizes em Python e entenda como isso se conecta ao seu dia a dia com bancos de dados na nuvem (como AWS RDS, Redshift e até S3).
🧮 O que é uma Matriz em Python?
Conceito:
Uma matriz é uma coleção de dados em forma de tabela — linhas e colunas — muito usada em ciência de dados, machine learning e bancos relacionais.
Código:
python
matriz = [
[1, 2, 3],
[4, 5, 6],
[7, 8, 9]
]
print(matriz[1][2]) # saída: 6
Analogias AWS:
- Pense na matriz como uma tabela no Amazon RDS (MySQL ou PostgreSQL): cada linha é um registro (row), e cada coluna é um campo (column).
matriz[1][2]
é como fazer:
sql
SELECT coluna3 FROM tabela WHERE id = 2;
📊 Tipos de Matrizes
Matriz Quadrada
python
quadrada = [
[1, 0],
[0, 1]
]
Na AWS: Uma matriz 2x2 pode representar controle de permissões simples, como se fossem flags de acesso a tabelas por função.
Matriz Identidade
python
import numpy as np
identidade = np.identity(3)
print(identidade)
Na AWS: Pode ser comparada ao controle de integridade referencial em banco relacional. Cada “1” na diagonal mostra que o campo está “relacionado com ele mesmo” — útil para entender primary keys.
Matriz Transposta
python
matriz = [
[1, 2, 3],
[4, 5, 6]
]
transposta = list(zip(*matriz))
print(transposta)
Na AWS: Isso seria como pivotar uma tabela no Redshift ou com Athena. Ou seja, transformar linhas em colunas — como no Power BI ou Excel.
➗ Fórmulas e Operações com Matrizes
Soma de Matrizes
python
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])
soma = A + B
print(soma)
Na AWS: Como se você tivesse dois conjuntos de dados em S3 e fizesse um merge com soma de colunas numéricas usando AWS Glue ou Pandas no SageMaker.
Multiplicação de Matrizes
python
produto = np.dot(A, B)
print(produto)
Na AWS: Equivale a um JOIN + agregação em uma query SQL Redshift, onde você cruza dados de duas tabelas com base em chave primária e aplica um SUM()
.
Determinante de uma Matriz
python
det = np.linalg.det(A)
print(det)
Na AWS: Pode representar o "grau de dependência" dos dados — como descobrir se a tabela tem chaves redundantes ou colunas com valores duplicados que impactam integridade.
🔄 Saídas e Como Interpretar
Acessando elementos
python
print(A[0][1]) # acesso à linha 1, coluna 2
Na AWS: Mesma lógica de uma query com WHERE + SELECT.
Iterando elementos
python
for linha in A:
for valor in linha:
print(valor)
Na AWS: Como fazer um scan total de tabela no DynamoDB, onde percorremos linha por linha.
☁️ Simulando uma situação real na AWS
Você tem logs armazenados no S3 como arquivos CSV. Ao carregá-los no Pandas:
python
import pandas as pd
df = pd.read_csv("dados.csv")
matriz = df.values
A partir daí, você pode fazer cálculos com np.mean(matriz)
, transpor, filtrar, etc.
É como se transformasse um bucket S3 em uma estrutura de matriz para análise, sem precisar carregar tudo no Redshift!
⁉️ Possíveis Duvidas...
- O que é Iterando Elementos?
Iterar significa percorrer item por item dentro de uma estrutura de dados. No caso de uma matriz em Python (ou seja, uma lista de listas), iterar elementos é o processo de visitar cada número ou valor que ela contém — geralmente com um laço for
.
- O que é Query?
Uma query é uma consulta de dados. No contexto de banco de dados (como MySQL, PostgreSQL, Redshift ou DynamoDB), é um comando que você envia ao banco para buscar, filtrar, contar ou modificar informações.
- O que é Merge?
Merge significa juntar dados de diferentes fontes com base em alguma chave comum — como o CPF, ID ou e-mail de uma pessoa.
- O que são Flags?
Uma flag é uma variável binária que indica se algo está ativo (True/1) ou inativo (False/0). Muito usada para controle de estados, permissões e condições lógicas.
- O que é Primary Key (Chave Primária)?
Uma Primary Key (chave primária) é um identificador único para cada registro (linha) em uma tabela de banco de dados. Ela garante que não existam duplicatas e que cada linha seja única.
✅ Conclusão
Matrizes são a base para muitas operações em Python e são ainda mais poderosas quando pensamos em bancos de dados como AWS RDS, Redshift, Athena ou DynamoDB. Ao dominar esses conceitos, você consegue Otimizar queries, entender dependências e trabalhar com grandes volumes em nuvem de forma inteligente.
📚 Referências
- Python Oficial - Data Structures
- Explicação detalhada sobre listas aninhadas, que são a base para matrizes em Python puro.
- NumPy Documentation
- Guia essencial para trabalhar com arrays e operações matriciais de forma eficiente usando NumPy.
- AWS RDS - Conceitos Básicos
- Introdução ao Amazon RDS e como bancos relacionais são estruturados em ambientes de nuvem.
- Amazon Redshift - Tabelas e Consultas
- Documentação técnica para quem deseja entender consultas SQL em grandes volumes de dados.
- Pandas - Trabalhando com Dados Tabulares
- Guia de uso do Pandas, ideal para transformar arquivos CSV em matrizes e aplicar operações analíticas.
- AWS Glue - Manipulação de Dados no S3
- Para quem deseja trabalhar com ETL (extração, transformação e carga) em cima de dados armazenados como tabelas/matrizes no S3.
- GeeksforGeeks – Matrix Operations in Python
- Diversos exemplos de operações de matriz usando Python puro e bibliotecas.