Matrizes em Python: Tipos, Fórmulas e Saídas com analogias AWS

#AWS
#Python

Aprenda como manipular matrizes em Python e entenda como isso se conecta ao seu dia a dia com bancos de dados na nuvem (como AWS RDS, Redshift e até S3).

🧮 O que é uma Matriz em Python?

Conceito:

Uma matriz é uma coleção de dados em forma de tabela — linhas e colunas — muito usada em ciência de dados, machine learning e bancos relacionais.

Código:

python

matriz = [
  [1, 2, 3],
  [4, 5, 6],
  [7, 8, 9]
]
print(matriz[1][2])  # saída: 6

Analogias AWS:

Pense na matriz como uma tabela no Amazon RDS (MySQL ou PostgreSQL): cada linha é um registro (row), e cada coluna é um campo (column).
matriz[1][2] é como fazer:

sql

SELECT coluna3 FROM tabela WHERE id = 2;

📊 Tipos de Matrizes

Matriz Quadrada

python

quadrada = [
  [1, 0],
  [0, 1]
]

Na AWS: Uma matriz 2x2 pode representar controle de permissões simples, como se fossem flags de acesso a tabelas por função.

Matriz Identidade

python

import numpy as np
identidade = np.identity(3)
print(identidade)

Na AWS: Pode ser comparada ao controle de integridade referencial em banco relacional. Cada “1” na diagonal mostra que o campo está “relacionado com ele mesmo” — útil para entender primary keys.

Matriz Transposta

python

matriz = [
  [1, 2, 3],
  [4, 5, 6]
]

transposta = list(zip(*matriz))
print(transposta)

Na AWS: Isso seria como pivotar uma tabela no Redshift ou com Athena. Ou seja, transformar linhas em colunas — como no Power BI ou Excel.

➗ Fórmulas e Operações com Matrizes

Soma de Matrizes

python

A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])
soma = A + B
print(soma)

Na AWS: Como se você tivesse dois conjuntos de dados em S3 e fizesse um merge com soma de colunas numéricas usando AWS Glue ou Pandas no SageMaker.

Multiplicação de Matrizes

python

produto = np.dot(A, B)
print(produto)

Na AWS: Equivale a um JOIN + agregação em uma query SQL Redshift, onde você cruza dados de duas tabelas com base em chave primária e aplica um SUM().

Determinante de uma Matriz

python

det = np.linalg.det(A)
print(det)

Na AWS: Pode representar o "grau de dependência" dos dados — como descobrir se a tabela tem chaves redundantes ou colunas com valores duplicados que impactam integridade.

🔄 Saídas e Como Interpretar

Acessando elementos

python

print(A[0][1])  # acesso à linha 1, coluna 2

Na AWS: Mesma lógica de uma query com WHERE + SELECT.

Iterando elementos

python

for linha in A:
  for valor in linha:
      print(valor)

Na AWS: Como fazer um scan total de tabela no DynamoDB, onde percorremos linha por linha.

☁️ Simulando uma situação real na AWS

Você tem logs armazenados no S3 como arquivos CSV. Ao carregá-los no Pandas:

python

import pandas as pd
df = pd.read_csv("dados.csv")
matriz = df.values

A partir daí, você pode fazer cálculos com np.mean(matriz), transpor, filtrar, etc.

É como se transformasse um bucket S3 em uma estrutura de matriz para análise, sem precisar carregar tudo no Redshift!

⁉️ Possíveis Duvidas...

O que é Iterando Elementos?

Iterar significa percorrer item por item dentro de uma estrutura de dados. No caso de uma matriz em Python (ou seja, uma lista de listas), iterar elementos é o processo de visitar cada número ou valor que ela contém — geralmente com um laço for.

O que é Query?

Uma query é uma consulta de dados. No contexto de banco de dados (como MySQL, PostgreSQL, Redshift ou DynamoDB), é um comando que você envia ao banco para buscar, filtrar, contar ou modificar informações.

O que é Merge?

Merge significa juntar dados de diferentes fontes com base em alguma chave comum — como o CPF, ID ou e-mail de uma pessoa.

O que são Flags?

Uma flag é uma variável binária que indica se algo está ativo (True/1) ou inativo (False/0). Muito usada para controle de estados, permissões e condições lógicas.

O que é Primary Key (Chave Primária)?

Uma Primary Key (chave primária) é um identificador único para cada registro (linha) em uma tabela de banco de dados. Ela garante que não existam duplicatas e que cada linha seja única.

✅ Conclusão

Matrizes são a base para muitas operações em Python e são ainda mais poderosas quando pensamos em bancos de dados como AWS RDS, Redshift, Athena ou DynamoDB. Ao dominar esses conceitos, você consegue Otimizar queries, entender dependências e trabalhar com grandes volumes em nuvem de forma inteligente.

📚 Referências

Python Oficial - Data Structures
Explicação detalhada sobre listas aninhadas, que são a base para matrizes em Python puro.
NumPy Documentation
Guia essencial para trabalhar com arrays e operações matriciais de forma eficiente usando NumPy.
AWS RDS - Conceitos Básicos
Introdução ao Amazon RDS e como bancos relacionais são estruturados em ambientes de nuvem.
Amazon Redshift - Tabelas e Consultas
Documentação técnica para quem deseja entender consultas SQL em grandes volumes de dados.
Pandas - Trabalhando com Dados Tabulares
Guia de uso do Pandas, ideal para transformar arquivos CSV em matrizes e aplicar operações analíticas.
AWS Glue - Manipulação de Dados no S3
Para quem deseja trabalhar com ETL (extração, transformação e carga) em cima de dados armazenados como tabelas/matrizes no S3.
GeeksforGeeks – Matrix Operations in Python
Diversos exemplos de operações de matriz usando Python puro e bibliotecas.