Article image
Fernanda Araujo
Fernanda Araujo12/07/2025 00:50
Compartilhe

Banco de dados NoSQL: com Big Data

  • #SQL
  • #NoSQL
  • #Big Data
  • #Banco de Dados

Se você já domina bancos de dados relacionais e sabe o que é uma boa modelagem em SQL, então está na hora de dar um passo além, e entender como o Big Data muda esse jogo. 😉

▪️Introdução

Quando o banco de dados tradicional não dá mais conta. Você já sabe trabalhar com PostgreSQL, MySQL ou SQL Server. Faz JOINs como quem toma café e entende o que é ACID sem pensar duas vezes. Mas... e quando os dados deixam de caber no seu banco? Quando os gigabytes viram terabytes e o tempo de resposta não acompanha o crescimento?

É aqui que entra o Big Data. Mas calma, nada de buzzwords soltas. Vamos entender isso juntos, passo a passo.

▪️ O que é Big Data❔

Big Data refere-se a conjuntos de dados extremamente grandes e complexos que as ferramentas tradicionais de processamento de dados não conseguem gerenciar com eficiência. 

Esses dados são caracterizados por três principais dimensões: volume (a quantidade de dados), velocidade (a taxa na qual os dados são gerados e processados), e variedade (a diversidade de tipos de dados, como estruturados, semiestruturados e não estruturados). 

O Big Data é usado para identificar padrões, tendências e comportamentos em grandes volumes de dados, permitindo a tomada de decisões mais informadas e aprimorando processos em diversas área 

Big Data não é só “grandes dados", "macrodados", ou "megadados”. É uma mudança completa na forma de armazenar, processar e analisar grandes volumes de dados que presentam os seguintes desafios, conhecidos como os 4 Vs do Big Data:

  • Volume → Os dados crescem sem parar. Estamos falando de terabytes, petabytes e até exabytes de informação.
  • Velocidade → Os dados chegam o tempo todo, em tempo real ou quase em tempo real, como em sensores IoT, redes sociais ou logs de sistemas.
  • Variedade → Os dados vêm de diferentes fontes e formatos: textos, imagens, vídeos, planilhas, bancos SQL e NoSQL, etc.
  • Veracidade → Os dados nem sempre são confiáveis. Eles podem estar incompletos, duplicados, desatualizados ou com erros, e por isso precisam ser tratados antes da análise.

Esse é o famoso modelo dos Vs do Big Data, e o motivo pelo qual soluções tradicionais muitas vezes travam ou se tornam caras e ineficientes. .

Por que bancos relacionais em determinado ponto não são mais o suficiente❔

Bancos relacionais funcionam muito bem quando lidamos com dados estruturados, tabelas bem definidas, e precisamos de transações confiáveis com integridade referencial. Até aqui, tudo certo.

Mas quando entramos no cenário de Big Data, os desafios mudam, e o modelo relacional começa a tropeçar. Isso por que:

  • Dados nem sempre vêm organizados: logs de sistemas, imagens, vídeos, sensores, cliques... muitos deles são semi ou não estruturados, e não se encaixam bem em tabelas fixas.
  • Volume e a variedade exigem processamento distribuído: não dá mais pra contar com um único servidor. É preciso dividir a carga em clusters de máquinas trabalhando juntas.
  • Crescimento exponencial: escalar “verticalmente” (colocar mais RAM ou CPU no mesmo servidor) tem limite e é caro. No Big Data, precisamos escalar horizontalmente, ou seja, adicionar mais máquinas ao sistema.
💬 Spoiler realista: Bancos relacionais tradicionais começam a engasgar nesse cenário. Eles não foram feitos para lidar com esse nível de diversidade, escala e velocidade por serem mais lentos.

▪️ Agora, entram os bancos NoSQL

Os bancos NoSQL não vieram para substituir o SQL, mas para complementar, adaptando-se a cenários de Big Data por serem mais rápido e de rápido acesso em tempo real.

Existem 4 principais tipos:

1. Documentos (Ex: MongoDB)

Armazenam dados no formato JSON ou BSON. Flexível e ideal para dados semi-estruturados.

  • JSON (JavaScript Object Notation)

Formato de texto leve, amplamente usado para troca de dados

  • BSON (Binary JSON)

É um formato de serialização binária que expande o JSON para ser mais eficiente em armazenamento e leitura, além de suportar mais tipos de dados.

Exemplo: Um app que armazena perfis de usuários com preferências personalizadas. Cada usuário pode ter campos diferentes.

2. Chave-Valor (Ex: Redis, DynamoDB)

Extremamente rápidos, ideais para cache ou sessões.

Exemplo: Login de usuários, contadores de curtidas em redes sociais.

3. Colunar (Ex: Apache Cassandra, HBase)

Armazenam dados por coluna e não por linha, otimizando buscas analíticas massivas.

Exemplo: Relatórios de analytics com bilhões de registros.

4. Grafos (Ex: Neo4j)

Perfeitos para representar relações complexas, como redes sociais ou rotas logísticas.

Exemplo: “Quem conhece quem” numa rede ou “qual o caminho mais curto entre X e Y”.

▪️E o que mais entra no ecossistema Big Data❔

Big Data não é só banco, é uma arquitetura inteira.

Veja alguns pilares:

  • Hadoop & HDFS

Framework para armazenamento distribuído. Pensa num “HD virtual gigante” espalhado em vários servidores.

  • Spark

Processamento de dados em memória, muito mais rápido que o antigo MapReduce.

  • Kafka

Mensageria em tempo real. Ideal para dados em streaming, como logs ou cliques em tempo real.

  • Data Lakes

Repositórios de dados brutos e diversos, onde tudo é armazenado primeiro para depois ser tratado (diferente de um data warehouse tradicional).

🔄️ E onde tudo isso roda❔

A maioria das arquiteturas de Big Data hoje está na nuvem. Veja alguns exemplos:

  • AWS: S3 + Glue + Athena + EMR + DynamoDB
  • Azure: Data Lake Storage + Synapse + Cosmos DB
  • GCP: BigQuery + Dataflow + Firestore

A boa notícia? Você não precisa montar tudo do zero, a nuvem já traz soluções prontas (e muitas vezes gratuitas no plano inicial ou contas vinculadas a universidade).

▪️ Conclusão

Hora de expandir seu mindset!!👩🏻‍💻

Você já domina os fundamentos dos bancos de dados. Agora, pense além:

  • Em dados que não cabem em tabelas,
  • Em arquiteturas distribuídas,
  • Em escalar não só o sistema, mas a sua forma de pensar.

Big Data não é um substituto. É uma evolução natural para quem lida com sistemas que crescem. Comece pequeno: explore um MongoDB, rode uma consulta no BigQuery ou monte seu primeiro Data Lake com arquivos CSV.

Sempre explore!!

🙋‍♀️ E aí, fez sentido pra você?

Esse artigo te ajudou a clarear o que é Big Data no mundo dos bancos de dados? Já teve alguma experiência com NoSQL ou ficou com dúvidas?

👉 Comenta aqui o que você já conhecia e o que foi novidade!

Compartilhe
Comentários (3)
DIO Community
DIO Community - 15/07/2025 17:23

Fernanda, o seu artigo está excelente! Ele traz de forma clara e detalhada as diferenças entre bancos de dados relacionais e não relacionais, além de explicar como o Big Data muda o jogo. A introdução sobre o que é Big Data e os desafios enfrentados pelos bancos relacionais é muito pertinente, principalmente para quem está começando a entender como lidar com grandes volumes de dados.

O conceito de "escala horizontal" e "vertical", e a introdução dos bancos NoSQL para resolver esses problemas, foi bem abordada, principalmente ao detalhar os diferentes tipos de bancos NoSQL como Documentos, Chave-Valor, Colunar e Grafos. A explicação sobre como o Big Data envolve mais que apenas bancos de dados, incluindo toda a arquitetura de Big Data, é importante para um entendimento completo do ecossistema.

Como você vê o papel dos bancos de dados relacionais nos próximos anos, à medida que o Big Data e as soluções NoSQL continuam ganhando terreno? Você acredita que haverá uma transição mais ampla para NoSQL em todos os tipos de sistemas, ou ainda teremos uma coexistência entre as duas abordagens por um bom tempo?

Fernanda Araujo
Fernanda Araujo - 12/07/2025 09:27

Obrigada pelo feedback! 👩🏻‍💻

Jeferson Ribeiro
Jeferson Ribeiro - 12/07/2025 09:16

Bancos NoSQL são essenciais para lidar com os desafios do Big Data, como volume, variedade e velocidade, onde os tradicionais bancos relacionais falham. Eles oferecem flexibilidade, escalabilidade horizontal e desempenho otimizado para dados semi ou não estruturados. Ótimo textoo.