Article image
Edilson Silva
Edilson Silva31/01/2025 18:58
Compartilhe

Mas afinal, o que a Famosa Tal da "DEEPSEEK" tem de tão especial comparado às outras IAs?

  • #Amazon Rekognition
  • #Machine Learning
  • #HTML
  • #Python
  • #CSS
  • #Inteligência Artificial (IA)

A Deepseek é uma empresa chinesa de IA que ganhou destaque recentemente por alguns aspectos interessantes:

A principal inovação da Deepseek está em seu modelo de código chamado Deepseek Coder, que se destaca por:

1. Capacidade avançada de programação: Demonstrou desempenho excepcional em tarefas de programação, frequentemente superando outros modelos em benchmarks de código.

2. Treinamento especializado: Foi treinado especificamente para entender e gerar código, com foco em qualidade e precisão técnica.

3. Modelo de código aberto: Diferentemente de muitas outras empresas de IA, a Deepseek disponibilizou versões de seus modelos em código aberto, permitindo que pesquisadores e desenvolvedores os estudem e adaptem.

No entanto, é importante notar que a Deepseek é uma empresa relativamente nova no campo da IA, especialmente quando comparada com gigantes como OpenAI, Google ou Anthropic. Seu foco principal tem sido em ferramentas de desenvolvimento e geração de código.

Não é tanto que a Deepseek seja revolucionariamente diferente de outras IAs, mas sim que ela encontrou um nicho específico (programação) onde conseguiu desenvolver modelos muito competentes.

Existe algum aspecto específico da Deepseek que você gostaria de entender melhor?

Compartilhe
Comentários (5)
Edilson Silva
Edilson Silva - 31/01/2025 20:54

Obrigado pelo feedback amigos!


Douglas Cabral
Douglas Cabral - 31/01/2025 20:11

Gostei do conteúdo! Faça mais.


Carlos Lima
Carlos Lima - 31/01/2025 19:54

@Edilson Silva

Eu acredito que FeedBack é uma ferramenta importante, e o faço com respeito ao seu trabalho. Há algumas pontuações importantes que gostaria de fazer em relação ao seu texto.


Você:

"[...] A principal inovação da Deepseek está em seu modelo de código chamado Deepseek Coder, que se destaca por:"


A razão pela qual a plataforma ficou popular deve-se a dois detalhes: 1) A quantidade de recursos utilizados e 2) A aplicação de RL (Reinforcement Learning) para treinar o seu modelo. Você pode obter essas informações no paper publicado pela empresa, inclusive isto é mencionado no título, DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning.


Há outras variações do modelos (Além da R1), a Coder é uma delas, mas há uma versão Vision e Math (Por exemplo). Todos tiveram resultados excepcionais (pelo método usado).

image

Você:

"[...]" Não é tanto que a Deepseek seja revolucionariamente diferente de outras IAs, mas sim que ela encontrou um nicho específico (programação) onde conseguiu desenvolver modelos muito competentes."


A imagem abaixo mostra o BENCHMARK do DeepSeek-V3 em relação a outros modelos. Além dos aspectos ténicos, como uma jornalidade da BBC fala, "Eles fizeram uma ferrari com peças de um chevette." Na arquitetura eles usam uma chamada MoE. A Meta (Llama), Alibaba Cloud (Qwen) usad DENSE. Há um avanço e tanto, vou ser breve na explicação para esclarecer.

image


  • MoE >> Um aluno quer tirar uma dúvida sobre história, de todos os professores escolhidos ele seleciona apenas aqueles que sabem sobre o tema.
  • Dense >> Um aluno tem uma dúvida mas todos os professores tentam ajudar (mesmo quem não sabe muito).


Pensando em termos de redes neurais é como se usando MoE apenas alguns neurônios mais espertos fossem usados enquanto Dense todos tentam ajudar. A lógica? MoE é mais eficiente, gasta menos recursos e é mais escalável.


Eu:

Observação minha: não sabemos a arquitetura da Openai porque eles não relevam ("Open"AI).


Acredito que tentou simplificar os conceitos o que é nobre, mas fiquei preocupado que essa simplificação possa levar outros leitores a assumirem pontos que não condizem com os avanços que a empresa fez.

Eu escrevi um artigo técnico, mas me reservo a não mencionar aqui, porque outras pessoas trataram sobre o tema. Além do paper, há outros recursos que talvez você queira checar.




Att, Cll.

Edilson Silva
Edilson Silva - 31/01/2025 19:54

Tamo junto Leilayne!

Que bom que gostou!

Leilayne Souza
Leilayne Souza - 31/01/2025 19:14

Bacana demais, Edilson! Parabéns pelo artigo!