10 repositórios do GitHub para dominar grandes modelos de linguagem
1. Introdução
Se você não está familiarizado com modelos de linguagem de grande porte (LLMs) hoje, talvez já esteja ficando para trás na revolução da IA.
As empresas estão cada vez mais integrando aplicativos baseados em LLM em seus fluxos de trabalho.
Como resultado, há uma alta demanda por engenheiros de LLM e engenheiros de operações que possam treinar, ajustar, avaliar e implementar esses modelos de linguagem em produção.
Neste artigo, reviso 10 repositórios do GitHub que te ajudarão a dominar as ferramentas, habilidades, estruturas e teorias necessárias para trabalhar com grandes modelos de linguagem.
2. Repositórios
2.1 brexhq/prompt-engineering
Este repositório é uma mina de ouro para aprender engenharia de prompts, uma das habilidades mais importantes para trabalhar eficazmente com LLMs. Ele fornece dicas, truques e exemplos para ajudar você a elaborar prompts melhores e aproveitar ao máximo modelos como o GPT-4o.
Por que é importante:
- Concentra-se em técnicas práticas para otimizar prompts.
- Inclui exemplos para diversos casos de uso, como sumarização, codificação e escrita criativa.
2.2 mlabonne/llm-course
Este repositório oferece um curso abrangente sobre LLMs, projetado para alunos de todos os níveis. Inclui tutoriais, projetos e exercícios práticos para ajudar você a compreender e aplicar os LLMs de forma eficaz.
Por que é importante:
- Abrange tanto fundamentos teóricos quanto aplicações práticas.
- Perfeito para iniciantes e profissionais que buscam aprofundar seus conhecimentos.
2.3 Hannibal046/Awesome-LLM
Esta é uma lista completa de recursos relacionados a LLMs, incluindo artigos de pesquisa, ferramentas, frameworks e tutoriais. É um lugar único para explorar o ecossistema de LLMs e se manter atualizado sobre os últimos avanços.
Por que é importante:
- Inclui recursos sobre treinamento, avaliação e serviço de LLMs.
- Atualizado regularmente para incluir novos modelos, ferramentas e pesquisas.
2.4 WooooDyy/LLM-Agent-Paper-List
Este repositório é um tesouro de artigos de pesquisa sobre agentes baseados em LLM. É perfeito para aqueles interessados em aplicações de IA de ponta que utilizam agentes de IA para aprimorar as capacidades dos LLMs.
Por que é importante:
- Mantenha-se atualizado com as últimas pesquisas sobre agentes baseados em LLM.
- Ideal para acadêmicos e profissionais que exploram aplicações de agentes LLM.
2.5 avvorstenbosch/Masterclass-LLMs-for-Data-Science
Este repositório se concentra na integração de LLMs em fluxos de trabalho. Ele oferece uma introdução em formato de e-book a diversos tópicos, como engenharia de prompts, LLMs locais, problemas de geração aumentada por recuperação (RAG) e muito mais. Além disso, inclui exercícios com soluções para você praticar seu aprendizado.
Por que é importante:
- Aprenda a aproveitar LLMs em projetos técnicos.
- Feito sob medida para cientistas de dados que buscam expandir seu conjunto de habilidades.
2.6 Shubhamsaboo/awesome-llm-apps
Este repositório é uma coleção de aplicações incríveis baseadas em LLM, apresentando casos de uso reais desenvolvidos com OpenAI, Anthropic, Gemini e modelos de código aberto. Também destaca agentes de IA e sistemas de geração aumentada de recuperação (RAG).
Por que é importante:
- Explore aplicações reais de LLMs.
- Inspire-se com casos de uso exclusivos e estruturas fáceis de usar.
2.7 BradyFU/Awesome-Multimodal-Large-Language-Models
Este repositório concentra-se em LLMs multimodais, que podem processar diversos tipos de entrada, como texto, imagens e áudio. É leitura obrigatória para quem está explorando a próxima fronteira das capacidades de LLM.
Por que é importante:
- Fornece insights sobre os mais recentes avanços em IA multimodal.
- Inclui uma lista de artigos, ferramentas e conjuntos de dados.
2.8 HandsOnLLM/Hands-On-Large-Language-Models
Este é o repositório oficial de código para o livro "Hands-On Large Language Models" da O'Reilly. Ele inclui exemplos práticos e projetos para ajudar você a adquirir experiência prática com LLMs.
Por que é importante:
- Um recurso de aprendizagem prático para desenvolvedores e engenheiros.
- Abrange tópicos como ajuste fino, implantação e criação de aplicativos com tecnologia LLM.
2.9 SylphAI-Inc/LLM-engineer-handbook
Este manual contém uma lista de recursos para engenheiros de LLM, abrangendo desde o treinamento de modelos até a implantação. É perfeito para desenvolvedores que criam ou ajustam aplicativos de LLM.
Por que é importante:
- Um guia completo para engenharia LLM
- Inclui ferramentas e estruturas para treinamento e atendimento a LLMs.
2.10 rasbt/LLMs-from-scratch
Se você tem interesse em construir seu próprio LLM do zero, este repositório é para você. Ele o guia passo a passo pelo processo de implementação de um modelo semelhante ao ChatGPT no PyTorch.
Por que é importante:
- Ideal para quem quer uma compreensão profunda dos detalhes internos do LLM.
- Uma abordagem prática para dominar os conceitos fundamentais dos LLMs.
3. Conclusão
Dominar LLMs requer uma combinação de conhecimento teórico, familiaridade com ferramentas modernas e experiência prática.
Os 10 repositórios do GitHub abordados aqui oferecem todos os três, apresentando frameworks de IA de ponta, fornecendo recursos, artigos e tutoriais valiosos e guiando você por exercícios e projetos para construir seus próprios aplicativos baseados em LLM.
Além disso, esses repositórios são atualizados regularmente, ajudando você a se manter atualizado com os avanços em aplicativos de LLM, agentes de IA e frameworks.