Estamos prestes a perceber que, para fazer algo significativamente útil com IA Generativa, você não pode depender apenas de LLMs autorregressivos para tomar suas decisões. Eu sei o que você está pensando: “RAG é a resposta”. Ou ajuste fino ou GPT-5.
Sim. Técnicas como RAG baseado em vetores e ajuste fino podem ajudar. E eles são bons o suficiente para alguns casos de uso. Mas há toda uma outra classe de casos de uso em que todas essas técnicas esbarram no teto.
O RAG baseado em vetores – da mesma forma que o ajuste fino – aumenta a probabilidade de uma resposta correta para muitos tipos de perguntas.
No entanto, nenhuma das técnicas fornece a certeza de uma resposta correta. Muitas vezes, eles também carecem de contexto e conexão com o que você sabe ser verdade. Além disso, essas ferramentas não deixam muitas pistas sobre por que eles tomaram uma decisão específica.
Em 2012, o Google introduziu seu mecanismo de busca de segunda geração com uma postagem icônica intitulada “Apresentando o Mapa do Conhecimento: coisas, não strings” (link ao final do artigo). Eles descobriram que um grande salto em capacidade é possível se você usar um grafo de conhecimento para organizar as coisas representadas pelas strings em todas essas páginas da web, além de também fazer todo o processamento das strings. Estamos vendo esse mesmo padrão se desdobrar na IA Generativa hoje. Muitos projetos de IA Generativa estão esbarrando em um teto, onde a qualidade dos resultados é limitada pelo fato de que as soluções em uso lidam com strings e não com coisas.
Engenheiros de IA e pesquisadores acadêmicos de ponta estão descobrindo a mesma coisa que o Google descobriu: que o segredo para romper esse teto são os grafos de conhecimento. Em outras palavras, traga conhecimento sobre as coisas para a mistura de técnicas de texto baseadas em estatísticas. Isso funciona como qualquer outro tipo de RAG, exceto com uma chamada para um grafo de conhecimento além de um índice vetorial. Ou em outras palavras, GraphRAG!
Vamos trazer uma série de posts baseados no manifesto do GraphRAG (link ao final deste post). Construir um grafo de conhecimento dos seus dados e usá-lo no RAG oferece diversas vantagens poderosas. Há um conjunto robusto de pesquisas provando que ele oferece melhores respostas para a maioria, senão TODAS as perguntas que você pode fazer a um LLM usando RAG “normal” baseado em vetor.
Só isso já será um grande impulsionador da adoção do GraphRAG. Além disso, você obtém um desenvolvimento mais fácil graças à visibilidade dos dados durante a construção do seu aplicativo. Uma terceira grande vantagem é que os grafos podem ser facilmente compreendidos e fundamentados tanto por humanos quanto por máquinas. Construir com GraphRAG, portanto, pode oferecer melhores resultados, é explicável e auditável!
Vamos deixar claro que quando dizemos grafo, queremos dizer algo assim:
Ou isso:
Ou mesmo isso:
Em outras palavras, estamos falando de grafo e não de gráfico.
Armazenamos um grafo de conhecimento em um banco de dados de grafo ou Graph Database como parte de um pipeline RAG, que então receberá consulta de um LLM. É disso que trata o GraphRAG.
GraphRAG é uma nova abordagem que visa superar muitos desafios e estender os recursos dos LLMs para dados privados. GraphRAG significa Graph Retrieval-Augmented Generation e combina dois componentes principais: um módulo de recuperação baseado em grafo e um módulo de geração com reconhecimento de grafo.
Vamos detalhar o tema nos próximos posts!
David Matos
Referências:
Introducing the Knowledge Graph: things, not strings
The GraphRAG Manifesto: Adding Knowledge to GenAI
GraphRAG: A New Approach for Question & Answering on Private Data
2 thoughts on “GraphRAG – A Nova Fronteira em IA Generativa”