RAG

Retrieval-Augmented Generation

søgningforankringviden

Overblik

Retrieval-Augmented Generation (RAG) kombinerer en sprogmodel med et søgesystem for at forankre output i specifikke, opdaterede dokumenter. I stedet for udelukkende at stole på parametrisk viden i modelsvægte, henter RAG dynamisk relevante afsnit fra en vektordatabase eller søgeindeks og videregiver dem som kontekst til LLM'en.

Nøglekoncepter

Forespørgselsindkodning: indlejrer brugerspørgsmålet i en vektor
Søgning: finder semantisk lignende dokumenter fra en vektordatabase
Kontekstinjektion: tilføjer hentede afsnit til LLM-prompten
Generering: LLM'en svarer forankret i hentet bevis
Valgfrit: post-søgning reranking for præcisionsforbedring

Fakta

RAG blev introduceret af Lewis et al. ved Facebook AI Research i 2020
Det reducerer hallucinationer ved at levere verificerbart kildemateriale
Hybrid RAG kombinerer tæt søgning med nøgleordssøgning (BM25)
RAG bruges udbredt i virksomhedsvidensbaser, juridisk forskning og medicinsk AI

RAG

Overblik

Nøglekoncepter

Fakta

Se også

Transformers

Prompt Engineering

Agentiske Workflows

Indlejringer

Store Sprogmodeller

Kontekstvinduet