Mikä on RAG
Hakutäydennetty generointi — LLM:n rikastaminen ulkoisella datalla
RAG (Hakutäydennetty generointi) — arkkitehtuuri, joka rikastaa LLM-vastauksia ulkoisen tietokannan asiaankuuluvilla tiedoilla.
Miten RAG toimii
- Kysely — käyttäjä esittää kysymyksen
- Haku — järjestelmä löytää asiaankuuluvat dokumentit tietokannasta
- Konteksti — löydetyt dokumentit lisätään kehotteeseen
- Generointi — LLM tuottaa vastauksen huomioiden kontekstin
RAG-järjestelmän komponentit
- Upotus-malli — muuntaa tekstin vektoreiksi
- Vektori-DB — tallentaa ja hakee upotuksia
- Pilkkominen — dokumenttien jakaminen osiin
- Järjestys — tulosten lajittelu relevanssin mukaan
- LLM — tuottaa lopullisen vastauksen
Edistyneet tekniikat
- Hybridihaku — vektori- ja avainsanahaun yhdistelmä
- Uudelleenjärjestys — tulosten uudelleenjärjestely
- Kyselyn laajennus — kyselyn laajentaminen synonyymeillä
- Monihyppyinen RAG — hakuketju monimutkaisiin kysymyksiin
Liiketoimintasovellukset
- Yritysavustajat — vastaukset sisäisistä dokumenteista
- Tekninen tuki — tietopohja tukiboteille
- Oikeusjärjestelmät — lakien ja ennakkotapausten haku
- Terveydenhuolto — tietoa oireista ja protokollista