How it works

How the RAG pipeline works

Technical overview of the consulting chat assistant on this site.

User question

LiveView chat form

Embed query

Vector embedding via LLM API

Retrieve chunks

pgvector similarity search

Augment prompt

FAQ + portfolio context

LLM answer

Gemini / OpenAI completion

Rate limit & log

ETS token bucket + audit