Cómo funciona

Cómo funciona el pipeline RAG

Resumen técnico del asistente de consultoría en este sitio.

Pregunta del usuario

Formulario chat LiveView

Embedding de consulta

Embedding vectorial vía API LLM

Recuperar chunks

Búsqueda por similitud pgvector

Aumentar prompt

Contexto FAQ + portafolio

Respuesta LLM

Completion Gemini / OpenAI

Rate limit y log

Token bucket ETS + auditoría