Arquitectura
Ingesta y chunking, vectorización, orquestador, políticas (guardrails), herramientas y observabilidad. Elección de base vectorial, esquema de metadatos y estrategias de actualización.
Calidad
- Estrategias de chunking, re-rankers, multi-vector y context windows.
- Evals automáticas/semiautomáticas, trazabilidad y feedback loop.
- Mitigación de alucinaciones y políticas de citación.
Costes
Estimación por volumen de consultas, tamaño de contexto y frecuencia de actualización. Caching, compresión y modelos alternativos para optimizar coste/latencia.