Cómo estimar Volumen de consultas y tamaño de contexto. Herramientas externas (APIs) y latencia. Caching, compresión y selección de modelos.