GPU vs CPU

Modo de procesamiento de LLM
Permite seleccionar cómo se ejecutarán los modelos de lenguaje: utilizando CPU o GPU.
CPU
El procesamiento se realiza mediante el procesador principal del servidor. Es adecuado para cargas moderadas, entornos de prueba o cuando no se dispone de GPU dedicada.
GPU
El procesamiento se acelera mediante una unidad gráfica. Recomendado para escenarios de mayor demanda, consultas complejas, RAG intensivo o múltiples usuarios concurrentes.
