La Fundación LightSeek ha presentado el Shepherd Model Gateway (SMG) para abordar los cuellos de botella de la CPU en los servicios de modelos de lenguaje grande (LLM). Lanzado el 1 de mayo, el SMG tiene como objetivo optimizar la eficiencia de producción al descargar las tareas que no requieren GPU a una pasarela basada en Rust. Este enfoque minimiza el bloqueo de la CPU durante el proceso de inferencia al establecer límites mínimos de gRPC, mejorando así el rendimiento general del servicio.