Logan Kilpatrick, Gerente Senior de Producto en Google DeepMind, ha instado a las empresas de inteligencia artificial a desarrollar sus propios puntos de referencia para evaluar mejor el rendimiento de los modelos de IA. Hablando en X, Kilpatrick enfatizó que los puntos de referencia personalizados permiten a las empresas centrarse en métricas relevantes para sus necesidades comerciales específicas, en lugar de depender de tablas de clasificación públicas que pueden no reflejar sus casos de uso únicos. Destacó que empresas como Zapier y Sierra ya se están beneficiando de este enfoque, que puede impulsar mejoras significativas en el rendimiento de los modelos de IA adaptados a tareas específicas del negocio.