Google DeepMind'de Kıdemli Ürün Yöneticisi olan Logan Kilpatrick, yapay zeka şirketlerini AI model performansını daha iyi değerlendirmek için kendi kıyaslamalarını geliştirmeye çağırdı. X platformunda konuşan Kilpatrick, özel kıyaslamaların şirketlerin benzersiz kullanım durumlarını yansıtmayabilecek genel sıralamalara güvenmek yerine, kendi iş ihtiyaçlarına uygun metriklere odaklanmalarını sağladığını vurguladı. Zapier ve Sierra gibi şirketlerin bu yaklaşımdan zaten faydalandığını ve bunun iş odaklı görevler için AI model performansında önemli iyileştirmeler sağlayabileceğini belirtti.