GLM-5.1 has emerged as the leading open-source model in the Artificial Analysis Coding Agent Benchmark, according to a report by Artificial Analysis. The benchmark evaluates model performance on three key tests: SWE-Bench-Pro-Hard-AA, Terminal-Bench v2, and SWE-Atlas-QnA, which simulate real-world programming and technical tasks. While the proprietary Opus 4.7 model secured the top global position, GLM-5.1, operating on Claude Code, led among open-source models, showcasing its advanced capabilities in programming agent scenarios.
GLM-5.1 Tops Open-Source Models in Coding Agent Benchmark
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
