Poetiq, una startup fundada por ex investigadores de Google y DeepMind, ha anunciado que su Meta-System ha establecido un nuevo récord en el benchmark de programación LiveCodeBench Pro. Este arnés inteligente basado en API mejora las capacidades de codificación de grandes modelos sin modificar los pesos del modelo ni realizar ajustes finos. Notablemente, la precisión de Kimi K2.6 aumentó del 50.0% al 79.9%, una ganancia de 29.9 puntos porcentuales, mientras que Gemini 3.0 Flash mejoró en 10 puntos, superando a modelos más grandes como Claude Opus 4.7 y GPT 5.2 High. El Meta-System también elevó la puntuación de GPT 5.5 High del 89.6% al 93.9%, y ayudó a Gemini 3.1 Pro a alcanzar un 90.9%, superando a Gemini 3 Deep Think de Google con un 88.8%. Poetiq enfatiza que su arnés permite a las empresas mejorar las capacidades de razonamiento sin los altos costos asociados con el ajuste fino tradicional y el despliegue de modelos a gran escala.