Poetiqは、元GoogleおよびDeepMindの研究者によって設立されたスタートアップであり、そのMeta-SystemがLiveCodeBench Proプログラミングベンチマークで新記録を樹立したことを発表しました。このAPIベースのインテリジェントハーネスは、モデルの重みを変更したりファインチューニングを行ったりすることなく、大規模モデルのコーディング能力を向上させます。特に、Kimi K2.6の精度は50.0%から79.9%に29.9ポイント上昇し、Gemini 3.0 Flashも10ポイント改善し、Claude Opus 4.7やGPT 5.2 Highといったより大きなモデルを上回りました。 また、Meta-SystemはGPT 5.5 Highのスコアを89.6%から93.9%に押し上げ、Gemini 3.1 Proが90.9%を達成し、GoogleのGemini 3 Deep Thinkの88.8%を超えました。Poetiqは、このハーネスにより、企業が従来のファインチューニングや大規模モデルの展開に伴う高コストなしに推論能力を向上させることができると強調しています。