Poetiqは、元GoogleおよびDeepMindの研究者によって設立されたスタートアップであり、そのMeta-SystemがLiveCodeBench Proプログラミングベンチマークで新記録を樹立したことを発表しました。このAPIベースのインテリジェントハーネスは、モデルの重みを変更したりファインチューニングを行ったりすることなく、大規模モデルのコーディング能力を向上させます。特に、Kimi K2.6の精度は50.0%から79.9%に29.9ポイント上昇し、Gemini 3.0 Flashも10ポイント改善し、Claude Opus 4.7やGPT 5.2 Highといったより大きなモデルを上回りました。
また、Meta-SystemはGPT 5.5 Highのスコアを89.6%から93.9%に押し上げ、Gemini 3.1 Proが90.9%を達成し、GoogleのGemini 3 Deep Thinkの88.8%を超えました。Poetiqは、このハーネスにより、企業が従来のファインチューニングや大規模モデルの展開に伴う高コストなしに推論能力を向上させることができると強調しています。
PoetiqのメタシステムがAIモデルの性能を最大29.9%向上
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
