Poetiq, ein von ehemaligen Google- und DeepMind-Forschern gegründetes Startup, hat bekannt gegeben, dass sein Meta-System einen neuen Rekord im LiveCodeBench Pro Programmier-Benchmark aufgestellt hat. Dieses API-basierte intelligente System verbessert die Programmierfähigkeiten großer Modelle, ohne die Modellgewichte zu verändern oder ein Feintuning durchzuführen. Bemerkenswert ist, dass die Genauigkeit von Kimi K2.6 von 50,0 % auf 79,9 % gestiegen ist, ein Zuwachs von 29,9 Prozentpunkten, während Gemini 3.0 Flash um 10 Punkte verbessert wurde und damit größere Modelle wie Claude Opus 4.7 und GPT 5.2 High übertraf. Das Meta-System steigerte auch die Punktzahl von GPT 5.5 High von 89,6 % auf 93,9 % und half Gemini 3.1 Pro, 90,9 % zu erreichen, womit es Googles Gemini 3 Deep Think mit 88,8 % übertraf. Poetiq betont, dass ihr System Unternehmen ermöglicht, die Fähigkeiten zum logischen Denken zu verbessern, ohne die hohen Kosten, die mit traditionellem Feintuning und dem Einsatz von vollumfänglichen Modellen verbunden sind.