Alibaba veröffentlicht AgenticQwen-Modell mit Dual Data Flywheel

Das PAI-Team von Alibaba hat das AgenticQwen-Modell veröffentlicht, ein leichtgewichtiges Agenten-Sprachmodell, das für den industriellen Einsatz bei der Werkzeugaufrufung entwickelt wurde und nun in den Versionen 8B und 30B-A3B als Open Source verfügbar ist. Durch die Nutzung eines neuartigen "Dual Data Flywheel"-Verstärkungslernrahmens erreicht das Modell Fähigkeiten, die denen großer Modelle ähneln, jedoch mit reduzierten Inferenzkosten. Der Dual-Flywheel-Ansatz verbessert die Leistung, indem er komplexe Entscheidungsfindungsszenarien generiert und aus Modellfehlern lernt. AgenticQwen-8B erzielt im Durchschnitt 47,4 Punkte bei Benchmarks wie TAU-2 und BFCL-V4, übertrifft das Basismodell Qwen3-8B und nähert sich dem Qwen3-235B-Modell an. Die 30B-A3B-Version, die nur 3 Milliarden Parameter aktiviert, erreicht 50,2 Punkte. Trotz seines Erfolgs stellt die Begrenzung der Kontextlänge auf 40.000 Token eine Herausforderung bei tiefgehenden Suchaufgaben dar. Das Modell wird bereits in den internen Systemen von Alibaba eingesetzt und bietet verbesserte Leistung bei kürzeren Inferenzzeiten.

Das könnte Ihnen auch gefallen