マイクロソフトは、コンピュータのタスク自動化に特化した7Bパラメータの小型言語モデル「Fara-7B」を発表しました。マルチモーダルデコーダーアーキテクチャを活用し、Fara-7Bはスクリーンショット画像とテキストコンテキストを処理して、操作アクションや思考の連鎖を予測します。このモデルはQwen 2.5-VL(7B)をベースにしており、128kのコンテキスト長をサポートし、64台のH100 GPUで2.5日間トレーニングされました。MITライセンスの下で公開されており、ブラウザの入力を解釈してアクションを予測することで、レストランの予約や旅行の計画などのタスクを実行できます。
Fara-7Bは、ポリシー違反を回避し、個人情報入力時などの重要なポイントで操作を停止するために、トレーニング後の手法やキーポイント認識などの安全対策を採用しています。このモデルはGitHub、vllm、fara-cliツールを通じて展開可能で、ウェブベースのタスクの自動化を促進します。
マイクロソフト、コンピュータ作業自動化のための7Bパラメータモデル「Fara-7B」を発表
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
