中国のAI愛好家であるAPFrisco氏は、Moonshot AIのKimi K2.5という1兆パラメータモデルを、単一のNvidia RTX 3060 GPUと768GBのIntel Optane Persistent Memoryを組み合わせた環境で成功裏に動作させました。ミッドレンジのGPUでありながら、このセットアップは1秒あたり約4トークンの処理速度を達成し、従来とは異なるハードウェア構成の可能性を示しました。
Kimi K2.5はMixture-of-Expertsモデルであり、1トークンあたりわずか320億パラメータのみを活性化するため、一般消費者向けのハードウェアでも動作可能です。モデルのフルサイズは約630GBで、量子化バージョンは381GBとなっており、従来のDRAMに比べてコスト効率が高いOptaneメモリの使用が必要です。このデモンストレーションは、Kimi K2.5がオープンウェイトであるため、エンタープライズインフラなしで大規模AIを試すことができるという、先進的なAIモデルのアクセスのしやすさを強調しています。
AI愛好家がOptaneメモリを搭載したRTX 3060で1兆パラメータモデルを実行
免責事項: Phemexニュースで提供されるコンテンツは、あくまで情報提供を目的としたものであり、第三者の記事から取得した情報の正確性・完全性・信頼性について保証するものではありません。本コンテンツは金融または投資の助言を目的としたものではなく、投資に関する最終判断はご自身での調査と、信頼できる専門家への相談を踏まえて行ってください。
