Perceptron AI, video anlayışı ve somut akıl yürütme için tasarlanmış amiral gemisi multimodal modeli Mk1'i tanıttı. Eski Meta FAIR araştırmacıları Armen Aghajanyan ve Akshat Shrivastava tarafından kurulan 14 kişilik ekip, Mk1'i daha düşük maliyetle sunarak Google ve OpenAI gibi sektör devleriyle rekabet etmeyi hedefliyor. Model, video zamanlama akıl yürütmesinde üstün performans gösteriyor; yapılandırılmış zaman çizelgesi analizleri oluşturabiliyor ve videolardaki belirli olayları tespit edebiliyor.
Mk1'in yetenekleri görüntü işlemeye de uzanıyor; piksel düzeyinde işaretleme, yoğun nesne sayımı ve karmaşık OCR destekliyor. Belgeleri HTML, JSON veya Markdown formatına dönüştürebiliyor, bu da onu gösterge paneli dijitalleştirme gibi endüstriyel uygulamalar için uygun hale getiriyor. Robotik alanında Mk1, politika modelleri için mekansal temel öğeler sağlıyor ve teleoperasyonlu video kayıtlarını notlandırarak manuel notlandırma ihtiyacını azaltıyor. Model, Perceptron API ve OpenRouter üzerinden erişilebilir durumda.
Perceptron AI, Google ve OpenAI'ye Meydan Okuyarak Mk1 Modelini Tanıttı
Sorumluluk Reddi: Phemex Haberler'de sunulan içerik yalnızca bilgilendirme amaçlıdır. Üçüncü taraf makalelerden alınan bilgilerin kalitesi, doğruluğu veya eksiksizliğini garanti etmiyoruz. Bu sayfadaki içerik finansal veya yatırım tavsiyesi niteliği taşımaz. Yatırım kararları vermeden önce kendi araştırmanızı yapmanızı ve nitelikli bir finans danışmanına başvurmanızı şiddetle tavsiye ederiz.
