xAI, gelişmiş ses işleme yetenekleri sunan Grok Konuşmadan Metne (STT) ve Metinden Konuşmaya (TTS) API'lerini piyasaya sürdü. Grok STT API, kelime düzeyinde zaman damgaları ve konuşmacı ayrımı gibi özelliklerle doğru ve düşük gecikmeli transkripsiyon hizmetleri sunmakta olup, 25'ten fazla dili desteklemektedir. Toplu işlem için saat başı 0,10 ABD doları, akış için ise saat başı 0,20 ABD doları fiyatlandırılmaktadır. Karşılaştırmalı testler, performansının ElevenLabs ve Deepgram gibi önde gelen modelleri geride bıraktığını göstermektedir. Grok TTS API ise ses etiketleri aracılığıyla ayrıntılı kontrol imkanı sunan hızlı ve doğal konuşma sentezi sağlamaktadır ve milyon karakter başına 4,20 ABD doları fiyatlandırılmaktadır. Her iki API de Grok Voice, Tesla araçları ve Starlink destek sistemlerinde kullanılan teknoloji yığınına dayanmakta olup, xAI'nın platformları genelinde en son ses çözümlerini entegre etme taahhüdünü vurgulamaktadır.