xAI запустила свои API Grok Speech-to-Text (STT) и Text-to-Speech (TTS), предлагая передовые возможности обработки аудио. API Grok STT обеспечивает точную транскрипцию с низкой задержкой и такими функциями, как отметки времени на уровне слов и диаризация говорящих, поддерживая более 25 языков. Стоимость составляет 0,10 доллара США за час пакетной обработки и 0,20 доллара США за час потоковой передачи. Тесты производительности показывают, что его эффективность превосходит ведущие модели, такие как ElevenLabs и Deepgram. API Grok TTS обеспечивает быструю и естественную синтез речи с детальным управлением через голосовые теги, стоимость — 4,20 доллара США за миллион символов. Оба API используют технологический стек, применяемый в Grok Voice, автомобилях Tesla и поддержке Starlink, что подчеркивает стремление xAI интегрировать передовые аудиорешения во всех своих платформах.