Пользователям также стали доступны автоматические субтитры в режиме реального времени.
Платформа для видеоконференций VK Звонки анонсировала новые функции на основе машинного обучения и нейросетей.
Функция расшифровки автоматически переводит звуковую дорожку беседы в текст, который можно найти в чате звонка после его окончания. Пользователи также смогут запустить автосубтитры, которые будут дублировать речь участников звонка в ходе конференции. Новые возможности доступны всем пользователям VK Звонков.
Кроме того, нейросеть умеет определять разных спикеров и разделять речь на предложения. Текстовую расшифровку можно запустить вместе с субтитрами и записью звонка. Пока сервис доступен на русском, но в будущем команда разработчиков добавит и другие языки.
Перевод речи в текст использует собственные нейросетевые разработки ВКонтакте, которые соцсеть применяет для расшифровки голосовых сообщений и создания автосубтитров в видео.