Общество

Точность распознавания речи в «VK Видео» на 25% повысил искусственный интеллект

17 сентября 2024

Сервис «VK Видео» внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Точность анализа и расшифровки выросла на 25 %, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Автоматические субтитры генерируются с помощью ML-моделей, которые создают текст и расставляют знаки препинания, синхронизируют его с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.

В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.

Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28 %, и сейчас субтитрами пользуются 11 % всей аудитории «VK Видео». Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.

Источник: CNews

Lifestyle

Сольный концерт Жени Львовской на СИГНОН Open Air Fest 2023 состоялся накануне выхода дебютного альбома певицы

В преддверии выхода дебютного альбома певица Женя Львовская выступила с сольным концертом на музыкальном фестивале…

Авто

Dahua Technology демонстрирует решения для ИТС на базе искусственного интеллекта на выставке Intertraffic 2026

Компания Dahua Technology, ведущий мировой поставщик видео-ориентированных решений и услуг AIoT, вновь приняла участие в…

Культура

Мазок кисти на миллиард долларов: арт-платформа юриста собирает каталог выставленных на продажу предметов на сумму более 1 млрд долл за первый месяц  

Смелый взгляд юриста в сфере развлечений и творчества на революционную платформу онлайн-аукционов, Lloyds Auctions, которая…

Экономика

Робин Цзэн: открытие эры устойчивой энергетики с помощью технологии с нулевым выбросом углерода

Д-р Робин Цзэн (Robin Zeng), председатель и генеральный директор CATL, выступил с речью о будущем…