Блог Sonos

Новая технология Arc Ultra упрощает диалоги в фильмах и шоу

Новая функция Sonos по улучшению речи на основе искусственного интеллекта: разработана для людей с нарушениями слуха

Если вы когда-либо пытались понять, что только что сказал персонаж по телевизору, вы не одиноки. Диалоги в фильмах и сериалах стало трудно воспринимать по многим причинам: спешка при съёмках, плохое микширование, глобальные акценты и даже акустика помещения. Тем, у кого проблемы со слухом, приходится ещё хуже. Увеличение громкости не всегда помогает, а субтитры могут отвлекать, когда вы пытаетесь насладиться всеми визуальными элементами кинокартины.

Именно поэтому мы представляем обновлённую функцию улучшения речи, которая обеспечивает четыре уровня контроля, позволяющие настроить чёткость речи в соответствии с вашими потребностями, в том числе для людей с нарушениями слуха. Впервые она будет доступна на нашей звуковой панели Arc Ultra в бесплатном обновлении программного обеспечения 13 мая 2025 года.

Более разумный способ услышать Каждое Слово В Sonos нашей целью всегда было помочь людям наслаждаться качественным звуком. Мы знали, что можем сделать больше для людей с нарушениями слуха, поэтому мы заключили первое в своём роде соглашение о сотрудничестве с RNID (Королевским национальным институтом для глухих), чтобы разработать решение для улучшения речи, которое действительно решает уникальные проблемы, с которыми сталкивается это сообщество при просмотре телевизора.

Мэтт Бенатан, главный научный сотрудник Sonos, говорит: «Это не просто практично, это эмоционально. Один из самых важных аспектов просмотра телепередач и фильмов — это возможность общаться во время культурных и развлекательных мероприятий, которые транслируются в реальном времени. Если один из зрителей не может полностью расслышать диалог, он может потерять возможность наслаждаться происходящим и участвовать в нём».

Это была суровая правда, но она глубоко вдохновила нашу команду. Несмотря на то, что телевизионные звуковые панели уже много лет предлагают базовую функцию улучшения речи, им часто не хватало эффективности и качества звука, необходимых для решения проблемы. Мы отправились в долгий путь, чтобы создать эффективное решение, и искусственный интеллект стал прорывом.

«Внедрив машинное обучение в нашу технологию распознавания речи, мы выяснили, как отделить диалог от других звуков в центральном канале и улучшить качество речи в режиме реального времени, — сказал Гарри Джонс, инженер по звуку в Sonos. — Это позволяет нам выделять только диалог в наиболее подходящие моменты, не слишком влияя на громкость и не нарушая целостность кинематографического впечатления».

В результате получился динамический инструмент для улучшения речи с четырьмя различными уровнями на выбор, самый высокий из которых специально разработан для людей с нарушениями слуха. Он доступен на главном экране приложения Sonos:

  • Низкий уровень — тонкий, художественный намёк, который подчёркивает диалог, сохраняя при этом оригинальный опыт и замысел автора.
  • Средний — средний уровень усиления, обеспечивающий лучшую разборчивость речи и гармоничное сочетание окружающих элементов.
  • Высокий — более высокая настройка, которая делает диалог более заметным, уменьшая при этом другие элементы микширования.
  • Макс. — наиболее выраженная настройка, при которой четкость диалога имеет первостепенное значение. Предназначена для людей с нарушениями слуха. В отличие от более сбалансированных настроек «Низкий», «Средний» и «Высокий» уровни, «Макс.» дополнительно контролирует динамический диапазон неречевых элементов, ставя диалог на первое место.

Разработан с участием Реальных Людей, для Реальной Жизни Работая с RNID, мы сотрудничали с 37 участниками разного возраста и с разной степенью потери слуха, чтобы собрать их подробные отзывы о повседневном прослушивании и протестировать функцию в различных типах контента в течение почти года.

«Мы хотели убедиться, что функция улучшения речи будет работать для всех, даже для тех, кто может даже не подозревать о потере слуха, — сказала Лорен Уорд, ведущий научный сотрудник RNID. — Каждый третий взрослый в Великобритании страдает от потери слуха, и, по имеющимся данным, чуть менее каждого четвёртого взрослого в США тоже. Этот инструмент может помочь большому количеству людей».

Мы также работали с отмеченным наградами специалистом по звуку в кино Крисом Дженкинсом, чтобы перенести методы извлечения речи, используемые в студии, прямо в дома людей, сохранив при этом другие элементы микширования, такие как звуковые эффекты и музыку.

«Новая функция Sonos «Улучшение речи» — это огромный шаг вперёд в решении проблем, связанных с диалогами, которые возникают из-за большого количества контента, доступного людям сегодня, — сказал Дженкинс. — Это также свидетельство того, насколько важно сохранять человеческий подход при создании ИИ-решений. Мы потратили бесчисленное количество часов на прослушивание, во время которых мы вместе прорабатывали детали, настраивая каждую функцию так, чтобы она деликатно улучшала диалог, сохраняя при этом задумку автора».

«При создании Speech Enhancement мы знали, что хотим с самого начала разработки учитывать мнение людей с нарушениями слуха, — сказал Бенатан. — То, что мы узнали от исследователей и участников RNID, идеально дополнило информацию от Криса Дженкинса, позволив нам рассмотреть более широкий спектр точек зрения слушателей. Это было невероятное сотрудничество, и мы благодарны за их опыт и время, потраченные на совместную разработку этого приложения».

Комментарии

Сообщения не найдены

Написать отзыв