\
Россия, Москва | Официальный портал (ВОИР) Всероссийского общества изобретателей и рационализаторов
Одна голова хорошо, а 3D — лучше
31.07.2020

Российские программисты воплотили метафору в реальность.

 

Патент: 2723454

 

Авторы: Альберт Ефимов; Алексей Гонноченко; Михаил Владимиров

 

Патентообладатель: Сбербанк России

 

Выражение «говорящая голова» встречалось почти каждому. В различных контекстах оно может обозначать разные понятия: от телевизионного ведущего-новостника, диктора за столом в студии, до человека, который особо не раздумывает над смыслом произносимых тезисов. Российские программисты решили, что этому выражению пора обрести реальное воплощение.

 

Технология, придуманная отечественными разработчиками, сочетает в себе два основных алгоритма.

 

Первый — это синтез речи на основе написанного текста. Подобные технологии, например, используются на новостных сайтах, чтобы люди с ограниченными возможностями могли усвоить материал на слух: в текстовый материал на странице встраивается специальный плеер, который на основе текста выдает звуковой файл.

 

Вторая технология — это синтез 3D-проекции лица на основе звукового сигнала. Программное решение, заложенное в основе упомянутого алгоритма, используя нейросети, помогает создавать точную действующую мимическую модель человеческого лица. Другими словами, вы будете не просто слышать из «уст» проекции какой-то текст, но и получать невербальную информацию, которую при общении двух людей мы считываем, слушая интонации и наблюдая за меняющейся мимикой собеседника. Мимическое выражение, точнее последовательность кадров динамической текстуры лицевой маски, 3D-проекции будет определяться на основе последовательности изображений частотного спектра звукового файла.

 

Технологию российских программистов можно использовать, например, для впечатляющей телевизионной и видео-рекламы, для визуальных шоу, спектаклей и игр, создания 3D-фильмов и анимации, в голосовых помощниках и «умных» домах, в процессах коммуникации большого количества людей и диктора (например, на вокзале или в аэропорту), а также различных терминалах.

 

Подробности технологии — в опубликованном патенте.

 

Источник: сайт Роспатента

 

Все материалы сайта доступны по лицензии Creative Commons Attribution 3.0 при условии ссылки на первоисточник (в случае использования материалов сайта в сети Интернет – интерактивная ссылка)

105122, г. Москва, ул. Щёлковское шоссе, д. 5, стр. 1, офис 602-3,
(м. Черкизовская) тел.: +7 (495) 849-12-23

По всем вопросам, связанным с работой портала, обращайтесь на: info@ros-voir.ru

© 1932-2017 | ОО «ВОИР»