allBanks.com.ua - крупнейший каталог банков
Банки Украины: Все
Киев Харьков Днепропетровск Одесса

Google представила ИИ-инструмент, который может оживлять фотографии

19.03.2024 в 18:45

Исследователи из Google Research разработали новую систему искусственного интеллекта Vlogger, которая может создавать реалистичные видео людей, говорящих, жестикулирующих и двигающихся — только по одной фотографии.

Согласно исследовательской работе под названием «Vlogger: мультимодальная диффузия для синтеза воплощенного аватара», для создания видео достаточно только одной фотографии и аудиозаписи, из которых ИИ сделает аватара, который говорит в соответствии с аудио, делает соответствующие выражения лица, движения головой и жесты руками, пишет VentureBeat.

Исследователи использовали диффузионные модели, недавно показавшие превосходную производительность в создании очень реалистичных изображений из текстовых описаний. Расширив их в сферу видео и научившись на огромном новом наборе данных, команда смогла создать систему искусственного интеллекта, которая может оживлять фотографии очень убедительным способом.

«В отличие от предыдущей работы, наш метод не требует обучения каждого человека, не полагается на распознавание лица и кадрирование, генерирует полное изображение (а не только лицо или губы) и учитывает широкий спектр сценариев (например, видимые торсы или различные субъектные идентичности), которые имеют решающее значение для правильного синтеза общающихся людей», — пишут авторы.

Ключевым фактором стала подготовка огромного нового набора данных под названием Mentor, который содержит более 800 000 разнообразных идентификаторов и 2200 часов видео — на порядок больше, чем было доступно ранее. Это позволило Vlogger научиться создавать видео людей разной этнической принадлежности, возраста, одежды, поз и окружения без предвзятости.

Технология может автоматически дублировать видео на других языках, просто заменяя аудиодорожку, легко редактировать и заполнять недостающие кадры в видео, а также создавать полноценные видеоролики о человеке с одного кадра.

Однако эта технология также имеет потенциал для злоупотребления, например для создания дипфейков. Поскольку созданные искусственным интеллектом видео становятся более реалистичными и их легко сделать, это может усугубить проблемы, связанные с дезинформацией и цифровыми подделками.

Vlogger все же имеет ограничения. Сгенерированные видеоролики относительно короткие и имеют статический фон. Люди не передвигаются в 3D-среде.

Похожие новости:
Мы в AllBanks.com.ua ВКонтакте Следить за нами :) AllBanks.com.ua  на Facebook

Курсы НБУ на

  c
0.00 0.00
0.00 0.00
0.00 0.00
Все курсы валют НБУ

Новости RSS Новости

13:30 Подержанные автомобили составили 27% от объема легковушек с пробегом (самые популярные модели)
12:00 Украина переправила модернизированный «Руслан» в Германию
07:15 Где быстрее оформляют карту побыту в Польше: статистика по воеводствам
06:15 SpaceX анонсировала спутники Starlink третьего поколения: в 10 раз быстрее предыдущих
05:00 Доступны кнопочные телефоны с ИИ (фото и цена)
03:30 Акции Renault упали на 17% после назначения временного гендиректора
03:00 Samsung Galaxy Fold 7 стал самым тонким складным смартфоном в мире (фото)

Главные новости RSS Новости

Microsoft опередила Amazon в рейтинге самых дорогих компаний мира
30.10.2018 в 12:32
IBM покупает производителя облачных сервисов Red Hat за $34 миллиарда
30.10.2018 в 12:32
Нейросеть научилась распознавать письменный обман
30.10.2018 в 12:31
Длительное пребывание в космосе сократило объем нервных клеток в мозге астронавтов
29.10.2018 в 10:48
Nokia намерена сократить годовые расходы на 700 млн евро
29.10.2018 в 10:43

Авторизация