Говорящая голова

Для тех, кто не любит публичных выступлений появилась прекрасная альтернатива. С приходом в нашу жизнь искусственного интеллекта, невозможное теперь кажется вполне реальным. Говорящая голова - это фото или изображение, которое будет озвучивать ваш текст.

Создатели проекта Deep Nostalgia (раннее ИИ оживляло старые фото), израильская компания D-ID, запустила новую платформу. Проект очень интересный и перспективный, он позволяет нам загрузить свое или любое другое изображение (портрет) + текст, из которых искусственный интеллект сгенерирует видео.

Пользоваться платформой совсем не сложно. На первом этапе загружаем снимок докладчика или выбираем портрет из встроенной галереи. Для тех, кто приобрел платную подписку, открывается доступ к альбому с премиум докладчиками. В отличие от базовых у премиум докладчиков лучше выражена мимика лица и движения рук, в следствие чего видео получается более реалистичным.

На втором этапе вводим текст или загружаем готовый аудио файл речи. Существует возможность выбрать язык (платформа поддерживает 119 языков), голос и стиль речи (веселый, грустный, дружелюбный). Алгоритмы на основе ИИ сгенерирует видео на основе данных параметров. Готовую запись можно применять свободно и где посчитаете нужным.

На сегодняшний день нам доступны 3 тарифа: бесплатный триал, PRO и Enterprise. Пробная версия дается на две недели и позволяет создать до 5 минут видео с разрешением 720p. На ролике отражается вотермарки, перекрывающие всё изображение. Pro версия стоит 49 долларов в месяц и открывает доступ к 15-минутному видео в формате Full HD, а также плагину PowerPoint и поддержке по емейлу.

В рамках платного тарифа можно загрузить свои аудио записи для клонирования голоса. Кроме всего компания работает над инструментом, который позволит добавлять свои кадры для обучения искусственного интеллекта. Что позволит лучше имитировать человека на видео.

Поиск по этому блогу

Говорящая голова

Комментарии

Отправить комментарий