Корпорація Meta анонсувала Emu Video і Emu Edit – інструменти на основі генеративного штучного інтелекту для редагування і створення контенту. Нові інструменти, в основу яких покладено алгоритми ШІ, дадуть змогу генерувати й редагувати фото та відеоролики за простим текстовим описом.
Як зазначається у блозі компанії, обидві нейромережі, за основу для яких узято мовну модель Emu, все ще перебувають на стадії тестування. Водночас, згідно із заявою, продукти вже демонструють потенційну користь для художників, аніматорів та інших фахівців творчого спрямування.
Emu Video здатний генерувати відеокліпи на основі введеного тексту і прикріплених зображень у форматі 512×512 з частотою 16 кадрів за секунду. Нейромережу навчали за допомогою “факторизованого” підходу, розділивши процес на два етапи, що дало змогу інструменту реагувати на різні вхідні дані.
Emu Edit дає змогу видаляти або додавати фон на фото, виконувати перетворення кольору і геометрії, а також підтримує локальне і глобальне редагування. ШІ навчений на наборі даних з 10 млн зразків, кожен з яких має вхідний варіант зображення і опис завдання, а також цільовий результат.
“Хоч Emu Video, Emu Edit і подібні до них нові технології, безумовно, не можуть замінити професійних художників, вони допоможуть людям виразити себе по-новому: від артдиректора, що вигадує нову концепцію, або відеомонтажера, який оживляє свій останній ролик, до кращого друга, який ділиться унікальним привітанням з днем народження”, – підкреслили в компанії.