A Meta bemutatja az AI-alapú Make-A-Video-t


Rövid videókat és animált GIF-eket készíthetünk a segítségével.


A Meta (korábban Facebook) a legkorszerűbbnek nevezi új mesterséges intelligencia rendszerét, a Make-A-Video-t. A rendszer a szövegből képet generáló technológia közelmúltbeli fejlődésére épül, amely a leírások segítségével mozgóképeket kanyarít a szövegekből. A Meta szárnyai alá vette az előrelépést, hiszen csatlakozik a társulathoz, és lehetővé teszi, hogy közönsége néhány szóval vagy szövegsorral saját GIF-et vagy videót készítsen.

A csapat által kipróbált leírások közül néhány: "Egy kutya szuperhős-jelmezben, piros köpenyben repül az égen", "Macska tévézik távirányítóval a kezében", "Egy olajfestmény, amelyen egy hazafelé tartó, hivatalos estélyi ruhás pár esernyővel kerül egy heves felhőszakadásba", és "Egy bolyhos, narancssárga kötött sapkás lajhárbaba egy laptopot néz, miközben a rendkívül részletes stúdióvilágítás képernyője tükröződik a szemében". Az első kettő úgy tűnik, hogy néhány szóval pontos képeket generált, míg az utóbbi kettő, bár szintén pontos képeket adott ki, több részletet igényelt. Mégis, az előállított mozgóképeknek sikerült megragadniuk a szövegben megfogalmazottakat.

montázs

Több internetes tartalom az alkotóknak és művészeknek

A Meta szerint a Make-A-Video lehetőséget nyit a tartalomkészítők és művészek számára, mivel olyan eszközöket kínál számukra, amelyekkel gyorsan és egyszerűen hozhatnak létre új tartalmakat a generatív AI segítségével. A rendszer a párosított szöveg-kép adatokból tanulja meg, hogy hogyan néz ki a világ, és hogyan mozog a világ a kapcsolódó szöveg nélküli videofelvételekből - írja a Meta. A rendszer képes videókat is létrehozni állóképekből, vagy meglévő videókat alapul véve új, hasonló videókat létrehozni. "Átgondoltan akarunk eljárni az ilyen új generatív mesterséges intelligencia-rendszerek létrehozásával kapcsolatban" - nyilatkoztak az alkotók a Meta-nál.

Nyilvánosan elérhető adathalmazok és kutatások

A felhasználók statikus képet is feltölthetnek, és a Meta Make-A-Video szolgáltatása a generatív AI technológiának köszönhetően mozgóképpé alakítja azt. A Make-A-Video nyilvánosan elérhető adathalmazokat használ, és a Meta nyíltan megosztja a generatív AI-kutatásait és eredményeit a közösséggel, hogy visszajelzést kapjon tőlük. A Meta továbbra is használni fogja a saját AI keretrendszerét arra, hogy finomítsák és fejlesszék a tudását. A Make-A-Video forrásadatai több millió adatot elemeznek, hogy megismerjék a világot. A káros tartalmak keletkezésének kockázatának csökkentése érdekében a csapat megvizsgálja, alkalmazza és iterálja a szűrőket, hogy csökkentse a videókban felbukkanó káros tartalmak kockázatát. Ezenkívül nem véletlenül tesznek hozzá a vízjelet minden általuk készített videóhoz. Ez segít abban, hogy a nézők tudják, hogy a videó mesterséges intelligenciával készült, és nem egy rögzített videó - írja a Meta.

 

Néhány példa és a létrehozásukhoz szükséges megfogalmazás:

A macska nézi a tévét távirányítóval a kezében

A macska nézi a tévét

 

Egy bolyhos lajhárbaba narancssárga kötött sapkában, amint egy laptopot próbál megfejteni közelről, rendkívül részletes stúdióvilágítás képernyője tükröződik a szemében.

Lajáhár

 

Egy olajfestmény, amelyen egy hazafelé tartó, hivatalos estélyi ruhás pár esernyővel kerül egy heves felhőszakadásba

Egy olajfestmény, amelyen egy hazafelé tartó, hivatalos estélyi ruhás pár esernyővel kerül egy heves felhőszakadásba

 

(Designboom)

Figyelem! A tartalom legalább 2 éve nem frissült! Előfordulhat, hogy a képek nem megfelelően jelennek meg.

Copyright © 2023 Trans-Europe Zrt. Minden jog fenntartva.
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram