A Meta bemutatja az AI-alapú Make-A-Video-t

Rövid videókat és animált GIF-eket készíthetünk a segítségével.

A Meta (korábban Facebook) a legkorszerűbbnek nevezi új mesterséges intelligencia rendszerét, a Make-A-Video-t. A rendszer a szövegből képet generáló technológia közelmúltbeli fejlődésére épül, amely a leírások segítségével mozgóképeket kanyarít a szövegekből. A Meta szárnyai alá vette az előrelépést, hiszen csatlakozik a társulathoz, és lehetővé teszi, hogy közönsége néhány szóval vagy szövegsorral saját GIF-et vagy videót készítsen.

A csapat által kipróbált leírások közül néhány: "Egy kutya szuperhős-jelmezben, piros köpenyben repül az égen", "Macska tévézik távirányítóval a kezében", "Egy olajfestmény, amelyen egy hazafelé tartó, hivatalos estélyi ruhás pár esernyővel kerül egy heves felhőszakadásba", és "Egy bolyhos, narancssárga kötött sapkás lajhárbaba egy laptopot néz, miközben a rendkívül részletes stúdióvilágítás képernyője tükröződik a szemében". Az első kettő úgy tűnik, hogy néhány szóval pontos képeket generált, míg az utóbbi kettő, bár szintén pontos képeket adott ki, több részletet igényelt. Mégis, az előállított mozgóképeknek sikerült megragadniuk a szövegben megfogalmazottakat.

montázs

Több internetes tartalom az alkotóknak és művészeknek

A Meta szerint a Make-A-Video lehetőséget nyit a tartalomkészítők és művészek számára, mivel olyan eszközöket kínál számukra, amelyekkel gyorsan és egyszerűen hozhatnak létre új tartalmakat a generatív AI segítségével. A rendszer a párosított szöveg-kép adatokból tanulja meg, hogy hogyan néz ki a világ, és hogyan mozog a világ a kapcsolódó szöveg nélküli videofelvételekből - írja a Meta. A rendszer képes videókat is létrehozni állóképekből, vagy meglévő videókat alapul véve új, hasonló videókat létrehozni. "Átgondoltan akarunk eljárni az ilyen új generatív mesterséges intelligencia-rendszerek létrehozásával kapcsolatban" - nyilatkoztak az alkotók a Meta-nál.

Nyilvánosan elérhető adathalmazok és kutatások

A felhasználók statikus képet is feltölthetnek, és a Meta Make-A-Video szolgáltatása a generatív AI technológiának köszönhetően mozgóképpé alakítja azt. A Make-A-Video nyilvánosan elérhető adathalmazokat használ, és a Meta nyíltan megosztja a generatív AI-kutatásait és eredményeit a közösséggel, hogy visszajelzést kapjon tőlük. A Meta továbbra is használni fogja a saját AI keretrendszerét arra, hogy finomítsák és fejlesszék a tudását. A Make-A-Video forrásadatai több millió adatot elemeznek, hogy megismerjék a világot. A káros tartalmak keletkezésének kockázatának csökkentése érdekében a csapat megvizsgálja, alkalmazza és iterálja a szűrőket, hogy csökkentse a videókban felbukkanó káros tartalmak kockázatát. Ezenkívül nem véletlenül tesznek hozzá a vízjelet minden általuk készített videóhoz. Ez segít abban, hogy a nézők tudják, hogy a videó mesterséges intelligenciával készült, és nem egy rögzített videó - írja a Meta.

Néhány példa és a létrehozásukhoz szükséges megfogalmazás:

A macska nézi a tévét távirányítóval a kezében

A macska nézi a tévét

Egy bolyhos lajhárbaba narancssárga kötött sapkában, amint egy laptopot próbál megfejteni közelről, rendkívül részletes stúdióvilágítás képernyője tükröződik a szemében.

Lajáhár

Egy olajfestmény, amelyen egy hazafelé tartó, hivatalos estélyi ruhás pár esernyővel kerül egy heves felhőszakadásba

(Designboom)

Figyelem! A tartalom legalább 2 éve nem frissült! Előfordulhat, hogy a képek nem megfelelően jelennek meg.