December 2-án került megrendezésre a MiaMI 2.0 konferencia, ahol a mesterséges intelligencia világának legújabb trendjeit vitatták meg. Az esemény fókuszában az AI térhódítása állt, különösen az utómunka világában. Az előadók között idén is ott volt Olejnyik Attila kollégánk, aki lenyűgöző előadásában bemutatta a generatív AI technológiák működését, lehetőségeit és jelenlegi korlátait.
Attila MiaMI 2.0 előadásából megtudhattuk, hogyan dolgoznak a modern generatív modellek, például a Runway, Kling vagy a Firefly. Ezek az eszközök lenyűgöző eredményekre képesek képek terén, de a videógyártásban még számos kihívással néznek szembe. Az idődimenzió kezelése, a folyamatos mozgások precíz generálása, és a hatalmas számítási igény jelenleg akadályozzák a technológia széleskörű elterjedését. Azonban Attila optimista: Úgy véli, hogy a mostani fejlesztések alapot adnak a következő évek forradalmi áttöréseihez.
A generatív AI egyik legérdekesebb, ugyanakkor legnagyobb kihívást jelentő területe a videók készítése. A képek generálása az AI számára már nem újdonság, azonban a videók készítése számos új kérdést vet fel. A legnagyobb probléma a mozgás és az idő dimenziójának kezelése. Hogy miért is? Sokkal nagyobb számítási kapacitást igényel, mint egy statikus kép létrehozása. Egyetlen másodpercnyi videó akár több tucat képkockából is állhat, így a generatív AI-nak képesnek kell lennie az időbeli összhang biztosítására, miközben minden egyes képkockát koherens módon kell generálnia.
Attila előadásában bemutatta, hogy a generatív modellek, mint például a diffúziós modellek, már képesek az alapvető mozgás és vizuális elemek létrehozására. Ám még mindig számos problémát okoz az állandó mozgás és a komplex narratív struktúrák kezelése. Az AI modellek számára még nem teljesen triviális, hogyan lehet tökéletesen kezelni az időbeliséget, és hogyan lehet az összes vizuális elem közötti kapcsolatot úgy megteremteni, hogy az valóban „élő” és dinamikus hatást keltsen.
A generatív videó készítés még nem teljesen kiforrott. Viszont, a mesterséges intelligencia segítségével már számos olyan utómunka eszközt használhatunk, amelyek drámaian gyorsítják és egyszerűsítik a kreatív folyamatokat. A konferencián különösen nagy figyelmet kaptak az olyan fejlesztések, mint az Adobe Premiere Pro AI funkciói, amelyek segítenek az automatikus vágásban, szövegalapú vágásokban, a tárgykivágásban, valamint a színcserében.
A generatív AI ezen alkalmazásai már most is lehetőséget biztosítanak a kreatív szakemberek számára, hogy a manuális munkafolyamatokat minimalizálják, és gyorsabban, hatékonyabban dolgozhassanak. Az olyan fejlesztések, mint az Object Addition and Removal funkciók, amelyek lehetővé teszik a tárgyak könnyed eltávolítását vagy hozzáadását egy jelenethez, már most is valósággá váltak. A Generative Extend funkció, amely lehetővé teszi a videók zökkenőmentes meghosszabbítását, szintén óriási segítséget jelent a vágás és az átmenetek tökéletesítésében.
Az Adobe Firefly eszközei, amelyek az AI legújabb vívmányait használják, különösen izgalmas lehetőségeket kínálnak. A Firefly text-to-video funkciója, amely jelenleg is várólistás, komoly áttörést jelenthet a videógyártásban. Ezzel a funkcióval a felhasználók egyszerű szöveges utasítások alapján generálhatnak új videókat. Ezek pedig tökéletesen illeszkedhetnek a már meglévő tartalomhoz, legyen szó akár egy B-roll anyagról vagy egy új történetvázlat létrehozásáról.
Ráadásul az Adobe eszközei nemcsak technológiailag innovatívak, hanem etikailag is felelősek. A Tartalom Hitelességi Jel technológia segítségével az AI által generált tartalom pontosan nyomon követhető, és a felhasználók biztosak lehetnek abban, hogy milyen AI modellek és hogyan készítették el a tartalmat. Ez az átláthatóság különösen fontos a kreatív iparban, ahol a művészi kifejezés és az eredetiség alapvető.
Az AI és a generatív technológiák fejlődése tehát egyértelmű irányt mutat a kreatív ipar számára. Bár a generatív videótechnológia még nem érte el azt a szintet, hogy teljesen kiváltsa az emberi alkotói munkát, az iparági eszközök folyamatos fejlődése azt jelzi, hogy a közeljövőben a mesterséges intelligencia kulcsfontosságú szereplővé válik a kreatív munkafolyamatokban.
Ha valaki lemaradt volna a MiaMI 2.0 konferenciáról, ne aggódjon! Olejnyik Attila december 5-én ismét előadást tart az AI Tech Nap 3.0 rendezvényen, ahol még több izgalmas részletet és friss információt oszt meg a generatív AI világáról. Ez egy remek alkalom arra, hogy a legújabb fejlesztésekről és azok gyakorlati alkalmazásairól halljunk a kreatív ipar számára!
Lezajlott a MiaMI 2.0 konferencia, és rengeteg érdekes gondolat hangzott el a kép és vidógyártás jövőjét illetően.
Kedvezményes QuarkXPress 2025 Black Firday alkalmával! A legújabb innovációkkal professzionális szintre emelkedhetsz a publikációk világában.
Most féláron juthatsz hozzá a az ABBYY szoftvereihez amíg a Black Friday tart! Itt az ideje forradalmasítani dokumentumkezelési módszereidet!