A mesterséges intelligencia fotórealizmusa új szintet lép és immáron bárki használhatja.
Mi az a DALLE-2?
A DALL-E-2 (a név a "Dali" (mint Salvador) és a Pixar "WALL-E" portmantaau-ja) egy szövegalapú, gépi tanuláson alapuló mesterséges intelligencia képgenerátor. Az Open AI mesterséges intelligenciával foglalkozó vállalat által létrehozott generatív eszköz, ami azt jelenti, hogy a felhasználók szöveges utasítások segítségével a semmiből generálhatnak művészeti alkotásokat.
A DALL-E hozzáférés áhított kiváltság volt azok körében, akik szívesen kísérleteztek volna az AI (artificial intelligence, mesterséges intelligencia) legújabb művészeti alkotásaival. Míg néhány szövegből képet készítő AI-képgenerátor, például a Stable Diffusion nyílt forráskódú és mindenki számára elérhető, addig a DALL-E 2 óvatosabb és korlátosabb volt, ami hosszú várólistát eredményezett a hozzáférésben reménykedők számára.
Most azonban a mögötte álló OpenAI bejelentette, hogy a várólista megszűnt. 2022 szeptember 28 óta bárki használhatja a DALL-E 2-t, és szabadjára engedheti fantáziáját, hogy AI által generált képeket hozzon létre.
A DALLE-2 áprilisban indult béta verzióban, és gyorsan az egyik legfejlettebb AI képgenerátorként üdvözölték, különösen, ha fotorealisztikus képek készítéséről van szó. Valószínűleg már láttál a DALL-E 2-vel készült képeket az interneten, a jobb alsó sarokban lévő árulkodó színes négyzetek vízjelével. Bár a DALL-E 2 még mindig rendelkezik néhány olyan rémálomszerű, arccal kapcsolatos problémával, amelyekkel más AI-képgenerátorok is küzdenek, de általában sokkal meggyőzőbb eredményt ad.
A bökkenő az volt, hogy a DALL-E-2 csak meghívásos alapon, várólistán keresztül volt elérhető, bár az OpenAI szerint jelenleg 1,5 millió ember használja. Ennek azonban már vége. A platform még béta állapotban van, most már bárki használhatja, aki regisztrál az OpenAI weboldalán.
Néhányan azonban arról számolnak be, hogy ez nem egészen ilyen egyszerű. Az emberek a Twitteren és az Instagramon azt válaszolták, hogy a DALLE-2 az ő országukban nem elérhető, vagy hogy hibaüzenetet kapnak, amikor megpróbálnak regisztrálni. Időközben elkészült az API is Továbbá még mindig nincs kész a DALL-E 2 API, bár az Open AI azt mondja, hogy dolgozik rajta.
A hozzáférés megnyitása inkább a DALL-E mögött álló cég nevéhez illőnek tűnik. Ironikusnak tűnt, hogy egy OpenAI nevű cég korlátozza a termékéhez való hozzáférést. Mindeközben az árképzés ugyanaz marad, mint július óta, amikor is bevezették a kredit alapú rendszert.
A nyílt hozzáférés igazságosabbnak tűnik, és azt jelenti, hogy minden kreatív alkotó kísérletezhet az egyik legsikeresebb szöveg alapú kép generátorral, ami új erőforrást biztosít számukra az új kreatív ötletek teszteléséhez és a munkafolyamatok potenciális felgyorsításához. De ez egyúttal eléggé ijesztő is. A DALL-E 2 nagyon valósághű képeket képes előállítani, ráadásul a napokban megszüntette a valódi emberi arcok szerkesztésének tilalmát, ami megnyitja annak a veszélyét, hogy az emberek képeit engedélyük nélkül megváltoztathatják, és a deep-fake verziókkal különböző csalásokat kövessenek el.
A Stability AI nyílt forráskódú Stable Diffusion programját a korlátozások hiánya miatt érte kritika, ami lehetővé tette a felhasználók számára, hogy erőszakos és pornográf tartalmakat hozzanak létre. A DALL-E 2 hozzáférés megnyitása most az OpenAI saját korlátozásait is teszteli, melyek elmondásuk szerint már a kezdetek óta léteztek, és fejlesztették tovább a "valós használatból való tanulással".
Néhány DALL-E 2 által generált vad fotó
A vállalat azt állítja, hogy automatizált és emberi felügyelet keverékét használja a tiltott tartalmak megakadályozására. A közszereplőkről készült képek létrehozására tett kísérletek tiltottak, és a DALL-E 2 betanításához használt adathalmazt úgy szűrték, hogy eltávolították a nyilvánvalóan erőszakos, szexuális vagy gyűlöletkeltő képeket. "Szűrőinket robusztusabbá tettük a szexuális, erőszakos és egyéb, a tartalmi szabályzatunkat sértő tartalmak létrehozására irányuló kísérletek elutasításában, és új észlelési és válaszadási technikákat fejlesztettünk ki a visszaélések megállítására" - áll az OpenAI közleményében.
A biztonsággal kapcsolatos aggályok mellett vannak megoldatlan szerzői jogi kérdések is. Az első ismert, szerzői joggal védett mesterséges intelligenciával készült művészeti alkotás ellentmondásosnak bizonyult, köszönhetően annak, hogy az alany egy hírességre hasonlít. A Getty Images homályosnak tartja az egész területet, így kitiltotta az AI által generált tartalmakat a képgyűjteményéből. Ugyanakkor sok alkotó az állása miatt is elkezdhetett aggódni. Ha valaki elméletileg bármilyen képet létrehozhat úgy, hogy egyszerűen beír egy leírást egy prompt mezőbe, miért fizetne ezért egy tervezőnek vagy illusztrátornak?
Egyelőre azonban a technológiának még sok útmutatásra és egy tisztességes művészi érzékkel rendelkező emberre van szüksége ahhoz, hogy a legtöbbet hozza ki belőle. Egy teljesen új munkaterület nyílik meg - az AI prompt íróé, és vannak AI prompt piacterek, amelyek bizonyos stílusú képekhez tartozó promptokat árulnak.
Mennyibe kerül a DALL-E 2 használata?
A DALLE-2 az első két hónapban ingyenes volt, de júliusban az OpenAI elkezdte felszámítani a krediteket, amelyek a platformon történő művészeti alkotások létrehozásához szükségesek. Minden első felhasználó kap egy csomó ingyenes kreditet a használathoz, de utána már csak 15 ingyenes kreditet havonta.
A felhasználók további krediteket vásárolhatnak, 115 kreditért 15 dollárt kell fizetni (ami 460 négyzet alakú kép létrehozásához elegendő). Az OpenAI ugyanakkor az anyagi segítségre szoruló művészeket támogatott hozzáféréssel támogatja.
Figyelem! A tartalom legalább 2 éve nem frissült! Előfordulhat, hogy a képek nem megfelelően jelennek meg.