Érdemes kihasználni a Black Friday adta lehetőséget, szerezd meg most 20% kedvezménnyel legújabb CorelDRAW licencedet!
A grafikusok számára sokszor nagy kihívás olyan képet készíteni, amelyen felírat, cím vagy valami izgalmas tipográfiai ábra szerepel. Azonban jelenleg ez még a gépeknek is nehéz feladat. Ha érdekel a sorozat előző részében tárgyalt téma, a 17. rész itt találod.
Emiatt egyre több program jelenik meg, amelyek egyre jobban megküzdenek ezzel a problémával, és igény is van rá bőségesen. Elsőként az Adobe Firefly hozott ki egy olyan megoldást, ahol már betűket és rövid szövegeket is kérhettünk. Később más programok is megpróbálkoztak vele: a magyar fejlesztésű Tengr.ai például egészen jól kezeli már az írást és szép logókat is tud rajzolni. A Dall-E a harmadik verziójától fogva nagy eséllyel azt írja le, amit kérünk, 2023. év végén pedig a Midjourney 6-os verziója is elkezdte a betűket használni.
De a betűk és az olvasható szöveg még mindig komoly kihívás a mesterséges intelligenciának.
Ez azért van, mert a betűknél sokkal kisebb a toleranciánk. Egy macskás képet sokkal nagyobb határokon belül fogadunk el. Ha már van négy lába, két háromszög alakú füle, sok szőre és bajsza van, akkor már jó lesz macskának. Ezzel szemben ha egy O betű elkezd lábakat növeszteni, akkor ott már komoly gondok vannak.
A probléma alapja, hogy a mesterséges intelligencia statisztikai alapon rajzol: elképzelhetetlenül sok képet néz meg, és ez alapján tudja, hogy az adott tárgy nagyjából hogy néz ki. Közben vannak dolgok, amelyeknél nem elég ha valami körülbelül olyan. Vannak szabályok, amiket pontosan be kell tartani. Egy F betű nem nézhet ki E betűnek. Ahogy egy K sem R-nek.
A tipográfusok pontosan azért nagy mesterek, mert úgy tudnak a betűk alakzataival játszani, hogy közben a fő szabályok megmaradnak. Ebben viszont a mesterséges intelligencia egyenlőre nem elég jó.
Például az alábbi képre az van írva, hogy “Pista”.
Ha látványos megjelenésről van szó, az egyik legjobb a Midjourney. De ha csak simán egy betűt szeretnénk rajzolni, a többi program sem marad el mögötte sokkal. Sőt! Lehet, hogy éppen a Tengr.ai vagy a Dall-E fog olyan betűt rajzolni, amilyet mit szeretnénk. Tehát inkább próbálkozzunk több programmal is! (azért is, mert nincs arra garancia, hogy a Midjourney jó betűt fog rajzolni).
Miközben a cikket írtam, készítettem egy R betűt, amit a Midjourney 5-ös verziójával. Szerencsém volt, mert az első generálással sikerült. Nagyon izgalmas, részletes, mindenféle bizgentyűkkel teli betűnk lett. Íme az utasítást (prompt):
letter R ::1 8 cute robot, futuristic advertisment art about the robotic art, stylized design featuring lines and shapes in shades of blue and silver, Inscription composed of gears and mechanical and hydraulic and robotic parts ::1
Most, hogy az első betűnk készen van, folytathatnánk úgy is, hogy ezt a képet próbáljuk meg a Midjourney-ben alakítani. Pl. a variációkkal, ám ez nehezen sikerül.
Viszont, ha átmegyünk az Adobe Photoshopba, és letesszük a betűt egymás mellé annyiszor, ahány betűből áll a kívánt szöveg, azzal is elérhetjük a kívánt eredményt. Én most a ROBOT szót szeretném leírni, ezért 5 db R betűt teszek egymás mellé.
Az Adobe Photoshop Generative Fill parancsa az egész kép tartalmát vizsgálja, és az alapján készíti az új rajzot. Emiatt nagyon fontos, hogy olyan környezetet adjunk neki, ami minél közelebb áll ahhoz, amilyen végső képet szeretnénk. Ezért is kellett a betűket betennünk a végső helyükre. Érdekes módon a Photoshop sokkal jobban dolgozik, ha a képet egy mesterséges intelligencia készítette. Úgy látszik, hogy a programok egymást jobban megértik, mint a valóságot.
Jelöljük ki a betűket egyesével. Majd a Generative Fill ablakba írjuk be azt a betűt, amit szeretnénk.
"letter O"
A Photoshop mesterséges intelligenciára erős hatással van a környezet, hogy mi is kép tartalma. Így mindenféle különösebb extra utasítás nélkül a mellette lévő betűkhöz hasonlókat próbál rajzolni.
A Photoshop sem lesz sokkal ügyesebb, mint a Midjourney (*). Bár valószínűleg a betanítás közben több betűvel találkozott. De még így is érdemes arra számítani, hogy elsőre nem fogja a megfelelő betűt eltalálni. Talán másodszorra sem. Vagy akár tíznél is többször kell próbálkoznunk. De ne adjuk fel!
(*) Ez a bejegyzés 2024. év elején készült. Idővel bizonyára mindkét programnak javul a betűgeneráló képessége.
Már csak egy feladatunk maradt: az illesztéseket tüntessük el. Ehhez is használhatjuk a Generative Fill parancsot, vagy valamelyik megszokott régi funkciót is.
Íme a végeredmény:
Hamarosan eljön az idő – hamarabb, mint várjuk -, amikor a mesterséges intelligencia gond nélkül fog olvasható szövegeket rajzolni. És nemcsak az ismert betűtípusokkal, hanem tipográfiai bravúrokkal együtt. 2024. elején viszont még nem tartunk itt, így maradnak az ilyen extra megoldások.
Figyeljünk oda arra, hogy bár a Photoshop a környező képi elemek alapján dolgozik, egyenlőre a Midjourney sokkal látványosabb eredményeket produkál. És a Photoshop ezzel nem mindig tud versenyezni, így az általa rajzolt betűk esetleg nem lesznek annyira érdekesek, egyszerűbbek és töredezettek lehetnek. Ráadásul minél több betűt alakítunk át, úgy fog a teljes kép is egyszerűsödni. Tehát minden újonnan átalakított betű kevésbé lesz kidolgozott, mint az előző.
Érdemes lehet az új betűket mindig külön rétegre kérni, majd azt a réteget kikapcsolni. Így a Photoshop mindig azt látja, amikor minden betű a Midjourneyból származik.
Egy kis extra tipp: Úgy tűnik, hogy a betűk generálása mind Photoshopban, mint Midjourneyben jobban működik akkor, ha nagybetűket használunk.
Szerző: Pi Tóth István
Ha érdekel AI sorozutunk többi része, kattints ide és merülj el még jobban a mesterséges intelligencia világában!
Érdemes kihasználni a Black Friday adta lehetőséget, szerezd meg most 20% kedvezménnyel legújabb CorelDRAW licencedet!
Elérhetőek a TeamViewer 2024-es Black Friday kedvezményei! Szerezd be akár 30%-kal kedvezőbben - mi pedig mutatjuk hozzá a részleteket!
3D épületmodellezés kivitelezése mesterséges intelligenciával! Tippek és trükkök a Stable Diffusion és a ControlNet modelljeinek beállításához.