Idén is ingyenes JetBrains IDE-k diákoknak, új AWS Skill Path képzések, adatvizualizációs kurzusok és versenyek középiskolásoknak.
Ha érdekel a sorozat előző része, azt itt tudod elolvasni.
A térképek újrarajzolásához most is a Stable Diffusion szöveg-alapú MI-rajzoló programot használjuk. Az eredeti vonalat megtartásához pedig a ControlNet kiegészítőt.
A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Lineart-ot. A Model lehet Canny vagy Lineart.
Utasításoknak (prompt) én a „top view of a city”-t választottam. Még jól működik az „aerial city view” vagy a „Drone Photography” is. Használhatjuk a „satellite view” parancsot is amennyiben nagyobb városrészt szeretnénk készíteni. Negatív prompt pedig „text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry”.
A képgeneráláshoz használt modell kiválasztása már nehezebb. Sajnos kevés olyan modell van, ahol a házak és utcák felülről látszódnak. Én a Realistic Vision-t választottam, ami egészen jól rajzol élethű házakat és parkokat is. További ajánlott modellek itt találhatóak.
A forrásképet a ControlNet kisablakba illesztjük be. Ne feledjük a generált kép arányait az eredeti képhez igazítani! És már kezdődhet is a képgenerálás!
Az én képem esetében a program megpróbálta az összes feliratot, szöveget, utcanevet és házszámot is értelmezni. Ez kicsit összezavarta. Tehát érdemes a képről előtte eltávolítani a felesleges elemeket.
Egy másik példában egy olyan kézzel rajzolt várostérképet használtam, amelyik mentes a feliratoktól (a képet a Pinteresten találtam forrás nélkül).
Egy kézzel rajzolt fantázia térkép lesz a kiindulási képünk.
A beállítások hasonlóak az előzőhöz. De itt kísérletképpen egy térképészeti modellt használtam.
Ha nem ragaszkodunk a valósághű képekhez, akkor találunk néhány térkép modelleket is. Mellé használhatunk LoRA modelleket is. Ebből is találunk olyanokat, amelyek a térkép rajzolásban segítenek. Az eredmény a következő:
Következő projektben egy madártávlati Róma rajzot használtam.
A beállítások hasonlóak, de különböző modellekkel és LoRA-kkal kísérleteztem. Itt is megfigyelhetjük, hogy a program megpróbálta az írott szöveget is a kép részeként értelmezni. Így pl. a tóra hajókat rajzolt.
A Stable Diffusion programnak nagyon sok finomhangoló beállítása van. Mellette pedig a számtalan modell található benne, éppen ezért nagyon sokféle eredményt kaphatunk. Érdemes kísérletezni vele!
Szerző: Pi Tóth István
Ha érdekel AI sorozutunk többi része, kattints ide és merülj el még jobban a mesterséges intelligencia világában!
Idén is ingyenes JetBrains IDE-k diákoknak, új AWS Skill Path képzések, adatvizualizációs kurzusok és versenyek középiskolásoknak.
Vége azoknak az időknek, amikor muszáj volt visszatérni az asztali géphez. Az Adobe Premiere új iPhone alkalmazása stúdió minőségű videoszerkesztést hoz el közvetlenül a zsebedbe - ingyen.
Használj Windows-t Mac-en gördülékenyen! Csapj le a lehetőségre a Parallels kedvezmény keretein belül most 35%-kal kedvezőbben!