Történelmi képekből valósághű fotók | AI sorozat 7. rész

2024-02-26 13:52
AI sorozat 7. rész: Hogyan lehet régi képeket restaurálni az AI segítségével? A MI itt is nagy segítség lehet, ha tudjuk hogyan használjuk.

ai sorozat 7. rész

A mesterséges intelligencia teljesen élethű képeket tud generálni, melyek olyan valóságosak, hogy nehéz elhinni: egyik személy sem valóságos, mind csupán képpontokból áll.

A technológia nemcsak arra jó, hogy sosemvolt embereket készítsünk, hanem hogy ténylegesen valós személyeket rekonstruáljunk vele. Az interneten már lehet találni olyan képeket, ahol a mesterséges intelligencia segítségével a római császárokat vagy más híres embereket élesztettek fel digitálisan.

Ez a technika bárki számára elérhető. Csak egy kis ügyesség, sok kitartás, és történelmi ismeret szükséges hozzá. Ha érdekel AI sorozatunk előző, 6. része, azt ide kattintva tudod elolvasni.

PixelRita véleménye

PixelRita! Mit gondolsz arról, hogy az MI-vel történelmi személyeket rekonstruálunk?

Óóó, azt mondom, ez valami zseniális cucc! 😄👩‍🔬 Képzeld el, hogy egy régi római császár márványarcát életre keltjük, és ott van veled szelfizni készen, mintha csak a legújabb Instagram filter lenne! Nem csupán a rómaiak; képesek vagyunk digitálisan felöltöztetni egyiptomi fáraókat, visszahozni a reneszánsz festők modelljeit, vagy akár Shakespeare-t is megidézni egy modern dráma premierjére!

Ez az egész olyan, mint egy időgép, ami lehetővé teszi, hogy betekintsünk a múltba. Az MI az adatok és a művészeti elemek alapján képes hihetetlenül részletes és pontos arcképeket létrehozni. A mélytanulási algoritmusok elemzik a szobrokat, festményeket és egyéb műalkotásokat, majd ezekből a puszta kőből vagy vászonról a legapróbb ráncokig, hajszálakig megalkotják az adott személy arcát.

De nem csak a híres emberekről van szó. Gondolj bele, milyen érdekes lenne megismerni az őseidet, ahogy valójában kinézhettek! Vagy mit szólnál egy digitális túrához a régi Pompeiiben, ahol mindenki él és mozog, mint egykoron?

Mindezek mellett, ez a technológia segíthet a történelem és az oktatás új szintre emelésében is, átélhetővé, megfoghatóvá téve a múltat. Szóval, én teljesen odavagyok érte! 🚀🌌🎭

Lássuk, hogyan lehet mindezt megcsinálni! A példánkban a kevésbé ismert szereplőket fogunk használni, hogy érdekesebb legyen.

A technológia

Jelenleg két technikát használhatunk. Egyik a Midjourney, másik a Stable Diffusion + ControlNet.
Minden esetben a jó eredmény érdekében egy jó forrásképre van szükségünk. Ez egyszerre jelent nagy felbontású képet, illetve azt, hogy a kép jól ábrázolja a személyt. Ezen kívül szükségünk van a megfelelő utasításra (prompt) is, ami lehetőleg minél pontosabban leírja a történelmi személyt és a ruházatát.

Én szándékosan olyan képeket választottam, amik nem túl jó minőségűek, mivel abban semmi érdekes nem lenne, ha egy élethű festményből csinálnánk élethű fotót.

Művészettörténetből viszont messze nem vagyok elég jó, hogy le tudjam írni, az egyes személyek milyen ruhákat, ékszereket hordtak, így ebben a ChatGPT segített nekem. Ettől még az eredmény lehet olyan, amitől egy valódi művészettörténész a haját tépi, úgyhogy ez most inkább csak egy kísérlet. Nyugalom, a hajat pedig a mesterséges intelligencia vissza tudja rajzolni.

Szent Piroska

Első kísérletünk Szent Piroska (Prisca, 1088–1134. augusztus 13.), aki a maga idejében talán az egyik leghíresebb magyar lehetett. Szent László lánya, majd Komnenosz II. János bizánci császár felesége volt. Ő alapította Konstantinápoly egyik legfőbb kolostorát, a Pantokrátor-kolostort és a vele egybeépített 50 ágyas kórházat, ami a kor legnagyobbjának számított. Sok tekintettben messze megelőzte a korát, pl. a tisztasági szabályokkal vagy a kórház részlegekre felosztásával. Halála után szentté avatták.

A fentiek ellenére nagyon keveset tudunk róla: egyetlen őt ábrázoló mozaik maradt fenn Konstantinápoly legfontosabb templomában, a Hagia Szophiában. Mi most ezt a mozaikot használjuk kiindulási alapnak.

szent piroska
Piroska (Prisca, 1088–1134. augusztus 13.) mozaik az isztambuli Hagia Szofiában

Midjourney

A Midjourney programban a mozaik képet adjuk meg kiindulásnak. Utána pedig jöhetnek az utasítások (prompt) is.
Amikor először próbálkoztam ezzel a technikával, még a ChatGPT elődei léteztek cask, azok viszont nem voltak eléggé okosak egy bizánci császárnő ruházatának megírásához. Nos, én sem vagyok az. Így csak néhány egyszerű utasítást írtam, ami eszembe jutott: bizánci császárné, bizánci korona, 30-éves vöröshajú nő.

/imagine prompt: https://s.mj.run/6d4FT2x06xU beautiful 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, exquisite detail

szent piroska
Szent Piroska a Midjourney programmal átrajzolva a mozaik alapján

Ez lett az első képem, ahol a mesterséges intelligenciával modernizáltam egy régi mozaikot. Az eredmény kétség kívül hagy maga után kívánnivalót, mégis úgy éreztem, hogy virtuálisan bepillanthattam a múltba.

A ChatGPT megjelenése mint oly sok mindent, ezt is megváltoztatta. Egy sokkal hosszabb, és részletesebb utasítást kértem tőle és talán az eredmény is közelebb áll a valósághoz.

/imagine prompt: https://s.mj.run/6d4FT2x06xU beautiful Hungarian 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, beautiful, intelligent empress, renowned for her wisdom and grace, descendant of the Árpád dynasty, beloved by the people for her fair rule and cultural patronage, gifted with a noble character inherited from her ancestors, richly decorated, elegant dresses, long sleeves, frilled or adorned with gold and pearl embellishments, high-heeled shoes, various pieces of jewelry, including gold and pearl necklaces, rings and precious stones, white or colorful dresses, adorned with gold and pearl embellishments, exquisite detail,

szent piroska
Szent Piroska a Midjourney programmal átrajzolva a mozaik alapján

Talán így nézett ki a valódi Piroska?

Stable Diffusion + ControlNet

De a Midjourney programnak van egy nagy hátránya. Ez az eszköz a kapott képet megpróbálja értelmezni, majd újrarajzolni. Így a fő motívumok megmaradhatnak, ám a részletek elveszhetnek. Pl. az arcvonás, a szem állása, az orr mérete, stb… Ezek nem olyan dolgok, amiket egyszerű utasítással le lehetne írni!

A Stable Diffusion programnak viszont van egy kiegészítője, a ControlNet. Ez olyan funkciót ad az alap programnak, ami a kép körvonalait és a kép tartalmát vizsgálja, értelmezi. Ez egy ember esetében az arc részletes felépítését, a mimikát, a mozdulatot, stb. jelenti. Vagyis a mi esetünkben a történelmi személyt sokkal pontosabban tudja rekonstruálni. Leginkább akkor, ha a mozaik vonalai nem zavarnak be…

Munka a Stable Diffusion + ControlNet programban

A történelmi személy MI rekonstrukciója során a következő beállításokkal kezdhetünk kísérletezni:

  • Stable Diffusion checkpoint: Egy élethű emberi modell. Szerencsére ebből sok van. Én a RealisticVision modelt választottam (a kedvenc checkpoint modelleimet ide gyűjtöttem).
  • A ControlNet kiegészítőben a Preprocessor Canny vagy Scribble.
  • A ControlNet kiegészítőben a Model Canny.
  • Az utasítások (prompt) pedig ugyan azok, mint a Midjourney esetében: beautiful Hungarian 30 year-old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, beautiful, intelligent empress, renowned for her wisdom and grace, descendant of the Árpád dynasty, beloved by the people for her fair rule and cultural patronage, gifted with a noble character inherited from her ancestors, richly decorated, elegant dresses, long sleeves, frilled or adorned with gold and pearl embellishments, high-heeled shoes, various pieces of jewelry, including gold and pearl necklaces, rings and precious stones, white or colorful dresses, adorned with gold and pearl embellishments, exquisite detail.
  • Negative prompt: text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry.
szent piroska
Szent Piroska a Stable Diffusion programmal átrajzolva a mozaik alapján

Ez a kép már sokkal jobban hasonlít a mozaikon látható személyre.

Szulejmán szultán és Hürrem szultána

Ismét a Stable Diffucion + ContolNet programot használtam, mert bár kevésé látványos, mint a Midjourney, de a történelmi személyt pontosabban rajzolta meg. Ezen felül a beállítások is nagyon hasonlóak voltak. A kiindulási kép mindkét esetben egy metszet volt, az utasításokat (prompt) pedig a ChatGPT írta.

Szulejmán szultán

Utasítás (prompt): Ottoman Sultan, the portrait showcases Suleiman. A man with a pronounced nose and a thin mustache. He has a determined gaze and a strong jawline. His skin is fair. He wears a large white turban with a tuft on the side. He is dressed in a vibrant red (RGB: 255, 0, 0) robe with a dark cloak over it. The robe is adorned with gold buttons and he holds a thin rod in his hand. A gold ring adorns one of his fingers. Encircling the image is an ornate frame filled with characteristic elements of Ottoman artistry. Among the complex patterns and forms, one can spot animal figures, mythological beings, and botanical motifs, all exquisitely detailed. The design of the frame is characterized by an ornamental and intricate style.

szulejmán szultán
Szulejmán szultán (fametszet az 1540-es évekből)
szulejmán szultán
Szulejmán szultán, Stable Diffusionnal újrarajzolva a metszet alapján

Hürrem szultána

Utasítás (prompt): Ottoman Sultana, Hürrem (Roxana) Sultan: A woman with a delicate facial structure, adorned with soft and expressive eyes that seem to tell a story. Her skin is fair, with a gentle glow that complements her serene expression. Atop her head, she dons a majestic crown, richly ornamented with jewels of various colors and sizes, including a prominent ruby-red gem (RGB: 255, 0, 0) at its center. This crown, a testament to her high stature, cascades with pearls and is flanked by an elegant veil which frames her face gracefully. She wears an opulent deep ruby dress (RGB: 139, 0, 0), intricately detailed with pearls and gemstones that trace her neckline and torso. Over her dress, she has a deep blue (RGB: 0, 0, 139) cloak, adorned with pearl detailing, hinting at her royal status. Elegant earrings dangle from her ears, completing her regal appearance.

hürren szultána
Hürrem szultána, metszet, 1537
Hürrem szultána, Stable Diffusionnal újrarajzolva a metszet alapján

Kossuth Lajos

Kossuth Lajosról nagyon sok képet találunk amelyeket próbáltak élethűre festeni vagy rajzolni. Ezeken nem is kellene dolgozni, hiszen láthatjuk, milyen lehetett valójában, ám a kísérletezés kedvéért kerestem rajzosabbat. Egy korabeli képeslapot találtam végül. A Stable Diffusion beállításai hasonlóak az előzőkhöz. Az utasítást (prompt) pedig ismét a ChatGPT írta.

Utasítás (prompt): A 30-year-old bearded European man with a slender mustache, wearing an admiral blue (RGB: 19, 10, 143) coat adorned with decorative elements. He proudly holds a feathered hat in his hand and has a sash draped across his chest. He stands in front of an old stone structure, possibly a part of a historic building or fortification. 1848 style

kossuth lajos
Kossuth Lajos képeslapon
kossuth lajos
Kossuth Lajos, Stable Diffusionnal újrarajzolva a képeslap alapján

Összegzés

A fenti műveletek remekül példázzák, hogy a mesterséges intelligenciával rekonstruálni lehet a régi képeket, festményeket, szobrokat, mozaikokat, rajzokat, vagy bármit.

De ezen dolgozni kell!

A mesterséges intelligencia fő előnye, hogy sokkal több adattal tud dolgozni, mint az ember. Az adatbázisába be tudjuk vinni az összes információt, ami a történelmi személy rajzolásához szükséges. A Stable Diffusion pedig még tanítható is: ha kellően sok képet kap az adott személyről, az adott kor öltözékéről, akkor sokkal pontosabban fog rajzolni, mint a mostani kísérletben láthattuk.

A ControlNet, ahogy a nevében is benne van, a képgenerálást szabályozza. Itt most csak az alapbeállítást használtam. Itt nagyon sok lehetőségünk van egészen odáig, hogy mi magunk rajzoljuk meg azt a vonalas képet, ami alapján a ControlNet működni fog. Így például a zavaró vonalakat eltávolíthatjuk, új vonalakat rajzolhatunk, stb.
Amennyiben tehát rászánjuk az időt, adatokat gyűjtünk, tanítjuk a modellünket, akkor nagyon élethűen megkaphatjuk a hajdan élt emberek képeit.

Természetesen most is fontos PixelRita véleménye

PixelRita, te mit tanácsolsz azoknak, akik MI-vel szeretnének régi festményeket, mozaikokat, szobrokat, rajzokat és egyebeket digitálisan rekonstruálni?

Ó, de izgi! Ha MI-vel akarod feltámasztani a múltat, kapaszkodj, itt van pár tuti tipp, hogy igazi időutazó lehess! 😎🚀

Válassz jó forrást! Minél jobb minőségű, részletesebb a kiinduló mű, annál szaftosabb lesz a végeredmény. Ha van egy picit fakó, de érdekes festményed vagy szobrod, az is tökéletes lehet!

Ismerd meg a történelmet! Ha tudod, kik voltak a diva divák vagy a menő manók az adott korban, jobban tudsz utasításokat adni az MI-nek. A részletek, mint a ruhák, ékszerek, hajstílusok szuperfontosak!

Tanulj meg egy kis technikai tudást! Nem kell egyből kódoló guru lenned, de egy kis MI ismeret csodákra képes. Tudj meg többet a különböző generatív algoritmusokról, mint a Midjourney vagy a Stable Diffusion.

Kísérletezz bátran! Ha az első szoborportrédat látva csak nevetsz, az is szuper! Minden próbálkozás egy lépés a mestermű felé. Játssz a beállításokkal, promptokkal, legyél kreatív!

Legyél türelmes és kitartó! Az MI olyan, mint egy kisgyerek, sokat kell neki magyarázni, de ha jól csinálod, hálás lesz a végeredmény!

Oszd meg a munkádat! Kérj visszajelzést, tanulj mások hibáiból és sikereiből. Ki tudja, lehet a te rekonstrukciód lesz a következő internetes szenzáció!

Szóval, vedd elő a digitális ecseteidet és vágj bele a múlt megelevenítésébe! 🖌️👑 A lényeg, hogy élvezd az utazást, és hagyd, hogy az MI varázslat vigyen egy kis extra pizzazz-t a történelembe! 🌟🎨


Szerző: Pi Tóth István


AI sorozat többi része

Ha érdekel AI sorozutunk többi része, kattints ide és merülj el még jobban a mesterséges intelligencia világában!

Termékek
Tanfolyamok

Olvass tovább

,
Black Friday - 20% kedvezmény CorelDRAW Graphics Suite-ra!

Érdemes kihasználni a Black Friday adta lehetőséget, szerezd meg most 20% kedvezménnyel legújabb CorelDRAW licencedet!

,
TeamViewer Black Friday 2024 - akár 30% kedvezmény!

Elérhetőek a TeamViewer 2024-es Black Friday kedvezményei! Szerezd be akár 30%-kal kedvezőbben - mi pedig mutatjuk hozzá a részleteket!


Fotóból alternatív változatok – Stable Diffusion az építészetben 3 | AI sorozat 29. rész

3D épületmodellezés kivitelezése mesterséges intelligenciával! Tippek és trükkök a Stable Diffusion és a ControlNet modelljeinek beállításához.

Copyright © 2023 Trans-Europe Zrt. Minden jog fenntartva.
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram