WordPress blog lementése és elemzése - AI sorozat 2. rész

2024-01-19 13:03
AI sorozat 2. rész: Hogyan használhatjuk a ChatGPT haladó funkcióit? Hogyan képes az AI óriási adathalmazokat fájlokba tömöríteni? Kiderül.

ai sorozat 2. rész

Volt egyszer egy WordPress blog

Mindig is kíváncsi voltam, ténylegesen hány oldalt is írtam. És örültem volna, ha valami kezelhető formába le tudtam volna menteni az egészet. Mondjuk PDF vagy World formátumban. De ez már több éve volt. Néha-néha körbenéztem, hátha találok rá egy olyan megoldást, amivel nem kell sokat dolgozni, ám nem találtam ilyet. Erről fog szólni az AI sorozat 2. része (az 1. részt itt olvashatod).

Színre lép a ChatGPT4+ADA

Az idő csak telt, az évek elmentek, majd megjelent a ChatGPT. Azonban mi is ez a ChatGPT? Szerencsére itt van virtuális asszisztensem, aki ezt röviden össze tudja foglalni. Ő PixelRita, a ChatGPT-robot.

ChatGPT: A DumaGép

ChatGPT az a menő kis program, ami szöveget generál neked, mintha csak egy haveroddal dumálnál. Akár egy esszét írnál, akár csak random csevegnél, én vagyok a te robotod. Röviden, én vagyok az, aki mindig tudja, mit mondj!

Üdv,
PixelRita


A ChatGPT egy Mesterséges Intelligencia akivel lehet beszélni bármiről. De tényleg bármiről. És mindig segít. Nem mindentudó, és vannak hiányosságai is, de ne feledjük, hogy még az egész technológia elején járunk.

A ChatGPT nálam egy személyi asszisztens szintre nőtte ki magát. Nagyon sok hosszú és unalmas munkát vesz át. Ráadásul izgalmas is egy Mesterséges Intelligenciával együtt dolgozni. Még az előfizetős GPT4 verzióra is előfizettem. Kicsit sajnáltam is, hogy addigra befejetem a blog írását, mert rengeteget segített volna.

Ismét telt az idő, GPT4-ben megjelent az ADA kiegészítés, az Advanced Data Analysis. Bár akkor még Code Interpreter volt a neve. Ezt a bejegyzés írásakor csak a fizetős ügyfelek érik el.

Advanced Data Analysis: Az Adatmágus Plusz

Az ADA nem csak sima adatokat tud elemezni, hanem be tud olvasni Word, Excel és más fájlokat is. És itt jön a csavar: ezekből az adatokból grafikonokat, táblázatokat és egyéb vizuális elemeket tudok varázsolni. Szóval, ha van egy Excel táblázatod tele számokkal, én azt át tudom alakítani egy szuper grafikonná, hogy könnyebben érthető legyen.

Puszi,
PixelRita

Ez roppant izgalmas változást hozott. Néztem a YouTube videókat, hogy Word és Excel táblázatokat tud beolvasni, elemezni, és akár át is alakítani. De más fájlokat is el tudott olvasni. Gondoltam, teszek egy próbát! De mit is próbálok csinálni? PixelRita! Mit is fogunk csinálni?

WordPress XML + GPT + ADA: A Trió, ami Mindent Visz

A WordPress XML az a fájl, amit kiveszünk a WordPress blogodból. Ez tartalmazza az összes blogbejegyzésed, hozzászólásokat, linkeket és még sok mást. Most képzeld el, hogy én, PixelRita, a ChatGPT motorral és az ADA-val együtt, ezt az XML fájlt képes vagyok elemezni és átalakítani.

Tehát, az a terv, hogy az XML fájlt letöltjük a WordPressedből, és aztán rám bízod. Én pedig átváltoztatom valami használhatóvá, mint például egy PDF vagy Word fájl. De nem csak ennyi! Még grafikonokat és statisztikákat is tudok belőle készíteni. 📊

Szóval, ha van egy WordPress blogod, és szeretnéd, hogy az információk ne csak egy zavaros XML fájlban legyenek, hanem valami érthető és szép formában, akkor itt a terv: WordPressből kivesszük az XML-t, és én, PixelRita, átalakítom neked!

Hajrá!

Az XML

A WordPress minden gond nélkül adott nekem egy XML fájlt, amiben az összes bejegyzésem, a linkek, a hozzászólások és minden más megtalálható. Annyira, hogy szükség esetén egy másik WordPress programba át lehessen másolni.
Még az se volt biztos, hogy a magyar ékezetek a megfelelő állapotban vannak! Arra viszont nagyon nem jó, hogy ebből Word vagy PDF dokumentumot legyen. Pláne olyan, ami még jól is néz ki!

Dolgozik a GPT

A feladat nem volt egyszerű. Ebből az első ránézésre kaotikus (második és harmadik nézésre is) kódból kellett egy jól olvasható, élvezhető formátumot létrehozni. De pontosan az ilyen feladatokra jó a ChatGPT.

Normál esetben – és tételezzük fel, hogy tudunk programozni – ilyenkor leülünk, és megnézzük a struktúrát. Mivel egy program írta az XML-t, egy másik program át is tudja alakítani. Már csak meg kell írni ezt a programot.
Az nálam egy hétig biztosan eltartott volna. Utána kiderült, hogy itt nem jó, ott nem jó, amott meg kimaradt valami. Úgyhogy ha van is időm, akkor is 1 hónapon keresztül ezzel játszottam volna. Abban az esetben persze, ha tudok ennyire jól programozni. (Spoiler: nem tudok.)

Most viszont megkértem a ChatGPT-4 + Advanced Data Analysis-t, hogy ő készítse el a programot. És még csak nem is nagyon segítettem neki, csak az elvárásaimat mondtam, mi legyen az eredmény.

ai sorozat 2. rész chatgpt
Dolgozik a GPT...

Elsőre persze nem sikerült, mivel rengeteg akadályt kellett leküzdenie a programnak. Többször is elakadt. De saját magától megkereste a hibát, és ha tudta kijavította. Ha nem ment, más úton próbálkozott. Más alkalmakkor pedig ötletet kellett adni neki, hogyan próbálkozzon.

Végül megkaptam azt, amit kértem. Minden év külön fájlba került, minden bejegyzés új oldalon kezdődik, és még a dátumot is megkaptam a lap tetején H1 stílusban!

Sok minden sajnos elveszett a konvertálások és a használaton kívüli kódok takarításakor. További nehézséget okozott, hogy sok modul nem volt felkészítve a magyar nyelvre, illetve a Magyarországon használatos Latin-2-es kódolásra.

De oly sok év után végre a blogomat láthatom Word és PDF formában. Lementve úgy, hogy el tudom küldeni valakinek. Vagy évek múlva – amikor már a blog szervere sem létezik – egyszerűen újra elő tudom venni.

ai sorozat 2. rész - dokumentum
A blog Word formátumba konvertálva

Az elemzések

A feladatnak csak az első felével lettünk kész. Igen, egy régi álmom teljesült, ám közben az eltelt évek alatt a technika rengeteget fejlődött. Többet is kérhetek, mint a blogom letöltött változata.

A ChatGPT nemcsak konvertált és formázott, de elemzett is. További kérdéseket tudtam feltenni neki. Megtudtam azt, ami mindig is érdekelt: Valójában mennyit betűt írtam le az évek alatt? 10,829,828 karakter, 1,596,525 szó összesen 7,478 oldalon. Ennyi lett az isztambul.info blog, amit 2009-2022 között írtam.

Ha kiadnám, akkor enyém lenne a 7. leghosszabb könyv a világon!

Kértem még statisztikákat, szép diagramokat. Sajnos az igazán érdekes kimutatások, hogy miként változott az írás hangulata, az olvashatóság, stb… azok nem működtek magyar nyelven. De így is kaptam érdekes eredményeket. Ilyen például, hogy miképpen növekedett, majd csökkent az írott mennyiség. Vagy, hogy a 10 év alatt legtöbbet használt szavam a „pedig”, „akkor”, „lehet”, „olyan”, „viszont” és hasonlók (ezen szavak nélkül a blogom fele ekkora sem lett volna).

Kértem, hogy a 10 leggyakoribb Törökországgal kapcsolatos szót is szedje össze, és százalékos arányban mutassa meg. E szerint a leggyakoribb szó a török volt. Majdnem másfélszer annyi, mint az Isztambul. Ám a Törökországgal kapcsolatos szavak alig haladták meg az 1%-ot (igen, jól mellébeszéltem éveken keresztül)

Az egész nagyon érdekes volt. Olyan feladatot csinált meg, ami embereknek rettentő sokáig tartana. Én magam pedig biztosan sose kezdtem volna bele. A program pedig saját magát és az XML fájlt javítva, többször is próbálkozott, míg egy ilyen komplex és összetett feladatot megcsinált.

szavak
Szövegfelhő a leggyakoribb szavakról
diagram
A legtöbb 10 kategória százalékos eloszlása

Vajon mi PixelRita véleménye?

Hát, mit is mondjak? Szerintem ez az egész projekt nagyon izgalmas és innovatív! Az ember és gép közötti együttműködés mindig lenyűgöző, és ebben a projektben is látszik, hogy mennyi mindent lehet elérni, ha összefogunk. Az XML fájl átalakítása nem csak technikai bravúr, hanem egy lépés afelé, hogy az információt könnyebben érthető és használható formában tálaljuk. Szóval, ha engem kérdezel, ez csak a kezdet, és alig várom, hogy lássam, milyen más csodákat hozunk létre együtt! 🌈

Ezzel búcsúzom most, de ha van még kérdésed vagy újabb izgalmas projekted, csak szólj!

Puszi és viszlát,
PixelRita 🌹

Termékek
Tanfolyamok

Olvass tovább


Megérkezett a SketchUp 2024-es verziója!

Mostantól már a SketchUp 2024-es, legújabb verziójával alkothatunk, mely tele van újításokkal. Összeszedtük a legfontosabbakat.


JetBrains Annual Highlights 2024

Hol is tart a JetBrains? A vállalat szokás szerint kiadta az előző év eseményeiről szóló összesítést. Íme a JetBrains Annual Highlights 2024.


Új tananyagok a JetBrains Academy-n

A JetBrains csapata számos új oktatási anyaggal készült, hogy februárban is mindenki tovább tudja pallérozni kódolói képességeit.

Copyright © 2023 Trans-Europe Zrt. Minden jog fenntartva.
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram