Az Arcanum Digitális Tudománytárban több mint huszonöt milliárd feldolgozott szó között kutathatunk bármilyen témában. Elég csak néhány részletet megadnunk hozzá és szemünk elé tárul a múlt és jelen nyomtatott verziója.
Az Arcanum Digitális Tudománytár az interneten keresztül hozzáférhető, folyamatosan bővülő tudományos és forrásadatbázis, amelyben a legfontosabb magyar nyelvű szakmai folyóiratok, 2. világháború előtti napilapok, hetilapok, lexikonok és egyéb dokumentumok, mint például ezredtörténetek, családtörténeti könyvek érhetők el.
A családi cég egy budai lakásban üzemel. Itt dolgozik Biszak Sándor vezérigazgató, valamint két gyermeke: Biszak Előd vezető fejlesztő, ügyvezető és Biszak Bogáta, aki az ügyfélszolgálatot kezeli. 1989-ben alakult a vállalkozás és azóta több átalakuláson is átment. Sokáig CD-ket adtak ki, részben könyveket, amiket kézzel gépeltek be, korrektúráztak, tördeltek újra. Az Arcanum Digitális Tudománytárral kapcsolatos munkák 6-8 évvel ezelőtt kezdődtek, akkor adta a Google Books felbukkanása az ihletet a nyomtatott tartalmak minél szélesebb körű digitalizálásához. Az ADT maga 2014-ben indult, bár akkor még csak intézményeknek nyújtott hozzáférést a digitalizált tartalmakhoz.
A cég igazi szimbiózisként üzemel. A munka folyamata pedig úgy zajlik, hogy a ház alsó szintjén több helyiségben felhalmozott, bekötött, vagy kötetlen újságokat, folyóiratokat, könyveket szkennelésre előkészítik. Egy szomszédos, nagyobb helyiségben zakatolnak a szkennerek. Többféle eszköz is falja az újságlapokat, az automatikus szkennerek szempillantás alatt végeznek egy-egy oldal 300 dpi-s bevitelével, függetlenül attól, hogy fekete-fehér vagy színes a tartalom. A nagy alakú és szét nem vágható újságköteteket egy másik, kisebb szobában digitalizálják. Itt állványra szerelt, Canon EOS 5Ds 50 megapixeles, full frame-es digitális fényképezőgépekkel fotózzák be a fixen megvilágított oldalakat.
Az adatbázis PDF-formátumban tárolja és jeleníti meg a tartalmakat. Ennek köszönhetően a felhasználó minden esetben az eredeti dokumentum hiteles oldalképét láthatja. Teljes szövegű keresést biztosít, ami nagyban hozzájárul ahhoz, hogy a kívánt információhoz kényelmesen, gyorsan és teljes egészében lehessen hozzájutni. Több fajta előfizetés közül is választhat, de egy része teljesen ingyenesen használható a tudománytárnak.
A keresést, illetve a találatok megjelenítését szűkíthetjük egy-egy kiadványra, téma- és évkörökre, továbbá lehetőségünk van szótávolsági keresésre, többszavas keresésre logikai operátorok használatával, valamint használhatjuk az INDEX funkciót is, amely az adatbázisban szereplő összes szó listáját mutatja meg nekünk.
Keresésünk eredményét találati listába rendezve, rövid szövegkörnyezettel együtt látjuk, a találatokat pedig a program kivilágítja a szövegben is.
Fontos, hogy a pontos oldalhivatkozások is mindig rendelkezésünkre állnak, így a digitális szöveg minden szempontból kiválthatja a ma már legtöbbször nehezen hozzáférhető papíralapú változatot.
Emellett az ADT-n működik egy bétaverziójú képkereső, amihez egy külön erre a célra betanított AI-t engednek rá az oldalakra. A neurális háló automatikusan felismeri, van-e az adott oldalon kép, fotó, grafika, ezzel is a felhasználó dolgát megkönnyítve. A Google TensorFlow gépi tanuló algoritmusára épített arcanumos mesterséges intelligencia egyelőre azonban még gyerekcipőben jár, sokszor előfordul, hogy bizonytalankodik, ugyanis például a szokatlan tördelési megoldások be tudják csapni, de az esetek nagy részében segít releváns találatokat hozni.
Biszak Sándor így összegezte cége tevékenységét: "Úgy érezzük, hogy az újságokkal valami jóba fogtunk bele. Egyrészt jól követhető, számon tartható, hogy mi van, mi nincs, mikor mi jelent meg, és mivel hírekről van szó, mindenki találhat az Arcanumon olyat, ami érdekli, ami érinti".
A írás az Indexen megjelent Nagy Attila Károly cikke alapján készült. További részletekért kattints a linkre!
Fotók: Facebook - Arcanum Adatbázis Kiadó
Figyelem! A tartalom legalább 2 éve nem frissült! Előfordulhat, hogy a képek nem megfelelően jelennek meg.