Az IT-ben mindenki dolgozik adatokkal, beleértve a fejlesztőket, elemzőket, minőségbiztosítási mérnököket, termékmenedzsereket és sok más szektorban dolgozót. A felhasznált adatok és az adatfeldolgozási módszerek a szereptől függően ugyan változnak, de egyet biztosan kijelenthetünk, a legtöbb esetben maga az adat a kulcs.
Az IT világban az adatok többet jelentenek szimpla adatoknál, s bár a velük való munka rendkívül izgalmas, hozzáférésük gyakran nehézkes. Az adatokat sokféle formátumban, különböző helyeken és különböző hozzáférési korlátozások mellett tárolják, és nagyon eltérő módon strukturálják őket. A megfelelő munkavégzéshez pedig mindegyiket ismerni kell, le kell őket kérdezni. Ez feltételezi azt, hogy szükség van egy helyre, ahol kezelhetjük az adattárainkkal kapcsolatos összes információt.
Erre kínál megoldást a Hive Metastore, melyet az Apache Hive részeként fejlesztettek ki. Ez egy elosztott, hibatűrő adattárházrendszer, amely hatalmas léptékű elemzést tesz lehetővé, tehát általa mindent egy helyről lekérdezhetünk.
Teszi ezt úgy, hogy az adattárolókkal kapcsolatos összes metainformáció tárolási pontja, tehát minden információt tárol az adataink szerkezetéről és annak helyéről. A HSQL dialektussal lehetővé teszi, hogy bármilyen adatszerkezetet olyan struktúrába vetítsen, amely alkalmas az SQL lekérdezésre. Ez az oka annak, hogy számos nagy cég jó eredménnyel használja.
További információkért kattints ide!
Figyelem! A tartalom legalább 2 éve nem frissült! Előfordulhat, hogy a képek nem megfelelően jelennek meg.