Hogyan lehet futtatni a kaptár szkripteket?

Ez egy oktatóanyag a Hive Scripts futtatásáról. A szkript futtatása csökkenti az egyes parancsok manuális megírására és végrehajtására fordított időt és erőfeszítést.

Mivel az Adache Warehousing csomag a Hadoop tetejére épül, az Apache Hive egyre inkább adatelemzésre, adatbányászatra és prediktív modellezésre használják. A szervezetek határozottan ragaszkodó szakembereket keresnek . Ebben a bejegyzésben nézzük meg, hogyan kell futtatni a Hive Scripteket. Általánosságban elmondható, hogy a parancsfájlok segítségével egyszerre hajtunk végre egy sor állítást. A Hive Scripteket nagyjából ugyanúgy használják. Csökkenti az egyes parancsok kézi írásához és végrehajtásához szükséges időt és erőfeszítést.



mik a csomagok a java-ban

A Hive szkripteket a Hive 0.10.0 és újabb verziói támogatják. Mivel a Hive 0.90 verzió telepítve van a CDH3-ra, nem tudjuk futtatni a Hive Scripteket a CDH3-ban. A CDH4 alábbi lépéseit kipróbálhatja, mivel a Hive 0.10.0 verziója van telepítve. Tudja, hogyan hozhat létre Hive parancsfájlt? Ha nem, kattintson a gombra hogy további tisztázást nyerjek.



Master-Hive-Now

Most nézzük meg, hogyan kell a szkripteket írni a Hive-be, és futtatni őket a CDH4-ben:



1. lépés: Hive parancsfájl írása.

A Hive Script megírásához a fájlt .sql kiterjesztéssel kell menteni. Nyisson meg egy terminált a Cloudera CDH4 terjesztésében, és adja meg a következő parancsot a Hive parancsfájl létrehozásához.
Parancs: sudo gedit minta.sql

A fenti parancs végrehajtásakor megnyílik a fájl, amely tartalmazza az összes végrehajtandó Hive parancsot.



Ebben a szkriptben egy táblát hoznak létre, leírnak, és az adatokat betöltik és lekérik a táblából.

1. A táblázat létrehozása a kaptárban:

Parancs: tábla termék létrehozása (termékazonosító: int, terméknév: karakterlánc, ár: úszó, kategória: karakterlánc) sorok formázása elválasztott mezők, végződés ’,’

Itt a termék a táblázat neve, a {productid, terméknév, ár, kategória} pedig a táblázat oszlopai.

A „,” betűvel végződő mezők azt jelzik, hogy a bemeneti fájl oszlopait a „,” szimbólum választja el.

Alapértelmezés szerint a bemeneti fájl rekordjait egy új sor választja el.

2. A táblázat ismertetése:

Parancs: termék leírása

3. Az adatok betöltése a táblázatba.

Az adatoknak a táblába történő betöltéséhez először létre kell hoznunk egy bemeneti fájlt, amely tartalmazza a táblázatba beillesztendő rekordokat.

hogyan lehet kilépni egy módszerből a java-ban

Hozzunk létre egy bemeneti fájlt.

Parancs: sudo gedit input.txt

Szerkessze a fájl tartalmát az ábra szerint.

4. Az adatok lekérése:

Az adatok lekéréséhez a select parancsot kell használni.

Parancs: Válassza a * terméket

A fenti parancs a táblázatban található összes oszlop értékének lekérésére szolgál. A szkriptnek olyannak kell lennie, mint az alábbi képen látható.

Most elkészültünk a Hive szkript megírásával. A sample.sql fájl most elmenthető.

2. lépés: A Hive Script futtatása

A következő parancs a Hive parancsfájl futtatására szolgál:

Parancs: kaptár –f /home/cloudera/sample.sql

git és github ugyanaz

A parancsfájl végrehajtása közben ellenőrizze, hogy a parancsfájl helyének teljes elérési útja megvan-e.

Láthatjuk, hogy az összes parancs sikeresen végrehajtásra kerül.

Így futtatják és futtatják a Hive parancsfájlokat a CDH4-ben.

A Hive a Hadoop kritikus eleme, és a Hive-ban szerzett szakértelme el tudja juttatni a legjobban fizető Hadoop-munkákat! Az Edureka rendelkezik egy speciálisan kurált Hadoop tanfolyammal, amely segít olyan fogalmak elsajátításában, mint a MapReduce, a fonal, a disznó, a kaptár, a HBase, az Oozie, a Flume és a Sqoop. A kezdéshez kattintson az alábbi gombra.

Van egy kérdésünk? Kérjük, említse meg őket a megjegyzések részben, és mi kapcsolatba lépünk Önnel.

Kapcsolódó hozzászólások:

Hive parancsok

Hive adatmodellek