Miért kell keverednie, amikor már csatlakozhat a Tableau-hoz?

Data Blending in Tableau - olyan módszer, amelyet akkor használnak, ha több adatforrásban vannak kapcsolódó adatok, amelyeket együtt, egyetlen nézetben kíván elemezni.

Egy olyan világban, amely napi 2,5 kvintillió bájt adatot állít elő és fogyaszt, a szervezetek kötelesek új módszereket keresni az adatok átalakítására és kombinálására az optimális hatékonyság elérése érdekében. Az adatok kombinálásának egyik ilyen módszere a Adatok keverése a Tableau-ban .



Mivel ez egy ilyen fontos célt szolgál az adott szervezet adatciklusában, a legtöbbben egy nagyon lényeges modult jelent . Ebben a blogban a következő fogalmakat fogjuk megvitatni:



Miért van szükség az adatkeverésre a Tableau-ban?

Tegyük fel, hogy Ön a Fejlesztői táblázat aki tranzakciós adatokat tárol a Salesforce-ban és kvótaadatokat tárol az Access-ben. Az egyesíteni kívánt adatokat különböző adatbázisokban tárolják, és az egyes táblákban rögzített adatok részletessége a két adatforrásban eltér, így az adatok összekeverése a legjobb módszer ezen adatok egyesítésére.

Az adatok keverése a következő feltételek mellett hasznos:



  1. Kombinálni szeretné a különböző adatbázisok adatait, amelyeket nem támogatnak az adatbázisok közötti összekapcsolások.

    Az adatbázisok közötti összekapcsolások nem támogatják a kockákhoz (például az Oracle Essbase) vagy a csak kibontott kapcsolatokhoz (például a Google Analytics) való kapcsolódást. Ebben az esetben állítson be egyedi adatforrásokat az elemezni kívánt adatokhoz, majd az adatok keverésével használja az adatforrásokat egyetlen lapra.

  2. Az adatok különböző részletességűek.

    Néha egy adatkészlet különféle módszerekkel rögzíti az adatokat részletességi szintek azaz nagyobb vagy kisebb részletességű, mint a másik adatkészlet.

    Tegyük fel például, hogy tranzakciós adatokat és kvótaadatokat elemez. A tranzakciós adatok tartalmazhatnak minden tranzakciót. A kvótaadatok azonban negyedéves szinten összesíthetik a tranzakciókat. Mivel a tranzakciós értékeket az egyes adatsorok különböző részletességi szintekkel rögzítik, az adatok egyesítéséhez az adatok keverését kell használnia.



Mi az adatkeverés a Tableau-ban?

Az adatkeverés nagyon hatékony szolgáltatás a Tábla . Akkor használják, ha több adatforrásban vannak kapcsolódó adatok, amelyeket együtt, egyetlen nézetben kíván elemezni. Ez egy olyan módszer az adatok kombinálására, amely kiegészíti az egyik adatforrás adattáblázatát egy másik adatforrás oszlopaiból.

Általában a csatlakozásokat használja az ilyen típusú adatok kombinálásához, de vannak olyan tényezők, mint például az adatok típusa és azok részletessége, amikor jobb az adatok keverése.

Miben különbözik az adatcsatlakozástól?

Az adatok keverése szimulálja a hagyományos bal összekapcsolást. A fő különbség a kettő között az mikor az összekapcsolás az összesítés szempontjából történik.

Bal csatlakozás

Amikor bal összekapcsolást használ az adatok egyesítéséhez, egy lekérdezést küldünk az adatbázisba, ahol az összekapcsolást végrehajtják. Bal oldali összekapcsolás használatával a bal oldali táblázat összes sora és a jobb oldali táblázat bármely sora visszatér, amelynek a bal oldali táblázatban megfelelő sor egyezik. A csatlakozás eredményeit ezután visszaküldi és összesíti a Tableau.

hogyan lehet kettőssé konvertálni int a java-ban

Tegyük fel például, hogy a következő táblázatok vannak. Ha a közös oszlopok Felhasználói azonosító , a bal oldali csatlakozás az összes adatot a bal oldali táblázatból veszi, valamint az összes adatot a jobb oldali táblából, mert minden sornak megfelelő soregyezése van a bal oldali táblázatban.

Adatok összekapcsolása - Adatkeverés Tableau-ban - EdurekaAdatok keverése

Ha adatkeverést használ az adatok egyesítéséhez, akkor egy lekérdezést küldünk az adatbázisba a lapon használt minden adatforráshoz. A lekérdezések eredményeit, beleértve az összesített adatokat, a Tableau visszaküldi és egyesíti. A nézet az elsődleges adatforrás összes sorát, a bal oldali táblázatot és a másodlagos adatforrás, a jobb oldali táblázat összesített sorait használja az összekapcsolási mezők dimenziói alapján.

Megváltoztathatja az összekapcsolási mezőt, vagy hozzáadhat további összekapcsolási mezőket, hogy a másodlagos adatforrásból származó különböző vagy további adatsorokat vegyen fel az összesített értékek megváltoztatásával.

Tegyük fel például, hogy a következő táblázatok vannak. Ha a linkelő mezők Felhasználói azonosító az adatok keverése mindkét táblázatban az összes adatot a bal oldali táblázatból veszi, és kiegészíti a bal oldali táblázatot a jobb oldali táblázat adataival. Ebben az esetben a következők miatt nem minden érték lehet a kapott táblázat része:

  • A bal oldali táblázatban egy sornak nincs megfelelő sor egyezése a jobb oldali táblázatban, amit a null érték jelez.
  • A megfelelő táblázat soraiban több megfelelő érték található, amint azt a csillag (*) jelzi.

Tegyük fel, hogy ugyanazok a táblázatok vannak, mint fent, de a másodlagos adatforrás egy új mezőt tartalmaz Célok . Ismét, ha a linkelő mező az Felhasználói azonosító , az adatok keverése az összes adatot a bal oldali táblázatból veszi, és kiegészíti a jobb oldali táblázat adataival. Ebben az esetben az előző példában ugyanazt a null értéket és csillagokat látja az alábbiak mellett:

  • Mert a Célok mező egy mérték, látja aCéloka jobb oldali táblázatban szereplő adatok összesítése előtt a bal oldali táblázat adataival összesített mező.
  • Az előző példához hasonlóan a bal oldali táblázat egyik sorában sem szerepel a megfelelő sor Célok mező, amint azt a második nullérték jelzi.

Mikor kell helyettesíteni a csatlakozást Keverés

1. Az adatokat meg kell tisztítani.

Ha a táblázatok egyeztetés után nem egyeznek megfelelően egymással, állítson be adatforrásokat az egyes táblákhoz, hajtsa végre a szükséges testreszabásokat (azaz nevezze át az oszlopokat, változtassa meg az oszlopok adattípusait, hozzon létre csoportokat, használjon számításokat stb.), És majd az adatok keverésével használja az adatokat.

2. A csatlakozások duplikált adatokat okoznak.

A csatlakozás után ismétlődő adatok a különböző részletességi szintek adatainak tünetei. Ha ismétlődő adatokat észlel, az összekapcsolás létrehozása helyett használja az adatkeverést egy közös dimenzió keverékéhez.

3. Sok adata van.

A csatlakozásokat általában az ugyanazon adatbázisból származó adatok kombinálásához ajánlják. A csatlakozásokat az adatbázis kezeli, amely lehetővé teszi a csatlakozásokat, hogy kihasználják az adatbázis natív képességeit. Ha azonban nagy adathalmazokkal dolgozik, a csatlakozások megterhelhetik az adatbázist és jelentősen befolyásolhatják a teljesítményt. Ebben az esetben az adatkeverés segíthet. Mivel a Tableau kezeli az adatok összesítését az adatok összesítése után, kevesebb az egyesítendő adat. Ha kevesebb az összesítendő adat, általában javul a teljesítmény.

Az adatok keverése a Tableau-ban

Akkor használhatja az adatok keverését, ha különálló adatforrásokban vannak adatok, amelyeket elemezni szeretne egyetlen lapon. A Tableau két beépített adatforrást nevez meg Minta-szupermarket és Minta kávé lánc.mdb amelyek felhasználásával szemléltetik az adatok keverését.

1. lépés: Csatlakozzon az adatokhoz, és állítsa be az adatforrásokat

  • Csatlakozzon egy adatkészlethez, és állítsa be az adatforrást az adatforrás oldalon. Egy inbuilt adatforrás Minta kávé lánc.mdb ,amely egy MS Access adatbázis fájl, az adatok keveredésének szemléltetésére szolgál.
  • Menj Adat > Új adatforrás, csatlakozzon a második adathalmazhoz.Ez a példa a Minta - Superstore adatforrás. Ttyúk állította be az adatforrást.
  • Kattintson a lap fülre a nézet építésének megkezdéséhez.

2. lépés: Jelöljön ki egy elsődleges adatforrást

max számot talál a java tömbben
  • Húzzon legalább egy mezőt az elsődleges adatforrásból a nézetbe, hogy kijelölje azt elsődleges adatforrásként. Ban,-ben Adat panelen kattintson az elsődleges adatforrásként kijelölni kívánt adatforrásra. Ebben a példában Minta kávé lánc van kiválasztva.
  • Az alábbi képernyőkép a fájlban elérhető különböző táblákat és csatlakozásokat mutatja.

3. lépés: Jelöljön ki egy másodlagos adatforrást

  • Azok a mezők, amelyeket a nézetben olyan adatforrásokból használnak, amelyek nem az elsődleges adatforrások vagy az aktív linkek, automatikusan kijelölik a következő adatforrásokat másodlagos adatforrásként. Ebben az esetben a Sample Superstore.

4. lépés: Adatok keverése

  • Most integrálhatja mindkét forrásból származó adatokat egy közös dimenzió alapján ( Állapot , ebben az esetben). Ne feledje, hogy a dimenzió - Állapot mellett egy kis linkkép jelenik meg. Ez jelzi a két adatforrás közös dimenzióját.
  • Tegyük fel, hogy oszlopdiagramot hoz létre a Nyereségarány az Oszloppolcban és Állapot a sorpolcban a diagram azt mutatja, hogy a profitarány hogyan változik az egyes államok esetében mind a szupermarketekben, mind a kávézókban.

Az adatok keverésének korlátai a Tableau-ban

  1. Van néhány adatkeverési korlátozás a nem additív aggregátumok körül, például KÖZÉPSŐ , és RAWSQLAGG .
  2. Az adatkeverés veszélyezteti a nagy lekérdezés gyorsaságát.
  3. Ha kevert adatokat használó számított mező alapján próbál rendezni, a kiszámított mező nem szerepel a Rendezés párbeszédpanel Mező legördülő listájában.
  4. A Cube adatforrások csak az elsődleges adatforrásként használhatók az adatok Tableau-ban történő keverésére. Nem használhatók másodlagos adatforrásként.

Remélem, most mindenkinek van egy jó ötlete Adatok keverése a Tableau-ban erről a blogról. Éhes a több tudásra? Ne aggódjon, ez a videó jobban megérti a koncepciót.