Power BI Microsoft Fabric-en - Marketingfogás vagy valódi szemantikusréteg-megoldás?

Az adatelemzés területén nem lehet eléggé hangsúlyozni a robusztus és hatékony üzleti intelligencia (BI) fontosságát. A Power BI integrációját a Microsoft Fabric Direct Lake architektúrájával, mint forradalmi megoldást üdvözölték a szakmában, mivel jelentős előrelépést jelent a Power BI analitikai lehetőségeinek kihasználásában. Az architektúra egyik legvonzóbb ígérete, hogy szemantikus réteget kínál. Ezzel lehetővé teszi a felhasználók számára, hogy közvetlenül és hatékonyan dolgozhassanak nagy adathalmazokkal, miközben a szemantikus réteg biztosítja az "egy igazság elvét", garantálja az adatok konzisztenciáját és megbízhatóságát a teljes szervezeten belül.

1. Kép - Kapcsolódási lehetőségek a Power BI-ban

Egy nemrégiben tartott webinárium mélyrehatóan vizsgálta ennek az architektúrának a hatékonyságát, és kritikus kérdéseket vetett fel a marketinges állításokkal és a valós teljesítményével kapcsolatban (a webináriumot Christopher Wagner, a Baker Tilly adatmegoldásokért felelős igazgatója és David Mariani, az AtScale technológiai igazgatója és alapítója vezette*). A bemutató főként a Microsoft Fabric és a Power BI/Direct Lake (A Power BI közvetlen kapcsolódása a OneLake-re) megoldásának gyakorlati lehetőségeit és kihívásait tárta fel. Kiemelve, hogy a Microsoft állításai szerint a Power BI/Direct Lake szemantikus rétegként funkcionál. A valóságban több technikai és skálázhatósági kihívás áll fenn a vállalati alkalmazhatóságban. A webináriumon elhangzott főbb megállapításokat és a fejlesztési lehetőségeket gyűjtöttük össze cikkünkben:

Kulcsfontosságú megállapítások:

  1. Kisebb adathalmazok esetében jó, nagy adathalmazok esetén nem megfelelő a lekérdezési teljesítmény
    • Kisebb adathalmazok (100 GB – 1 TB) esetén a Power BI/Direct Lake kiválóan teljesít, gyors lekérdezéseket és hatékony adatfeldolgozást kínál
    • Nagyobb adathalmazok (1 TB – 10TB) esetén a teljesítmény már nem elégséges (Direct Query módra való automatikus visszalépés (fallback) és egyéb teljesítményingadozások)
  2. Párhuzamos lekérdezések esetén a rendszer ingadozást mutat
    • Több egyidejű lekérdezés esetén a rendszer jelentős teljesítményingadozást mutat
    • Lekérdezési időtúllépések, a DirectQuery módra való automatikus visszalépés (fallback) és egyéb teljesítményingadozások jelentkeznek
  3. Skálázhatóság és stabilitás:
    • A fenti megállapítások (nagy adathalmazok, párhuzamos lekérdezések esetén teljesítményromlás) alapján a Power BI Fabric-en nem, vagy nehezen skálázható
    • Ezek az aggályok kiemelten fontosak, mivel ezek közvetlenül befolyásolják a rendszer vállalati szintű alkalmazhatóságát és stabilitását

Összehasonlítás az AtScale-lel a Snowflake-en:

  • Bár a Power BI/Direct Lake kisebb adathalmazoknál költséghatékonyabb megoldás, nagyobb adatmennyiségek és több felhasználó egyidejű elérése esetén az AtScale jobb teljesítményt és költséghatékonyságot nyújt

Tesztelés során azonosított fejlesztési lehetőségek:

  • Szemantikus modellezési korlátok, fejlesztendő területek: a Power BI/Direct Lake-nek javítania kell a bonyolultabb adatszerkezetek kezelésén, hogy az adatokat mélyebben és könnyebben lehessen elemezni és összekapcsolni.
    • Hogy a fenti kijelentés érhetőbb legyen, képzeljük el úgy a Power BI/Direct Lake szemantikus modellezését, mint egy szakácskönyvet. Jelenleg csak az egyszerűbb recepteket tudjuk elkészíteni, mert a bonyolultabbakat nagyon speciális, nehéz nyelvezettel írták le. Ha nem ipari vagy Michelin-csillaggal kitüntetett konyhán dolgozunk, akkor nem értjük őket. Ezeknek a recepteknek a leírását egyszerűsíteni kell, hogy – az analógiából visszatérve – a felhasználók képesek legyenek részletes és átfogó jelentések elkészítésére minőségbiztosított forrásból.
  • Skálázhatósági fejlesztendők: A Power BI/Direct Lake-nek javítania kell a nagy adathalmazok és párhuzamos lekérdezések kezelésének képességét (ez a fejlesztendő a fenti első kettő megállapításhoz kapcsolódik). Ez azért szükséges, hogy jól skálázható és megbízható megoldást nyújtson a vállalati szintű adatkezelési igényekre.

IFUA Horváth összefoglalás: Bár a Power BI/Direct Lake bizonyos helyzetekben alkalmasnak tűnik, a performancia problémák és a skálázhatósági aggályok miatt jelenleg csak a kisebb vállalatoknak ajánlott a használata. A jövőre való tekintettel a megoldás ígéretes, azonban a Microsoftnak még sok végrehajtási, leszállítási feladata van, amíg a megoldás nagyvállalatoknak is ajánlható lesz.

Szerzők:
Balázs Bertold, vezető tanácsadó, nagyvállalati riporting szakértő
Tallós Farkas, tanácsadó

* Forrás: Power BI on Microsoft Fabric | AtScale

2024.01.31. | Közzétette: Christopher Wagner (Baker Tilly, Director of Data Solutions) és David P. Mariani (AtScale, CTO és társalapító)

Az érdemi és ritmusban történő döntéshozás, döntéstámogatás okán a vállalati egy igazság megteremtése és fenntartása, illetve az adatsilók felszámolása, használatra bírása okán vizsgáljuk a szemantikus rétegek és az adatvirtualizáció adta lehetőségeket. A meghatározó szakmai források és gyártók (pl.: Denodo, Atscale, Microsoft, Databricks, Cloudera, IBM stb.) követése során a Microsoft Fabric idevágó aktuális mondásait vettük górcső alá tanácsadó kollégáinkkal.