Ma azonban az úgynevezett citizen eszközök (vizuális keretrendszerrel rendelkező; gyakran MS Office felületre hajazó; képességeivel a „nagyokat” megközelíteni akaró vagy be is érő eszközök; illetve ezek újszerű licencelési konstrukciói) forradalmasítják (átalakítják) ezt a területet, megnyitva az ajtót többek számára. Elképzelhető, hogy egy marketinges (inkább marketing elemző) vagy egy HR menedzser (inkább HR controller) saját maga elemez adatokat, fedezi fel a trendeket és hoz döntéseket, anélkül, hogy mély statisztikai és technikai tudásra lenne szüksége.
Ez a szélesebb körű eszközhozzáférés új korszakot jelent az adatvezéreltebb döntéshozatalban, ahol nem csak az adatbányászok / adattudósok, hanem gyakorlatilag bárki képes értékes információkat előállítani az adatokból. A felhasználók citizen eszközöket használva a standardokhoz közelebb (többnyire no-code / low-code megközelítéssel) olyan megoldásokat hoznak létre, amelyek megfelelnek az üzleti vagy személyes igényeknek. Így a „citizen”-ség nem csak eszköz, hanem standardizáció, skálázhatóság, helyettesíthetőség, költséghatékony kiterjesztési lehetőség.
Mik lehetnek a legfőbb előnyök és kihívások?
A citizen eszközök legfőbb előnyei:
- Könnyű hozzáférés és használat: Beszerzési konstrukcióik rugalmasak (pl.: alacsony belépési küszöb, ingyenes letölthetőség), skálázhatók, a felületek vizuális, letisztult. Szokták úgy is mondani, hogy pilótavizsga nem kell a felület értelmezéséhez.
- Jobb ritmusú döntéshozatali folyamat: Az adatelemző citizen eszközök és azok komponenseinek segítségével az adatokat gyorsabban feldolgozhatjuk és értelmezhetjük.
- Költséghatékony megoldás: A citizen eszközök használatának költségei általában eltérnek a régi szereplők konstrukcióitól; illetve sok esetben felsőoktatási környezetből indulva alap hozzáértő penetrációja is szokott lenni.
A citizen eszközök kapcsán felmerülő leggyakoribb kihívások:
- Korlátozott tudás és képzettség: A felhasználók nem mindig rendelkeznek a szükséges szakmai kompetenciákkal. Az elemzési módszertanok ismerete, az eszközök betanítása, funkcióinak helyes értelmezése időigényes lehet.
- Skálázhatóság: Bár a citizen eszközök kiválóak kisebb projektekhez, a nagyobb méretű vállalatoknál és a komplexebb feladatokhoz más, speciális eszközökre lehet szükség (sok ilyen eszköz kíván „nagyvállalati” funkcionalitást, keretrendszert).
- Pontosság és megbízhatóság: A citizen eszközökkel gyűjtött / elemzett adatok pontossága és megbízhatósága kérdéses lehet. A nem adatelemzők által készített elemzések ellenőrzése és validálása fontos feladat.
Jelen cikkünben egy ilyen kiragadott „citizen” Data Science eszközt, a KNIME-ot fogjuk részletesen megvizsgálni.
A KNIME-ról dióhéjban
A Konstanz Information Miner (KNIME) kezdetben egyetemi projekt volt a gyógyszerészeti adatelemzés területén. Azóta azonban az eszköz rengeteget fejlődött és általánosan használttá vált az adatbányászat, elemzés és gépi tanulás terén. A KNIME (fenti általános előnyökön túli) két fontos előnye:
- Univerzalitás: A KNIME egyike azon kevés eszköznek, amelyet mind adatátalakítási platformként, mind pedig gépi tanulásra alkalmas eszközként lehet használni.
- Elérhetőség: Az asztali verzió ingyenesen elérhető, miközben a nagyvállalati felhasználásért és a szerveres futtatásért fizetnünk kell, de a felhőalapú lehetőség rugalmasan skálázhatóvá teszi az eszközt.
A fentiek okán a BI jövőkép projektjeinkben az ETL (adatintegráció, adattranszformáció) funkciót is ellátó Advanced Analytics (fejlett adatelemzés) eszközként hivatkozunk a KNIME-ra a nagyvállalati ETL eszközök mellett. Mik a KNIME válaszai a fentebb megfogalmazott legfőbb kihívásokra?
- Korlátozott tudás és képzettség: A KNIME válasza az intuitív, könnyen használható (no-code) felhasználói felület, amely lehetővé teszi a felhasználók számára az adatelemzést anélkül, hogy mély technikai tudásra lenne szükségük.
- Skálázhatóság: A KNIME kiváló kisebb projektekhez, a nagyobb méretű vállalatoknak pedig a KNIME Business Hub megoldását kínálja, mely nagyvállalati, szerveres környezetet biztosít a kollaborációt elősegítve.
- Pontosság és megbízhatóság: A pontosság és megbízhatóság problémaköre inkább szervezeti, mint eszközfüggő. Az adatok validálásának és ellenőrzésének megszervezése a KNIME esetében is kiemelt feladat, eszköz erre nem tud (még) megoldást kínálni.
Összefoglalás
A citizen típusú eszközök forradalmasítják az adatelemzés területét, megnyitva az ajtót többek számára. Lehetővé teszik, hogy nem csak az adatbányászok és adattudósok, hanem bárki értékes információkat állítson elő az adatokból, gyakran nagyon alacsony (vagy nem létező) belépési küszöbbel.
Amennyiben felkeltette az érdeklődését valamely citizen data scientist eszköz, lépjen kapcsolatba velünk, segíteni tudjuk az eszköz használatba vételét, valamint annak nagyvállalativá tételét.
Közgazdászból BI-szakértő
Cikkünk egyik szerzője, Balázs Bertold jó példa arra, hogy nem csak informatikai végzettséggel lehet valaki elhivatott BI-os. Kollegánk a BGF Gazdálkodás és Menedzsment alapszakán és a Corvinus Vezetés és Szervezés mesterszakán végzett. Az IFUA Horváth Enterprise Analytics területének Business Intelligence szegmensében kezdetben vizualizációs és front-end eszközökkel (például Tableau, Power BI, SAP BO BI, SAC, Qlik, Microstrategy, Squirrel stb.) dolgozott. Egyre mélyebben ásta bele magát az üzleti intelligencia architektúrájának elemeibe. 2020 végén egy kollégájával közösen megnyerte a Budapest BI adatvizualizációs versenyét egy Citizen Vizualization eszközzel (Squirrel365), 2023 végén pedig elnyerte a KNIME Kninja címet. Emellett 2024 januárjában a KNIME Contributor of the Month címet is megkapta. Bertold a hétköznapjai megkönnyítésére is számos KNIME automatizációt kifejlesztett, erről ebben a cikkben olvashatnak.