Üzleti és informatikai tanácsadás
Adatbányászat
"Az adatbányászat vagy tudáskinyerés alatt implicit, korábban nem ismert és potenciálisan hasznos új információk adatokból történő kinyerését értjük."
(William J. Frawley, Gregory Piatetsky-Saphiro, Cristopher J. Matheus).
Az adatbányászat multidiszciplínáris terület, egyesíti többek közt az adatbázis-kezelés, a statisztika és a mesterséges intelligencia területeit.
Az adatbányászati projektek egységes menedzselhetősége érdekében a legnagyobb adatbányászattal foglakozó szoftvercégek saját módszertanokat hoztak létre. A két legismertebb a SAS Institute által felállított SEMMA módszertan és az NCR, Daimler Chrysler, SPSS és OHRA által felállított CRISP-DM módszertan.
A SEMMA módszertan lépései:
- Sample: mintavételezés, azaz egy vagy több kisebb tábla létrehozása megfigyelési, tanulási célra.
- Explore: az adatok természetének vizsgálata, a bennük rejlő összefüggések, trendek, ellentmondások, hiányosságok meghatározása.
- Modify: a modellezés számára szükséges változók készítése, kiválasztása, átalakítása.
- Model: olyan modellek készítése, amelyek a mintaadatokban rejlő összefüggések alapján a lehető legjobb előrejelzéseket tudják adni.
- Assess: a különböző modellek kiértékelése, összehasonlítása.
A CRISP-DM (CRoss Industry Standard Process for Data Mining) módszertan lépései:
- Üzleti probléma megértése
- Adatok megismerése
- Adatelőkészítés
- Modellezés
- Kiértékelés
- Bevezetés
Az adatbányászat feladatait alapvetően két csoportba lehet sorolni:
- Leíró adatbányászat: egy adathalmaz tulajdonságainak tömör, összefoglaló jellegű feltárása.
- Adatok megjelenítése, összesítések
- Klaszterezés
- Osztályjellemzés
- Link analízis
- Prediktív adatbányásza: objektumok bizonyos jellemzőinek jövőbeni változásait leíró modellek készítése.
- Osztályozás
- Előrejelzés, regresszió
- Idősorok elemzése
A leggyakrabban alkalmazott adatbányászati technikák:
- Döntési fák
- Logisztikus regresszió
- Mesterséges neurális hálózatok
- Support Vector Machine
- K-szomszédsági eljárások
Adatbányászati projektjeink során az üzleti lehetőségek kiaknázását tartjuk szem előtt. Nagy hangsúlyt fektetünk a gazdasági alkalmazhatóságra. Úgy gondoljuk, hogy a matematikai modellezésen túlmenően, kiemelten fontos az eredmények hétköznapi életbe való ültethetőségének, az üzleti folyamatokba való integrálhatóságának vizsgálata, a lehetőségek megteremtése.




