Manóbolt - Babaruha

Üzleti és informatikai tanácsadás

Adatbányászat

"Az adatbányászat vagy tudáskinyerés alatt implicit, korábban nem ismert és potenciálisan hasznos új információk adatokból történő kinyerését értjük."
(William J. Frawley, Gregory Piatetsky-Saphiro, Cristopher J. Matheus).

Az adatbányászat multidiszciplínáris terület, egyesíti többek közt az adatbázis-kezelés, a statisztika és a mesterséges intelligencia területeit.

Az adatbányászati projektek egységes menedzselhetősége érdekében a legnagyobb adatbányászattal foglakozó szoftvercégek saját módszertanokat hoztak létre. A két legismertebb a SAS Institute által felállított SEMMA módszertan és az NCR, Daimler Chrysler, SPSS és OHRA által felállított CRISP-DM módszertan.

A SEMMA módszertan lépései:

  • Sample: mintavételezés, azaz egy vagy több kisebb tábla létrehozása megfigyelési, tanulási célra.
  • Explore: az adatok természetének vizsgálata, a bennük rejlő összefüggések, trendek, ellentmondások, hiányosságok meghatározása.
  • Modify: a modellezés számára szükséges változók készítése, kiválasztása, átalakítása.
  • Model: olyan modellek készítése, amelyek a mintaadatokban rejlő összefüggések alapján a lehető legjobb előrejelzéseket tudják adni.
  • Assess: a különböző modellek kiértékelése, összehasonlítása.

A CRISP-DM (CRoss Industry Standard Process for Data Mining) módszertan lépései:

  • Üzleti probléma megértése
  • Adatok megismerése
  • Adatelőkészítés
  • Modellezés
  • Kiértékelés
  • Bevezetés

Az adatbányászat feladatait alapvetően két csoportba lehet sorolni:

  • Leíró adatbányászat: egy adathalmaz tulajdonságainak tömör, összefoglaló jellegű feltárása.
    • Adatok megjelenítése, összesítések
    • Klaszterezés
    • Osztályjellemzés
    • Link analízis
  • Prediktív adatbányásza: objektumok bizonyos jellemzőinek jövőbeni változásait leíró modellek készítése.
    • Osztályozás
    • Előrejelzés, regresszió
    • Idősorok elemzése

A leggyakrabban alkalmazott adatbányászati technikák:

  • Döntési fák
  • Logisztikus regresszió
  • Mesterséges neurális hálózatok
  • Support Vector Machine
  • K-szomszédsági eljárások

Adatbányászati projektjeink során az üzleti lehetőségek kiaknázását tartjuk szem előtt. Nagy hangsúlyt fektetünk a gazdasági alkalmazhatóságra. Úgy gondoljuk, hogy a matematikai modellezésen túlmenően, kiemelten fontos az eredmények hétköznapi életbe való ültethetőségének, az üzleti folyamatokba való integrálhatóságának vizsgálata, a lehetőségek megteremtése.

« vissza



Minőségbiztosítás - ISO 9001:2000
Jegyzett tőke 2003-2006 Saját tőke 2003-2006 Nettó árbevétel 2003-2006