„Adatbányászat” változatai közötti eltérés

[nem ellenőrzött változat][nem ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
Betuveto (vitalap | szerkesztései)
Betuveto (vitalap | szerkesztései)
15. sor:
 
== Folyamata ==
Az adatbányászati folyamatnak több kidolgozott eljárása is létezik, amely többnyire valamilyen termékhez kapcsolódik. A legismertebbek Magyarországon az SPSS (ma IBM) 5A (Assess, Access, Analyze, Act, Automate), a SAS SEMMA <ref><ref>SAS Institute; [http://www.sas.com/offices/europe/uk/technologies/analytics/datamining/miner/semma.html ''SAS Enterprise Miner - SEMMA''], 2010</ref> (Sample, Explore, Modify, Model, Assess) eljárása és a CRISP-DM <ref>Shearer, C; The CRISP-DM Model: The New Blueprint for Data Mining; Journal of Data Warehousing 5 (4); 13-22; 2000</ref> (CRoss Industry Standard Process for Data Mining), ami egy ipari szabvány; de a legtöbben saját módszertant használnak. Bár ezek a módszertanok különböző részelemekre fókuszálnak attól függően, hogy milyen termék vagy a létrehozását támogató kör támogatta, összességében nagyon hasonló eljárásokról beszélünk. Az 5A és a SEMMA elsősorban magára az elemzésre fókuszál, a CRISP-DM pedig az üzleti környezetbe való beágyazást tekinti a kiindulási állapotnak.
 
Egy sikeres adatbányászati projekt legfontosabb lépcsői: