„Adatbányászat” változatai közötti eltérés

[nem ellenőrzött változat][nem ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
Betuveto (vitalap | szerkesztései)
Betuveto (vitalap | szerkesztései)
Nincs szerkesztési összefoglaló
36. sor:
Magyarországon az első adatbányászati tanácsadó cégek a 90-es évek végén alakultak.
 
 
== Folyamata ==
== Az adatbányászat mint folyamat ==
Az adatbányászati folyamatnak több kidolgozott eljárása is létezik, amely többnyire valamilyen termékhez kapcsolódik. A legismertebbek Magyarországon az SPSS (ma IBM) 5A (Assess, Access, Analyze, Act, Automate), a SAS SEMMA <ref>SAS Institute; [http://www.sas.com/offices/europe/uk/technologies/analytics/datamining/miner/semma.html ''SAS Enterprise Miner - SEMMA''], 2010</ref> (Sample, Explore, Modify, Model, Assess) eljárása, a KDD Process <ref>{{cite journal |author=Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. |title=From Data Mining to Knowledge Discovery in Databases |year=1996 |journal=AI Magazine |volume=17 |pages=37-54 }}</ref> és a CRISP-DM <ref>{{cite journal |author=Shearer, C.|title= The CRISP-DM Model: The New Blueprint for Data Mining|journal= Journal of Data Warehousing |volume= 5 (4) |pages=13-22 |year=2000 }}</ref> (CRoss Industry Standard Process for Data Mining), ami egy ipari szabvány; de a legtöbben saját módszertant használnak. Bár ezek a módszertanok különböző részelemekre fókuszálnak attól függően, hogy milyen termék vagy a létrehozását támogató kör támogatta, összességében nagyon hasonló eljárásokról beszélünk. Az 5A és a SEMMA elsősorban magára az elemzésre fókuszál, a CRISP-DM pedig az üzleti környezetbe való beágyazást tekinti a kiindulási állapotnak.
 
50 ⟶ 51 sor:
 
Az egyes lépéseken sorban haladnak végig a projektek során, alkalmazásuk azonban több iterációban történik. Minden szakaszban új ismeretre lehet szert tenni - ha másért nem, hát azért, mert látjuk, hogy helyes-e egy-egy hipotézis vagy sem -, amelyet a megelőző szakaszokba integrálva új optimumpont keresését és kiválasztását teszi lehetővé.
 
 
== Algoritmuscsaládok, modellezési technikák ==
61 ⟶ 63 sor:
* Gyakori mintázatok és asszociációs szabályok kinyerése: előre nem ismert, de jellemző összefüggések vagy viselkedési minta feltárása a feladat.
 
== Az adatok értelmezése ==
Az adatoknak önmagukban nincs [[jelentés]]ük; az értelmezéstől, azok feldolgozásának módjától, alkalmazásuktól nyernek értelmet, és válhatnak [[információ]]vá, ''hasznos'' adatokká. Ebből következik, hogy minden adatbányászat [[hipotézis]]ekkel indul, azzal az előfeltételezéssel, hogy létezik olyan összefüggés az adatok között, amely figyelmet érdemel.
 
== Alkalmazási területek ==
70. sor:
* Kereskedelem: Kampányoptimalizáció; Vásárlói kosár elemzése; Direkt reklámok; Vásárlói útvonalak feltérképezése
* Biológia, orvostudományok: Gyógyszerkutatás; [[Dezoxiribonukleinsav|DNS]] elemzése
 
 
== Adatbányászati szoftverek ==