„Adatbányászat” változatai közötti eltérés
[nem ellenőrzött változat] | [nem ellenőrzött változat] |
Tartalom törölve Tartalom hozzáadva
Nincs szerkesztési összefoglaló |
|||
6. sor:
Az újszerűség azt foglalja magában, hogy jelenleg a területi szakértők által még nem ismert összefüggések feltárására törekszünk, meglévő tudás kinyerése, bizonyítása ugyan lehet mellékhatás, de sosem cél. Érvényesnek kell lennie a felmérésnek, azaz vizsgálni kell azt a kérdést is, hogy a kinyert összefüggés a valósággal összhangban van-e, más jelenségek is alátámasztják az összefüggést, nem csak az adatok valamilyen sajátos rendezése folytán jutottunk-e az adott következtetésre. A vélhető hasznosság hangsúlyozása azért fontos, mert az adatbányászatnak mindig üzleti célúnak és szemléletűnek kell lennie; értékelni kell minden esetben, hogy egy-egy feltárt összefüggés hordoz-e értéket potenciálisan a szervezet számára. Végezetül magyarázhatónak kell lenni az összefüggésnek, azaz fel kell tárni azt, hogy miért és hogyan jutottunk egy következtetésre, nem elegendő elfogadni az eredményeket; a szervezetbe való beilleszthetőségének, a döntéshozók felelős döntésének ez elengedhetetlen része.
Az '''adatbányászat''' egyes elemeit több szempont alapján szokás osztályozni. Adattípusok alapján beszélhetünk:
* Strukturált adatok esetében
** strukturált adatbányászatról
** folyamjellegű (strukturált) adatbányászatáról (web kattintások, idősorok, gének, gráfok és hang - ami egy speciális idősor - tartozik jellemzően ide)
* Nem strukturált adatok esetében
** szövegbányászatról
** kép analízisról (kép alapú adatbányászatról)
** videó analitikáról (videó alapú adatbányászatról)
Éppennyire gyakori azonban a cél szerinti osztályozás is, amely értelemszerűen valamely adattípushoz inkább kötődik, de a sajátos feladat határozza meg az alkalmazható eljárások körét. Ilyen például - a teljesség igénye nélkül:
* (web-, kép-, videó-, név- stb.) keresés
* webbányászat
* ajánló rendszerek
* érzelemdetekció (szentiment elemzés)
* génkutatás
* gépi látás
* biometrikus azonosítás (aláírás, arcfelismerés, hangfelismerés, mozgásfelismerés stb.)
== Története ==
|