„Klaszteranalízis” változatai közötti eltérés

[nem ellenőrzött változat][ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
Schlilla (vitalap | szerkesztései)
A szócikk kiegészítése az angol nyelvű szócikk és releváns irodalmak alapján
Schlilla (vitalap | szerkesztései)
aNincs szerkesztési összefoglaló
44. sor:
A klaszter-analízis során használt [[távolság]]mérték kiválasztása kritikusan fontos lépés, mert ez alapján fogja a klaszterelemzés meghatározni, hogy két elem mennyire hasonló egymáshoz. Így a kiválasztott távolságmérték befolyásolja az eredményül kapott klaszterek alakját is.
 
====Gyakori távolságmértékek====
 
*[[euklideszi távolság]]  – leggyakrabban használt távolságfüggvény, intervallum és arány  skálán mért metrikus adatoknál használható
*[[négyzetes euklideszi távolság]]
75 ⟶ 76 sor:
A következő lépésben a {b, c} és a {d, e, f} klaszterek esnek a legközelebb egymáshoz, ezért ezekből jön létre egy új, nagy klaszter. Most már csak két klaszterünk van, az {a} és a {b, c, d, e, f}. Az összevonáson alapuló eljárás végeredményeként pedig egyetlen nagy klaszter jön létre, mely tartalmazza az összes elemet: {a, b, c, d, e, f}.
 
==== '''Korlátok''' ====
A hierchikus klaszterelemzésnek megvannak a saját korlátai. A legfontosabbak közé tartozik, hogy  két klaszter egyesítése nem visszafordítható, azaz utólag már nem módosítható. Ezenkívül a hierarchikus klaszterelemzés zaj és kiugró értékek iránti érzékenysége nagy, valamint nehezen kezeli a konvex alakú és a jelentősen eltérő méretű klasztereket, és a nagy klasztereket hajlamos feldarabolni (Dr. Obádovics Csilla, 2009 alapján). Végül, a hierarchikus klaszterelemzés csak folytonos, metrikus változókon alkalmazható (Venables and Ripley, 2002.)
 
122 ⟶ 123 sor:
A klaszterelemzés rendkívül népszerű eljárás, melyet gyakran használnak például az ökológiában növény- és állatközösségek csoportosítására heterogén környezetben, növényrendszertanban egyedek csoportjainak meghatározására faj, család stb. szintjén. A bioinformatikán belül például a hasonló expressziós mintázatot létrehozó gének klaszterezésénál alkalmazzák.
 
==== '''Ökológia''' ====
A klaszteranalízis térbeli és időbeli összehasonlítására szolgálhat heterogén környezetben élő szervezetek közösségeire. Szintén használt növényi rendszertanban mesterséges törzsfejlődés képzésére vagy organizmusok faji, nemzetségi vagy fentebbi szintű, azonos tulajdonságokban osztozó klaszterekbe csoportosítására.
 
==== '''Transzkriptomiksz''' ====
Klaszterezés használható különbözően kifejeződő gének csoportjainak megalkotására.
 
==== '''Emberi genetikai klaszterezés''' ====
A genetikus adatok hasonlóságágból klaszterezéssel következtethetünk a populáció struktúrájára.
 
=== '''Orvoslás''' ===
 
==== '''Orvosi képalkotás''' ====
PET képeknél a klaszteranalízis használható a különböző típusú szövetek megkülönböztetésére háromdimenziós képeknél.
 
==== '''Antimikrobális tevékenyég elemzése''' ====
Kaszteranalízis használható az antibiotikus ellenállás elemzésére, az antimikrobális összetevőket a tevékenyégi mechanizmusuk által osztályozva, hogy az antibiotikumokat az antibakteriális tevékenységük alapján lehessen osztályozni.
 
147 ⟶ 148 sor:
A képfeldolgozásban a klaszterelemzés igénybevételével azonosíthatóak az élek vagy a tárgyak a képeken. A klaszterezés segítségével a weboldalak, webes keresési eredmények csoportokba rendezésénél relevánsabb szempontokat alkothatunk (szemben például a hagyományos keresőprogramokkal), vagy például internetes boltok termékeit is csoportosíthatjuk.
 
=== '''Üzlet és marketing''' ===
 
==== '''Piackutatás''' ====
A klaszteranalízis széleskörűen alkalmazott piackutatások során, többváltozós tesztadatokkal dolgozva. A piackutatók általában arra használják a klaszteranalízist, hogy a fogyasztókat piacszegmensekbe osszák, és így jobban megértsék a különböző fogyasztói csoportok közti kapcsolatokat és ez piacszegmentációra, termék pozícionálásra, új termékek kifejlesztésére és teszt piacok kiválasztására felhasználják
 
155 ⟶ 156 sor:
A klaszterezés arra is alkalmas, hogy az összes interneten elérhető terméket egyedi termékek csoportjaira bontsa.
 
=== '''Internet''' ===
 
==== Közösségi hálózat analízis ====
163 ⟶ 164 sor:
A klaszterezés alternatívát jelenthet a hagyományos keresőmotoroknak, mivel képes arra, hogy csoportosítsa a megtalált weboldalakot és fájlokat, és ezáltal relevánsabbá tegye a keresési eredményeket (például csoportosíthatja a találatokat, amikor a keresőszó több különböző dologra is utalhat).
 
=== '''Társadalomtanulmányok''' ===
 
==== Bűnelemzés ====
175 ⟶ 176 sor:
Közvéleménykutatási adatokból klaszterelemzéssel kinyerhetők véleményekre, szokásokra, és demográfiára vonatkozó tipológiák, amik hasznosak lehetnek a politikában és marketingben.
 
=== '''Egyéb''' ===
A klaszterelemzés hasznos megoldás olyan tudományterületeknél is, mint a robotika, matematikai kémia, klímakutatás, geográfia