„Főkomponens-analízis” változatai közötti eltérés

[nem ellenőrzött változat][ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
R4b6it (vitalap | szerkesztései)
R4b6it (vitalap | szerkesztései)
65. sor:
*Második lépésben kivonjuk az átlagokat minden adat dimenzióból, vagyis minden ''x'' értékből kivonjuk a hozzá tartozó <math>\bar{X}</math> átlagot, illetve minden ''y'' értékből a hozzá tartozó <math>\bar{Y} </math> átlagot.<ref name="A tutorial on Principal Components Analysis"/>
*Harmadik lépésben kiszámoljuk a kovariáns mátrixot a fenti képlet alapján. Ez esetben a kovariáns mátrix ''2 x 2''-es lesz.<ref name="A tutorial on Principal Components Analysis"/>
*Negyedik lépésben kiszámoljuk a kovariancia mátrixhozkovarianciamátrixhoz tartozó sajátvektorokat és sajátértékeket. A főkomponens-analízis esetében fontos, hogy a sajátvektorok egységvektorok legyenek (hosszuk 1). A sajátvektoroknak egymásra merőlegeseknek kell lenniük.<ref name="A tutorial on Principal Components Analysis"/>
*Ötödik lépésben kiválasztjuk a komponenseket és kialakítjuk a vonás vektort. A sajátvektorokat sajátérték szerint sorrendbe állítjuk, legnagyobbtól a legkisebbig, megkapva így a komponenseket szignifikanciájuk szerint. Ha a sajátértékek kellően kicsit, akkor az adatmennyiség amit elveszítünk ezzel arányos mértékben szintén kicsi lesz. Ezt követően létrehozzuk a vonásvektort a megtartott sajátvektorokból.<ref name="A tutorial on Principal Components Analysis"/>
*Utolsó lépésben származtatjuk az új adathalmazt. Ez úgy történik, hogy az előző lépésben kapott vonás vektort, ami oszlopvektor, transzponáljuk, vagyis átalakítjuk sorvektorrá úgy, hogy a legszignifikánsabb sajátvektor lesz az első érték. Az így kapott vektort megszorozzuk jobbról az eredeti adathalmaz transzponáltjával.<ref name="A tutorial on Principal Components Analysis"/>