„Döntési fa” változatai közötti eltérés

[ellenőrzött változat][ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
Hkbot (vitalap | szerkesztései)
a Bottal végzett egyértelműsítés: Modell –> Modell (tudomány)
a helyesírási javítás
12. sor:
:*A csomóponthoz tartozó elemek homogének a vizsgált tulajdonságokra
:*Elfogytak a csomóponthoz tartozó elemek
:*Elfogytak az osztályozó attributumokattribútumok
:Ekkor a csomóponthoz tartozó elemek típusáról szavazás dönt, vagy feljegyzik az ide tartozó elemek osztályát
*Az adott ág elért egy bizonyos mélységet
22. sor:
 
Az ID3 családba tartozó algoritmus:
*A legnagyobb [[entrópia|entrópiájú]] attributumotattribútumot választja
*Csak magukra az attributumokraattribútumokra tesztel, és nem attributumokattribútumok lineáris kombinációira
*Nominális attributumraattribútumra annyi felé ágazik, ahány értéket az attributumattribútum felvehet
*Nagy méretű fát épít
*Ha egymás után kevés attributumotattribútumot tesztel, akkor lehet, hogy az attributumokattribútumok egy függvénye az igazi kritérium
 
A CART családba tartozó algoritmus:
*A Gini-indexet használja:
:<math>\mathrm{Gini}(n)=\sum _{i=1}^k p_i \left ( 1-\sum_{j=1}^l p_{ij}^2 \right )</math>
:„ahol ''p''<sub>''i''</sub> az ''i''-edik attributumattribútum érték relatív gyakorisága az ''n'' csúcshoz tartozó mintában, és ''p''<sub>''ij''</sub> a magyarázott változó ''j''-edik értékének relatív gyakorisága a ''c''<sub>''i''</sub> gyerekhez tartozó almintában.” Azaz mindig a lehető legnagyobb homogén osztályt választja le.
*Az attributumokattribútumok lineáris kombinációit is teszteli
*Nagy bináris fát épít
*Az intervallum skálán mért magyarázandó változó szórásának csökkenését is figyeli
38. sor:
A CHAID családba tartozó algoritmus:
*A [[khi-négyzet próba|khi-tesztet]] használja
*Csak magukra az attributumokraattribútumokra tesztel
*Intervallum skálán mért magyarázott változó esetén F-tesztet használ
*Csak addig növeli a bináris fát, amíg a legjobb szétvágás szignifikanciája meghalad egy bizonyos szintet
*Ha egymás után kevés attributumotattribútumot tesztel, akkor lehet, hogy az attributumokattribútumok egy függvénye az igazi kritérium
 
Az ID3 fák csak osztályozásra, a többi fa osztályozásra és előrejelzésre is használható.