NM-módszer

tényellentétes kontingencia-tábla konstruálási módszer
A lapnak nincs ellenőrzött változata, lehet, hogy még egyáltalán nem ellenőrizte senki a minőségét.

Az NM-módszer (avagy a Naszódi–Mendonça-módszer) a statisztikában, ökonometriában, közgazdaságtanban, szociológiában és demográfiában alkalmazható módszer, amellyel tényellentétes kontingenciatáblázatok készíthetők. A módszer megkeresi azt az () mátrixot, amely a „legközelebb” áll a () – magtáblázatnak is nevezett – mátrixhoz abban az értelemben, hogy azonos rangsorolású, de a sor- és oszlop-összegei egy célmátrix sor- és oszlop-összegeivel egyeznek meg. Míg az mátrix sor- és az oszlop-összegei ismertek, addig maga az mátrix nem feltétlen ismert.

NM-method
NM-módszer

Mivel a fenti megkötések egyértelműen meghatározzák az mátrixot, ezért az NM-módszer egy függvény: , ahol egy kizárólag 1-esekből álló, méretű sor-vektor, míg egy kizárólag 1-esekből álló, méretű oszlop-vektor.

Az NM-módszert Naszodi és Mendonca (2021)[1] fejlesztette ki (és először Naszodi és Mendonca (2019)[2] alkalmazta) olyan kontingenciatáblázat transzformálási problémákra, ahol a mátrix nem a keresett mátrix által reprezentált populációból vett mintát, hanem egy attól eltérő populációt reprezentál.

Az alkalmazásukkal a végzettség szerinti homofília erősségének generációk közötti változását számszerűsítették és ezáltal a különböző végzettségű csoportok közötti társadalmi egyenlőtlenség historikus változását mérték meg az USA-ra 1980 és 2010 között. Az egyenlőtlenség trendjét U-alakúnak találták, ami azt a nézetet erősíti, hogy megfelelő társadalom- és gazdaság-politikával az egyenlőtlenség mérsékelhető.[3]

A mátrixok rangsorának definíciója

szerkesztés

Két azonos méretű mátrix "közelsége" többféleképpen definiálható. Az euklideszi távolság és a Kullback-Leibler divergencia két jól ismert példa.

Az NM-módszer egy harmadik, a Liu-Lu ordinális indexen alapuló definícióval[4] áll összhangban, ahol a Liu-Lu index a Coleman-index kissé módosított változata (lásd Coleman (1958)-ös tanulmányának (15)-ös egyenletét).[5] A meghatározás szerint akkor áll az   mátrix a   mátrixhoz legközelebb, ha a Liu-Lu értékeik megegyeznek. Más szóval, ha az   és   mátrixok azonos rangsorolásúak a Liu-Lu ordinális index alapján.

Ha   egy 2-szer-2-es méretű mátrix, akkor a Liu-Lu index skalár-értékű és így definiált:

 , ahol   ;   ;   ;   ;  .

Coleman (1958)[5] nyomán ezt az indexet úgy értelmezhetjük, mint a „ténylegesen felvett érték mínusz a várható érték osztva a maximálisan felvehető érték mínusz a minimálisan felvehető érték”, mivel   a   magtáblázat  -helyén felvett tényleges értékét jelöli;   az ugyanezen helyen felvett érték várható értékét (illetve annak egészrészét) jelöli azon tényellentétes feltételezés mellett, hogy a   mátrix sor- és oszlop-összegei előre meghatározottak, míg a mátrix belső elemei véletlenszerűek.   a   magtáblázat  -helyén felvehető érték minimális értéke is egyben, feltéve, hogy a   magtáblázat sor- és oszlop-változója közötti asszociáció nem-negatív. Végül,   a   maximális értéke adott sor-összeg ( ) és oszlop-összeg ( ) vektorok mellett.

A Liu-Lu indexet Naszodi és Mendonca (2021)[1] általánosította arra az esetre, amikor   mérete   ( ,  ). Az általánosított Liu-Lu index mátrix-értékű. Az általánosítás egyik előfeltétele, hogy a   mátrix sor- és oszlop-változója rendezett legyen. Ugyanis a   és az   mátrixok mátrix-értékű Liu-Lu indexei csak úgy tehetők egyenlővé, hogy dichotomizáljuk a rendezett sor- és oszlop-változóikat   módon, melynek során kihasználjuk a rendezettségüket. Majd az így kapott 2-szer-2-es mátrixok skalár-értékű Liu-Lu indexeit tesszük egyenlővé. Formalizálva: minden egyes   párra (ahol  , és  ) kikötjük, hogy  , ahol   az alábbi   méretű mátrix  melynek az első blokkja   méretű, a második blokkja   méretű. Hasonlóképpen, a   egy   méretű mátrix, amely az alábbi mátrix transzponáltjaként áll elő:  , amelynek első blokkja   méretű, második blokkja   méretű.

A sorösszegekre és az oszlopösszegekre vonatkozó megkötések

szerkesztés

A keresett   matrixnak nem csak az   megkötést, hanem a sor- és oszlop-összegekre vonatkozó megkötéseket is teljesíteni kell, azaz:   és  .

Feltéve, hogy   teljesül minden   párra (ahol  , és  ), a   mátrixra vonatkozó megoldás egyértelmű, determinisztikus, és egy zárt formájú képlettel megadható.[1]

A   méretű   és   mátrixokra a megoldás:

 .

Az   mátrix további 3 cellájában lévő értékeket pedig egyértelműen megadják a sor- és az oszlop-összegekre vonatkozó megkötések. Tehát így működik az NM-módszer  -es táblázatokra.

Ha azonban az  , és   mátrixok   ( ,  ) méretűek, akkor először a rendezett értékű sor- és oszlop-változókat minden lehetséges módon dichotomizálnunk kell, mielőtt megoldunk   számú  -es formátumú feladatot. Egy tetszőleges   párra (ahol   és  ) a feladatokat egyfelől a   megkötés, másfelől a sor- és oszlop-összegekre vonatkozó megkötések definiálják:  , és  . Minden egyes feladatot külön-külön meg kell oldani a fenti képlettel. A megoldások meghatározzák az   mátrix   darab cella-értékét. Míg a maradék   cella-értéket a sor- és oszlop-összegek határozzák meg.

Ezután azt nézzük meg, hogy alkalmazható-e az NM-módszer, ha a   mátrix nem teljesíti azt az előfeltételt, hogy   párra  .

Ennek egyik alesete, ha   párra  . Ekkor a megoldás szintén egyértelmű, determinisztikus, és zárt formájú képlettel adott. A mátrix-rangsor fogalma azonban kissé eltér a fentebb tárgyalttól. Liu és Lu (2006)[4] így definiálja azt  , ahol   ;   az a legkisebb egész szám, amely nagyobb vagy egyenlő, mint  .

Végül ha van olyan   pár is, amelyre  , és olyan   pár is, amelyre , akkor sem az NM-módszer, sem   nem definiált.

Egy számpélda

szerkesztés

Tekintsük az alábbi   mátrixot, amelyet kiegészítettünk annak sor- és oszlop-összegeivel, valamint a cél-sor-összegeivel (azaz az   mátrix sor-összegeivel) és cél-oszlop-összegeivel (azaz az   mátrix oszlop-összegeivel):

Z 1 2 3 4 ÖSSZES CÉL
1 120 70 30 20 240 400
2 50 100 50 35 235 300
3 30 40 75 40 185 150
4 10 20 30 80 140 150
ÖSSZES 210 230 185 175 800
CÉL 400 300 200 100 1000

Az NM-módszer első lépéseként a   mátrixot megszorozzuk az egyes   ( , és  ) párokhoz tartozó  , és   mátrixokkal. Szorzatként a következő 9 darab  -es méretű mátrixot kapjuk (ahol a cél-sor- és cél-oszlop-összegeket is feltüntettük):

  1 2 ÖSSZES CÉL
1 120 120 240 400
2 90 470 560 600
ÖSSZES 210 590 800
CÉL 400 600 1000
  1 2 ÖSSZES CÉL
1 190 50 240 400
2 250 30 560 600
ÖSSZES 440 360 800
CÉL 700 300 1000
  1 2 ÖSSZES CÉL
1 220 20 240 400
2 405 155 560 600
ÖSSZES 625 175 800
CÉL 900 100 1000
  1 2 ÖSSZES CÉL
1 170 305 475 700
2 40 285 325 300
ÖSSZES 210 590 800
CÉL 400 600 1000
  1 2 ÖSSZES CÉL
1 340 135 475 700
2 100 225 325 300
ÖSSZES 440 360 800
CÉL 700 300 1000
  1 2 ÖSSZES CÉL
1 420 55 475 700
2 205 120 325 300
ÖSSZES 625 175 800
CÉL 900 100 1000
  1 2 ÖSSZES CÉL
1 200 460 660 850
2 10 130 140 150
ÖSSZES 210 590 800
CÉL 400 600 1000
  1 2 ÖSSZES CÉL
1 410 250 660 850
2 30 110 140 150
ÖSSZES 440 360 800
CÉL 700 300 1000
  1 2 ÖSSZES CÉL
1 565 95 660 850
2 60 80 140 150
ÖSSZES 625 175 800
CÉL 900 100 1000

A következő lépés az általánosított mátrix-értékű Liu-Lu index kiszámítása  , (ahol  ) alkalmazva az eredeti skalár-értékű Liu-Lu index képletét mind a 9 mátrixra:

       
  0,39 0,54 0,62
  0,53 0,44 0,47
  0,73 0,61 0,45

Amint az látható, az   mátrix pozitív, ezért az NM-módszer definiált. A 9 darab 2-szer-2-es feladat megoldása az   mátrix 9 cella-értékét határozza meg. A maradék 7 cella értékét pedig a cél-sor-összegek és a cél-oszlop-összegek alapján tudjuk kiszámolni. A megoldás:

  1 2 3 4 ÖSSZES
1 253,1 91,4 40,5 15,1 400
2 91,1 147,1 39,8 21,9 300
3 39,6 36,8 64,2 9,3 150
4 16,2 24,7 55,5 53,6 150
ÖSSZES 400 300 200 100 1000

Egy további numerikus példa, amely Abbott és szerzőtársaitól (2019) származik

szerkesztés

Tekintsük a következő   mátrixot kiegészítve annak sor- és oszlop-összegeivel, valamint a cél-sor- (  mátrix sor-összegei) és a cél-oszlop-összegekkel (  mátrix oszlop-összegei):

Z 1 2 3 ÖSSZES CÉL
1 1 070 270 20 1360 1 600
2 300 4 980 560 5840 5 900
3 20 420 2 360 2800 2 500
ÖSSZES 1 390 5 670 2 940 10 000
CÉL 1 390 5 670 2 940 10 000

Az NM-módszer első lépéseként a   mátrixot megszorozzuk az egyes   ( , és  ) párokhoz tartozó  , és   mátrixokkal. Ez a következő 4 darab 2-szer-2-es mátrixot eredményezi (kiegészítve a cél-sor- és a cél-oszlop-összegekkel):

  1 2 ÖSSZES CÉL
1 1 070 290 1 360 1 600
2 320 8 320 8 640 8 400
ÖSSZES 1 390 8 610 10 000
CÉL 1 390 8 610 10 000
  1 2 ÖSSZES CÉL
1 1 340 20 1 360 1 600
2 5 720 2 920 8 640 8 400
ÖSSZES 7 060 2 940 10 000
CÉL 7 060 2 940 10 000
  1 2 ÖSSZES CÉL
1 1 370 5 830 7 200 7 500
2 20 2 780 2 800 2 500
ÖSSZES 1 390 8 610 10 000
CÉL 1 390 8 610 10 000
  1 2 ÖSSZES CÉL
1 6 620 580 7 200 7 500
2 440 2 360 2 800 2 500
ÖSSZES 7 060 2 940 10 000
CÉL 7 060 2 940 10 000

A következő lépés az általánosított mátrix-értékű Liu-Lu index kiszámítása  , (ahol  ) alkalmazva az eredeti skalár-értékű Liu-Lu index képletét mind a 4 mátrixra:

     
  0,75 0,95
  0,95 0,78

Látható, hogy az   mátrix pozitív. Ezért az NM-módszer definiált. A 4 darab 2-szer-2-es feladat megoldása az   mátrix 4 cella-értékét határozza meg. A többi 5 cella-értéket pedig a cél-sor- és a cél-oszlop-összegek alapján számolhatjuk ki. A megoldás a következő   mátrix:

  1 2 3 ÖSSZES
1 1 101 476 24 1 600
2 271 4 819 809 5 900
3 18 375 2 107 2 500
ÖSSZES 1 390 5 670 2 940 10 000

Implementáció

szerkesztés

Az NM-módszer Excelben,[6] Visual Basicben,[6] R-ban[6] és Statában[7] érhető el leprogramozva.

Alkalmazások

szerkesztés

Az NM-módszer különféle jelenségek tanulmányozására alkalmazható, beleértve az assortatív párválasztást, a generációk közötti mobilitást, mint a társadalmi mobilitás egy fajtáját, a lakóhely szerinti szegregációt, a munkaerő-toborzást, és a tehetséggondozást.

Mindezen alkalmazásokban az  ,  , és   mátrixok a párokba rendezett entitások (pl. férjek és feleségek, vagy elsőszülött gyermekek és anyák, lakások és főbérlők, vagy vezérigazgatók és cégek, vagy sakkoktatók és legtehetségesebb tanítványaik) együttes eloszlásait reprezentálják, amelyeket vagy egy dichotóm kategorikus változó jellemez (pl. vegetáriánus/nem vegetáriánus, nagymester/nem nagymester), vagy egy rendezett multinomiális kategorikus változó (pl. végső iskolai végzettség szintje, a sítudás szintje, jövedelmi kategória, bérleti díj kategória, hitelminősítés, FIDE címek). Bár az NM-módszer széles körben alkalmazható, a következőkben bemutatásra kerülő példák mindegyike az iskolai végzettség szerinti asszortatív párválasztásról szól. Ezen alkalmazások esetén ugyanis az NM-módszer alkalmazhatóságának két előfeltétele (a rendezett-értékű tulajdonság-változó, és a minden oktatási csoportra jellemző pozitív assortatív párválasztás) nem vitatott.

Tegyük fel, hogy a   és az   mátrixok jellemzik a zalaegerszegi, valamint a yorki férjek és feleségek együttes iskolázottsági megoszlását, rendre. Az NM-módszerrel konstruálandó   mátrix azt mondja meg, hogy mi lenne a párok együttes végzettség-eloszlása Zalaegerszegen, ha a házasulandó férfiak és nők iskolai végzettsége megegyezne a yorkiakéval, miközben a homogámia iránti általános vágy (vagy közgazdasági szóhasználattal élve, az aggregált házassági preferenciák, avagy szociológiai szóhasználattal élve, a házasodási társadalmi norma) változatlan maradna.

Egy második alkalmazásban a   és   mátrixok ugyanazt az országot két különböző évben jellemzik. A   mátrix jellemzi az olyan frissen házasodott amerikaiak együttes iskolázottsági eloszlását 2040-ben, ahol a férjek a Z-generációba tartoznak, és a megfigyelés évében (2040-ben) fiatal felnőttek. Az   mátrix annyiban tér el a   mátrixtól, hogy az a 2024-ben megfigyelt Y-generációt jellemzi. Az   mátrix megkonstruálásával azt lehet majd tanulmányozni a jövőben, hogy a frissen házasodott amerikai fiatal párok iskolai végzettség szerinti együttes eloszlása milyen lenne, ha az érintettek ugyanúgy szeretnének majd házasodni, mint a Z-generációs férfiak és partnereik, miközben az iskolai végzettségük az Y-generációba tartozó férfiak és partnereik végzettségével azonos.

Egy harmadik alkalmazásban a   és   mátrixok ismét ugyanazt az országot jellemzik, de két különböző évben. Ebben az alkalmazásban a   mátrix a portugál fiatal párok (ahol a férfi partnerek életkora 30 és 34 év közötti) együttes végzettség szerinti elosztását mutatja 2011-ben.   ugyancsak egy végzettség szerinti elosztást mutat, de az 1981-ben megfigyeltet. Az   mátrix megkonstruálásának ebben az esetben az lehet a célja, hogy tanulmányozzuk, milyen lett volna a portugál fiatal párok iskolai végzettsége, ha a 2011-ben fiatal társaikhoz hasonlóan rendeződtek volna párokba, miközben a nemenkénti iskolai végzettségük megegyezett volna az 1981-essel.

Az első két alkalmazás mindegyikében az   mátrix egy tényellentétes együttes eloszlást reprezentál, amely bizonyos ceteris paribus hatások számszerűsítésére szolgál. Pontosabban, a segítségével egy tényellentétes dekompozíció során kardinális skálán számszerűsíthetjük a Zalaegerszegiek és York-iak – közvetlenül nem-megfigyelhető – házassági preferencia különbségét, vagy a Z- és az Y-generációk házassági preferencia különbségét. A dekompozíció minden esetben az   tényellentétes táblázatra épül, hiszen annak segítségével tudjuk kiszámolni az egyes faktorok (azaz a különböző iskolai végzettségű potenciális partnerek megfigyelhető strukturális elérhetősége, amely meghatározza a párválasztási lehetőségeket a népesség szintjén; és a nem-megfigyelhető nem-strukturális mozgatórugók, pl. aggregált házassági preferenciák, vágyak, normák, társadalmi korlátok) és azok interakciójának[8] a hozzájárulását egy megfigyelhető kardinális statisztika változásához (pl. a végzettség szerinti homogám pár-arány változásához).

A harmadik alkalmazást Naszodi és Mendonca (2021)[1] arra használta, hogy az értelmetlen tényellentétes esetét illusztrálja vele: az iskolai végzettség olyan drasztikusan változott meg Portugáliában a vizsgált három évtized alatt, hogy az 1981 és 2011-es megfigyelésekből "összemixelt" tényellentétes nem fordulhatna/ nem fordulhatott volna elő.

Az NM-módszer néhány jellemzője

szerkesztés

Először is, az NM-módszer nem ad értelmes megoldást, ha átlépi az alkalmazhatósága határát.[1] Például a harmadik alkalmazásban az NM-módszer negatív cella-értékű   mátrixot eredményez, mivel a tényellentétes lehetetlen (lásd: AlternativeMethod_US_1980s_2010s_age3035_main.xls PT_A1981_P2011_Not_meaningful lap).[6] E tekintetben az NM-módszer hasonlít a lineáris valószínűségi modellhez, amely ugyancsak jelzi, ha elértük az alkalmazhatósága határát: az egységnyi intervallumon   kívüli valószínűséget rendel egyes eseményekhez.

Másodszor, az NM-módszer kommutál mind a sor-változó, mind az oszlop-változó szomszédos kategóriáinak összevonásával:[1]  , ahol   az   méretű sor-összevonó mátrix; és  , ahol   az   méretű oszlop-összevonó mátrix.

Harmadszor, az NM-módszer akkor is alkalmazható, ha a   mátrix egyes celláiban nulla szerepel.[1]

Összehasonlítás az IPF-fel

szerkesztés

Az Iterative Proportional Fitting eljárás (IPF) is egy függvény:[9][10][11][12]  . Ezzel az eljárással megtalálható az az   mátrix ( ), amely ahhoz hasonló megkötéseket elégít ki, mint amilyeneket az NM-módszerrel készített   mátrix. Pl. az   mátrix az a   mátrixhoz legközelebbi mátrix, amelynek a sor- és oszlop-összegei az   mátrix által meghatározott cél-sor- és cél-oszlop-összegek.

Azonban van néhány fontos különbség az IPF és az NM-módszer között. Az IPF az azonos méretű mátrixok közelségét a kereszt-entrópiával avagy a Kullback-Leibler divergenciával határozza meg.[13] Ennek megfelelően a 2x2 mátrixok közötti távolság IPF-kompatibilis fogalma szerint az   és   mátrixok távolsága akkor nulla, ha a kereszt-szorzati arányaik[12] (más néven esélyhányadosaik) egyenlők:  .[14] Emlékeztetőül, az NM-módszer hasonló feltétele az   és   mátrixok azonos rangsorolására:  .

A következő numerikus példa rávilágít arra, hogy az IPF és az NM-módszer nem azonos:  . Vegyük a következő   mátrixot a cél-sor- és cél-oszlop-összegeivel

1 2 ÖSSZES CÉL
1 450 150 600 1 050
2 50 350 400 450
ÖSSZES 500 500
CÉL 1 000 500 1 500

Az NM-módszerrel a következő   mátrixot kapjuk:

  1 2 ÖSSZES
1 925 125 1 050
2 75 375 450
ÖSSZES 1 000 500 1 500

Míg az IPF- fel kapott megoldás:

  1 2 ÖSSZES
1 900 150 1 050
2 100 350 450
ÖSSZES 1 000 500 1 500

Az IPF ekvivalens az együttes populációs eloszlás maximum likelihood-módszerén alapuló becslésével,[11] ahol az   mátrix a   mátrixból becsült együttes populációs eloszlás és a   mátrix egy olyan populációból vett véletlen minta, amelynek marginális eloszlásait az   mátrix sor- és oszlop-összegei jellemzik. Az IPF által megoldott problémával ellentétben a   mátrix nem egy sokaságból vett mintát reprezentál abban a problémában, amelynek megoldására az NM-módszert fejlesztették ki. Valójában az NM-problémában a   és   mátrixok két különböző populációt jellemeznek (amelyek vagy egyidejűleg megfigyelhetőek, mint a Zalaegerszegiek és Yorkiak esetében, vagy két különböző időpontban figyelhetőek meg, mint a Z- és Y-generációkról szóló példánkban). Az empirikus alkalmazások során ez a különbség segít az NM-módszer és az IPF közötti választásban.[14]

Deming és Stephan (1940), az IPF kitalálói,[15] módszerük alkalmazását egy klasszikus maximum likelihood becslési problémával illusztrálták, ahol a   mátrix egy adott marginális eloszlással jellemzett populációból vett mintát reprezentált. Ők ugyanis tisztában voltak azzal a ténnyel, hogy az IPF nem alkalmas általánosan tényellentétes predikció készítésére: kifejezetten felhívták a figyelmet arra, hogy algoritmusuk „önmagában nem használható predikció készítésére” (lásd Stephan és Deming 1940, p. 444).[14][15]

Egy további különbség: azon értelmezési tartományok is eltérőek, amelyekre az IPF és az NM-módszer megoldásokat ad. Először is, ellentétben az NM-módszerrel, az IPF nem nyújt megoldást bármely, nulla értéket tartalmazó   magtáblázatra (Csiszár (1975)[16] tárta fel az IPF alkalmazhatóságának szükséges és elégséges feltételeit a nulla értéket tartalmazó   magtáblázatok esetére). Másodszor, az IPF-től eltérően, az NM-módszer nem ad értelmes megoldást olyan   és   mátrix-párokra, amelyek lehetetlen tényellentéteseket határoznak meg. Harmadszor, az NM-módszer alkalmazhatóságának azon előfeltétele, hogy vagy  , vagy  , nem előfeltétele az IPF alkalmazhatóságának.

Végül, az NM-től eltérően, az IPF nem kommutál a szomszédos kategóriák összevonásával, amint azt Naszodi (2023)[17] egy numerikus példája illusztrálja. Emiatt az IPF-fel kapott transzformált táblázat érzékeny lehet a kategóriák számának megválasztására.

Összehasonlítás a minimális euklideszi távolság megközelítéssel

szerkesztés

A Minimum Euclidean Distance Approach (MEDA) (amelyet Abbott és szerzőtársai (2019) írtak le részletesen, de Fernández és Rogerson 2001 alkalmazott először) szintén egy függvény:[18][19]  .

A MEDA első lépésként egy skalárt rendel a   mátrixhoz: a skalár a két szélsőséges eset (a véletlenszerű és a tökéletesen assortatív párválasztás esetei, ahol a marginálisok  ) konvex kombinációjánál alkalmazandó azon relatív súly, amellyel a kombináció eredményéül kapott mátrix és a   mátrix euklédeszi távolsága minimalizált. Pl. ennek a skalárnak az értéke   az Abbott és szerzőtársai (2019) által elemzett példában.[18] Második lépésként a MEDA megkonstruálja a két szélsőséges eset konvex kombinációját (azaz a véletlenszerű és a tökéletesen assortatív párválasztás kombinációját) bármely tényellentétes határeloszlás-párra ( ).

Különbségek az NM és a MEDA között: míg az NM az asszortativitás mértékét (avagy az aggregált házassági preferenciákat) az általánosított mátrix-értékű Liu-Lu index változatlanságával tartja fixen, addig a MEDA ugyanezt a   skalár rögzítésével éri el. Ha  , és   mátrixok   -esek, akkor a két módszer eredményezheti ugyanazt a transzformált táblázatot feltéve, hogy a   ugyanúgy rangsorolja a kontingencia táblákat, mint a skalár-értékű Liu-Lu index.[20] Azonban ha   2-szer-2-esnél nagyobb, akkor az általánosított Liu-Lu index mátrix-értékű, így nem egyezhet meg a skalár-értékű   -vel. Emiatt az NM-el kapott transzformált táblázat is különbözik a MEDA-val kapott transzformált táblázattól.

Visszatérve az Abbott és tsai (2019) numerikus példájához, a MEDA-val készített tényellentétes táblázat:

  1 2 3 ÖSSZES
1 1 081 240 279 1 600
2 217 5 054 629 5 900
3 92 376 2 032 2 500
ÖSSZES 1 390 5 670 2 940 10 000

Nem elhanyagolható az   mátrix és az   mátrix közötti eltérés. Pl. a homogám párok aránya 2 százalékponttal kisebb a MEDA által konstruált tényellentétes   mátrixban, mint a megfigyelt   mátrixban, míg ugyanez a különbség 3,4 százalékpont az NM-által konstruált tényellentétes   mátrix és a megfigyelt   mátrix esetén.

Mivel Abbott számpéldája nem egy kitalált példa, hanem egy, az Amerikaiakat jellemző, empirikus végzettség szerinti eloszláson alapszik, ezért a 2 százalékpont és a 3,4 százalékpont közötti különbséget úgy interpretálhatjuk, hogy a MEDA lényegesen kisebbnek találja a iskolázottság szerinti homofília (avagy az eltérő végzettségűek közötti társadalmi egyenlőtlenség) generációról generációra való megváltozását az NM-hez képest.

  1. a b c d e f g Naszodi (2021). „A new method for identifying the role of marital preferences at shaping marriage patterns”. Journal of Demographic Economics 1 (1), 1–27. o. DOI:10.1017/dem.2021.1. 
  2. Naszodi (2019). „Like marries like”. Fairness Policy Brief Series. [2023. április 16-i dátummal az eredetiből archiválva]. (Hozzáférés: 2023. április 21.) 
  3. Naszodi (2021). „A széteső és összeforró társadalom”. Defacto. 
  4. a b Liu (2006). „Measuring the degree of assortative mating”. Economics Letters 92 (3), 317–322. o. DOI:10.1016/j.econlet.2006.03.010. 
  5. a b Coleman (1958). „Relational Analysis: The Study of Social Organizations with Survey Methods”. Human Organization 17 (4), 28–36. o. DOI:10.17730/humo.17.4.q5604m676260q8n7. 
  6. a b c d Naszodi (2021). „Code for A NEW METHOD2, Kiadó: Mendeley. DOI:10.17632/x2ry7bcm95.2. 
  7. Naszodi (2023). „Code for "A NEW METHOD FOR IDENTIFYING WHAT CUPID'S INVISIBLE HAND IS DOING. IS IT SPREADING COLOR BLINDNESS WHILE TURNING US MORE "PICKY" ABOUT SPOUSAL EDUCATION?"”, Kiadó: Mendeley. DOI:10.17632/95k6mmrxvg. 
  8. Naszodi (2022). „Hogyan szálazzuk szét a megfigyelhető változások okait?”. Közgazdasági Szemle 69 (11), 1407-1432. o. 
  9. Sinkhorn, Richard (1964). “A Relationship Between Arbitrary Positive Matrices and Doubly Stochastic Matrices”. In: Annals of Mathematical Statistics 35.2, pp. 876–879.
  10. Bacharach, Michael (1965). “Estimating Nonnegative Matrices from Marginal Data”. In: International Economic Review 6.3, pp. 294–310.
  11. a b Bishop (1967). „Multidimensional contingency tables: cell estimates”. PhD Thesis. Harvard University. 
  12. a b Fienberg (1970). „An Iterative Procedure for Estimation in Contingency Tables”. Annals of Mathematical Statistics 41 (3), 907–917. o. DOI:10.1214/aoms/1177696968. 
  13. Kullback S. and Leibler R.A. (1951) On information and sufficiency, Annals of Mathematics and Statistics, 22 (1951) 79-86.
  14. a b c Naszodi, A. (2023). "The iterative proportional fitting algorithm and the NM-method: solutions for two different sets of problems". arXiv:2303.05515 [econ.GN].
  15. a b Deming (1940). „On a Least Squares Adjustment of a Sampled Frequency Table When the Expected Marginal Totals are Known”. Annals of Mathematical Statistics 11 (4), 427–444. o. DOI:10.1214/aoms/1177731829. 
  16. Csiszár (1975). „I-Divergence of Probability Distributions and Minimization Problems”. Annals of Probability 3 (1), 146–158. o. DOI:10.1214/aop/1176996454. 
  17. Naszodi, A. (2023). "What do surveys say about the historical trend of inequality and the applicability of two table-transformation methods?". arXiv:2303.05895 [econ.GN].
  18. a b Abbott (2019). „Education policy and intergenerational transfers in equilibrium”. Journal of Political Economy 127 (6), 2569–2624. o. DOI:10.1086/702241. 
  19. Fernández (2001). „Sorting and long-run inequality”. The Quarterly Journal of Economics 116 (4), 1305–1341. o. DOI:10.1162/003355301753265589. 
  20. Chiappori (2021). „The measuring of assortativeness in marriage: A comment”. Cowles Foundation Discussion Paper NO. 2316. 

Fordítás

szerkesztés

Ez a szócikk részben vagy egészben a NM-method című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.