Szókincsméretek összehasonlító listája

Wikimédia-listaszócikk

Ez a szócikk általános és speciális szótárak, valamint anyanyelvi és idegen nyelvi beszélők szókincsének méretét veti össze a lexémákat tekintve. (Nem kerülnek be tehát ide azok az adatok, amelyek a webkorpuszok méretét jelölik, azaz hogy hány szót dolgoztak fel, csak az, hogy hányféle szót találtak, nem számítva egy szó különböző előfordulásait és különböző alakjait.)

Ahol a szókincs értelme nincs megadva, ott az ún. aktív szókincset jelöli (tehát amit a beszélő nemcsak felismer, hanem használ is). A szótáraknál legalább hat tényező van, amelyek döntően befolyásolják az eredményt:

  • külön vesszük-e az összetett szavakat, ill. az állandósult (szó értékű) szókapcsolatokat (még akkor is, ha az adott nyelvben egy adott forma különíródik),
  • külön vesszük-e a képzett szavakat (külön kérdés a produktív és az improduktív képzőké),
  • külön vesszük-e a homonimákat és az egyes szavak más szófajú jelentéseit, amelyek akár jelentősen eltávolodhatnak egymástól,
  • külön vesszük-e az egyes szavak szuppletív (más tőalakú) származékait,
  • beleszámítjuk-e a kulturálisan jelentős tulajdonneveket (városok, mitológiai alakok neve stb.), és mit teszünk például azokkal a terméknevekkel, amelyek az egyik nyelvben tulajdonnevek, a másikban köznevek,
  • hogyan kezeljük a ragokat és a funkciószavakat (az egyik nyelvben ugyanazt a jelentést kifejezheti rag, míg a másikban önálló elöljárószó).

Ezek fényében az egyes adatok tényleges jelentése számottevően eltérhet.

Nagyságrendek szerkesztés

1000 alatt szerkesztés

15 Egy szöveg leggyakoribb szavai közül ennyi adja ki annak 25%-át.[1]
100 Egy szöveg leggyakoribb szavai közül ennyi adja ki annak 60%-át.[1]
300 Kb. egy 2 éves gyerek szókincse[2]
500 Kb. egy 2,5 éves gyerek szókincse[2]
A Közös Európai Referenciakeret A1-es fokozatának, az ún. minimumszintnek megfelelő szókincs.[3]
850 Az Ogden-féle egyszerű angol nyelv (Basic English) szókincse[4]
920 Kb. ennyi szógyököt tartalmazott az eszperantónak a Zamenhof által kidolgozott alapszókincse, amelyből több tízezer további szó képezhető (pl. a ’jó’ szóból ’rossz’, ’jóság’, ’javulni’ stb.).[5]

1000 – 10 000 szerkesztés

1000 Kb. egy 3 éves gyerek szókincse[2]
Az 1000 leggyakoribb szó adja ki egy szöveg szavainak 85%-át.[1]
Az 1000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 64%-át fedi le.[6]
A Közös Európai Referenciakeret A2-es fokozatának, az ún. alapszintnek megfelelő szókincs (ez a B1-nek megfeleltetett alapfokú nyelvtudásnál eggyel alacsonyabb szint).[3][7]
1500 Kb. egy 4 éves gyerek szókincse[2] Ez hátrányos helyzetű családok négyéves gyerekeinél csupán 600 is lehet, míg diplomás szülők azonos korú gyerekeinél a 2100-at is elérheti,[8] tehát a gyerekek szókincsére vonatkozó adatok csak tájékoztató jellegű középértékek, amelyek erősen függenek a családi körülményektől.
2000 Kb. egy 5 éves gyerek szókincse[2]
Ennyi szót használnak az első osztályosok olvasástanításában.[9]
Az élő-aktív szókincs legszerényebb alsó határa épelméjű felnőtt embereknél[10]
A Longman Dictionary of Contemporary English angol egynyelvű szótár ennyi szót használ fel szótári definícióiban.[11]
A 2000 leggyakoribb szóval egy szöveg 90%-át megértjük; ekkora szókinccsel és a tulajdonnevek ismeretével pedig 93,7%-ot.[12]
A 2000 leggyakoribb szóval egy átlagos szöveg 80%-át értjük meg; a források szerint ennyire van szükség egy szöveg lényegének megértéséhez.[7]
A 2000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 72%-át fedi le.[6]
A Közös Európai Referenciakeret B1-es fokozatának, az ún. küszöbszintnek megfelelő szókincs; ez a magyarországi rendszerben az alapfokú nyelvtudásnak felel meg.[3][7]
2100-2300 B2-es szintű nyelvtanulók szókincse olaszból, ill. németből vagy angolból[13]
2500 Kb. egy 6 éves gyerek szókincse[2]
Egy szöveg leggyakoribb szavai közül ennyivel (pontosabban 2600-zal) szavainak 96%-át megértjük.[12]
3000 Kb. egy 7 éves gyerek szókincse[2]
A 3000 leggyakoribb szóval egy szöveg 95%-át megértjük, s ez az arány szükséges ahhoz, hogy a kontextusból a többire is következtetni tudjunk.[12]
A 3000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 77%-át fedi le.[6]
Megközelítőleg Katona József Bánk bán c. művének szókincse (egész pontosan: 2882).[9]
Arany János Toldi c. művében felhasznált szókincse (egész pontosan: 3059).[9]
Jean Racine összes tragédiáját állítólag ennyi szó felhasználásával írta.[14][15]
3000–
5000
Az átlagember aktív szókincse (élő-aktív és szunnyadó-aktív)[10]
3500–
3900
A Közös Európai Referenciakeret által Görögországban és Magyarországon B2-ként értékelt, az ún. középszintnek megfelelő szókincs; ez a magyarországi rendszerben a középfokú nyelvtudásnak felel meg.[7]
3762–
5576
Agatha Christie egy regényének szókincse (15 műve alapján)[16]
4000 Kb. egy 9 éves gyerek szókincse[2]
A 4000 leggyakoribb szó adja ki egy szöveg szavainak 97,5%-át.[1]
4353[17][18]
4735[18]
Balassi Bálint műveiből kimutatható szókincse
5000 Kb. egy 11 éves gyerek szókincse[2]
Az 5000 leggyakoribb szóval egy szöveg 98,5%-át megértjük.[12]
Az 5000 leggyakoribb lemma egy mai orosz nyelvű szöveg szavainak kb. 82%-át fedi le.[6]
5000–
10 000
Az átlagember passzív szókincse[10]
6000 Ennyi szóval a Shreket 95%-ban megértjük.[19]
6000–
8000
A leggyakoribb szavak közül ennyivel egy átlagos szöveg 95-98%-át értjük meg; a források szerint ennyire van szükség egy szöveg lényegében teljes megértéséhez.[7]
6882[9]
7824[18]
Zrínyi Miklós összes műveiből kimutatható szókincse
8000–
9000
Ennyi szó szükséges a 20. századi angol próza megértéséhez.[19]
8000–
10 000
A klasszikus vagy bibliai héber nyelv szókincse, a gyökök számolásától függően.[20]
9812 Csokonai Vitéz Mihály színműveiből kimutatható szókincse[21]

10 000 – 100 000 szerkesztés

10-12 ezer Ennyi szóval a tankönyveket 95%-ban megértjük[19]
10-20 ezer Az egyes nyelvek beszélői legfeljebb ennyi szót használnak[22]
10-30 ezer Egy kétnyelvű kisszótár terjedelme (címszók),[23]
Magay Tamás szerint kb. 20 000[24]
11 606 Juhász Gyula verseiből kimutatható szókincse[22]
16 000 Arany János műveiben használt egyedi szótövek száma – megelőzve Vörösmartyt (12e), Babitsot (11e), Adyt (10,4e), Petőfit (9,6e) és József Attilát (8,2e)[25]
Az ókori egyiptomi nyelv legteljesebb szótárának, a Wörterbuch der ägyptischen Sprachénak a terjedelme
A 18 éves korukig vagy tovább az oktatásban részt vevő angol anyanyelvű beszélők legalább ennyi szócsaládot (szótövet) ismernek[26]
18 és 25 ezer között Shakespeare (műveiben felhasznált) szókincsét ennyire becsülik (a konkrét érték attól függ, melyik kutató mit számít önálló szótári szónak; a kiindulás 29 066 különböző szóalak)[27]
22 719[9]
23 ezernél több[17][18]
Petőfi Sándor verseiből kimutatható szókincse
25 ezer Arany János (műveiben felhasznált) szókincsét kb. ekkorára becslik[17][28]
25-30 ezer Egy átlag értelmiségi egyévi beszédét gondolatban rögzítve kb. ennyiféle szó fordulna elő.[29]
30-40 ezer „az igen választékosan fogalmazó, nyelvi leleményekkel is megáldott írók 30-40 ezer szót használnak”[30]
35-80 ezer Egy kétnyelvű kéziszótár terjedelme (címszók)[31]
40-45 ezer Jókai Mór (műveiben felhasznált) szókincsének becsült mérete[17][18]
45 ezer Ennyi szó fordul elő a 100 millió szavas Brit Nemzeti Korpuszban; a ritkábbak már vagy archaikusak, vagy szakkifejezések.[32]
50-60 ezer Igen művelt embereknél a passzív szókincs nagysága[10]
60 ezer Kb. ennyi címszót tartalmaz egy középszótár Magay Tamás szerint[24]
60-100 ezer Kb. ennyi mai magyar szót tartanak számon.[29]
75 ezer Ennyi szó jelentését magyarázza meg az új Magyar értelmező kéziszótár (ezek között már szakszavak és rétegnyelvi szavak is szerepelnek).[22][33]
87 000 A Grand Larousse terjedelme (címszók, 2005-ös kiadás)[34]
88 431 A Spanyol Királyi Akadémia hivatalos értelmező szótára 22. kiadásának terjedelme (címszók).[35]

100 000 – 1 000 000 szerkesztés

100 ezer A francia Trésor de la langue française informatisé terjedelme (címszók)[36]
Egy nagyszótár címszóanyagának alsó határa Magay Tamás szerint[24]
110 ezer A 18 kötetesre tervezett A magyar nyelv nagyszótára tervezett terjedelme (címszók)[37]
120 ezer[22][38]
130 ezer[39]
135 ezer[40]
190 ezer[41]
Egy kétnyelvű nagyszótár terjedelme (címszók)
171 476 A 20 kötetes Oxford English Dictionary 2. (nyomtatott) kiadásából (1989) a ma is használt szavak száma[42]
291 500 A 20 kötetes Oxford English Dictionary 2. (nyomtatott) kiadásának (1989) terjedelme (címszók)[43]
350 ezer A 33 kötetes Deutsches Wörterbuch terjedelme (1960-as kiadás, címszók)[44]
több mint 450 000 A Webster’s Third New International Dictionary, Unabridged terjedelme (címszók)[45]
mintegy 600 000,[46] ill.
750[47]–800[48] ezer
Az 1772 és 2000 közötti időszak magyarul publikált szókészlete, amelynek szűréséből A magyar nyelv nagyszótára 110 ezer szavas anyagát összeállítják.
615 100 A 20 kötetes Oxford English Dictionary 2. (nyomtatott) kiadásának (1989) terjedelme (definiált szóalakok száma)[43]

1 000 000 és fölötte szerkesztés

1 millió Ennyi angol szót tartanak számon[49][50]
2 millió A magyar nyelvben kb. ennyi szó (lexéma!) van (túlnyomórészt elavult vagy rendkívül speciális szavak)[22]
7,2 millió Az 1,48 milliárd szövegszót (v. szóelőfordulást) tartalmazó magyar webkorpusz 4%-os hibatűréssel készült metszetéből kinyert szókincs mérete (lexémák, ill. szótári szavak), kézi ellenőrzés nélkül[51]

Jegyzetek szerkesztés

  1. a b c d David Crystal: A nyelv enciklopédiája, Osiris, Bp. 2003, ISBN 9633894816 (újabb kiadás: 2006, ISBN 9789633894811), 115. o.
  2. a b c d e f g h i David Crystal: A nyelv enciklopédiája, Osiris, Bp. 2003, ISBN 9633894816 (újabb kiadás: 2006, ISBN 9789633894811), 290. o. és 308. o. adatai, ill. azok interpolálása
  3. a b c Statement of the Fachverband Chinesisch e.V. (Association of Chinese Teachers in German Speaking Countries) on the new HSK Chinese Proficiency Test. [2013. december 2-i dátummal az eredetiből archiválva]. (Hozzáférés: 2013. január 19.)
  4. Basic English szócikk az angol Wikipédiában
  5. A Fundamento de Esperanto (’az eszperantó alapjai’) egyik fejezete az Universala Vortaro (’általános szókészlet’), amelynek előzménye az 1887-es Unua Libro (’első könyv’). Források a számértékhez: en:Esperanto, en:Esperanto vocabulary: 900, de:Fundamento de Esperanto: 920, eo:Universala Vortaro: 900, eo:Unua Libro: 947, ebből 11 tulajdonnév.
  6. a b c d The frequency dictionary for Russian
  7. a b c d e A francia mint idegen nyelv és a Közös Európai Nyelvi Referenciakeret (James Milton cikkének kivonata, Swansea-i Egyetem); a WebCite archívumának linkje
  8. Építeni kell a gyerekek szókincsét (Nyest, 2011. március 23.)
  9. a b c d e Gyakorisági szótárak – Magyarországi helyzetkép Archiválva 2008. január 7-i dátummal a Wayback Machine-ben (Lengyelné Molnár Tünde, Könyvtári Figyelő, 52. évf., 2006/1. sz.)
  10. a b c d Nádasdy Ádám: Egy átlag angol munkás (Magyar Narancs, 2007/08/02, 31. szám Archiválva 2008. április 23-i dátummal a Wayback Machine-ben)
  11. Longman Dictionary of Contemporary English Updated Edition Archiválva 2008. január 24-i dátummal a Wayback Machine-ben, Longman Catalogue
  12. a b c d Paul Nation és Robert Waring: Szókincsméret, szöveglefedettség és szójegyzékek Archiválva 2007. december 22-i dátummal a Wayback Machine-ben, Hirsh és Nation kutatása;
  13. Word lists in Reference Level Descriptions of CEFR (Common European Framework of Reference for Languages): …after 200 – 250 hours lessons, B2 students “know” two thousand and seventy eight Italian words, and one hundred or two hundred more in German and English.
  14. „En étudiant le vocabulaire des écrivains classiques on a pu constater que Racine a écrit toutes ses tragédies avec seulement 3 000 vocables.” Recherches sur une chaîne de caractères Archiválva 2008. február 8-i dátummal a Wayback Machine-ben
  15. Langue sauce piquante » Blog Archive » Mots défunts
  16. Ian Lancashire and Graeme Hirst: Vocabulary Changes in Agatha Christie’s Mysteries as an Indication of Dementia: A Case Study
  17. a b c d Balassi Bálint szép szavainak szótára, Holmi, 2005. június
  18. a b c d e Irodalmi szemle, 2005. április, 81. o. skk. (PDF)
  19. a b c Szókincsfelmérések a Nyelvi Referenciakeretben (James Milton, Swansea-i Egyetem), HTML-változat
  20. BDB: The New Brown–Driver–Briggs–Gesenius Hebrew and English Lexicon 1906, repr. 1979, Hendrickson Publishers, Peabody, Massachusetts, ISBN 1-56563-206-0 (Wikisource: Repr. 1936)
  21. Csokonai-szókincstár I. Előszó (a Debreceni Egyetem Magyar Nyelvtudományi Tanszéke)
  22. a b c d e A nyelv és a nyelvek, 4. és 5. fejezet, szerk.: Kenesei István, Akadémiai, Bp. 2004, ISBN 9630579596, 76–77., 84. és 86. o., 4. fejezet, 5. fejezet (PDF)
  23. Akadémiai Kiadó: Magyar–angol kisszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (ISBN 9789630583589, 18 000 címszó), Angol–magyar kisszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (ISBN 9789630583572, 18 000 címszó), Angol–magyar–angol kisszótár egybekötve Archiválva 2007. december 12-i dátummal a Wayback Machine-ben (ISBN 9789630584838, 18‑18 000 címszó), Magyar–német kisszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (ISBN 9630584158, 30 000 címszó), Német–magyar kisszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (ISBN 963058414X, 30 000 címszó), Magyar–francia kisszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (ISBN 9630581760, 25 000 címszó), Francia–magyar kisszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (ISBN 9789630583268, 22 000 címszó), Magyar–olasz, olasz–magyar kisszótár (ISBN 9789630955072, 10 000 címszó)
  24. a b c 1. Anyaggyűjtés, válogatás, címszóanyag, tipológia in Zöldgallytörés, avagy minden, amit a szótárírásról tudni érdemes (Akadémiai Kiadó, Bp. 2020, ISBN 9789634545811)
  25. Legenda bizonyítva: megszámoltuk Arany szavait (Origó, Mester Tamás adatelemző cikke, 2015. március 30.)
  26. Longman Language Activator, Longman, 1998. F15-ös oldal, ISBN 0 582 04093 0
  27. How many in the language and how many does any one person know? (World Wide Words)
  28. Hajdanócok kora – Kövületekről és kövült szavakról (Székely Nemzeti Múzeum)
  29. a b Nádasdy: A magyar nem nehéz (az Origo Vendégszoba interjúja, 2003. november 26.)
  30. Lassan készülő Nagyszótár – Példás szavak (interjú Ittzés Nóra főszerkesztővel, HVG 2012/33, 08.18., 44-46.)
  31. Eckhardt Sándor: Magyar–francia kéziszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (Akadémiai): 35 000 címszó; Halász Előd: Magyar–német kéziszótár (Akadémiai, Bp. 1995): 40 000 címszó; Magyar–angol kéziszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (Akadémiai): 50 000 címszó, Magyar–spanyol kéziszótár (Terra, Bp. 1992): 50 000 címszó, Magyar–német kéziszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (Akadémiai): 60 000 címszó; Aquila Kiadó: Varga György és Lázár A. Péter: Magyar–angol szótár Archiválva 2008. január 15-i dátummal a Wayback Machine-ben: 72 ezer, Héra István: Magyar–német szótár Archiválva 2008. január 18-i dátummal a Wayback Machine-ben: 72 ezer, Lázár A. Péter és Varga György: Angol–magyar szótár Archiválva 2008. január 18-i dátummal a Wayback Machine-ben: 76 ezer, Héra István: Német–magyar szótár Archiválva 2008. január 18-i dátummal a Wayback Machine-ben: 80 ezer.
  32. „Even though our dictionary contains around 70,000 headwords (and many more derived forms), we were surprised to find only approximately 45,000 of them present in the 100-million-word BNC”; Why do you only test up to 45,000 words? – Because honestly, there really aren't any more generally-used words than that. The Oxford English Dictionary may list 300,000 words, but after 45,000, they're pretty much all either archaic, scientific/technical, or otherwise inapplicable to any kind of "general" vocabulary test. In fact, finding such general words beyond 35,000 was a real challenge.”
  33. Ingyenesen elérhető elektronikus nagyszótárak, lexikonok és nyelvvizsgára előkészítő anyagok Archiválva 2008. április 23-i dátummal a Wayback Machine-ben (Akadémiai Kiadó)
  34. Le Grand Larousse illustré - dictionnaire encyclopédique en 3 volumes + CD-ROM - habillé par Starck (Dicoland.com)
  35. Spanyol Királyi Akadémia: 22.a edición del DRAE – Datos comparados con la edición anterior
  36. Trésor de la langue française informatisé szócikk a francia Wikipédiában
  37. Hír az MTA honlapján (2007. november 7.) Archiválva 2008. április 23-i dátummal a Wayback Machine-ben, Hír az MTA honlapján (2007. november 14.) Archiválva 2007. május 27-i dátummal a Wayback Machine-ben A szótár, amire 200 évet várunk – Interjú Ittzés Nóra lexikográfussal Archiválva 2008. december 5-i dátummal a Wayback Machine-ben (Index, 2007. április 20.)
  38. Akadémiai Kiadó: Magyar–angol nagyszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben
  39. Akadémiai Kiadó: Magyar–német nagyszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben
  40. Akadémiai Kiadó: Francia–magyar nagyszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben, Magyar–francia nagyszótár Archiválva 2008. április 23-i dátummal a Wayback Machine-ben
  41. Magyar–német klasszikus nagyszótár CD-vel Archiválva 2008. április 23-i dátummal a Wayback Machine-ben, Magyar–német nagyszótár CD-vel Archiválva 2008. április 23-i dátummal a Wayback Machine-ben
  42. How many words are there in the English language? Archiválva 2007. szeptember 29-i dátummal a Wayback Machine-ben (AskOxford.com, Frequently Asked Questions)
  43. a b Szótári tények. [2008. május 9-i dátummal az eredetiből archiválva]. (Hozzáférés: 2008. január 18.)
  44. Deutsches Wörterbuch szócikk a német Wikipédiában
  45. Webster's Third New International
  46. Kétszáz éve írják, és még nem látják a végét (Népszabadság, 2015. augusztus 22.)
  47. Kiadták a b betűs magyar szavakat Archiválva 2015. szeptember 25-i dátummal a Wayback Machine-ben (Parókia Portál, 2011. december 1.)
  48. Nádasdy és a békeláb (Népszabadság, 2011. december 1.)
  49. Egymillió angol szó van[halott link] (Wikitech)
  50. Több mint egymillió angol szó van (Index)
  51. Hungarian webcorpus (ismertető angolul; BME Szociológia és Kommunikáció Tanszék - Médiaoktatási és Kutatóközpont), értelmezéséhez l. Mártonfi Attila hozzászólása az Index egyik fórumában

Külső hivatkozások szerkesztés

Cikkek szerkesztés

További weboldalak szerkesztés