Tudnivalók

Előtanulmányok botos javításhoz

Problémameghatározás szerkesztés

2013-ban a fejlesztők megoldották a kategóriákon belül a nagyjából helyes ábécébe rendezést. Ami változott:

  • A magyar ékezetes betűket automatikusan helyesen kezeli a szoftver.
    • Az ékezettelenített betűk ennélfogva feleslegesek, zavaróak, ezért eltávolítandók.
  • A magyar kettős betűket (a hosszúakat is) automatikusan helyesen kezeli a szoftver, a hamis digráfokat (pl. Tucson nevében a cs) jelölni kell.
    • A ssz → szsz átalakítások tehát elavultak és eltávolítandóak.
  • A tilde (~) a fenti két okból elavult, szükségtelen, ennélfogva eltávolítandó.
  • A névtér előtagját automatikusan figyelmen kívül hagyja a szoftver (a nem szócikknévtérbeli lapok többségénél feleslegessé vált a rendezőkulcs).

Ami nem változott:

  • A vesszők elhagyandóak a defsortból, sose lett volna szabad ott lenniük, még 2013 előtt se.

Továbbra is szükséges

  • a névelő elhagyása a rendezőkulcsból
  • a nem személynévi kategóriák egybeírása a rendezőkulcsban
  • a külföldi személyneveknél a nyugati névsorrend jelölése
  • a pontok elhagyása a rendezőkulcsból

stb.

A probléma, hogy a 2013 előtt kihelyezett elavult rendezőkulcsok többsége ma is ott van, és ezek hatására azóta is születnek újabbak. Javítandók továbbá a teljesen hibás, a lap címéhez nem igazodó rendezőkulcsok.

A jelen projekt csak az alapértelmezett rendezőkulcs (DEFAULTSORT) javítására irányul, a | után megadott egyedi rendezőkulcsokkal nem foglalkozom.

Linkek szerkesztés

A bot képességei szerkesztés

A Pywikibot képességeit a huwiki csomag hordozza.

Kész:

  • Életrajzok elkülönítése a szócikkeken belül
  • A meglévő defsort felismerése
  • Magyarok és nem magyarok szétválasztása (nem üzembiztos)
  • A {{külföldi név}}(?) sablon alapján felismeri, ha a magyar kategóriában levő cikkalany neve nem magyar

Megvalósítható:

  • Bizonyos hibás és elavult defsortok kiszűrése és eltávolítása, ill. aktualizálása
  • Ismétlődő rendezőkulcsok észrevétele, amelyekből akár defsort is lehet
  • Defsort képzése névelő elhagyásával, ha van lista a névelőkről

Nem valószínű:

  • Hamis digráfok automatikus felismerése

Kérdéses:

  • Teljesen idegen kulcs felismerése (pl. átnevezés után maradt)

A Szerkesztő:Bináris/DEFAULTSORT-tesztek oldalon látható lista fejlesztésének nem a tökéletesség a célja, hanem inkább a bot tevékenységének korlátozása a biztonságosan végezhető feladatokra.

A lap alján levő tesztlista alapján kijelenthetjük, hogy a bot képes eltávolítani a tildéket, és a tesztállományban (Kategória:Írók 6 alkategória mélységben) nem talált megtartandó tildét.

Feladatok, kérdések szerkesztés

Egyáltalán nem cél egy teljes megoldás, csak azoknak a problémáknak a kezelése, amelyek bottal biztonságosan megoldhatók. A többi marad kézi szerkesztésre.

  1. Elandslaagtei csata: {{DEFAULTSORT:Elandslaagteic~sata}} – az ilyenek automatikusan törlendők? A jelenlegi útmutatóban nem szerepel tilde.
  2. A cikk címével megegyező defsortok eltávolítandók? (Döntés: az izlandi személyeknél maradnak.)
  3. A cikk címétől csak a magyar ékezetek hiányában eltérő defsortok eltávolítandók? (A nem magyarok maradnak!)
  4. A névelők automatikusan elhagyandók? Melyek ezek? (a, the, le, la, l', der, die, das...)
  5. A címből a kötőjelek automatikusan elhagyandók?
  6. Személyneveknél a defsortban már meglévő vesszők automatikusan elhagyandók?
    Kiderült, hogy vegyületekben is előfordulnak, ahol maradniuk kell. Én csak személynevekre gondoltam, csak pontatlanul fogalmaztam, mert nem tudtam, hogy máshol is van.
    Példa: Paul Vanden Boeynants → {{DEFAULTSORT:Vanden Boeynants, Paul}}
  7. A szóközök a nem életrajzi szócikkekből automatikusan elhagyandóak, az emberek nevéből pedig nem?
  8. Milyen egyéb elavult, a jelenlegi útmutatóban már nem szereplő régi gyakorlatok vannak? (Lehetőleg példával)
  9. Jó lenne detektálni az átnevezés után úgy maradt elavult kulcsokat.
  10. A magyar ékezetes betűket helyesen sorolja be a szoftver, de a külföldieknél maradjon a tilde?