Wikipédia:Szócikkírás bottal

Ez az útmutató a szócikkek bottal történő megírásához ad segítséget. Jelenleg még nincs egyértelmű egyetértés a témában, ezért ez a lap megpróbálja összefoglalni az eddig elhangzott pro és kontra érveket, továbbá a lehetőségeket.

Miért írjunk cikket bottal? szerkesztés

A magyar Wikipédia 10 év alatt közel 300 ezer szócikkel gazdagodott, ami nagyon szép teljesítmény a többi Wikipédiához képest. Azonban, ahogy az angol és a német társoldalakon is látszik, feldolgozásra váró téma van még bőven, nem is beszélve a jelenlegiek bővítéséről és frissítéséről. Az eddigi tempót tartva, talán 150 év múlva érjük el a jelenlegi angol wiki mostani szócikkmennyiségét, miközben az angol is tovább gyarapodik eközben. Így látható, hogy emberi erővel nehéz lefedni az összes témakört.

A botokkal létrehozott szócikkeknek több haszna is lenne:

  • Segíthetne kevésbé feldolgozott témakörök bővítésében, vagy olyan cikkeket hozna létre, melyekre van olvasói igény, de nincs a témában érdekelt szerkesztő;
  • Segítene kialakítani egy egységes, követendő szócikkformát;
  • Azzal, hogy a szócikkek vázát létrehozza, beírva a legfontosabb adatokat, emberi munka szabadul fel, amit az így létrejövő csonk cikkek fejlesztésére lehet fordítani.

Adatok forrása szerkesztés

A bottal létrehozott szócikkeket létrehozhatjuk külső adatbázis felhasználásával is, de sokkal egyszerűbb és gyorsabb, ha a 2012-ben elindult Wikidatára támaszkodunk. A Wikidatán rengeteg adat elérhető rendezett formában, melyet a magyar wikipédia sablonjai fel tudnak használni és meg tudnak egyszerűen jeleníteni. A hiányzó szócikkek összegyűjtésére a nagyobb Wikipédiák listái és kategóriái adnak segítséget. Fontos, hogy egyszerre csak egy bizonyos szűk témakörbe tartozó cikkek hozhatóak létre.

Technikai segítség szerkesztés

Szócikkeket bottal legegyszerűbben a Wikipédia:AutoWikiBrowserrel tudunk írni. Ez a félautomata szerkesztőprogram képes szócikkek módosítására, szövegek cseréjére, de új szócikkek létrehozására is. Képességei megtalálhatóak a program szócikkében, továbbá a Wikipédia:A CSVLoader használata című cikkben. A botokkal kapcsolatos kérdésekben a Wikipédia:Kocsmafal (műszaki) és a Wikipédia:Botgazdák üzenőfala oldalakon lehet választ kapni.

Lehetőségek szerkesztés

Más Wikipédiákon ma már bevett gyakorlat, hogy a szócikkek egy részét programmal írják. A műszaki lehetőségek figyelembevételével, a témában elérhető rendezett adatok mennyiségétől és minőségétől függően különböző hosszúságú cikkek írhatóak. Korábban már a magyar Wikipédián is volt példa botok használatára, leggyakrabban a nyelvközi hivatkozások frissítésében, a vitalapok archiválásában és a települések népességének frissítésében segédkeztek. Rengeteg nehezen kezelhető, unalmas, sok hibával járó feladatot vettek át a szerkesztőktől.

Szócikkek tömeges létrehozása botokkal már két ízben is megtörtént a magyar Wikipédián, különösebb, emlékezetesebb technikai problémáktól mentesen. Elsőnek a magyar települések készültek el, az akkori technikai lehetőségek miatt meglehetősen rövid változatban. Majd később rengeteg kisbolygóról szóló cikk is született külső adatbázis adatainak felhasználásával.

Jelenleg a Wikidata, az AutoWikiBrowser és a CSVLoader használatával jóval bővebb, információban gazdagabb cikk születhet, elsősorban különböző településekről. Fontos, hogy meglegyen a kellő mennyiségű adat hozzá, hogy ne üres infoboxokat és üres szakaszcímeket tartalmazó, használhatatlan lapokat hozzunk létre, melyek nem építik, hanem ellenkezőleg, rombolják az enciklopédia hírnevét. Természetesen ez a folyamat is "öngyógyító", hiszen az ilyen cikkeket is bővíthetik a szerkesztők és a Wikidatába is kerülhetnek új adatok.

A településekről szóló, automatikusan létrehozott cikkek több kisebb teszten is átestek, így már látható, milyen minőségű lesz a végeredmény. A Wikidatán elérhető többek között (de nem minden településnél) kép, ország, pozíciós térkép, földrajzi koordináta, lakosságszám, körzetszám, rendszám, logó, pecsét, zászló, commons kategória, hivatalos oldal, időzóna... adat. Ezekből épülhetnek fel a jövőbeli cikkek, melyek első körben infoboxot, rövid bevezetőt, szakaszcímeket, forrást, hivatalos oldalt, portálsablont, navigációs sablont, nyelvközi hivatkozásokat és kategóriát kapnának. Amint látható, folyószöveg létrehozása még nem megoldott, ez az emberi szerkesztők feladata marad továbbra is.

Bizonyos adatok csak akkor jelennek meg, ha a Wikidatán a magyar címkéket is beírja valaki (polgármester, közigazgatási egység). A munka elején sok címkét kell megadni, de idővel ez a munka egyszerűsödik, ugyanis azonos címkét igénylő különböző cikkeknél elég csupán az egyik Wikidata lapján pótolni a hiányt, a másik cikk ezután szintén megjeleníti az új címkét.

Összekapcsolás a Wikidatával szerkesztés

A Wikidatáról származó információk csak akkor jelennek meg, ha a szócikk és a Wikidata között már létrejött a kapcsolat. Erre az alábbi eszközök használhatók:

Minta:

Departamento Caseros	Shuwiki	"Caseros megye"
Departamento Caseros	Lhu	"Caseros megye"
Departamento Caseros	Dhu	"megye Argentínában"
Departamento Concepción (Misiones)	Shuwiki	"Concepción megye (Misiones)"
Departamento Concepción (Misiones)	Lhu	"Concepción megye"
Departamento Concepción (Misiones)	Dhu	"megye Argentínában, Misiones tartományban"

Fontos, hogy a mezőket a TAB karakterrel kell elválasztani, ezért a mintát a forrásból kell kimásolni. A minta harmadik oszlopában lévő értékeket idézőjelbe kell tenni. Külön meg kell adni, hogy az első oszlopban lévő címek melyik Wikiből vannak, a mintában eswiki. Engedélyeztetni kell a WiDaR alkalmazást.

Ismert korlátok szerkesztés

  • A szócikkek létrehozása legegyszerűbb az angol kategóriák vagy navigációs sablonok alapján. Emiatt azonban előfordulhat, hogy bizonyos szócikkek nem a magyar Wikipédián elfogadott elnevezési szokásokat követik. Ilyen akkor fordulhat elő, ha a szócikket egyértelműsíteni kellett. Az angolok általában vesszővel választják el az egyértelműsítő toldalékot, míg a magyarok zárójelbe teszik. Később ezek a szócikkek az egységes megjelenítés miatt átnevezendőek;
  • A szócikkek alig tartalmaznak folyószöveget;
  • Sok hasonló, szinte azonos szócikk születik;
  • A magyar nyelv bonyolult ragozása és a két különböző határozott névelő (a, az) miatt előfordulhat, hogy nyelvtanilag nem helyes mondatok is kerülnek bele.

Személyekhez szerkesztés

[[Kategória:{{subst:#invoke:Nyelvtani modul|hanyban|{{subst:#invoke:String|sublength|s={{subst:Wikidata|P569|format=iso}}|i=0|len=4}}}} született személyek]]
[[Kategória:{{subst:#invoke:Nyelvtani modul|hanyban|{{subst:#invoke:String|sublength|s={{subst:Wikidata|P570|format=iso}}|i=0|len=4}}}} elhunyt személyek]]

Ha a fenti két sort beillesztjük a Wikidatával már összekötött cikkekbe, akkor a wikidata információk alapján a szócikk bekerül a megfelelő születetési és halálozási kategóriákba is. Fontos, a fenti kód nem különbözteti meg a még élő személyeket a már elhunytaktól. Még élő személyek, vagy hibásan, hiányosan kitöltött wikidata adatok esetén hibás kategóriát szúr be!

Állomásokhoz szerkesztés

[[Kategória:{{subst:#invoke:Nyelvtani modul|hanyban|{{subst:#invoke:String|sublength|s={{subst:Wikidata|P1619|format=iso}}|i=0|len=4}}}} megnyílt vasútállomások]]

Hasonló, mint a fenti példa, de az állomásokhoz a megnyitás évét szúrja be.

Utólagos feladatok szerkesztés

Miután a Wikidata kapcsolatok létrejöttek, az interwikik törölhetőek. A bottal történő törléshez angol interwikik esetén a regex minta: \[\[en:[^\]]*?\]\]\s*?\n?

Lásd még szerkesztés