Tartalom törölve Tartalom hozzáadva
Gyimhu (vitalap | szerkesztései)
Gyimhu (vitalap | szerkesztései)
A lap tartalmának cseréje erre: Két botom van: * A Dal infobox paramétereinek összegyűjtése és tárolása a Modul:Kották metaadatai lapon. A bot forrása és amd64-es binárisa elér…
Címke: Oldal nagy része eltávolítva
1. sor:
Két botom van:
* A Dal infobox paramétereinek összegyűjtése és tárolása a [[Modul:Kották metaadatai]] lapon. A bot forrása és amd64-es binárisa elérhető [http://www.gyimesilaszlo.hu/ debian repositoryból] (<tt>wikikotta</tt> csomag).
* A[[/Összegképlet robot|Összegképlet robot]]: a kémiai lapok összegképleteinek összegyűjtése. Az átdolgozott bot tesztelése most<ref>2018. április</ref> folyik. A korábbi változattal ellentétben ez nem használja a wikidump-ot. A bot forrása és amd64-es binárisa elérhető a [http://www.gyimesilaszlo.hu/ debian repositoryból](<tt>kemiabot</tt> csomag).
 
== Összegképlet robot ==
{| border="1" align="right"
|+ Új kémiai szócikkek évenként
! Darab !! Év
|-
| align="right" | 1 || 2003
|-
| align="right" | 5 || 2004
|-
| align="right" | 119 || 2005
|-
| align="right" | 116 || 2006
|-
| align="right" | 359 || 2007
|-
| align="right" | 293 || 2008
|-
| align="right" | 139 || 2009
|-
| align="right" | 166 || 2010
|-
| align="right" | 244 || 2011
|-
| align="right" | 149 || 2012
|-
| align="right" | 318 || 2013
|-
| align="right" | 195 || 2014
|-
| align="right" | 105 || 2015
|-
| align="right" | 20 || 2016
|-
| align="right" | 27 || 2017
|-
| align="right" | 11 || 2018<ref name="utfut">2018. április 17-ig.</ref>
|}
 
Az összegképletek összegyűjtésekor a bot az alábbi szócikkekbe ír:
{| border="1"
! A robot által feltöltött lap !! Hivatkozás a fő névtérből
|-
| [[Sablon:Összeglista|Összeglista]] || [[Vegyületek összegképlete]]
|-
| [[Sablon:Összegtáblázat|Összegtáblázat]] || [[Vegyületek összegképlet-táblázata]]
|-
| [[Sablon:Berilliumvegyületek|Berilliumvegyületek]] || [[Berilliumvegyületek összegképletének listája]]
|-
| [[Sablon:Brómvegyületek|Brómvegyületek]] || [[Brómvegyületek összegképletének listája]]
|-
| [[Sablon:Céziumvegyületek|Céziumvegyületek]] || [[Céziumvegyületek összegképletének listája]]
|-
| [[Sablon:Fluorvegyületek|Fluorvegyületek]] || [[Fluorvegyületek összegképletének listája]]
|-
| [[Sablon:Foszforvegyületek|Foszforvegyületek]] || [[Foszforvegyületek összegképletének listája]]
|-
| [[Sablon:Jódvegyületek|Jódvegyületek]] || [[Jódvegyületek összegképletének listája]]
|-
| [[Sablon:Kalciumvegyületek|Kalciumvegyületek]] || [[Kalciumvegyületek összegképletének listája]]
|-
| [[Sablon:Káliumvegyületek|Káliumvegyületek]] || [[Káliumvegyületek összegképletének listája]]
|-
| [[Sablon:Kénvegyületek|Kénvegyületek]] || [[Kénvegyületek összegképletének listája]]
|-
| [[Sablon:Klórvegyületek|Klórvegyületek]] || [[Klórvegyületek összegképletének listája]]
|-
| [[Sablon:Magnéziumvegyületek|Magnéziumvegyületek]] || [[Magnéziumvegyületek összegképletének listája]]
|-
| [[Sablon:Nátriumvegyületek|Nátriumvegyületek]] || [[Nátriumvegyületek összegképletének listája]]
|-
| [[Sablon:Nitrogénvegyületek|Nitrogénvegyületek]] || [[Nitrogénvegyületek összegképletének listája]]
|-
| [[Sablon:Rubídiumvegyületek|Rubídiumvegyületek]] || [[Rubídiumvegyületek összegképletének listája]]
|-
| [[Sablon:Talliumvegyületek|Talliumvegyületek]] || [[Talliumvegyületek összegképletének listája]]
|-
| [[Sablon:Vasvegyületek|Vasvegyületek]] || [[Vasvegyületek összegképletének listája]]
|-
| [[Sablon:nincs összegképlet|nincs összegképlet]] || [[Vita:Vegyületek összegképlete]]
|}
 
A botot [[Szerkesztő:Gyimhu|Gyimhu]] üzemelteti. Az utolsó futás ideje 2018. április 17.
 
=== Statisztikák ===
{|
| valign="top" |
 
{| border="1"
|+ A különböző atomok száma<ref>Pl. a Na<sub>2</sub>CO<sub>3</sub> különböző atomjainak száma 3. 0 esetén nincs összegképlet, a 2 neve <dfn>biner</dfn>.</ref><ref name="utfut"/><ref>A különböző atomok szerinti vegyületek listája lekérdezhető az [https://www.gyimesilaszlo.hu/vegykeres.htm Összegképlet] lapról úgy, hogy a keresőfeltételek közül csak az atomszámot töltjük ki.</ref>
! Atom !! Vegyület
|-
| align="center" | 0 || align="right" | 57
|-
 
| align="center" | 1 || align="right" | 8
|-
 
| align="center" | 2 || align="right" | 455
|-
 
| align="center" | 3 || align="right" | 786
|-
 
| align="center" | 4 || align="right" | 690
|-
 
| align="center" | 5 || align="right" | 211
|-
 
| align="center" | 6 || align="right" | 60
|-
 
| align="center" | 7 || align="right" | 1
|-
 
! Összesen: !! align="right" | 2268
|}
 
|
{| border="1" style="margin-left: 20pt"
|+ A legaktívabb szerkesztők<ref name="utfut"/>
! Új<br>szócikk !! Név
|-
|-
| align="right" | 472 || [[Szerkesztő:Gyimhu]]
|-
| align="right" | 334 || [[Szerkesztő:Glikol]]
|-
| align="right" | 257 || [[Szerkesztő:Tsch81]]
|-
| align="right" | 201 || [[Szerkesztő:Szaszicska]]
|-
| align="right" | 195 || [[Szerkesztő:Xxxx00]]
|-
| align="right" | 169 || [[Szerkesztő:Cacattila]]
|-
| align="right" | 105 || [[Szerkesztő:PhHG]]
|-
| align="right" | 42 || [[Szerkesztő:Tetrodotoxin]]
|-
| align="right" | 26 || [[Szerkesztő:Dorgan]]
|-
| align="right" | 23 || [[Szerkesztő:Csd]]
|}
|}
 
== Működés ==
Lépések:
# A bot lekérdezi a szócikk névtérből a kémiai sablonokra hivatkozó lapokat. Egyenként letölti őket, és kinyeri belőlük az összegképletet.
# Az összegképletek listáját korrigálja a kézzel megadott összegképletekkel, kihagyja belőlük a kézzel megadott szócikkeket.
# Generálja a wiki-lapokat.
# Lekérdezi a letöltött lapok létrehozási és utolsó módosítási dátumát és az azt végző szerkesztőt.
# Statisztikákat készít az új lapokról.
# Feltölti a lapokat a Wikipédiára.
A bot működésének fontos alapelve, hogy nem köti meg a szócikkek alakját, vagyis nem korlátozza a szerkesztőket, hanem alkalmazkodik hozzájuk. (Ez minden botra érvényes kellene legyen.)
 
A bot programjai linux shell scriptek és C programok, az atomszámok szerinti statisztika pedig [[Lua (programozási nyelv)|lua]] nyelven készült. Debian disztribúcióban az amd64-re fordított kód és a forrás megtalálható a http://www.gyimesilaszlo.hu lapon, a <tt>kemiabot</tt> csomagban. Az alábbi rövid leírásnál több technikai részlet található a man lapokon.
 
A bot [[raspberry pi]]-n fut, [[raspbian]] disztribúcióban, a már említett [http://www.gyimesilaszlo.hu/ debian repositoryból], forrásból letöltött debian-csomagokkal.
 
=== Az összegképletes lapok összegyűjtése ===
Kémiai sablonok:
* {{sl|Chembox}}
* {{sl|Chembox_new}}
* {{sl|Chembox új}}
* {{sl|Drugbox}}
* {{sl|Gyógyszeresdoboz}}
* {{sl|Vegyület_infobox}}
A shell script neve <tt>kembot</tt>, ami egyúttal le is kérdezi a lapokat (lásd alább). A lapok összegyűjtésére a <tt>sablhiv</tt> scriptet hívja a wikiscript csomagból a sablonra hivatkozó lapok lekérdezésére.
* Bemenő fájl: –
* Eredményfájl: <tt>kembot.mol</tt>.
A fenti sablonokra hivatkozó laplisták lekérdezése párhuzamosan történik, így a futási idő néhány másodperc. A sávszélességet maximálisan kihasználja, a processzor- és diszkigény minimális, .
 
=== Az összegképletek lekérdezése ===
Ezt is a <tt>kembot</tt> csinálja. A lapok lekérdezésére a <tt>wikiszoveg</tt> scriptet hívja a wikiscript csomagból, a lap parszolására és az összegképlet kinyerésére a <tt>kemia</tt> nevű C-programot.
 
Az eredmény ilyen alakú:
<pre>
Aceton-peroxid
Acibenzolár|C=7|N=2|S=2|O=1|H=4
</pre>
Az első esetben a parszer nem talált összegképletet a lapon, több különbözőt talált, vagy az összegképletet nem tudta értelmezni.<ref>Az aceton-peroxid esetén a dimer és a trimer képlete is meg van adva a szócikkben, ugyanabban a paraméterben, amint ez a hibakimenetben is látható.</ref> Az utóbbi leggyakoribb okai:
* polimer
* kristályvíz
* töltés/ion
* több képlet, vagy ugyanaz a képlet többféle alakban.
A kémiai sablonok lehetővé teszik több eltérő összegképlet megadását, és ezt a wiki parszere nem veszi észre, mert
* többféle paraméterben adhatók meg: <tt>Formula</tt>, <tt>Képlet</tt>, <tt>kémiai_képlet</tt>, <tt>chemical_formula</tt>. Az összegképlet vegyjel-paraméterekkel is megadható.
* a három <tt>chembox</tt> típusú sablon alsablonokat hívhat, melyek szintén elfogadják a fenti összegképlet-paramétereket.
 
Fájlok:
* Bemenő fájl: <tt>kembot.mol</tt>.
* Eredményfájl: <tt>kembot.kepl</tt>.
100 Mbit-es hálózatban a futási idő kb. negyed óra. A processzor- és diszkhasználat minimális.
 
=== Kézi korrekció ===
Két célja van:
* a parszer által fel nem ismert összegképlet megadása
* szócikk elhagyása az összegképletek közül. Pl. a [[Béta-receptor-blokkolók]] hívja a <tt>Drugbox</tt> sablont, ezért a gépi listában benne lesz, viszont az összegképlet értelmetlen egy vegyületcsoportra (melyek ráadásul kémiailag nem is hasonlóak).
 
A korrigálni kívánt információt egy kézzel szerkesztett fájlban kell megadni (<tt>kezi.txt</tt>), melynek alakja azonos a gépi eredményfájléval. Az értelmezésben annyi különbség van, hogy a <tt>kezi.txt</tt> képletet nem tartalmazó szócikkeit törölni kell a gép által megtaláltak közül.
 
A kézi lista elsőbbséget élvez a géppel előállítottal szemben. Ha egy szócikk mindkét listában benne van, a gépiből töröljük. Ez lehetővé teszi a gépi összegképlet felülbírálását is (bár remélhetőleg erre nem lesz szükség).
 
A feladat tehát két lista összefésülése, melyet az <tt>olista</tt> script végez. Paraméterként megadható a gépi összegképletlista arra az esetre, ha az más módon (pl. a bot régebbi, a wikidump-ot használó verziójával) állt elő.
 
* Bemenő fájl: <tt>kezi.txt</tt>, <tt>kembot.kepl</tt>.
* Eredményfájl: <tt>hufo.kepl</tt>.
 
A futási idő néhány másodperc erős diszkhasználattal. Hálózatot nem, processzort minimálisan használ.
 
=== Az összegképlet lapok előállítása ===
Az összegképletek fent leírt alakú listájából wiki-lapokat állít elő egy külön könyvtárba. A gyakori elemekről külön lap készül, melynek minden vegyülete tartalmazza az elemet.
 
* Bemenő fájl: <tt>welem.txt</tt>, <tt>wiki.txt</tt>, <tt>hufo.ali</tt>, <tt>hufo.kepl</tt>.
* Eredményfájlok a huwiki alkönyvtárban.
 
A script neve <tt>okepl</tt>, mely a <tt>wtabl</tt> és <tt>wossz</tt> nevű (majdnem azonos) C-programot hívja. Az erőforrásigény elhanyagolható.
 
=== Statisztika ===
Lekérdezi a szócikkek létrehozási és módosítási idejét. Évenkénti/havonkénti statisztikát csinál.
 
Az időket és a szerkesztőket a <tt>kemcre</tt> script kérdezi le, melynek futási ideje kb. megegyezik a szócikkek lekérdezési idejével. Bemenete az <tt>olista</tt> eredményfájlja: <tt>hufo.kepl</tt>. Az eredményfájl neve <tt>kemcre.ido</tt>. A többi statisztikai szkriptnek ez a bemenete.
* kemcrestat: kilistázza a paraméterként megadott időnél később készült összegképlet lapokat, és kiírja havonként külön táblázatban.
* kemcreev: az összegképletes szócikkek száma évenként, 2003 óta.
* kemcreszerk: a legtöbb összegképletes szócikket létrehozó szerkesztők listája, ugyancsak 2003 óta.
 
=== A lapok feltöltése ===
Egyelőre tesztüzem van: kézi ellenőrzés után a wikibot szkripttel.
 
== Jegyzetek ==
{{<references|oszlopok=1}}/>
 
== További információk ==
* [https://www.gyimesilaszlo.hu/vegykeres.htm külső összegképlet kereső]
 
== Kapcsolódó lapok ==