„Szerkesztő:BinBot/munka/vegyes” változatai közötti eltérés

Tartalom törölve Tartalom hozzáadva
Nincs szerkesztési összefoglaló
kisebb jav.
1. sor:
{{../helyes}}
Ez egy igen összetett javítócsomag, amelynek nagyon hosszú a futásideje, és sok esetben vezet konfliktushoz (azaz javítandó hibákra és hamis találatokra is illeszkedik egy cikken belül). A tesztelések során sikerült a hamis találatok arányát egész jól használható szintre csökkenteni, amint a munkanaplóban is látható. Érdemes megfontolni egyes részeinek külön futtatását.
<!-- Semmi köze a Pascalhoz, csak ez ad egy jól olvasható színkombinációt. Még a C is elég jó. -->
<source lang="c">
9. sor:
},
'replacements': [
 
 
#Kis/nagybetűérzékeny javítások
(ur'Tíbor', ur'Tibor'),
(ur'(k|K)ülső Hivatkozások', ur'Külső hivatkozások'), #Szócikknévtérben biztosan jó, máshol gond lehet.
(ur'Trianoni(?! béke(szerződés)?\||g)', ur'trianoni'), #Így a linkekben a vonal előtti részt nem javítja.
(ur'(1\.|2\.|3\.|I+\.) ?Világháború', ur'\1 világháború'),
(ur'USÁ\-?([^\]])', ur'USA-\1'), #Ne tegyen - jelet a hivatkozáson belülre
21 ⟶ 20 sor:
(ur'ELTÉ\]\]\-?', ur'ELTE]]-'), #De javítsa ki hivatkozáson belül is
(ur'[Áá]rpád\-?(ház|kor)', ur'Árpád-\1'),
(ur'(a|A)mikoris[Cc]elsius\s*\-*\s*fok', ur'\1mikor isCelsius-fok'),
#Magyar nyelvű
69. sor:
(ur'kg-al', ur'kg-mal'),
(ur'(\d)\s*m-el', ur'\1 m-rel'),
(ur'(\d) *%-*al\b', ur'\1%-kal'), #számjegy után ne legyen szóköz; \b: % align= kivétel, sok táblázatban van, meg 50% alatti
(ur'%\s*-*\s*al\b', ur'%-kal'), #pl. száz %-kal -- szöveges számnál nem irtjuk a szóközt
(ur'(\d)\s*%-*\s*(kal|os|ot|át|tól|ban|ig|áig|uk|a\b)', ur'\1%-\2'),
(ur'(\d)\s*%', ur'\1%'),
81. sor:
(ur'(v|V)ízes([^é])', ur'\1izes\2'),# nem vízesés
(ur'(v|V)ízet', ur'\1izet'),
(ur'(v|V)[ií]zit[uú]r', ur'\1ízitúr'), #Ez kifogta a víziturbinát is. :-) De nincs belőle sok.
(ur'(v|V)izigény', ur'\1ízigény'), #A piszok (POV!) vizigótok miatt kell külön venni.
(ur'(v|V)izi([^tog])', ur'\1ízi\2'), #vizit kizárva, vízitelep IJ :-), mellékhatás: televizió :-)
#Valamint a vizigót, a revizionista és a vizionál is kizárva, a víziorgona meg IJ.
(ur'(v|V)ízig[oó]t', ur'\1izigót'), #Ezt meg visszafelé javítjuk (nyugati gót).
(ur'(s|S)zervíz', ur'\1zerviz'),
93. sor:
(ur'(s|S)zelid', ur'\1zelíd'),
(ur'(k|K)isér', ur'\1ísér'),
(ur'(k|K)ívál[ií]vál+', ur'\1ivál'),
(ur'(k|K)iván(?!d)', ur'\1íván'), #kivándorlás nem
(ur'(h|H)írdet', ur'\1irdet'),
105. sor:
(ur'(i|I)rígy', ur'\1rigy'), #mirigyre is jó :-)
(ur'(b|B)[ií]rk[oó]z', ur'\1irkóz'),
(ur'(a|A)rgentin(a|á)(?!\}|\.svg|\.gif|\.png|\.jpg)', ur'\1rgentín\2'), #{{flagicon|[aA]rgentina}} és a képek kizárása negatív előreolvasással
(ur'(a|A)rgentínok', ur'\1rgentinok'),
(ur'(a|A)rgentín\b', ur'\1rgentin'),
#Szó elejiek
(ur'\bigy\b', ur'így'), #imigyen és igyekez* kizárása (az utóbbira rengeteg találat van)
(ur'\bIgy\b', ur'Így'), #És az igyon, igyunk stb. is. Bőven elég ez szóvégjelekkel.
#írtás (ezt nagyon körül kell járni), nyílván
 
#u/ú, ü/ű
134 ⟶ 136 sor:
(ur'[UÚ]j+ab+', ur'Újabb'),
(ur'\buj([^jg])', ur'új\1'), #ujgurok kizárva, újgörög IJ
(ur'\bUj(?!j|gur|ház|vári|váry|lak|hely|falussyfal)', ur'Új'), #Jellemző tulajdonnevek kizárása
(ur'\bugy( |is|se|hogy)', ur' úgy\1'),
(ur'\bUgy( |is|se|hogy)', ur' Úgy\1'),
170 ⟶ 172 sor:
(ur'(k|K)ellet\b', ur'\1ellett'), #szó végén!
(ur'(m|M)ellet\b', ur'\1ellett'), #szó végén!
(ur'(a|A)aut[oó]gram+', ur'\1utogram'), #kiv. autogrammal -- talán nem gyakori
(ur'(k|K)ilógram\b', ur'\1ilogramm'),
(ur'(k|K)ilogram]]m', ur'\1ilogramm]]'), #Sajnos a ]]-t is szóhatárnak veszi a következő.
179 ⟶ 182 sor:
(ur'(m|M)agasrangú', ur'\1agas rangú'), #hosszú távon: magas????[úű], kivéve magasságú, magasrendű
(ur'(a|A)lacsony rendű', ur'\1lacsonyrendű'),
(ur'(e|E)gyetlen egy(?!séges|etem|ház|ed)', ur'\1gyetlenegy'), #szóközzel a végén több hibát hagy ki, mint javítana jót
(ur'(a|A)mikoris', ur'\1mikor is'),
(ur'(m|M)ég is\b', ur'\1égis'),
(ur'(a|A)mikoris', ur'\1mikor is'),
(ur'(n|N)agyonis', ur'\1agyon is'),
(ur'(n|N)agyrészben', ur'\1agy részben'),
(ur'(t|T)öbb(száz|ezer|millió|milliárd|tucat)', ur'\1öbb \2'),
(ur'(k|K)oránt sem', ur'\1orántsem'),
#Vigyázat, erre be fog jönni a segédalakulat is, de az még nincs. Ja, már nem, mert a megalakulás-->meg alakúlás miatt kivettem az [uú]-t.
#A papagájalakúak stb. kizárása negatív előreolvasással
#(ur'([a-zióöőúüű])alakú(?!ak\]\]|ak\||ak rend)', ur'\1 alakú'), #bármi, kivétel: két- stb./nagy-/kis-/többalakú, hangalakú; nagybetűk nem kellenek.
#Kikommetezve, mert még így is gyakorlatilag csak fals találatokat adott.
#Új koncepció: keressük csak az egyes számú alakot, ezzel a rendszertani kategóriáka kizárjuk. De így is figyelni kell!
(ur'([a-zióöőúüű])alakú(?!ak)', ur'\1 alakú'),
#ezen kívül
 
#j/ly