Wikipedia:Dugnadskontor/Standardisere redirect og omdirigering
Standardisere redirect og omdirigering
[rediger kilde]Lagt inn av: H@r@ld diskusjon 18. mai 2014 I april var det 154 737 artikler på bokmål og nynorsk inneholder #REDIRECT eller #redirect, mens 127 222 inneholdt #OMDIRIGERING eller #omdirigering. Kunne dette vært standardisert til en form, helst #OMDIRIGERING, ved hjelp av en botjobb? Når jeg gjør innholdsanalyser av norsk Wikipedia må jeg hele tiden legge inn sjekk på begge disse og koble meg på registeret over omdirigeringer.
Fullført Stigmj (diskusjon) 15. jan. 2016 kl. 17:27 (CET)
Fullført Stigmj (diskusjon) 27. feb. 2016 kl. 16:03 (CET)
Fullført Stigmj (diskusjon) 7. mar. 2016 kl. 15:46 (CET)
Fullført Stigmj (diskusjon) 11. apr. 2016 kl. 15:04 (CEST)
Tekniske detaljer på foreslått kjøring
[rediger kilde]- Hvilket script som kjøres med lenke til kildekode/hjemmeside. F.eks. mw:Manual:Pywikibot/replace.py
- Hvilke parametre som benyttes.
python pwb.py replace.py -summary:"[[Wikipedia:Dugnadskontor/Standardisere_redirect_og_omdirigering|Standardisering av omdirigeringer]]" -nocase -regex "^#(?:omdirigering|redirect):*\s+\[\[" "#OMDIRIGERING [[" -xml
- Lenke til eventuelt datagrunnlag der dette er mulig å fremvise.
- XML-fil som benyttes for grunnlag: nowiki-20160203-pages-meta-current.xml.bz2
- nowiki-20160305-pages-articles.xml.bz2
Testkjøring
[rediger kilde]- Bevis på testkjøring uten at noen faktiske endringer er utført. Legges helst inn som en underside av denne jobben
- testkjøring med -simulate og avbrutt
Diskusjon
[rediger kilde]StigBot jobber med følgende nå:
python /shared/pywikipedia/core/scripts/replace.py -summary:"Standardisering av omdirigeringer" -regex "\#[Rr][Ee][Dd][Ii][Rr][Ee][Cc][Tt]\s+\[\[" "#OMDIRIGERING [[" -file:quarry-6662-all-redirect-pages-on-nowiki-run55975.tsv
Hvor http://quarry.wmflabs.org/query/6662 er utgangspunktet for de som skal sjekkes. Stigmj (diskusjon) 5. jan. 2016 kl. 16:41 (CET)
Denne jobben ble påbegynt for en stund siden, men det mangler å kjøre gjennom noen flere entries. Nøyaktig antall er usikkert, men det kan potensielt dreie seg om flere titusenvis av sider, særlig hvis vi går utover namespace 0. Siden dette er en standardiseringsjobb, burde vi gjøre dette på alle sider og ikke bare namespace 0. Stigmj (diskusjon) 16. feb. 2016 kl. 20:46 (CET)
- Denne jobben kjører nå. Stigmj (diskusjon) 24. feb. 2016 kl. 13:00 (CET)
- Og den ble ferdig den 24. feb. 2016 kl. 17:10 (CET) Stigmj (diskusjon) 27. feb. 2016 kl. 16:03 (CET)
- Kjører nå igjen på ny XML-dump datert 5. mars 2016. Stigmj (diskusjon) 7. mar. 2016 kl. 15:44 (CET)
- Og da var den ferdig. Stigmj (diskusjon) 7. mar. 2016 kl. 15:46 (CET)
- Kjører nå igjen med en ny variasjon hvor det er et ":" etter #omdirigering. Stigmj (diskusjon) 18. mar. 2016 kl. 15:25 (CET)
- Og der var den ferdig. Stigmj (diskusjon) 18. mar. 2016 kl. 15:50 (CET)
- Kjører nå igjen på ny XML-dump datert 7. april 2016. Stigmj (diskusjon) 11. apr. 2016 kl. 15:00 (CEST)
- Og der var den ferdig. Endret på 215 sider. Stigmj (diskusjon) 11. apr. 2016 kl. 15:03 (CEST)