Wikipedia:Etiketter/Om
Wikietiketter (Wiki labels) er både et navn for en programpakke og et wikiprosjekt. I dette wikiprosjektet så vil vi lage et datasett av merkede wikiting. Vi bruker programpakken for å forenkle denne jobben. Navnet kan du tolke som
- Vi arbeider sammen på Wikipedia for å merke viktige data.
eller som
- For å få de datene vi trenger så merker vi kvalitetsredigeringer.
Mål og omfang
[rediger kilde]Vårt mål i dette prosjektet er å lage merkede datasett for å løse behov som finnes lokalt på bokmålsutgaven og internasjonalt. Merkede datasett har flere bruksområder, inkludert forskning (slik som kvalitative analyser av nybegynnere[1] og hvordan skribenter interakterer[2]) og utvikling av avanserte wikiverktøy (slik som modellene brukt av w:en:User:ClueBot NG and w:en:WP:STiki). Generelt så er det vanskelig og tidkrevende å skaffe til veie den her typen informasjon, ikke minst om gruppen som skal gjøre det er liten. Ved å be en større gruppe om hjelp så blir det overkommelig å
Vi er opptatt av å (1) identifisere muligheter for å skape viktige merkede datasett, (2) distribuere dette arbeidet så bredt som mulig, og (3) gjøre det så effektivt som mulig å håndkode store datasett. Se lista over våre kampanjer for hva vi holder på med for øyeblikket. Hvis du ønsker å hjelpe oss så skriv deg på deltagerlista. Hvis du har en idé om et merket datasett som du ønsker å produsere så spør på diskusjonssiden.
Hvordan kan du hjelpe?
[rediger kilde]Det er noen måter du kan hjelpe til på dette prosjektet
- Merking
- Dette prosjektet er om å merke ting på Wikipedia. I de fleste kampanjene så trengs det et stort antall observasjoner for at et datasett skal bli brukbart. Så ett av målene med prosjektet er er å effektivt fordele dette arbeidet. Hvis du ønsker å bidra så sett opp navnet ditt på deltagerlista.
- Programmering
- Fikse bugs, lage nye funksjoner og forbedre systemets effektivitet. Pull requests er velkomne! Se programvarelageret for mer informasjon.
- Administrasjon
- Sette opp kampanjer, håndtere feil i systemet, og hjelpe nybegynnere til rette med merking av ting. Hvis du er interessert i å hjelpe til med vedlikehold så kontakt EpochFail or He7d3r. (Vi trenger en kontakt lokalt på nowiki.)
Tilgrensende prosjekter
[rediger kilde]Revision scoring som en tjeneste
[rediger kilde]Utdypende artikler: m:Research:Revision scoring as a service og m:Research:Revision scoring as a service/ORES
Mange av Wikipedias viktigste verktøy bruker automatisk klassifisering av redigeringskvalitet. I dette prosjektet så lages det et offentlig endepunkt for slik klassifisering av revisjoner. Vi tror at ved å tilby en slik tjeneste så vil vi gjøre det mye enklere å bygge nye verktøy og forbedre eksisterende, og tilby disse på nye wikier. For å bygge avanserte automatiske klassifikatorer så må vi først ha merkede datasett av høy kvalitet. Det er her Wikipedia:Etiketter (Wiki labels) kommer inn. Se w:en:WP:Labels/Edit quality for mer informasjon.
Den primære måten som utviklere av wikiverktøy vil utnytte dette prosjektet er via et «restfullt» endepunkt mot en nettjeneste som gjør karaktersetting (scoring) som vi kaller ORES (Objective revision evaluation service). Dette er en tjeneste som som vil sette karakterer på revisjoner etter hvert som de kommer inn. For eksempel så kan en spørre etter karakteren i henhold til «revertert-modellen» på #34854258 inne på engelsk Wikipedia.
Referanser
[rediger kilde]- ^ Halfaker, A., Geiger, R. S., Morgan, J. T., & Riedl, J. (2012). The rise and decline of an open collaboration system: How Wikipedia’s reaction to popularity is causing its decline. American Behavioral Scientist, 0002764212469365. summary full paper
- ^ m:Grants:IEG/Editor Interaction Data Extraction and Visualization