Spring til indhold

Wikipedia:Landsbybrønden/Ekstern-link-bot checker

Fra Wikipedia, den frie encyklopædi
[rediger kildetekst]

Jeg er ved at kigge på [1] og beder hermed om tilladelse til:

  • 1) Teste den.
  • 2) Senere sætte den i drift, når den er blevet testet.

Følgende ideer og ikke komplette overvejelser haves pt. til en ekstern-link-bot checker:

  • Find et ekstern linkafsnit - f.eks. syntaksen [http://www.et_site.dk/en_side.html Dette er et site] Citat: "...a,b,c...".<returtegn>
    • Link: "http://www.et_site.dk/en_side.html"
  • Check linken på internettet.
  • Indsæt i artiklens linkafsnit om serveren svarede at siden direkte var tilgængelig. Sandsynligvis kun under afsnit "Eksterne henvisninger". I den synlige del af statistikken skrives: [1/5] = [tekstboksvisning:] Har virket 1 ud af 5 gange under linktest over en længere periode.
    • Eksempel på isat information - statistik som kommentar og "(1/5)" for at vise at denne link virkede 1 ud af 5 gange:
      • [http://www.et_site.dk/en_side.html <!-- Linkbot stat: 20050131 401,20050131 401,20050228 401,20050315 401,20050331 OK checksum (MD5?) (checksum er inkl. adressen) -->(1/5) Dette er et site] Citat: "...a,b,c...".<returtegn>
      • [http://www.et_andet_site.dk/en_anden_side.html <!-- Linkbot stat: 20050131 OK,20050131 OK,20050228 OK,20050315 OK,20050331 OK checksum (MD5?) (checksum er inkl. adressen) -->(5/5 link OK) Dette er et site] Citat: "...a,b,c...".<returtegn>
    • Hvis link ikke eksisterer, prøves at finde en i Webarchive backup - denne isættes så i stedet - muligvis manuelt.
    • Hvis der bliver redirigeret, checkes redirigeringen manuelt, evt. med sammenligning med Webarchive backup.

Hvis den eksterne link har en af følgende problemer:

  • ikke er set f.eks. 5 gange ud af 5 fortløbende forsøg over længere tidsintervaller - (en måned)/5?.
  • Domænet eksisterer ikke.
- slettes linkafsnittet.

-

Genbrug af statistik:

  • Hvis linken er set før, kan statistikken fra en tidligere adresse hentes herfra.
  • Virker linken ikke og linkens site tidligere er klassificeret som utilgængelig slettes linkafsnittet.

-

Det være oplagt at lave flere statussider - f.eks.:

  • Redirigeringer som skal checkes.
  • Om link findes i Webarchive backup.
  • Links som er på ikke-artikel sider (diskussionssider, brugersider, hjælpesider, billedsider...) ændres ikke, da de har en dokumenterende formål.

mvh Glenn 10. apr 2005 kl. 12:28 (CEST) (ændret Glenn 12. apr 2005 kl. 10:31 (CEST))

Nogle af robotterne i pywikipediabot pakken kan køre direkte fra et database dump af Wikipedia, det foreslår jeg du gør for disse robotter. Det har jeg for eksempel gjort med weblinkchecker.py og sat resultatet på din diskussionsside. For alle de andre robotter, så foreslår jeg du opretter en seperat bruger konto til robotton, så vi kan markere den som en robot.
En statusside er en fin ide. Du kan jo starte med alle dem jeg har sat på din diskussionsside. Der er kun ca. 900 link med fejl, så det burde være overkommeligt at få dem rettet.
Du skal være velkommen til at opsætte det fine system du her snakker om. Dog syntes jeg det måske er lidt for meget at gøre ud af 900 links, hvoraf mange af dem ikke virker fordi man har glemt et mellemrum efter linket!
--Christian List 11. apr 2005 kl. 15:11 (CEST)
Hej Christian

Formålet med linkbotten er at den checker og om fornødent sletter ikke fungerende links såvidt muligt automatisk.

Om f.eks. 12 måneder er der sikkert flere der ikke virker.

"...Dog syntes jeg det måske er lidt for meget at gøre ud af 900 links, hvoraf mange af dem ikke virker fordi man har glemt et mellemrum efter linket!"
??? Du er vist lidt ironisk?

mvh Glenn 11. apr 2005 kl. 18:46 (CEST)

Hej Christian

Linkbotten hedder Webot. Kunne denne bruger registreres som robot? --Webot 13. apr 2005 kl. 21:54 (CEST)

Ja, den er nu registreret som bot. --Christian List 14. apr 2005 kl. 02:51 (CEST)