Spring til indhold

Hjælp:Avanceret søgning

Fra Wikipedia, den frie encyklopædi
Denne side er en hjælpeside på den danske Wikipedia.
Siden indeholder basal eller avanceret information om dansk Wikipedia og eventuelt teknisk vejledning. Se oversigten over alle hjælpesider under Hjælp.

Denne hjælpeside fortæller, hvordan man med avancerede søgefiltre kan finde artikler og andre sider, der opfylder helt bestemte kriterier. I stedet for disse avancerede søgefiltre, kan man også anvende de mere simple måder at søge på forklaret i Hjælp:Søgning.

I søgefeltet på Søgesiden er der maksimalt plads til 250 tegn. Søgningen kan afgrænses til bestemte navnerum og det er muligt at anvende specialtegn og filtre, der gør søgningen mere eller mindre præcis. Således kan en søgning omfatte mere eller mindre præcise "fraser", ligesom wildcard-søgninger, "diffuse" søgninger (der i et vist omfang kan tage højde for stavefejl), sortering og vægtning af søgeresultater samt brug af logiske operatorer. Man kan også søge direkte i sidernes wikikode ved hjælp af regulære udtryk, der kan gøre søgningen meget præcis. Endelig kan man afgrænse søgningen ud fra forekomsten af skabeloner, medlemskab af kategorier eller til sider der linker til specifikke andre sider.

Søgningen sker normalt blandt de ord på en side, der bliver vist på skærmen eller ved udskrivning. Man kan dog søge i den "rå" wikikode ved at anvende søgefiltret insource:. Et ord opfattes ved en almindelig søgning som en hvilken som helst ubrudt række af bogstaver og tal. Alle andre tegn som punktum, komma, parentes, skråstreg eller matematiske tegn vil ikke kunne findes ved en almindelig søgning. Som standard vil søgningen ske efter ordets ordstamme og dets forskellige bøjningsformer. Søgningen skelner normalt ikke mellem store og små bogstaver. De fundne sider indeholdende søgeordene vil automatisk blive sorteret efter søgeordenes hyppighed og placering i teksten, men det er som sagt muligt at påvirke denne sortering i forhold til f.eks. tidspunkt for seneste redigering af siden, brug af skabeloner eller sidens lighed med andre sider.

Søgningen foregår rent teknisk som en fuldtekstsøgning i en indekseret database, der holdes opdateret i forhold til det aktuelle indhold af Wikipedias sider. En søgning kan gemmes som et link, der f.eks. kan indsættes på en diskussionsside: [[Speciel:Search/søgestreng]] eller ved at bruge skabelonen {{wikisøg}}.

Wikipedia special search box
Et screenshot af søgesiden

Det er I søgefeltet på søgesiden man har mulighed for at angive avancerede søgefiltre. Forskellen mellem dette søgefelt og det der vises øverst på alle sider, er at man her ikke ved et præcist match bliver ledt direkte til en side. Fra søgesiden vil man derimod blive vist en side med søgeresultater.

For at komme til søgesiden, kan man enten foretage en tom søgning i søgefeltet øverst (tryk Enter mens man er i søgefeltet uden at have skrevet noget), eller klikke på forstørrelsesglasset til højre for søgefeltet.

Efter en søgning vil den anvendte søgestreng stadig blive vist i søgefeltet, for at gøre det nemmere at ændre den for en ny søgning. Øverst inden søgeresultaterne kan være vist forslag om andre stavemåder af søgeordet, eller lignende. Rækkefølgen i listen af søgeresultater bestemmes af en indbygget søgealgoritme. De viste resultater matcher ordstammer sammen med deres forskellige mulige bøjningsformer (datid, flertal og så videre), bortset fra når søgeord er i anførselstegn, se afsnittet Bøjningsformer nedenfor.

I listen over resultater bliver de ord der matcher med søgeordene fremhævet med fed skrift, i alle tilfælde når de matcher med sidetitler, mens de andre gange muligvis ikke vises, hvis de ligger for langt adskilt fra hinanden i sidens tekst.

Et enkelt resultat fra hver af en række udvalgte søsterprojekter vises i højre side (det mest relevante resultat fra hvert projekt). Mediefiler fra Wikimedia Commons medtages i søgeresultaterne, når navnerummet "Fil:" er valgt.

Alt hvad der skrives i søgefeltet kaldes for søgestrengen. Hvad der mere præcist er muligt at anvende som søgestreng gennemgås i det følgende.

Logiske operatorer

[redigér | rediger kildetekst]

Det er muligt at søge ved hjælp af logiske operatorer. Disse operatorer omfatter bindestreg (minustegn) "-" eller udråbstegn "!" for "logisk ikke", AND for logisk "og" og OR for logisk "eller".

Operatorerne OR og AND skal skrives med stort. Det er ikke nødvendigt at anvende AND, da alle søgetermer adskilt af mellemrum behandles som om de var forbundet med AND. Parenteser gør ingen forskel, f.eks giver:  (blå OR rød) AND grøn samme resultat som: blå OR (rød AND grøn).

Sammenfatning:

  • ord ord2 svarer til ord AND ord2 .
  • -ord eller !ord vil udelukke de sider der matcher ordet.
  • Man kan ikke anvende AND eller OR sammen med søgefiltre som intitle: og hastemplate: , hvilket dog er muligt med ikke (! eller -)
  • Parenteser er ikke mulige. Det er derfor ikke muligt at gruppere flere søgeord til en enkelt logisk enhed.

Når man anvender OR øges generelt antallet af fundne søgeresultater, mens AND mindsker dem. Logisk ikke er en god måde at forfine en søgning ved at fjerne en søgeterm. For eksempel finder kredit kort -"kreditkort" alle artikler med "kredit" og "kort", men uden "kreditkort".

Ikke-alfanumeriske tegn

[redigér | rediger kildetekst]

De såkaldt ikke-alfanumeriske tegn ~!@#$%^&*()_+{}|[]\:";'<>?,./ er de tegn, der ikke er bogstaver eller tal. Disse tegn bliver opfattet som mellemrumstegn ved en almindelig søgning (bortset fra kolon). Det er f.eks. ikke muligt at finde strengen |LT| (bogstaverne LT mellem to lodrette streger), hvilket bruges i nogle skabeloner på engelsk Wikipedia som forkortelse af "long-ton" (vægtenhed svarende til 1.016 kg). Hvis man søgte efter det, ville man få vist alle sider, der indeholdt lt. Hvis man skulle finde sider med disse tegn, ville det kræve en særlig søgning ved hjælp af søgefiltret insource: med denne søgestreng: all: lt insource:/\|LT\|/.

Nogle tegn får en forskellig behandling alt efter sammenhængen. F.eks. vil søgestrengen option (finans) vise alle artikler med ordene option og finans, ignorerende parenteserne, med mindre der eksisterer en artikel med titlen Option (finans).

De ikke-alfanumeriske tegn ignoreres med mindre de har en særlig betydning (se også jokertegn):

  • +term slår "Mente du..." fra
  • _term slår "Mente du..." fra for denne term
  • : kan angive "artikelnavnerummet" som det sted der skal søges, og det kan i nogle tilfælde opfattes som en del af et ord, når det befinder sig inde i et ord (uden mellemrum omkring sig)
  • ~ har normalt den betydning at det gør søgningen bredere, så flere sider bliver fundet:
    • ord~ laver en "diffus søgning" efter dette ord
    • "præcis frase"~ tilføjer søgning efter hvert af ordenes bøjningsformer
    • "præcis frase"~n laver en "nærhedssøgning", hvor der tillades n ekstra ord inde i den præcise frase

Bøjningsformer

[redigér | rediger kildetekst]

Ved en normal søgning medtages også sider hvor søgeordet findes i andre bøjningsformer, det vil sige det samme ord med forskellige endelser. På den måde matches i højere grad ordets betydning, således at f.eks. søgeordet kirke også matcher kirkerne og så videre. Denne søgning efter bøjningsformer foregår ikke ved hjælp af automatisk opslag i en digital ordbog, men er styret af en computeralgoritme. Derfor er den ikke helt nøjagtig og medtager ikke altid de rigtige bøjningsformer.

Man kan undgå søgning efter bøjningsformer ved at sætte søgeordet i anførselstegn, f.eks. "kirke".

Eksempler:

Søgning
stammer Matcher "stammer", "stamme", "stammerne", "stam" osv, men også "Stamer" (et personnavn)
hånd Matcher "hånd", "hånds", "håndens" eller "håndtere" og "håndterede" med flere, men ikke "hænder"
"stammer" Matcher kun "stammer"
"hånd" Matcher kun "hånd"

Man kan også undgå søgning efter bøjningsformer ved at anvende søgefiltret insource: (f.eks. kirker insource:kirker).

Jokertegn (wildcards)

[redigér | rediger kildetekst]

Med jokertegn (også kaldet wildcards eller trunkeringer) kan man angive hvilke bogstaver i et ord der må variere (dog ikke det første bogstav), og der er ingen grænse for antallet af bogstaver, det drejer sig om. Man kan matche et enkelt ukendt bogstav eller tal med \?. Det er nødvendigt med den omvendte skråstreg for at undgå forveksling med et almindeligt spørgsmålstegn der bruges, når et spørgsmål skrives i søgefeltet, noget mange mennesker benytter sig af ved en søgning. Man kan desuden bruge tegnet asterisk (*), der enten kan betyde ingen, en eller flere forekomster af tal eller bogstaver.

Følgende regler gælder for jokertegn:

  • hverken \? eller * kan matche første bogstav.
  • \? og * kan bruges et vilkårligt antal gange i et ord.

Eksempler:

  • bonde* → bonde, bondegård, bondefanger og bondesejlads osv.
  • n\?vle → navle og nuvle
  • n*øg → naturbesøg og nærlæsningsforsøg

Se også søgninger med regulære udtryk ved hjælp af insource: nedenfor.

Diffus søgning

[redigér | rediger kildetekst]

Med en tilde (~) placeret efter ordet kan man foretage en såkaldt diffus søgning. I modsætning til en søgning efter bøjningsformer vil resultatet være sider der indeholder andre ord, der blot ligner i stavemåden samt sider med ord der præcis matcher søgeordet. Der vil højst være to bogstaver der er forskellige mellem søgeordet og det matchede ord, dog ikke de to første bogstaver i ordet.

  • hvem~ → hvem, hver, Hven, Hvam, Hveger og flere
  • charlie~ parker~ → Charlie Parker, Charles Palmer og Charlie Chaplin

Sættes et tal efter tilden ændres nøjagtigheden af søgningen, "præcis frase"~1 matcher ordene i den angivne rækkefølge samt tillader et ekstra vilkårligt ord mellem de søgte ord.

Eksempler og forklaring:

  • Standardværdien er ~2 og ~0 giver præcis overensstemmelse, mens f.eks. ~9 tillader ni ekstra ord inden for anførselstegnene.
  • Ved diffus søgning bliver der ikke søgt i sidetitler eller efter ordenes forskellige bøjningsformer.
  • "præcis ord3 frase"~2 tillader to ekstra ord ind før eller efter det andet af de tre ord (her kaldet ord3).
  • "præcis frase"~3 finder også "frase præcis" (de to ord i omvendt rækkefølge)

Betydningen af en tilde er lidt forskellig alt efter om den sættes efter et ord (uden anførselstegn) eller en frase med anførselstegn:

  • For en frase gælder f.eks. at "præcis en to frase"~2 matcher præcis frase (altså uden de to ord en og to).
  • For et ord betyder tilden ekstra tegn eller andre tegn.
  • For en frase skal det med et heltal angives hvor mange ekstra der tillades, men for et ord kan et decimaltal angives (standard er ord~0.5 (ord~.5), hvor højst to bogstaver kan ombyttes, skiftes eller tilføjes, men aldrig de to første.

I søgninger efter præcise fraser fortolkes kolonet som et bogstav, men ikke underscore-tegnet _ (det samme er tilfældet for komma (,) inde i et tal). Se følgende eksempler:

parserfunction parserFunction parser function parser-function parser:function parSer:funcTion
parserfunction Ja Ja
"parser function" Ja Ja
parser_function Ja Ja Ja
parserFunction Ja Ja Ja Ja
"parser:function" Ja Ja
"parser_function" Ja Ja
"parSer_funcTion" Ja Ja
parSer_FuncTion Ja Ja Ja Ja

Selv om anførselstegn normalt slår søgning efter forskellige bøjningsformer fra, vil en tilde alene (uden tilføjet ciffer) slå det til igen. Se følgende eksempler:

flowers flower Flowers for Algernon flower for Algernon
flowers Ja Ja Ja Ja Bøjningsformer.
"flowers" Ja Ja Anførselstegn slår søgning efter bøjningsformer fra.
"flowers"~ Ja Ja Ja Ja Tilføjelse af tilde slår igen bøjningsformer til.
"flowers for algernon" Ja Anførselstegn ved præcis frase
"flowers for algernon"~ Ja Ja Diffus søgning
"flowers algernon"~1 Ja Et ekstra ord tilladt i frasen.
"flowers algernon"~1~ Ja Ja Både ekstra ord tilladt og diffus søgning.

Almindelig søgning

[redigér | rediger kildetekst]

Eksempler på søgninger i den viste tekst:

gren* Trunkering (wildcard) for en del af et ord.
gren OR træ Søgning efter sider med gren eller træ i stedet for som standard at begge ord skal findes på samme side.
gren -træ Udelukkelse af et ord eller frase ved hjælp af bindestreg (minustegn).
unfair~ Diffus søgning. Finder ord der ligner ordet "unfair", f.eks. „ungefair“ og „Unai“.
"gren over" Søgning efter præcis denne frase.
gren over Finder flere sider uden anførselstegn.
"gren over"~ Diffus søgning med frase.
"gren over"~9 Tillader op til 9 ekstra ord i frasen.
intitle:træ Søgning i titel (finder også omdirigeringer).
incategory:træ Afgræns søgning til en bestemt kategori. Der søges ikke i underkategorier.
træ prefix:Portal:B Begræns søgning til bestemte navnerum eller til sider hvis titel begynder på en bestemt måde. Søgeordet skal stå før prefix:....
all: træ Søgning i alle navnerum.
Diskussion: træ Finder alle diskussionssider til artikler, hvor diskussionssidens titel eller tekst matcher „træ“.

Wien boost-templates:"Skabelon:God|500%"

Finder især de artikler, der matcher „Wien“ og har skabelonen {{God}}.

Fil: Amsterdam Finder kun mediefiler, hvor „Amsterdam“ matcher i filens beskrivelsestekst eller titel.
"planteart" -hastemplate:Taksoboks Finder alle artikler med ordet "planteart", hvor skabelonen {{Taksoboks}} ikke er brugt.
incategory:"Planter i Danmark" "mos" Finder alle artikler i Kategori:Planter i Danmark , der indeholder ordet "mos".
intitle:"Hus (flertydig)" Finder artikler med "Hus (flertydig)" i titlen.
all: linksto:Hjælp:Søgning Finder sider i alle navnerum, der linker til Hjælp:Søgning.
-intitle:Guide prefix:Hjælp: Finder hjælpesider uden ordet "Guide" i titlen.

Søgning i wikikode

[redigér | rediger kildetekst]

insource:toolserver

Finder artikler, der i wikikoden matcher ordet „toolserver“, stavet med stort eller lille.

insource:"index.php?title="

Søgning i wikikoden med ikke-alfanumeriske tegn ignoreres i formen af insource: uden skråstreger (regexp)

insource:"index php title"

Finder derfor de samme sider som forrige søgning

insource:"Infoboks person"

Finder artikler, der i wikikoden indeholder navnet på skabelon:Infoboks person. Ved en normal søgning i den "viste artikeltekst" giver "Infoboks person" ingen træffere, fordi skabelonens navn ligesom det er tilfældet for andre skabeloner bliver erstattet (transkluderet) på siden med dens indhold.

insource:/i de sidste år af/ -insource:/i de sidste år af (sit|sin|hans|hendes|deres)/

Finder sider der indeholder i de sidste år af, men som ikke efterfølgende har nogen af ordene sit, sin, hans, hendes eller deres.

Den udelukkelse ved hjælp af -insource:/i de sidste år af (sit|sin|hans|hendes|deres)/ gør dog at også sider, der andre steder i teksten ikke indeholder et af disse efterføgende ord bliver udelukket fra resultatet.

"i de sidste år af" insource:/i de sidste år af/ -insource:/i de sidste år af (sit|sin|hans|hendes|deres)/

Ved hjælp af en foranstillet almindelig søgning efter "i de sidste år af" bliver antallet af mulige sider stærkt begrænset, så færre sider skal have analyseret deres wikikode med det regulære udtryk. Dermed reduceres tidsforbruget og serverbelastningen.

Avanceret eksempel

[redigér | rediger kildetekst]

Ved at søge i kildekoden er det muligt at søge efter en skabelon, der kaldes med en specifik parameter. Eksemplet viser, hvordan man ville kunne søge efter en side, hvor skabelonen {{Cite book}} kaldes med den navngivne parameter year med værdien 2010 (muligvis omgivet af mellemrum):

hastemplate:"cite book" insource:"year 2010" insource:/\{\{[cC]ite book *\|[^}]*year *= *2010/

Bemærk at lighedstegnet (=) i "year 2010" ikke er nødvendigt og at det ikke ville ændre søgningen, hvis det blev tilføjet. Søgestrengen er hurtig, fordi den anvender to ekstra filtre, således at regexp-delen af søgningen har færrest mulige sider at skulle gennemsøge.

Skabelonen {{Template usage}} er specielt beregnet til søgning efter anvendte parametre i de skabeloner der bruges inline, det vil sige som er uden linjeskift i skabelonkaldet.

Almindelige søgefiltre

[redigér | rediger kildetekst]

De almindeligste søgefiltre (søgeparametre) er hastemplate:, intitle:, insource:, prefix: og navnerum: ("navnerum" skal her ikke forstås bogstaveligt – brug i stedet navnet på det ønskede navnerum).

Der gælder følgende for søgefiltre:

  • Ingen OR. For eksempel kan man ikke skrive: intitle:A OR intitle:B
  • Kun søgefiltret incategory accepterer mere end et input (kategorinavn) (placeret mellem lodrette streger | )
  • Kun linksto skelner mellem store og små bogstaver
  • Alle navne for søgefiltre skal skrives med småt

Dette søgefilter anvendes som "incategory:kategorinavn", hvor kategorinavn er sidetitlen for en kategoriside. Mellemrum i kategoriens navn kan enten erstattes af bundstreg (_) eller man kan bruge anførselstegn omkring navnet.

Incategory kan anvendes på formen

incategory: "kategori|kategori|...|kategori

og vil her medtage foreningsmængden af de sider, der under hver kategori er nævnt i afsnittet "Sider i kategorien", svarende til brug af den logiske operator OR.

  • Incategory skelner ikke mellem store og små bogstaver
  • Resultatet medtager ikke underkategorier
  • Flere kategorier kan medtages, men grænsen på søgestrengen er 250 tegn

Man kan ikke kombinere dette søgefilter med en søgning på navnerummet Kategori:.

Søgefiltret incategory er ligesom intitle et ældre søgefilter. For også at søge i underkategorier, brug da det nyere søgefilter deepcat:.

Eksempler Beskrivelse
ilt incategory:"Kemikere fra Tyskland" Finder artikler i Kategori: Kemikere fra Tyskland, der matcher "ilt" i teksten
incategory:"Broer i København" incategory:"Fredede broer og viadukter i Danmark" Artikler der findes i begge disse kategorier
"vildkat" -incategory:Vildkatte Artikler der indeholder ordet "vildkat", men ikke findes i Kategori:Vildkatte

Med søgefiltet intitle: kan man søge efter et ord eller en frase indeholdt i en sidetitel. Det er muligt at anvende regulære udtryk med intitle:/regexp/, hvor regexp er det regulære udtryk, se afsnittet insource .

Der gælder dette:

  • Ved søgning efter et enkelt ord kan man sætte en tilde (~) efter ordet for at søge lidt bredere
  • Ved søgning efter et enkelt ord kan man sætte en asterisk (*) efter ordet for at lave en wildcard-søgning
  • Det er ikke muligt at tillade et bestemt antal ekstra ord (f.eks.: ~3) som beskrevet ved diffus søgning ovenfor.
Eksempler Beskrivelse
intitle:lufthavn Alle artikler med lufthavn i titlen
parkering intitle:lufthavn Artikler, der matcher "parkering" i teksten og "lufthavn" i titlen
intitle:international intitle:lufthavn Artikler med "international" og "lufthavn" i deres titel (også fx Birmingham Airport, fordi Birmingham Lufthavn og Birmingham International Airport omdirigeres til denne)
intitle:"international lufthavn" Artikler med frasen "international lufthavn" i titlen
skabelon: fodbold intitle:/.*\/.*/ Finder skabelontitler, hvis navne indeholder en skråstreg og hvor side eller titel indeholder ordet fodbold
intitle:solen Viser at der også søges efter bøjningsformer af søgeordet

hastemplate:

[redigér | rediger kildetekst]

Med søgefiltret hastemplate: kan man finde sider, der bruger en bestemt skabelon. Der skelnes ikke mellem store og små bogstaver i skabelonens navn. Søgefiltret finder også de sider som kun anvender skabelonen som en underskabelon til en anden skabelon brugt på siden.

Hvis man søger på hovednavnet for skabelonen, finder man også de sider der bruger skabelonen gennem en eventuel omdirigering. For eksempel finder hastemplate:Forveksles også de sider der bruger skabelon:forveksle, fordi den omdirigeres til skabelon:forveksles. Derimod finder hastemplate:Forveksle kun sider der bruger denne omdirigeringsskabelon. For kun at finde de skabeloner der er nævnt i wikikoden, brug da søgefiltret insource:.

Modsat ved boost-templates skal hele skabelonens navn anvendes. Hvis skabelonens navn indeholder mellemrum, skal det være omgivet af anførselstegn eller mellemrum skal erstattes af bundstreger (underscore).

Med "linksto:sidetitel" kan man søge efter sider der indeholder wikilinks til en given side. Det kan også udnyttes modsat til at finde sider, der ikke linker til en given side ved at sætte et minustegn foran. Ulig andre søgefiltre skelnes mellem store og små bogstaver i sidetitlen (bortset fra første bogstav).

Der gælder desuden at linksto ikke finder sider med wikilinks, der omdirigeres til den givne side. Man må da søge på omdirigeringens navn.

Linksto kan give et andet resultat end værktøjet "Hvad henviser hertil" i menuen til venstre, fordi den sidstnævnte søger i alle navnerum, mens linksto som standard kun søger efter artikler.

Foruden at søge efter wikilinks i wikikoden, søges også i transkluderet indhold fra skabeloner. Det betyder for eksempel at søgningen:

linksto:"Elektrodynamik"

vil give en liste på omkring 50 artikler, selvom Elektrodynamik faktisk kun findes som link i wikikoden i langt færre artikler. Resten skyldes det link der findes i navigationsboksen Elektromagnetisme, der findes indsat (transkluderet) på mange sider som en skabelon.

Hvis man kun ønsker at få vist de sider der faktisk indeholder linket i wikikoden, kan man anvende insource: i stedet for linksto: på denne måde ved hjælp af et regulært udtryk:

insource:"Elektrodynamik" insource:/\[\[[Ee]lektrodynamik[]|]/

Den første af de to insource: er anvendt for at gøre søgningen hurtigere ved at indsnævre den til sider med ordet "Elektrodynamik" (eller "elektrodynamik"). Forklaring af det regulære udtryk: 1) den indledende og afsluttende skråstreg fortæller at insource: skal søge efter et regulært udtryk. 2) Et wikilink starter altid med to kantede parenteser, men fordi disse parenteser også fungerer som metategn i regulære udtryk findes omvendte skråstreger før hver af dem. 3) den tredje og fjerde kantede parentes er brugt som metategn og angiver mulighederne e og E, fordi det er valgfrit om første bogstav i et wikilink skrives med stort. 4) Til slut kan enten komme en lodret streg eller den første af de afsluttende kantede parenteser i wikilinket (det er ikke nødvendigt med omvendt skråstreg før denne kantede parentes, fordi den ikke her kan fungere som metategn).

Eksempel Beskrivelse
linksto:lufthavn Alle sider der indeholder et wikilink til lufthavn
parkering linksto:lufthavn Artikler der matcher "parkering" i teksten og samtidig linker til lufthavn
-linksto:"Albert Einstein" "Albert Einstein" Artikler der indeholder "Albert Einstein", men som IKKE linker til Albert Einstein

Prefix: og navnerum

[redigér | rediger kildetekst]

Ved afgrænsning af søgningen ved hjælp af prefix: og navnerum har deres placering i søgestrengen betydning. Kun den ene af de to kan anvendes samtidig. Brugen af disse søgefiltre vil overtrumfe angivelsen af navnerum i søgeformularen under søgefeltet. Prefix: vil altid have prioritet over angivelse af navnerum.

Navnerum skal angives aller først i søgestrengen, mens prefix: skal placeres til slut.

Navnet på navnerummet angives efterfulgt af et kolon, eksempelvis skabelon:. Artikelnavnerummet angives med blot et kolon, men dette er normalt ikke nødvendigt, da da der som standard søges her. For søgning i alle navnerum kan man skrive all:. Det er muligt at benytte aliaser for et navnerum, f.eks. wp: for Wikipedia:.

Ved en søgning har angivelsen af navnerum betydning for i hvilken del af Wikipedia søgningen finder sted. Standard er artikelnavnerummet. I søgeformularen under søgefeltet er det muligt samtidigt at angive flere navnerum. Dette kan indstilles som standard for fremtidige søgninger. Når der angives navnerum i søgefeltet, vil dette dog altid overtrumfe disse angivelser.

Ved brug af all: søges dog ikke i navnerummet Fil:. Dette navnerum omfatter også mediefiler der er placeret hos Commons, såsom søgbare pdf-filer. For eksempel matcher file:"885.7 seconds" tekst i en pdf-fil, men all:"885.7 seconds" gør ikke.

Eksempel Beskrivelse
diskussion: "vindmølle" Finder sider i navnerummet Diskussion hvis titel eller tekst indeholder "vindmølle".
fil: "vindmølle" Finder sider i navnerummet Fil, hvis titel eller tekst indeholder "vindmølle".

I slutningen af søgestrengen kan prefix:navnerum: streng anvendes til at finde alle sider, der har en given begyndelse. Her er navnerum navnet på et navnerum og streng kan være et eller flere ord, der indleder titlen. For eksempel vil prefix:hjælp:t finde alle hjælpesider der begynder med "T".

Der gælder følgende:

  • Når streng har nul tegn, gælder søgningen alle sider i et givet navnerum.
  • Når streng er lig en sidetitel, finder søgningen kun siden med denne titel, med mindre siden indeholder undersider.
  • I strengen skelnes ikke mellem store og små bogstaver.
  • Navnerummet kan være alias for et navnerum, f.eks. WP for Wikipedia.
  • Et mellemrum mellem navnerum og streng er tilladt (efter kolon).
  • Som standard er navnerummet lig artikelnavnerummet.
  • Prefix vil ikke matche en omdirigeringsside (i modsætning til Speciel:Præfiksindeks).
  • Prefix kan ikke anvendes til udelukkelse, det vil sige at minustegnet i -prefix ignoreres.
  • Ingen tegn i streng ignoreres. Også mellemrumstegn og anførselstegn opfattes som del af strengen. Det er af denne grund, at prefix: skal stå sidst i søgestrengen.

Prefix kan det samme som en søgning efter navnerum i begyndelsen af søgestrengen og har prioritet over denne.

Et alternativ til at søge ved hjælp af prefix: er Speciel:PræfiksIndeks, der:

  • opstiller fundne sider i kolonner med flere hundrede sider ad gangen
  • skelner mellem store og små bogstaver
  • også medtager omdirigeringssider
Eksempel Beskrivelse
ubåd prefix:USS Artikler der matcher ubåd og hvis titel begynder med "USS"
navn prefix:Diskussion:Danmark Diskussionssider for sider der begynder med Danmark og matcher ordet "navn", inklusiv undersider
navn prefix:Diskussion:Danmark/ Samme søgning, dog kun med undersider
Diskussion: "varme" OR "ocean" Alle diskussionssider med et af disse to ord, inklusiv undersider

Sjældnere søgefiltre

[redigér | rediger kildetekst]

deepcategory:

[redigér | rediger kildetekst]

Også kaldet deepcat:. Dette gør det muligt at søge i en kategori og dens underkategorier. Dog er dette begrænset til kategorier med højst 5 niveauer af underkategorier og i alt højst 256 kategorier, ellers søges kun i de sider der findes direkte i kategorien, eller der vises en fejlmeddelelse ved for mange kategorier.

Se også incategory:.

Eksempel Beskrivelse
deepcat:"Luftfart i Danmark" Finder alle artikler i Kategori:Luftfart i Danmark og dens underkategorier.

contentmodel:

[redigér | rediger kildetekst]

Alle normale sider tilhører den såkaldte contentmodel wikitext. Andre sider hvis indhold udelukkende er skrevet i et bestemt programmeringssprog og er markeret som sådan, kan filtreres i en søgning med contentmodel:model. For eksempel finder søgningen all: contentmodel:css sider med Cascading Style Sheets.

Almindelige typer ses i denne tabel. Flere kan ses i mw:Content handlers/da.

Contentmodel Format Brug
css text/css For sider der indeholder CSS, fx MediaWiki:Common.css
javascript text/javascript For sider der indeholder, fx MediaWiki:Common.js
json application/json Sider der lagrer information i formatet JSON.
text text/plain Sider der viser uformateret tekst.
wikitext text/x-wiki Wikitekst, også kaldet wikikode. Det er standard og anvendes på de fleste sider.

 Vigtigt: I søgefeltet øverst til højre på siden er det nødvendigt at vælge det nederste søgeforslag: indeholder... hvis dette søgefilter anvendes.

Dette afgrænser søgningen til undersider af den angivne side. Man kan også udelukke undersiderne fra en søgning ved at sætte et minustegn (bindestreg) foran. Bemærk at artikler på Wikipedia normalt ikke har undersider, men for sider i andre navnerum er det ikke usædvanligt. Søg derfor også ved hjælp af navnerum:

Eksempelvis for at finde en brugers undersider, kan man skrive:

Bruger: subpageof:Steenth

Søgefiltret subpageof: virker i store træk ligesom prefix:, der dog også virker i de navnerum, hvor undersider rent teknisk ikke rubriceres som sådanne på trods af brugen af skråstreg i titlen.

neartitle: og nearcoord:

[redigér | rediger kildetekst]

Med neartitle:"artikelnavn" kan man finde artikler, der indeholder geografiske koordinater inden for et vist område.

Der kan også angives en søgeradius, neartitle:"søgeradius,artikelnavn"

Med nearcoord: er det i stedet for en artikel muligt at angive kooordinater i decimalformat, nearcoord:længdegrad,breddegrad

Søgeradius og koordinater kan kombineres i: nearcoord:søgeradius,længdegrad,breddegrad

To varianter der muliggør en noget større og mere fleksibel omkreds er:

  • boost-nearcoord:
  • boost-neartitle:

Rangering af resultater

[redigér | rediger kildetekst]

Resultatet af en søgning kan være flere sider, der alle passer mere eller mindre godt på teksten i søgefeltet. Der sker en rangering af sider som afgør i hvilken rækkefølge resultatet vises. Jo bedre en side matcher søgestrengen jo højere oppe i listen vil den være placeret.

Der gælder følgende:

  • Et match i en sides indledning er bedre end i et senere afsnit.
  • Et match i sidetitlen eller en overskrift er bedre end i indledningen.
  • Jo flere gange et søgeord optræder jo bedre.
  • Et præcis match er bedre end et match med en bøjningsform.
  • Når flere forskellige søgeord matcher på en side, rangeres de sider højest, hvor ordenes rækkefølge stemmer med den i søgefeltet.
  • Sider med flere wikilinks til eller fra siden rangeres højere.

boost-templates:

[redigér | rediger kildetekst]

Denne avancerede parameter kan anvendes til at få de sider højere op på resultatlisten, der indeholder en eller flere specifikke skabeloner.

Syntaksen er:

boost-templates:"sidetitel| procenttal%"
  • Sidetitlen skal være fuldstændig, altså skal den begynde med Skabelon:
  • Procenttallet skal være et heltal og skal for at give mening være klart større end 100 % .

Anvendes f.eks. procenttallet på 1000% vil dette gange en sides rangeringsscore med 10, hvilket vil betyde at det f.eks. kun vil have lille betydning for rangeringen om et søgeord findes i titlen eller ej. Dette vil som regel ikke være hensigtsmæssigt.

  • Eksempel: Århus boost-templates:"Skabelon:God|500%" finder især de artikler der indeholder ordet „Århus“ og er kendetegnet ved skabelonen {{God}} .

Søgeparameteren morelike:Artikel A|Artikel B finder de artikler, hvis indhold mest ligner den eller de angivne sider med hensyn til ordfrekvens og ordlængde. Ingen andre søgefiltre eller søgeord er tilladt i samme søgestreng som morelike:

morelike: virker ved at tage et vist antal ord fra inputartiklen (eller inputartiklerne) og derefter foretage en søgning med disse ord. Man kan finjustere søgningen ved at tilføje de følgende parametre til søgeresultatets URL:

&cirrusMltMinDocFreq Antal artikler med en bestemt søgeterm, minimum
&cirrusMltMaxDocFreq Antal artikler med en bestemt søgeterm, maksimum
&cirrusMltMaxQueryTerms Antal søgetermer, maksimum
&cirrusMltMinTermFreq Minimum for hyppighed af et valgt ord
&cirrusMltMinWordLength Minimal længde for at ord kommer i betragtning. Standard er 0.
&cirrusMltMaxWordLength Maksimal ordlængde over hvilken ord ignoreres. Standard er ubegrænset (0).
&cirrusMltFields En kommasepareret liste med de felter der ønskes anvendt. Tilladte felter er: title, text, auxiliary_text, opening_text, headings og all.
&cirrusMltUseFields (true eller false) Brug kun feltdata. Standard er false: systemet vil anvende indholdet af text-feltet (brødteksten) til at danne søgningen.
&cirrusMltPercentTermsToMatch Procentdelen af søgetermer der skal matche. Standard er 0.3 (30 procent).

Eksempelvis kan de to parametre cirrusMtlUseFields og cirrusMltFields bruges således, at der kan findes lignende artikler baseret på f.eks. kun titlen, overskrifterne eller artiklens indledning:

  • &cirrusMtlUseFields=yes&cirrusMltFields=title
  • &cirrusMtlUseFields=yes&cirrusMltFields=headings
  • &cirrusMtlUseFields=yes&cirrusMltFields=text
  • &cirrusMtlUseFields=yes&cirrusMltFields=auxiliary_text
  • &cirrusMtlUseFields=yes&cirrusMltFields=opening_text
  • &cirrusMtlUseFields=yes&cirrusMltFields=all

Her er hvordan adresselinjens URL vil se ud, hvis man søger lignende sider til to inputartikler (Niels Bohr og Albert Einstein) på basis af deres indledning (opening_text): https://da.wikipedia.org/w/index.php?search=morelike%3ANiels+Bohr%7CAlbert+Einstein&title=Speciel%3AS%C3%B8gning&go=G%C3%A5+til&cirrusMtlUseFields=yes&cirrusMltFields=opening_text .

prefer-recent:

[redigér | rediger kildetekst]

Man kan sortere resultaterne efter dato.

  • prefer-recent:
  • prefer-recent:recent,boost

Som standard er recent sat til 160 dage og boost er 0.6 (det skal være et decimaltal mellem 0 og 1), jo højere des mere foretrækkes nyligt redigerede sider fremfor sider, hvis indhold svarer til de øvrige søgekriterier. Tallet recent skal forstås som "halveringstiden" målt i dage. Sider der senest er redigeret for længere tid siden end dette tal, bliver kun "boosted" halvt så meget. Hvis recent f.eks. er 7 vil sider ældre end 7 dage blive boosted halvt så meget, sider ældre end 14 dage kun med det halve igen, 21 dage endnu igen det halve og så videre. Tallet recent kan være så lille som 0.0001, hvilket svarer til cirka 9 sekunder.

Med insource: er det muligt at søge i wikikoden i stedet for i den viste tekst på en side. På den måde er det muligt at finde f.eks. URL'er, parametre for skabeloner eller HTML-kommentarer i <!-- skjult -->. Man kan kun bruge insource: til at søge i sider med "normalt indhold", altså i sider med contentmodel wikitext. I sider der udelukkende indeholder computerkode som Lua, CSS eller JavaScript er det ikke muligt. Der findes to former af insource:. Den ene form søger i en indekseret database over ord i wikikoden, mens den anden form søger i wikikoden ved hjælp af et regulært udtryk. De ser næsten ens ud, men regexp-formen anvender to skråstreger til at afgrænse søgemønstret.[1]

De to former Beskrivelse
insource:ord
insource:"ord1 ord2"
Ligesom ved almindelige søgninger efter ord eller fraser bliver ikke-alfanumeriske tegn ignoreret
insource:/regexp/
insource:/regexp/i
Dette er regulære udtryk. Ønsker man ikke at skelne mellem store og små bogstaver kan man tilføje et i efter den sidste skråstreg, hvilket dog gør søgningen langsommere.

En regexp-søgning kræver meget processor-kraft. Derfor kan den være langsom og være udsat for time-out efter et antal sekunder. For at undgå dette anbefales det at kombinere regexp-søgningen med andre søgefiltre.

Kombiner med almindelig søgning

[redigér | rediger kildetekst]

Hvis det er muligt, skal man helst undgå at anvende regexp-søgninger alene, fordi de er langsomme. Man kan f.eks. i første omgang teste mønstret i det regulære udtryk ved at kombinere det med søgefiltret prefix:sidetitel således at der kun søges i en enkelt side, som man på forhånd ved indeholder det ønskede søgemønster. Denne side kan eventuelt oprettes til lejligheden som en underside til ens brugerside. Derefter, når det korrekte mønster er fundet, kan man udvide søgningen, men stadig begrænse den til så få sider som muligt. Man kan duplikere søgningen ved hjælp af den form af insource: der blot har anførselstegn, ligesom man kan bruge søgefiltre som hastemplate, intitle, incategory og linksto. En tilføjelse af almindelige søgeord med eller uden anførselstegn er også en god idé.

Eksempelvis matcher insource:"M S" både med M/S, "M-S" og "m=s". Ønsker man kun at søge efter M/S, bør man kombinere dem, for at gøre søgningen hurtigere: insource:"M S" insource:/M\/S/.

For at søge efter specielle ord, der begynder med tegnene - eller ! (der begge bruges til at udelukke ord eller fraser fra en søgning), såsom det engelske -in-law eller !Kung, kan man bruge insource sammen med en almindelig søgning efter ordene. For eksempel "in-law" insource:/-in-law/i eller "kung" insource:/!kung/i.

Brug af flaget i for at ignorere skelnen mellem store og små bogstaver gør søgningen langsommere.

Se også Se også: Regulære udtryk.

I den form af insource der bruger regulære udtryk udnyttes de såkaldte metategn, der kan danne mønstre som matcher bestemte dele af wikikoden. Hvis metategnene i et regulært udtryk skal have deres almindelige betydning, kan man bruge en omvendt skråstreg foran tegnet. Metategn der befinder sig inden for kantede parenteser har i de fleste tilfælde også deres almindelige betydning. For eksempel er det nødvendigt at sætte en omvendt skråstreg før en almindelig skråstreg, for at undgå at den sidstnævnte opfattes som afslutningen på det regulære udtryk. Ved en regexp-søgning opfattes wikikoden på en side som en eneste lang række af tegn. Derfor er det ikke muligt at anvende de to ellers ofte anvendte metategn i regulære udtryk, ^ og $, der angiver begyndelse og afslutning på en linje. De har her ikke nogen speciel betydning.

De følgende tegn har en særlig betydning i regulære udtryk og må derfor foranstilles en omvendt skråstreg \, hvis man ønsker at søge efter deres normale betydning:

/ . * + ? ( ) [ ] { } < > | \ " ^ & # ~

Indenfor kantede parenteser ([ og ]) er det kun / \ ( ) der opfattes som metategn.

Eksempel: insource:/\[\[Kategori:/

Den første kantede parentes [ ville i eksemplet blive opfattet som begyndelsen på en tegnklasse, der skulle afsluttes med et ], hvis den omvendte skråstreg havde manglet.

Enkelttegn og tegnklasser

[redigér | rediger kildetekst]

Når man i et regulært udtryk skal angive hvilke tegn der skal søges efter, kan man gøre det både med specifikke enkelttegn og med såkaldte tegnklasser, der angives med kantede parenteser, se tabellen nedenfor. Det er ikke muligt i den her anvendte variant af regulære udtryk at anvende særlige tegn som angiver alfanumeriske tegn, mellemrumstegn eller begyndelsen eller afslutningen på en linje.

Type Syntaks / Eksempel Forklaring
Specifikt enkelttegn B Her eksempelvis præcis det store bogstav B
Også unicode-tegn kan som regel anvendes. Metategn skal foranstilles en omvendt skråstreg.
Vilkårligt enkelttegn . Et punktum . står for et hvilket som helst enkelttegn.
Flere tegn [xyz] En række af enkelttegn kan indsættes i kantede parenteser, hvoraf præcis et skal matche.
Tegninterval [a-z] Bindestregen - definerer et interval i den række af unicode-tegn, som de to tegn til venstre og højre angiver begyndelse og afslutning for. Flere intervaller og enkelttegn kan kombineres.
Negation (tegninterval) [^b] En cirkumfleks ^ i starten negerer resten af indholdet i de kantede parenteser. Her matches alle andre tegn end bogstavet b.
Negation (enkelttegn) ~b En tilde ~ negerer det efterfølgende enkelttegn. Samme effekt som [^b] .

Eksempler:

  • Ma.s
    matcher eksempelvis „Mais“, „Mars“ og „Maus“;
  • [aeiou]
    præcis et af tegnene „a“, „e“, „i“, „o“ eller „u“;
  • [0-6]
    t ciffer fra „0“ til „6“ – bindestregen angiver et interval;
  • [A-Za-z0-9]
    Et vilkårligt bogstav i det latinske alfabet eller et vilkårligt ciffer;
  • [^aA]
    Et vilkårligt tegn bortset fra „a“ eller „A“;
  • [-A-Z]
    Denne tegnklasse indeholder også bindestregen -, når den er angivet som det første tegn i opregningen af enkelttegn.

Indhold der er indesluttet i almindelige runde parenteser ( ) danner en gruppe. Ved hjælp af kvantorer kan det angives hvor mange gange denne gruppe skal optræde.

  • (Gruppe)

Pipe-symbolet (lodret streg) | gør det muligt at angive forskellige undermønstre, hvoraf et af dem skal matche:

  • (a|b|c)

Sjældnere anvendt er & mellem flere undermønstre, hvor alle skal matche

  • (a&b)

Hvis man udelod parenteser, ville de to symboler | og & gælde det regulære udtryk i hele sin længde.

Kvantorer (engelsk quantifiers) gør det muligt at tillade det foregående mønster at optræde i forskellig grad af hyppighed i rækken af tegn. Det forudgående mønster kan være enkelttegn, en tegnklasse eller en gruppe.

De forskellige kvantorer:

? Det foregående mønster er valgfrit, det kan forekomme en enkelt gang, men behøver ikke gøre det; altså kan det forekomme nul eller en gang – modsvarer{0,1}
+ Det foregående mønster skal mindst forekomme en gang, men må gerne forekomme flere gange – modsvarer{1,}
* Det foregående mønster må forekomme et vilkårligt antal gange (også aldrig) – modsvarer{0,}
{n} Det foregående mønster skal forekomme præcis n gange – modsvarer{n,n}
{min,} Det foregående mønster skal mindst forekomme min gange
{min,max} Det foregående mønster skal mindst forekomme min gange og må højst forekomme max gange.
{0,max} Det foregående mønster må højst forekomme max gange.

Eksempler:

  • Det kan angives på to måder, at det tyske ord „Schifffahrt“ både kan forekomme med to og tre „f“-er:
    • chifff?ahrt
    • chif{2,3}ahrt
  • Her matches eksempelvis „kasus“, „kaktus“ og „kakaomous“:
    • ka.+us
  • Her vil både „Klingeling“ og „Klingelingeling“ (eller længere) blive matchet:
    • Kling(eling)+

Mediefiler hos Commons

[redigér | rediger kildetekst]

Det er muligt at finde mediefiler ved en kombineret søgning på indholdet af deres beskrivelsessider (kategorier, skabeloner, tekst) og egenskaber ved mediefilerne selv (filstørrelse og type med mere). Man kan desuden specifikt søge i navnerummet Fil:.

Følgende parametre kan anvendes til at søge på filernes egenskaber:

filetype: / filemime:

[redigér | rediger kildetekst]

På Wikimedia Commons skelnes mellem disse filtyper:

filetype: filemime:
Bitmap image/png
image/jpeg
image/gif
image/tiff
image/djvu
image/xcf
image/webp
Drawing xml/svg (= image/svg)
Audio application/ogg (kun OGG Vorbis)
application/ogg
audio/flac
audio/wav
audio/midi
Video video/webm
application/ogg (kun Ogg Theora)
Multimedia application/ogg (kun OGG Opus)
Office application/pdf

Ved søgning efter filemime: er det muligt kun at søge efter den ene del af de to typer: filemime:jpeg er altså det samme som filemime:image/jpeg, og med filemime:image kan man søge efter alle billeder (rastergrafik og vektorgrafik).

Eksempler:

  • Videoer: filetype:video
  • Billeder uden gif: filetype:bitmap -filemime:gif
  • Julesange: jul filetype:audio

Med filesize: er det muligt at søge efter filer med en ønsket filstørrelse. Det er derfor muligt at angive en nedre, en øvre eller en nedre og øvre grænse. Enheden er kilobyte (1024 byte).

Syntaks:

  • filesize:kb eller filesize:>kb – Filer som mindst er kb kilobyte store.
  • filesize:<kb – Filer der er mindre end kb kilobyte.
  • filesize:kb1,kb2 – Filer der er mellem kb1 og kb2 kilobyte store.

Eksempler:

  • Filer med mindst 20 kB i filstørrelse: filesize:>20
  • Filer mindre end 1 MB: filesize:<1024
  • Filer med filstørrelse mellem 1 og 4 MB: filesize:1024,4096

fileheight:, filewidth: ogfileres:

[redigér | rediger kildetekst]

Med parametrene filewidth:/filew:, fileheight:/fileh: og fileres: er det muligt at søge efter filer med en bestemt opløsning.

Syntaksen afviger en smule fra filesize:

  • Parameter:talParameter er præcis tal.
  • Parameter:>talParameter er større eller lig tal.
  • Parameter:<talParameter er mindre end tal.
  • Parameter:tal1,tal2Parameter ligger mellem tal1 og tal2 (inklusiv).

Hvor Parameter: er en af de disse:

  • filewidth:/filew: – Filbredde i pixel
  • fileheight:/fileh: – Filhøjde i pixel
  • fileres: – Billedopløsning (defineret som kvadratroden af filbredde × filhøjde) i pixel

Eksempler:

  • Søgning efter 4K-videoer: filetype:video filew:>3800
  • Søgning efter filer med mindst 800x600 pixel opløsning: filew:>800 fileh:>600

Med filebits: er det muligt at søge efter filer med bestemt farvedybde. Det er farvedybden per farve i bit, altså værdier mellem 1 og 16. Søgning efter farvedybde virker kun med JPEG-, PNG-, GIF- og XCF-filer.

Syntaksen afviger en smule fra filesize:

  • filebits:dybde – Farvedybden er præcis dybde.
  • filebits:>dybde – Farvedybden er større eller lig dybde.
  • filebits:<dybde – Farvedybden er mindre end dybde.
  • filebits:dybde1,dybde2 – Farvedybden ligger mellem dybde1 og dybde2 (inklusiv).

Eksempler:

  • Søgning efter billeder med 16 bit-farvedybde: filebits:16
  1. ^ Indenfor computerverdenen er det almindeligt at afgrænse et /regulært udtryk/ med skråstreger.