For alternative betydninger, se Variabel.
Der er for få eller ingen kildehenvisninger i denne artikel, hvilket er et problem. Du kan hjælpe ved at angive troværdige kilder til de påstande, som fremføres i artiklen.
En stokastisk variabel er inden for sandsynlighedsregning og statistik uformelt set en variabel, hvis værdi påvirkes af tilfældigheder. Dens mulige værdier er hver associeret med en vis sandsynlighed. Værdierne kunne f.eks. repræsentere de mulige udfald af et endnu ikke udført eksperiment. En stokastisk variabel kaldes i nogle tilfælde også en tilfældighedsvariabel, jf. det engelske random variable.
Stokastiske variable betegnes ofte med store bogstaver som f.eks.
,
og
.
Formelt set defineres en stokastisk variabel som en målbar afbildning
hvor
betegner et sandsynlighedsrum, for et passende sandsynlighedsmål
, og
et målbart rum. I tilfældet hvor
siger man at
er en reel stokastisk variabel.
En umiddelbar konsekvens af denne definition er, at urbilledet af en stokastisk variabel
inducerer et nyt sandsynlighedsmål
givet ved
for alle
. Det er sædvane at betegne
ved notationen
.
Hvis billedet af
under
er højst tælleligt, altså hvis
, siger vi at
er en diskret stokastisk variabel. I tilfældet hvor
og
siger vi at
er en kontinuert stokastisk variabel.
Lader vi
betegne vores sandsynlighedsrum med sandsynlighedsmål
, siger vi at funktionen
givet ved
er fordelingsfunktionen for
.
Fordelingsfunktionen siges at karakterisere funktionen: gælder der for to sandsynlighedsmål
og
at
for alle
, så følger det at
.
Hvis
betegner en reel stokastisk variabel og
et sandsynlighedsmål, siger vi at fordelingen af
er givet ved fordelingsfunktionen
for
og vi skriver her,
.
Definitionen for fordelingen af en reel stokastisk variabel inspirerer ydermere en naturlig udvidelse i det tilfælde hvor
med
betegner en flerdimensionel reel stokastisk variabel. Vi kan her tilsvarende definere en fordelingsfunktion
hvor vi skriver,
.
Vi siger i dette tilfælde at
betegner den simultane fordeling af
.
Hvis fordelingsfunktionen for en reel stokastisk variabel
kan udtrykkes som
-integralet af en funktion
for et mål
, siger vi at
har tæthed
mht. målet
. I tilfældet hvor
er Lebesgue-målet på
og
er Riemann-integrabel, siger vi ofte blot at
har tæthed
og der gælder i dette tilfælde at,
.
Da fordelingsfunktionen for en stokastisk variabel karakteriserer fordelingen, undlader man ofte diskussioner om det bagvedliggende sandsynlighedsrum
, da det i de fleste steder er svært at beskrive og arbejde med eksplicit. Herunder giver vi dog nogle eksempler på eksplicit definerede stokastiske variable, samt også eksempler på stokastiske variable hvis fordeling defineres ud fra deres fordelingsfunktioner.
Et eksempel på en diskret stokastisk variabel er summen af kast med terninger. Vi lader
være en stokastisk variabel med et diskret ligefordelt sandsynlighedsmål
, det vil sige
for alle
. Definerer vi her
ser vi at
og
er derfor en diskret stokastisk variabel.
En fortolkning af
er per konstruktion at den betegner summen af øjne ved kast af
fair
-sidede terninger. Vi kan her se at sandsynligheden for at få en sum af
øjne er givet ved,
.
At en stokastisk variabel
er Bernoullifordelt med parameter
, karakteriseres meget simpelt af det tilfælde hvor
antager værdien
med sandsynlighed
og værdien
med sandsynlighed
. Vi skriver ofte,
,
som karakterisering af denne fordeling. En fortolkning af Bernoullifordelingen kan være at der er sandsynlighed
for at en begivenhed indtræffer, og sandsynlighed
for at den ikke gør. Vi skriver her typisk
.
Alternativt kan Bernoullifordelingen karakteriseres ud fra punktsandsynlighederne ved,
.
Vi siger at en stokastisk variabel
er Binomialfordelt med parametre
og
, hvis fordelingen af
karakteriseres af punktsandsynlighederne,
.
En fortolkning af Binomialfordelingen er at vi udfører
uafhængige eksperimenter
af Bernoullifordelte stokastiske variable, alle med parameter
, og definerer her
som summen af disse, det vil sige
. Vi skriver her at
.
Man kalder en stokastisk variabel
for Poissonfordelt med parameter
hvis fordelingen af
kan karateriseres ved punktsandsynlighederne,
.
Vi skriver i dette tilfælde at
. Det kan let vises at Poissonfordelingen blot er grænseopførslen, som
, for en Binomialfordelt stokastisk variabel
med
defineret således at
. Vi ser her at vi har,
,
hvor tilnærmelsen gælder for store
og små
.
Lad
være en reel stokastisk variabel med et ligefordelt sandsynlighedsmål
, det vil sige at
for alle
, hvor
almindeligvis betegner Lebesgue-målet på
. Lader vi nu
følger det fra en simpel udregning at
, og
, altså er
en kontinuer stokastisk variabel. Vi ser her at vi har,
.
Vi ser yderligere for punktsandsynligheden i
, at der gælder,
,
hvilket eksemplificerer idéen om at kontinuerte stokastiske variable har sandsynlighed
i deres punkter.
Inden for sandsynlighedsregning og statistisk spiller Normalfordelingen en central rolle. Det anses af mange for den vigtigste fordeling. Vi siger at en stokastisk variabel
er normalfordelt med parameter
og
, hvis den har tæthedsfunktionen
.
I dette tilfælde skriver vi at
. I specialtilfældet hvor
og
siger vi at
følger en standard Normalfordeling. Vi anvender ofte notationen
eller blot
for tæthedsfunktionerne når
er standard Normalfordelt og tilsvarende
eller
for fordelingsfunktionerne. I dette tilfælde får vi at,
.
Især spiller den standard Normalfordeling en hovedsaglig rolle i Den Centrale Grænseværdisætning.
Vi siger at
følger en Eksponentialfordeling med parameter
, hvis den karakteriseres af tæthedsfunktionen,
.
Vi kan her finde et eksplicit udtryk for den tilsvarende fordelingsfunktion, som er givet ved
.
Hvis
er Eksponentialfordelt, skriver vi
.
Da fordelingsfunktionen kan udtrykkes eksplicit ved elementære funktioner, er det ikke unormalt at man støder på en alternativ definition af Eksponentialfordeling centreret omkring fordelingsfunktionen frem for tæthedsfunktionen.
Lader vi
betegne en stokastisk variabel og
siger vi at
har endelig forventning, hvis
er integrabel mht. målet
. Vi kalder integralet for forventningen af
og skriver,
,
hvor
og
er den hhv. positive og negative del af
. Vi betegner ved
mængden af alle
-integrabel stokastiske variable på
.
Hvis en kontinuer stokastisk variabel
har tæthed
, som er Riemann-integrabel, kan den forventede værdi findes simpelt ved integralet,
.
I tilfældet hvor
er diskret, findes en lignende metode der kan udtrykket som en sum,
.
Disse udtryk gør det i praksis lettere at udregne forventningen for de mere velkendte stokastiske variable der kan karakteriseres fra en tæthed.
Vi siger at to stokastiske variable er ens næsten sikkert og skriver
-n.s. hvis
. Denne definition er blot en indskrænkelse af det målteoretiske begreb
-næsten overalt til specialtilfældet med sandsynlighedsmål. En ækvivalent definition af
-n.s. er at
.
Ved
betegner vi mængden af ækvivalensklasser for integrable stokastiske variable under ækvivalensrelationen
-n.s.
Hvis
og
betegner to stokastiske variable, siger vi at
og
er uafhængige hvis der for alle valg af
og
gælder at
.
Uafhængighed af stokastiske variable har en række af nyttige egenskaber, blandt andet ved beregningen af forventningen og variansen.
Udover det sædvanlige konvergensbereb, gælder en række andre typer af konvergens for stokastiske variable. Vi giver her et par eksempler på de mest anvendte.
Vi siger at en sekvens
af stokastiske variable konvergerer mod
næsten sikkert hvis
-n.s., det vil sige hvis
. I dette tilfælde skriver vi
fra det engelske almost surely.
En sekvens
af stokastiske variable konvergerer mod
i
, eller blot i
hvis
og
er underforstået, hvis både
og
er i
og der ydermere gælder at
. Vi anvender ofte notationen
i dette tilfælde.
Vi siger at en sekvens
af stokastiske variable, konvergerer mod
i sandsynlighed, hvis der for alle valg af
gælder at
. Vi skriver her at
.
Blandt disse typer af konvergens siger man ofte at konvergens i sandsynlighed er svagest ment i den forstand at både næsten sikker konvergens samt konvergens i
medfører hver især konvergens i sandsynlighed.
Mange dele af sandsynlighedsteori er lempelig med den anvendte notation. Det er som eksempel sjældent man nogensinde laver nogle dybe betragtninger om strukturen af det bagvedlæggende sandsynlighedsrum
, og det er næsten aldrig at man eksplicit formulerer det. Af denne årsag er man sjældent interesseret i de konkrete funktionsværdier
for
, og blot denoterer disse ved
.
Yderligere i introducerende sandsynlighedsregning, betragter man sjældent stokastiske variable som egentlige afbildninger. De bliver ofte her betragtet som seperate matematiske strukturere som defineres ud fra deres egenskaber i forbindelse med deres tætheder og fordelingsfunktioner. Dette lægger også op til den almindeligt anvendte notation
,
og
frem for de mere stringente
,
og
.
Hvis vi for en vilkårlig indeksering
har en sekvens
som tilhører den samme ækvivalensklasse i
, det vil sige at
-n.s. for alle
, er det sædvane at betegne dem blot ved en repræsentant
for ækvivalensklassen. Dette skyldes at stokastiske variable tilhørende samme ækvivalensklasse i
ofte deler en række af egenskaber.