Hvordan beregne varians: forklaring med eksempler

Innholdsfortegnelse:

Hvordan beregne varians: forklaring med eksempler
Hvordan beregne varians: forklaring med eksempler
Anonim

Sannsynlighetsteori fungerer med tilfeldige variabler. For tilfeldige variabler er det såk alte fordelingslover. En slik lov beskriver dens tilfeldige variabel med absolutt fullstendighet. Men når du arbeider med reelle sett med tilfeldige variabler, er det ofte svært vanskelig å umiddelbart fastslå loven om distribusjonen og begrenses til et visst sett med numeriske egenskaper. For eksempel er det ofte svært nyttig å beregne gjennomsnittet og variansen til en tilfeldig variabel.

Hvorfor trengs det

Hvis essensen av den matematiske forventningen er nær middelverdien av mengden, så forteller spredningen i dette tilfellet hvordan verdiene til kvantiteten vår er spredt rundt denne matematiske forventningen. For eksempel, hvis vi målte IQ-en til en gruppe mennesker og ønsker å undersøke måleresultatene (utvalg), vil den matematiske forventningen vise den omtrentlige gjennomsnittsverdien av intelligenskvotienten for denne gruppen mennesker, og hvis vi beregner utvalgsvariansen, vil vi finne ut hvordan resultatene er gruppert rundt den matematiske forventningen: en haug nær den (liten variasjon i IQ) eller mer jevnt over hele området fra minimum til maksimum resultat (stor variasjon, og et sted i midten - matematisk forventning).

For å beregne variansen trenger du en ny karakteristikk av en tilfeldig variabel - verdiens avvik fra den matematiskeventer.

Avvik

For å forstå hvordan du beregner variansen, må du først forstå avviket. Definisjonen er forskjellen mellom verdien som en tilfeldig variabel tar og dens matematiske forventning. Grovt sett, for å forstå hvordan en verdi er "spredt", må du se på hvordan dens avvik er fordelt. Det vil si at vi erstatter verdien av verdien med verdien av dens avvik fra matten. forventninger og utforsk distribusjonsloven.

Fordelingsloven til en diskret, det vil si en tilfeldig variabel som tar på seg individuelle verdier, skrives i form av en tabell, der verdien til verdien er korrelert med sannsynligheten for at den skal forekomme. Da vil den stokastiske variabelen i avviksfordelingsloven erstattes av sin formel, der det er en verdi (som har beholdt sin sannsynlighet) og en egen matte. venter.

Egenskaper til fordelingsloven for avviket til en tilfeldig variabel

Vi har skrevet ned fordelingsloven for avviket til en tilfeldig variabel. Fra det kan vi så langt bare trekke ut en slik egenskap som den matematiske forventningen. For enkelhets skyld er det bedre å ta et talleksempel.

La det være en fordelingslov for en tilfeldig variabel: X - verdi, p - sannsynlighet.

distribusjonsloven
distribusjonsloven

Vi beregner den matematiske forventningen ved å bruke formelen og umiddelbart avviket.

Forventet verdi
Forventet verdi

Tegner en ny avviksfordelingstabell.

Fordelingslov for avvik
Fordelingslov for avvik

Vi beregner forventningen her også.

Matematisk forventning til avvik
Matematisk forventning til avvik

Det blir null. Det er bare ett eksempel, men det vil alltid være slik: det er ikke vanskelig å bevise dette i den generelle saken. Formelen for den matematiske forventningen til avviket kan dekomponeres i differansen mellom de matematiske forventningene til en tilfeldig variabel og, uansett hvor skjev det måtte høres ut, den matematiske forventningen til matten. forventninger (rekursjon), som er de samme, og forskjellen deres vil derfor være null.

Dette er forventet: tross alt kan fortegnsavvik være både positive og negative, derfor bør de i gjennomsnitt gi null.

Hvordan beregne variansen til et diskret tilfelle. mengder

Hvis mat. det er meningsløst å beregne avviksforventningen, du må se etter noe annet. Du kan ganske enkelt ta de absolutte verdiene av avvikene (modulo); men med moduler er ikke alt så enkelt, så avvikene kvadreres, og deretter beregnes deres matematiske forventninger. Det er faktisk dette som menes når de snakker om hvordan man beregner variansen.

Det vil si at vi tar avvikene, kvadrerer dem, og lager en tabell med kvadratiske avvik og sannsynligheter som tilsvarer tilfeldige variabler. Dette er en ny fordelingslov. For å beregne den matematiske forventningen må du legge til produktene av kvadratet av avviket og sannsynligheten.

Enklere formel

Artikkelen begynte imidlertid med at fordelingsloven til den initiale stokastiske variabelen ofte er ukjent. Så det trengs noe lettere. Faktisk er det en annen formel som lar deg beregne prøvevariansen ved å bruke bare matten.venter:

Dispersjon - forskjellen mellom matten. forventning til kvadratet til en tilfeldig variabel og omvendt kvadratet på matten. venter.

Det er et bevis for dette, men det gir ikke mening å presentere det her, siden det ikke har noen praktisk verdi (og vi trenger bare å beregne variansen).

Hvordan beregne variansen til en tilfeldig variabel i variasjonsserier

I ekte statistikk er det umulig å reflektere alle tilfeldige variabler (fordi det grovt sett er uendelig mange av dem). Derfor er det som kommer inn i studien det såk alte representative utvalget fra en generell generell befolkning. Og siden de numeriske egenskapene til enhver tilfeldig variabel fra en slik generell populasjon beregnes fra utvalget, kalles de sample: sample mean, henholdsvis sample varians. Du kan beregne den på samme måte som den vanlige (gjennom kvadratiske avvik).

Utvalgsskjev varians
Utvalgsskjev varians

En slik spredning kalles imidlertid partisk. Den objektive variansformelen ser litt annerledes ut. Det kreves vanligvis for å beregne det.

Eksempel på objektiv varians
Eksempel på objektiv varians

Liten tillegg

En annen numerisk karakteristikk er forbundet med spredning. Den tjener også til å evaluere hvordan den tilfeldige variabelen sprer seg rundt matten. forventninger. Det er ikke stor forskjell på hvordan man beregner variansen og standardavviket: sistnevnte er kvadratroten av førstnevnte.

Anbefalt: