Distribusjonsfunksjoner til en tilfeldig variabel. Hvordan finne fordelingsfunksjonen til en tilfeldig variabel

Innholdsfortegnelse:

Distribusjonsfunksjoner til en tilfeldig variabel. Hvordan finne fordelingsfunksjonen til en tilfeldig variabel
Distribusjonsfunksjoner til en tilfeldig variabel. Hvordan finne fordelingsfunksjonen til en tilfeldig variabel
Anonim

For å finne fordelingsfunksjonene til tilfeldige variabler og deres variabler, er det nødvendig å studere alle egenskapene til dette kunnskapsfeltet. Det finnes flere forskjellige metoder for å finne de aktuelle verdiene, inkludert å endre en variabel og generere et øyeblikk. Distribusjon er et konsept basert på elementer som spredning, variasjoner. Imidlertid karakteriserer de bare graden av spredningsamplitude.

Distribusjonsfunksjoner til en tilfeldig variabel
Distribusjonsfunksjoner til en tilfeldig variabel

De viktigste funksjonene til tilfeldige variabler er de som er relaterte og uavhengige, og likt fordelt. For eksempel, hvis X1 er vekten til et tilfeldig valgt individ fra en mannlig populasjon, X2 er vekten til en annen, …, og Xn er vekten til en person til fra den mannlige populasjonen, så må vi vite hvordan den tilfeldige funksjonen X er fordelt. I dette tilfellet gjelder det klassiske teoremet k alt sentralgrensesetningen. Den lar deg vise at funksjonen for store n følger standarddistribusjoner.

Funksjoner av én tilfeldig variabel

The Central Limit Theorem er for å tilnærme diskrete verdier som vurderes, for eksempel binomial og Poisson. Fordelingsfunksjoner av tilfeldige variabler vurderes først og fremst på enkle verdier av en variabel. For eksempel, hvis X er en kontinuerlig tilfeldig variabel med sin egen sannsynlighetsfordeling. I dette tilfellet utforsker vi hvordan vi finner tetthetsfunksjonen til Y ved å bruke to forskjellige tilnærminger, nemlig fordelingsfunksjonsmetoden og endringen i variabel. Først vurderes kun én-til-én-verdier. Deretter må du endre teknikken for å endre variabelen for å finne sannsynligheten. Til slutt må vi lære hvordan den inverse kumulative distribusjonsfunksjonen kan hjelpe til med å modellere tilfeldige tall som følger visse sekvensielle mønstre.

Metode for distribusjon av vurderte verdier

Metoden for sannsynlighetsfordelingsfunksjonen til en tilfeldig variabel er anvendelig for å finne dens tetthet. Ved bruk av denne metoden beregnes en kumulativ verdi. Deretter, ved å differensiere den, kan du få sannsynlighetstettheten. Nå som vi har distribusjonsfunksjonsmetoden, kan vi se på noen flere eksempler. La X være en kontinuerlig tilfeldig variabel med en viss sannsynlighetstetthet.

Hva er sannsynlighetstetthetsfunksjonen til x2? Hvis du ser på eller graferer funksjonen (øverst og til høyre) y \u003d x2, kan du merke at det er en økende X og 0 <y<1. Nå må du bruke den betraktede metoden for å finne Y. Først blir den kumulative fordelingsfunksjonen funnet, du trenger bare å differensiere for å få sannsynlighetstettheten. Gjør vi det, får vi: 0<y<1. Distribusjonsmetoden er vellykket implementert for å finne Y når Y er en økende funksjon av X. Forresten, f(y) integreres til 1 over y.

I det siste eksemplet ble det brukt stor forsiktighet for å indeksere de kumulative funksjonene og sannsynlighetstettheten med enten X eller Y for å indikere hvilken tilfeldig variabel de tilhørte. For eksempel, når vi fant den kumulative fordelingsfunksjonen til Y, fikk vi X. Hvis du trenger å finne en tilfeldig variabel X og dens tetthet, trenger du bare å differensiere den.

Variabel endringsteknikk

La X være en kontinuerlig tilfeldig variabel gitt av en fordelingsfunksjon med en fellesnevner f (x). I dette tilfellet, hvis du setter verdien av y i X=v (Y), får du verdien av x, for eksempel v (y). Nå må vi få fordelingsfunksjonen til en kontinuerlig tilfeldig variabel Y. Der den første og andre likheten finner sted fra definisjonen av kumulativ Y. Den tredje likheten gjelder fordi den delen av funksjonen som u (X) ≦ y er for også sant at X ≦ v (Y). Og den siste gjøres for å bestemme sannsynligheten i en kontinuerlig tilfeldig variabel X. Nå må vi ta den deriverte av FY (y), den kumulative fordelingsfunksjonen til Y, for å få sannsynlighetstettheten Y.

Distribusjonsfunksjon av en kontinuerlig tilfeldig variabel
Distribusjonsfunksjon av en kontinuerlig tilfeldig variabel

Generalisering for reduksjonsfunksjonen

La X være en kontinuerlig tilfeldig variabel med felles f (x) definert over c1<x<c2. Og la Y=u (X) være en avtagende funksjon av X med invers X=v (Y). Siden funksjonen er kontinuerlig og avtagende, er det en invers funksjon X=v (Y).

For å løse dette problemet kan du samle inn kvantitative data og bruke den empiriske kumulative distribusjonsfunksjonen. Med denne informasjonen og appellerende til den, må du kombinere midler, standardavvik, mediedata og så videre.

Tilsvarende kan selv en ganske enkel sannsynlighetsmodell ha et stort antall resultater. For eksempel hvis du slår en mynt 332 ganger. Da er antallet resultater oppnådd fra flips større enn for google (10100) - et tall, men ikke mindre enn 100 kvintillioner ganger høyere enn elementærpartikler i det kjente universet. Ikke interessert i en analyse som gir svar på alle mulige utfall. Et enklere konsept ville være nødvendig, for eksempel antall hoder, eller det lengste haleslaget. For å fokusere på spørsmål av interesse godtas et spesifikt resultat. Definisjonen i dette tilfellet er som følger: en tilfeldig variabel er en reell funksjon med et sannsynlighetsrom.

Området S for en tilfeldig variabel kalles noen ganger tilstandsrommet. Hvis X er den aktuelle verdien, så N=X2, exp ↵X, X2 + 1, tan2 X, bXc, og så videre. Den siste av disse, avrunding av X til nærmeste hele tall, kalles etasjefunksjonen.

Distribusjonsfunksjoner

Når fordelingsfunksjonen av interesse for en tilfeldig variabel x er bestemt, blir spørsmålet vanligvis: "Hva er sjansene for at X faller inn i en delmengde av B-verdier?". For eksempel, B={oddetall}, B={større enn 1}, eller B={mellom 2 og 7} for å indikere de resultatene som har X, verdientilfeldig variabel, i delmengde A. I eksemplet ovenfor kan du derfor beskrive hendelsene som følger.

{X er et oddetall}, {X er større enn 1}={X> 1}, {X er mellom 2 og 7}={2 <X <7} for å matche de tre alternativene ovenfor for delmengde B. Mange egenskaper ved tilfeldige størrelser er ikke relatert til en bestemt X. De avhenger heller av hvordan X tildeler verdiene. Dette fører til en definisjon som høres slik ut: fordelingsfunksjonen til en tilfeldig variabel x er kumulativ og bestemmes av kvantitative observasjoner.

Distribusjonsfunksjon av en diskret tilfeldig variabel
Distribusjonsfunksjon av en diskret tilfeldig variabel

Tilfeldige variabler og distribusjonsfunksjoner

Dermed kan du beregne sannsynligheten for at fordelingsfunksjonen til en tilfeldig variabel x tar verdier i intervallet ved subtraksjon. Tenk på å inkludere eller ekskludere endepunkter.

Vi vil kalle en tilfeldig variabel diskret hvis den har et endelig eller tellelig uendelig tilstandsrom. Dermed er X antallet hoder på tre uavhengige vendinger av en forutinntatt mynt som går opp med sannsynlighet p. Vi må finne den kumulative fordelingsfunksjonen til en diskret tilfeldig variabel FX for X. La X være antall topper i en samling av tre kort. Da er Y=X3 via FX. FX starter på 0, slutter på 1, og synker ikke når x-verdiene øker. Den kumulative FX-fordelingsfunksjonen til en diskret tilfeldig variabel X er konstant, bortsett fra hopp. Når du hopper, er FX kontinuerlig. Bevis påstanden om riktigkontinuiteten til fordelingsfunksjonen fra sannsynlighetsegenskapen er mulig ved å bruke definisjonen. Det høres slik ut: en konstant tilfeldig variabel har en kumulativ FX som er differensierbar.

For å vise hvordan dette kan skje, kan vi gi et eksempel: et mål med en enhetsradius. Antagelig. pilen er jevnt fordelt over det angitte området. For noen λ> 0. Dermed øker fordelingsfunksjonene til kontinuerlige tilfeldige variabler jevnt. FX har egenskapene til en distribusjonsfunksjon.

En mann venter på bussholdeplassen til bussen kommer. Etter å ha bestemt seg for at han vil nekte når ventetiden når 20 minutter. Her er det nødvendig å finne den kumulative fordelingsfunksjonen for T. Tiden når en person fortsatt vil være på busstasjonen eller ikke vil forlate. Til tross for at den kumulative fordelingsfunksjonen er definert for hver tilfeldig variabel. Likevel vil andre egenskaper bli brukt ganske ofte: massen for en diskret variabel og fordelingstetthetsfunksjonen til en tilfeldig variabel. Vanligvis sendes verdien ut gjennom en av disse to verdiene.

Finn fordelingsfunksjonen til en tilfeldig variabel
Finn fordelingsfunksjonen til en tilfeldig variabel

Massefunksjoner

Disse verdiene vurderes av følgende egenskaper, som har en generell (masse) karakter. Den første er basert på at sannsynlighetene ikke er negative. Den andre følger av observasjonen at settet for alle x=2S, tilstandsrommet for X, danner en partisjon av den sannsynlige friheten til X. Eksempel: kaste en forutinntatt mynt hvis utfall er uavhengige. Du kan fortsettevisse handlinger til du får en kast med hodet. La X betegne en tilfeldig variabel som gir antall haler foran det første hodet. Og p angir sannsynligheten for en gitt handling.

Så, massesannsynlighetsfunksjonen har følgende karakteristiske trekk. Fordi begrepene danner en numerisk sekvens, kalles X en geometrisk tilfeldig variabel. Geometrisk skjema c, cr, cr2,.,,, crn har en sum. Og derfor har sn en grense som n 1. I dette tilfellet er den uendelige summen grensen.

Massefunksjonen ovenfor danner en geometrisk sekvens med et forhold. Derfor er naturlige tall a og b. Forskjellen i verdiene i fordelingsfunksjonen er lik verdien til massefunksjonen.

Tetthetsverdiene som vurderes har en definisjon: X er en tilfeldig variabel hvis FX-fordeling har en derivert. FX som tilfredsstiller Z xFX (x)=fX (t) dt-1 kalles sannsynlighetstetthetsfunksjonen. Og X kalles en kontinuerlig tilfeldig variabel. I den grunnleggende teoremet til kalkulus er tetthetsfunksjonen den deriverte av fordelingen. Du kan beregne sannsynligheter ved å beregne bestemte integraler.

Fordi data er samlet inn fra flere observasjoner, må mer enn én tilfeldig variabel om gangen vurderes for å modellere de eksperimentelle prosedyrene. Derfor betyr settet med disse verdiene og deres felles fordeling for de to variablene X1 og X2 visning av hendelser. For diskrete tilfeldige variabler er felles sannsynlighetsmassefunksjoner definert. For kontinuerlige vurderes fX1, X2, hvorleddsannsynlighetstettheten er oppfylt.

Uavhengige tilfeldige variabler

To tilfeldige variabler X1 og X2 er uavhengige hvis to hendelser knyttet til dem er like. Med ord, sannsynligheten for at to hendelser {X1 2 B1} og {X2 2 B2} inntreffer samtidig, y, er lik produktet av variablene ovenfor, at hver av dem inntreffer individuelt. For uavhengige diskrete tilfeldige variabler er det en felles probabilistisk massefunksjon, som er produktet av det begrensende ionevolumet. For kontinuerlige tilfeldige variabler som er uavhengige, er felles sannsynlighetstetthetsfunksjonen produktet av margin altetthetsverdiene. Til slutt tar vi for oss n uavhengige observasjoner x1, x2,.,,, xn som oppstår fra en ukjent tetthet eller massefunksjon f. For eksempel, en ukjent parameter i funksjoner for en eksponentiell tilfeldig variabel som beskriver ventetiden for en buss.

Den tilfeldige variabelen er gitt av fordelingsfunksjonen
Den tilfeldige variabelen er gitt av fordelingsfunksjonen

Imitasjon av tilfeldige variabler

Hovedmålet med dette teoretiske feltet er å gi verktøyene som trengs for å utvikle slutningsprosedyrer basert på solide statistiske vitenskapelige prinsipper. En svært viktig brukssak for programvare er derfor muligheten til å generere pseudodata for å etterligne faktisk informasjon. Dette gjør det mulig å teste og forbedre analysemetoder før de må brukes i reelle databaser. Dette er nødvendig for å utforske egenskapene til dataene gjennommodellering. For mange ofte brukte familier av tilfeldige variabler, gir R kommandoer for å generere dem. For andre forhold vil det være behov for metoder for å modellere en sekvens av uavhengige tilfeldige variabler som har en felles fordeling.

Diskrete tilfeldige variabler og kommandomønster. Prøvekommandoen brukes til å lage enkle og stratifiserte tilfeldige prøver. Som et resultat, hvis en sekvens x legges inn, velger sample(x, 40) 40 poster fra x slik at alle valg av størrelse 40 har samme sannsynlighet. Dette bruker standard R-kommando for henting uten erstatning. Kan også brukes til å modellere diskrete tilfeldige variabler. For å gjøre dette må du gi et tilstandsrom i vektoren x og massefunksjonen f. Et kall til erstatning=TRUE indikerer at sampling skjer med erstatning. Deretter, for å gi et utvalg av n uavhengige tilfeldige variabler som har en felles massefunksjon f, brukes utvalget (x, n, replace=TRUE, prob=f).

Bestemte at 1 er den minste verdien som er representert og 4 er den største av alle. Hvis kommandoen prob=f er utelatt, vil prøven prøve jevnt fra verdiene i vektor x. Du kan sjekke simuleringen mot massefunksjonen som genererte dataene ved å se på det doble likhetstegnet,==. Og regne om observasjonene som tar alle mulige verdier for x. Du kan lage et bord. Gjenta dette for 1000 og sammenlign simuleringen med den tilsvarende massefunksjonen.

Illustrasjon av sannsynlighetstransformasjon

Førstsimulere homogene distribusjonsfunksjoner av stokastiske variable u1, u2,.,,, un på intervallet [0, 1]. Omtrent 10 % av tallene skal være innenfor [0, 3, 0, 4]. Dette tilsvarer 10 % av simuleringene på intervallet [0, 28, 0, 38] for en tilfeldig variabel med FX-fordelingsfunksjonen vist. Tilsvarende bør omtrent 10 % av de tilfeldige tallene være i intervallet [0, 7, 0, 8]. Dette tilsvarer 10 % simuleringer på intervallet [0, 96, 1, 51] til den tilfeldige variabelen med fordelingsfunksjonen FX. Disse verdiene på x-aksen kan oppnås ved å ta inversen fra FX. Hvis X er en kontinuerlig tilfeldig variabel med tetthet fX positiv over alt i sitt domene, så øker fordelingsfunksjonen strengt tatt. I dette tilfellet har FX en invers FX-1-funksjon kjent som kvantilfunksjonen. FX (x) u bare når x FX-1 (u). Sannsynlighetstransformasjonen følger av analysen av stokastisk variabel U=FX (X).

Sannsynlighetsfordelingsfunksjon for en tilfeldig variabel
Sannsynlighetsfordelingsfunksjon for en tilfeldig variabel

FX har et område på 0 til 1. Det kan ikke være under 0 eller over 1. For verdier på u mellom 0 og 1. Hvis U kan simuleres, må en tilfeldig variabel med FX-fordeling være simulert via en kvantilfunksjon. Ta den deriverte for å se at tettheten u varierer innenfor 1. Siden den tilfeldige variabelen U har en konstant tetthet over intervallet til dens mulige verdier, kalles den uniform på intervallet [0, 1]. Den er modellert i R med runif-kommandoen. Identiteten kalles en probabilistisk transformasjon. Du kan se hvordan det fungerer i eksempelet på darttavlen. X mellom 0 og 1, funksjonfordeling u=FX (x)=x2, og derav kvantilfunksjonen x=FX-1 (u). Det er mulig å modellere uavhengige observasjoner av avstanden fra midten av dartpanelet, og dermed lage enhetlige tilfeldige variabler U1, U2,.,, Un. Fordelingsfunksjonen og den empiriske funksjonen er basert på 100 simuleringer av fordelingen av en darttavle. For en eksponentiell tilfeldig variabel, antagelig u=FX (x)=1 - exp (- x), og dermed x=- 1 ln (1 - u). Noen ganger består logikk av likeverdige utsagn. I dette tilfellet må du sette sammen de to delene av argumentet. Skjæringsidentiteten er lik for alle 2 {S i i} S, i stedet for en verdi. Unionen Ci er lik tilstandsrommet S og hvert par er gjensidig utelukkende. Siden Bi - er delt inn i tre aksiomer. Hver sjekk er basert på den tilsvarende sannsynligheten P. For enhver delmengde. Bruk av en identitet for å sikre at svaret ikke avhenger av om intervallendepunktene er inkludert.

Loven for fordeling av funksjonen til en tilfeldig variabel
Loven for fordeling av funksjonen til en tilfeldig variabel

Eksponentiell funksjon og dens variabler

For hvert utfall i alle hendelser, brukes til slutt den andre egenskapen til sannsynlighetens kontinuitet, som anses som aksiomatisk. Loven om fordelingen av funksjonen til en tilfeldig variabel her viser at hver har sin egen løsning og svar.

Anbefalt: