Pearson-distribusjon: definisjon, applikasjon

Innholdsfortegnelse:

Pearson-distribusjon: definisjon, applikasjon
Pearson-distribusjon: definisjon, applikasjon
Anonim

Hva er Pearsons distribusjonslov? Svaret på dette brede spørsmålet kan ikke være enkelt og konsist. Pearson-systemet ble opprinnelig designet for å modellere synlige forvrengte observasjoner. På den tiden var det velkjent hvordan man justerer en teoretisk modell for å matche de to første kumulantene eller øyeblikkene av observerte data: enhver sannsynlighetsfordeling kan utvides direkte for å danne en gruppe med plasseringsskalaer.

Pearsons hypotese om normalfordelingen av kriterier

Unntatt i patologiske tilfeller kan lokaliseringsskalaen gjøres til å matche det observerte gjennomsnittet (første kumulant) og variansen (andre kumulant) på en vilkårlig måte. Det var imidlertid ikke kjent hvordan man konstruerte sannsynlighetsfordelinger der skjevhet (standardisert tredje kumulant) og kurtosis (standardisert fjerde kumulant) kunne kontrolleres like fritt. Dette behovet ble tydelig når man forsøkte å tilpasse kjente teoretiske modeller til observerte data,som viste asymmetri.

I videoen nedenfor kan du se analysen av Pearsons chi-distribusjon.

Image
Image

Historie

I sitt originale arbeid identifiserte Pearson fire typer distribusjoner (nummerert I til IV) i tillegg til normalfordelingen (som opprinnelig var kjent som type V). Klassifiseringen avhenger av om distribusjonene støttes over et begrenset intervall, på en halvakse eller på hele den reelle linjen, og om de var potensielt skjeve eller nødvendigvis symmetriske.

To utelatelser ble rettet i den andre artikkelen: han omdefinerte type V-fordelingen (opprinnelig var det bare normalfordelingen, men nå med invers gamma) og introduserte type VI-fordelingen. Sammen dekker de to første artiklene de fem hovedtypene av Pearson-systemet (I, III, IV, V og VI). I den tredje artikkelen introduserte Pearson (1916) flere undertyper.

Pearson distribusjonsfunksjoner
Pearson distribusjonsfunksjoner

Forbedre konseptet

Rind fant opp en enkel måte å visualisere parameterrommet til Pearson-systemet (eller fordelingen av kriterier), som han senere tok i bruk. I dag bruker mange matematikere og statistikere denne metoden. Typene Pearson-fordelinger er preget av to størrelser, vanligvis k alt β1 og β2. Den første er kvadratet av asymmetri. Det andre er den tradisjonelle kurtosis, eller det fjerde standardiserte momentet: β2=γ2 + 3.

Moderne matematiske metoder definerer kurtosis γ2 som kumulanter i stedet for momenter, så for en normalfordeling har vi γ2=0 og β2=3. Her er det verdt å følge den historiske presedensen og bruke β2. Diagrammet til høyre viser hvilken type en spesiell Pearson-distribusjon er (angitt med prikken (β1, β2).

Pearson-statistikk
Pearson-statistikk

Mange av de skjeve og/eller ikke-mesokurtiske distribusjonene vi kjenner i dag, var ennå ikke kjent på begynnelsen av 1890-tallet. Det som nå er kjent som beta-fordelingen ble brukt av Thomas Bayes som den bakre parameteren for Bernoulli-fordelingen i hans artikkel fra 1763 om invers sannsynlighet.

Beta-distribusjonen ble fremtredende på grunn av sin tilstedeværelse i Pearson-systemet og var kjent frem til 1940-tallet som Pearson type I-distribusjonen. Type II-distribusjonen er et spesi altilfelle av Type I, men den skilles vanligvis ikke ut lenger.

Gamma-distribusjonen stammet fra hans eget verk og var kjent som Pearson Type III Normal Distribution før den fikk sitt moderne navn på 1930- og 1940-tallet. En artikkel fra 1895 av en vitenskapsmann presenterte Type IV-fordelingen, som inneholder Students t-distribusjon, som et spesi altilfelle, som gikk før William Seely Gossets påfølgende bruk med flere år. Hans artikkel fra 1901 presenterte en fordeling med invers gamma (type V) og beta-primtal (type VI).

Another opinion

I følge Ord utviklet Pearson den grunnleggende formen for ligning (1) basert på formelen for den deriverte av logaritmen til normalfordelingstetthetsfunksjonen (som gir en lineær divisjon med kvadratiskstruktur). Mange spesialister er fortsatt engasjert i å teste hypotesen om fordelingen av Pearson-kriteriene. Og det beviser sin effektivitet.

Alternativ Pearson-distribusjon
Alternativ Pearson-distribusjon

Hvem var Karl Pearson

Karl Pearson var en engelsk matematiker og biostatistiker. Han er kreditert med å skape disiplinen matematisk statistikk. I 1911 grunnla han verdens første avdeling for statistikk ved University College London og ga betydelige bidrag til feltene biometri og meteorologi. Pearson var også tilhenger av sosialdarwinisme og eugenikk. Han var Sir Francis G altons protesjé og biograf.

Biometri

Karl Pearson var med på å skape skolen for biometri, som var en konkurrerende teori for å beskrive utviklingen og arven til populasjoner ved begynnelsen av det 20. århundre. Hans serie på atten artikler "Mathematical Contributions to the Theory of Evolution" etablerte ham som grunnleggeren av den biometriske arveskolen. Faktisk viet Pearson mye av tiden sin i 1893-1904 til utvikling av statistiske metoder for biometri. Disse metodene, som er mye brukt i dag for statistisk analyse, inkluderer kjikvadrattesten, standardavvik, korrelasjon og regresjonskoeffisienter.

Pearsons korrelasjonskoeffisient
Pearsons korrelasjonskoeffisient

Spørsmålet om arv

Pearsons arvelov utt alte at kimplasmaet består av elementer som er arvet fra foreldre, så vel som fra fjernere forfedre, hvor andelen varierte i henhold til ulike egenskaper. Karl Pearson var en tilhenger av G alton, og selv om deresverkene skilte seg i noen henseender, brukte Pearson en betydelig mengde av lærerens statistiske konsepter for å formulere en biometrisk skole for arv, for eksempel regresjonsloven.

Pearson distribusjon
Pearson distribusjon

Skolefunksjoner

Den biometriske skolen, i motsetning til mendelianerne, var ikke fokusert på å gi en mekanisme for arv, men på å gi en matematisk beskrivelse som ikke var kausal i naturen. Mens G alton foreslo en diskontinuerlig evolusjonsteori der arter ville endre seg i store sprang i stedet for små endringer som akkumulerte over tid, påpekte Pearson feil i dette argumentet og brukte faktisk ideene sine til å utvikle en kontinuerlig evolusjonsteori. Mendelianerne foretrakk den diskontinuerlige evolusjonsteorien.

Mens G alton hovedsakelig fokuserte på bruken av statistiske metoder for studier av arv, utvidet Pearson og hans kollega Weldon resonnementet sitt på dette området, variasjon, korrelasjoner mellom naturlig og seksuell seleksjon.

Typisk fordeling
Typisk fordeling

En titt på evolusjon

For Pearson var ikke evolusjonsteorien ment å identifisere den biologiske mekanismen som forklarer mønstrene for arv, mens den mendelske tilnærmingen erklærte genet for å være arvemekanismen.

Pearson kritiserte Bateson og andre biologer for ikke å ta i bruk biometriske metoder i deres studie av evolusjon. Han fordømte forskere som ikke fokuserte påstatistisk gyldighet av teoriene deres, som sier:

"Før vi kan akseptere [enhver årsak til progressiv endring] som en faktor, må vi ikke bare vise dens plausibilitet, men om mulig demonstrere dens kvantitative evne."

Biologer har bukket under for "nesten metafysiske spekulasjoner om årsakene til arvelighet" som har erstattet prosessen med å samle inn eksperimentelle data, som faktisk kan tillate forskere å begrense potensielle teorier.

statistisk bro
statistisk bro

naturlover

For Pearson var naturlovene nyttige for å lage nøyaktige spådommer og for å oppsummere trender i observerte data. Årsaken var opplevelsen «at en bestemt sekvens skjedde og gjentok seg i fortiden».

Dette har ikke vært et verdig forsøk for biologer å identifisere en spesiell mekanisme for genetikk, som i stedet bør fokusere på matematiske beskrivelser av empirien. Dette førte delvis til en bitter strid mellom biometrister og mendelianere, inkludert Bateson.

Etter at sistnevnte avviste et av Pearsons manuskripter som beskrev en ny teori om avkomsvariasjon eller homotypi, grunnla Pearson og Weldon Biometrika-selskapet i 1902. Selv om den biometriske tilnærmingen til arv til slutt mistet sitt mendelske perspektiv, er metodene de utviklet på den tiden avgjørende for studiet av biologi og evolusjon i dag.

Anbefalt: