Bayesianske nettverk: definisjon, eksempler og hvordan de fungerer

Innholdsfortegnelse:

Bayesianske nettverk: definisjon, eksempler og hvordan de fungerer
Bayesianske nettverk: definisjon, eksempler og hvordan de fungerer
Anonim

Et tros-, beslutningsnettverk, Bayesiansk (ian) modell eller sannsynlighetsdrevet asyklisk grafmodell er et variantskjema (en type statistisk modell) som representerer et sett med variabler og deres betingede avhengigheter gjennom en rettet asyklisk graf (DAG)).

For eksempel kan et Bayesiansk nettverk representere sannsynlige sammenhenger mellom sykdommer og symptomer. Gitt sistnevnte kan nettverket brukes til å beregne muligheten for å ha ulike sykdommer. I videoen nedenfor kan du se et eksempel på et Bayesiansk trosnettverk med beregninger.

Image
Image

Effektivitet

Effektive algoritmer kan utføre inferens og læring på Bayesianske nettverk. Nettverk som modellerer variabler (som talesignaler eller proteinsekvenser) kalles dynamiske nettverk. Generaliseringer av bayesianske nettverk som kan representere og løse problemer under usikkerhet kalles påvirkningsdiagrammer.

Essence

FormeltBayesianske nettverk er DAG-er hvis noder representerer variabler i Bayesiansk forstand: de kan være observerte verdier, skjulte variabler, ukjente parametere eller hypoteser. Fordi det er veldig interessant.

bayesiansk nettverkseksempel

To hendelser kan føre til at gresset blir vått: en aktiv sprinkler eller regn. Regn har en direkte effekt på bruken av sprinkleren (nemlig at når det regner, er sprinkleren vanligvis inaktiv). Denne situasjonen kan modelleres ved hjelp av et Bayesiansk nettverk.

Typisk formel
Typisk formel

Simulering

Fordi det bayesianske nettverket er en komplett modell for variablene og deres relasjoner, kan det brukes til å svare på sannsynlighetsspørsmål om dem. For eksempel kan den brukes til å oppdatere kunnskap om tilstanden til et undersett av variabler når andre data (bevisvariabler) blir observert. Denne interessante prosessen kalles probabilistisk slutning.

A posteriori gir en universelt tilstrekkelig statistikk for oppdagelsesapplikasjoner ved valg av verdier for en undergruppe av variabler. Dermed kan denne algoritmen betraktes som en mekanisme for automatisk å anvende Bayes' teorem på komplekse problemer. På bildene i artikkelen kan du se eksempler på Bayesianske trosnettverk.

Praktisk Bayesiansk nettverk
Praktisk Bayesiansk nettverk

Utdatametoder

De vanligste eksakte inferensmetodene er: variabel eliminering, som eliminerer (ved integrasjon eller summering) det uobserverbareikke-søkeparametere én etter én ved å allokere beløpet til produktet.

Klikkformidling av et "tre" som cacher beregninger slik at mange variabler kan spørres på en gang og nye bevis kan spres raskt; og rekursiv matching og/eller søking, som tillater avveininger mellom rom og tid og matcher effektiviteten til variabel eliminering når nok plass brukes.

Alle disse metodene har en spesiell kompleksitet som avhenger eksponentielt av lengden på nettverket. De vanligste omtrentlige inferensalgoritmene er eliminering av minisegmenter, syklisk trosforplantning, generalisert trosutbredelse og variasjonsmetoder.

Typer nettverk
Typer nettverk

Nettverk

For å spesifisere det Bayesianske nettverket fullstendig og dermed fullt ut representere den felles sannsynlighetsfordelingen, er det nødvendig å spesifisere sannsynlighetsfordelingen for X for hver node X på grunn av foreldrene til X.

Fordelingen av X betinget av foreldrene kan ha hvilken som helst form. Det er vanlig å jobbe med diskrete eller gaussiske fordelinger da det forenkler beregninger. Noen ganger er bare distribusjonsbegrensninger kjent. Du kan deretter bruke entropi til å bestemme enkeltfordelingen som har den høyeste entropien gitt begrensningene.

Tilsvarende, i den spesifikke konteksten til et dynamisk Bayesiansk nettverk, den betingede distribusjonen for den tidsmessige utviklingen av det latentetilstand er vanligvis satt til å maksimere entropihastigheten til den impliserte tilfeldige prosessen.

Bayesiansk tillitsnett
Bayesiansk tillitsnett

Direkte maksimering av sannsynlighet (eller posterior sannsynlighet) er ofte vanskelig gitt tilstedeværelsen av uobserverte variabler. Dette gjelder spesielt for et Bayesiansk beslutningsnettverk.

Klassisk tilnærming

Den klassiske tilnærmingen til dette problemet er forventningsmaksimeringsalgoritmen, som alternerer å beregne de forventede verdiene for uobserverte variabler avhengig av de observerte dataene med å maksimere den totale sannsynligheten (eller den bakre verdien), forutsatt at den tidligere beregnede forventede verdiene er riktige. Under forhold med moderat regularitet konvergerer denne prosessen i de maksimale (eller maksimale a posteriori) verdiene for parameterne.

En mer komplett Bayesiansk tilnærming til parametere er å behandle dem som ekstra uobserverte variabler og beregne den fulle posteriore distribusjonen over alle noder gitt de observerte dataene, og deretter integrere parameterne. Denne tilnærmingen kan være kostbar og resultere i store modeller, noe som gjør klassiske tilnærminger for parameterjustering mer tilgjengelige.

I det enkleste tilfellet blir et Bayesiansk nettverk definert av en ekspert og deretter brukt til å utføre slutninger. I andre applikasjoner er oppgaven med å bestemme for vanskelig for et menneske. I dette tilfellet må strukturen til det Bayesianske nevrale nettverket og parametrene for lokale distribusjoner læres blant dataene.

Bayesianske nettverk
Bayesianske nettverk

Alternativ metode

En alternativ metode for strukturert læring bruker optimaliseringssøk. Dette krever bruk av en evalueringsfunksjon og en søkestrategi. En vanlig skåringsalgoritme er den bakre sannsynligheten for en struktur gitt treningsdata som BIC eller BDeu.

Tiden som kreves for et uttømmende søk som returnerer en struktur som maksimerer poengsummen, er supereksponentiell i antall variabler. Den lokale søkestrategien gjør inkrementelle endringer for å forbedre strukturestimeringen. Friedman og hans kolleger vurderte å bruke gjensidig informasjon mellom variabler for å finne ønsket struktur. De begrenser settet med foreldrekandidater til k noder og søker dem grundig.

En spesielt rask metode for å studere BN nøyaktig er å forestille seg problemet som et optimaliseringsproblem og løse det ved hjelp av heltallsprogrammering. Asyklisitetsbegrensninger legges til heltallsprogrammet (IP) under løsning i form av skjæreplan. En slik metode kan håndtere problemer med opptil 100 variabler.

Grafer og nettverk
Grafer og nettverk

Problem Solving

For å løse problemer med tusenvis av variabler, er det nødvendig med en annen tilnærming. Det ene er å først velge én ordre og deretter finne den optimale BN-strukturen med hensyn til den ordren. Dette innebærer å jobbe i søkeområdet for mulig bestilling, noe som er praktisk fordi det er mindre enn plassen til nettverksstrukturer. Flere bestillinger blir deretter valgt ut og evaluert. Denne metoden viste segbest tilgjengelig i litteraturen når antallet variabler er stort.

En annen metode er å fokusere på en underklasse av nedbrytbare modeller som MLE-er er stengt for. Da kan du finne en konsistent struktur for hundrevis av variabler.

Å studere Bayesianske nettverk med en begrenset bredde på tre linjer er nødvendig for å gi nøyaktig, tolkbar slutning, siden den verste tilfelle kompleksiteten til sistnevnte er eksponentiell i trelengde k (i henhold til den eksponentielle tidshypotesen). Som en global egenskap ved grafen øker den imidlertid kompleksiteten til læringsprosessen. I denne sammenhengen kan K-tree brukes til effektiv læring.

Kort nettverk
Kort nettverk

Utvikling

Utvikling av et Bayesian Web of Trust begynner ofte med opprettelsen av en DAG G slik at X tilfredsstiller en lokal Markov-eiendom med hensyn til G. Noen ganger er dette en kausal DAG. Det estimeres de betingede sannsynlighetsfordelingene til hver variabel over dens foreldre i G. I mange tilfeller, spesielt når variablene er diskrete, hvis fellesfordelingen av X er produktet av disse betingede fordelingene, så blir X et Bayesiansk nettverk mht. G.

Markovs "knutteppe" er et sett med knuter. Markov-teppet gjør noden uavhengig av resten av blanken til noden med samme navn og er tilstrekkelig kunnskap til å beregne fordelingen. X er et Bayesiansk nettverk med hensyn til G hvis hver node er betinget uavhengig av alle andre noder, gitt dens Markovianteppe.

Anbefalt: