Relasjonsdatamodellen er Definisjon, konsept, struktur og teori om normalisering

Innholdsfortegnelse:

Relasjonsdatamodellen er Definisjon, konsept, struktur og teori om normalisering
Relasjonsdatamodellen er Definisjon, konsept, struktur og teori om normalisering
Anonim

Relasjonsdatamodellen er en unik tilnærming til å administrere parametere ved hjelp av struktur og språk i henhold til enkeltordre predikatlogikk. Den ble først beskrevet i 1969 av den engelske forskeren Codd. I dette prosjektet presenteres alle parametere som tupler gruppert i visse relasjoner.

Formålet med relasjonsdatamodellen…

relasjonsdatarepresentasjonsmodell
relasjonsdatarepresentasjonsmodell

…er å gi en deklarativ metode for å spesifisere modeller og spørringer.

Brukere merker direkte hvilken informasjon databasen inneholder og hvilken teori de ønsker fra den. Og la også databasebehandlingsprogramvaren ta seg av å beskrive strukturene for å lagre den. Prosedyren for informasjonsinnhenting for å svare på forespørsler er også viktig.

De fleste RDB-er bruker SQL-datadefinisjoner og et søkespråk. Disse systemene implementerer det som kan sees på som en teknisk tilnærming tilrelasjonsmodell.

En tabell i et SQL-databaseskjema tilsvarer en predikatvariabel. Nøkkelbegrensninger og SQL-spørringer samsvarer med predikater.

Slike databaser avviker imidlertid fra relasjonsmodellen i mange detaljer, og Codd har sterkt motsatt seg endringer som kompromitterer de opprinnelige prinsippene.

Oversikt

typer datamodeller relasjonsdatamodell
typer datamodeller relasjonsdatamodell

Hovedideen til den relasjonsdatamodellen er beskrivelsen av hele databasen som et sett med predikater for den endelige komponenten av variablene, som beskriver begrensningene for mulige verdier og deres kombinasjoner. Innholdet til enhver tid er den endelige (logiske) modellen. Det vil si et sett med relasjoner, en per predikatvariabel, slik at alle komponenter er tilfredsstilt. Dette er relasjonsdatamodellen.

Alternatives

relasjonsdatamodellstruktur
relasjonsdatamodellstruktur

Andre modeller er hierarkiske systemer og nettverkssystemer. Noen av dem, som bruker eldre arkitekturer, er fortsatt populære i datasentre med høy kapasitet. Eller i tilfeller der eksisterende systemer er så komplekse og abstrakte at overgang til dem ved bruk av relasjonsmodellen vil være uoverkommelig kostbart. Det er også viktig å merke seg de nye objektorienterte databasene.

Implementering

relasjonsdatamodellkonsepter
relasjonsdatamodellkonsepter

Det har vært flere forsøk på å få den sanne materialiseringen av RMD, opprinnelig definert av Codd og forklart av andreforskere.

Relasjonsdatarepresentasjonsmodellen var den viktigste i sitt slag, som ble beskrevet i formelle matematiske termer. Hierarkiske og nettverksbaser eksisterte før relasjonssystemer, men deres spesifikasjoner var relativt uformelle. Når RMD ble definert, ble det gjort mange forsøk på å sammenligne og kontrastere ulike modeller – og dette førte til strengere beskrivelser av tidlige systemer. Selv om den prosedyremessige karakteren til datamanipuleringsgrensesnittene for hierarkiske databaser og nettverksdatabaser begrenset mulighetene for formalisering.

Themes

Den grunnleggende antakelsen om begrepet en relasjonsdatamodell er at de alle er representert som en matematisk "p" - typiske relasjoner, "Cn" - et parvis forhold, som er en delmengde i det kartesiske produktet av flere domener. I den matematiske modellen blir resonnement om slike data utført i en to-verdi predikatlogikk, som betyr at for hver setning er det to mulige evalueringer: enten sant eller usant (og det er ingen tredje verdi, for eksempel ukjent eller ikke aktuelt, som hver ofte er assosiert med konseptet 0). Data behandles ved hjelp av kalkulus eller algebra, som er ekvivalente i uttrykkskraft.

Typer av datamodeller, relasjonsdatamodell

RMD lar utvikleren lage et konsistent, logisk syn på informasjon. Alt dette oppnås ved å inkludere de angitte begrensningene i databasedesignet, ofte referert til som det logiske skjemaet. Teorien er å utvikle en prosessmodellnormalisering, hvorved et design med visse ønskede egenskaper kan velges fra et sett med logisk ekvivalente alternativer. I tilgangsplaner og andre implementeringer og operasjoner håndteres detaljene av DBMS-motoren og reflekteres ikke i den logiske modellen. Dette er i motsetning til vanlig praksis der ytelsesjustering ofte krever endringer i logikkfunksjonen.

Den grunnleggende relasjonsdatamodellen representerer en byggestein - det er et domene eller en type informasjon, vanligvis redusert til et minimum. En tuppel er et ordnet sett med attributtverdier. Og de er på sin side et felles navn og type. Det kan enten være en skalarverdi eller en mer kompleks verdi.

En relasjon består av en overskrift og en body

grunnleggende for relasjonsdatamodellen
grunnleggende for relasjonsdatamodellen

Den første er et sett med attributter.

Kroppen (med den n-te relasjonen) er et sett med tupler.

Tangency-overskriften er også gjenstand for hver struktur.

Relasjonsdatamodellen er definert som et sett med n-tupler. I både matematikk og MRD er et sett en uordnet samling av unike ikke-dupliserte elementer, selv om noen DBMS-er pålegger dataene deres en sekvens. I matematikk har en tuppel en rekkefølge og gir mulighet for duplisering. E. F. Codd satte opprinnelig opp tupler ved å bruke denne matematiske definisjonen.

Senere var en av E. F. Codds gode ideer at bruk av attributtnavn i stedet for bestilling ville være mye mer praktisk (vanligviscase) på et relasjonsbasert dataspråk. Denne uttalelsen er fortsatt nyttig i dag. Selv om konseptet har endret seg, har ikke navnet "tuppel" blitt transformert. En umiddelbar og viktig konsekvens av denne distinksjonen er at i relasjonsmodellen blir det kartesiske produktet kommutativt.

En tabell er en vanlig visuell representasjon av relasjoner. En tuppel ligner på konseptet med en streng.

Relvar er en navngitt variabel av en bestemt type tangent som til enhver tid er tilordnet en eller annen relasjon av den typen, selv om blikket kan inneholde null-tupler.

Grunnleggende for relasjonsdatamodellen: all informasjon er representert av informasjonsverdier i relasjoner. I samsvar med dette prinsippet er relasjonsbasen et sett med relvar, og resultatet av hver spørring er representert som en tangency.

Konsistensen til en relasjonsdatabase håndheves ikke av regler innebygd i applikasjonene som bruker den, men snarere av begrensninger deklarert som en del av det logiske skjemaet og håndhevet av DBMS for alle applikasjoner. Begrensninger kommer til uttrykk i bruken av relasjonssammenligningsoperatorer, hvorav kun én er en delmengde (⊆), teoretisk tilstrekkelig. I praksis forventes det å være flere nyttige snarveier, hvorav kandidatnøkler og eksterne kildebegrensninger er de viktigste. Det er dette relasjonsdatamodellen handler om.

tolkning

For å forstå RMD fullt ut, er det nødvendig å forstå den tiltenkte tolkningensom en relasjon.

Kroppen til en berøring kalles noen ganger forlengelsen. Dette er fordi det skal tolkes som å representere en økning i et eller annet predikat. Dette er settet med sanne setninger som kan dannes ved å erstatte hver fri variabel med et navn.

Det er en en-til-en-korrespondanse mellom objektrelasjonelle datamodeller. Hver tuppel av relasjonskroppen gir attributtverdier for å instansiere predikatet ved å erstatte hver av dens frie variabler. Resultatet er et utsagn som anses som sant på grunn av forekomsten av en tuppel i kroppen av relasjonen. Omvendt anses hver prosess hvis tittel samsvarer med relasjonsnavnet, men som ikke vises i brødteksten, som falsk.

Denne antagelsen er kjent som den lukkede verden-hypotesen. Det blir ofte krenket i praktiske databaser, der fraværet av en tuppel kan bety at sannheten i den tilsvarende setningen er ukjent. For eksempel kan fraværet av visse termer ("John", "spansk") i språkferdighetskartet ikke nødvendigvis være bevis på at en gutt som heter John ikke snakker spansk.

Applikasjon til databaser, normaliseringsteori

Informasjonsemnet som brukes i en typisk relasjonell RDM kan være et sett med heltall, et sett med tegnstrenger som utgjør datoer, eller to boolske sanne og usanne, og så videre. De tilsvarende emnenavnene for disse figurene kan være strenger med navnene "Indeks", "Gjør det nødvendige arbeidet","Time", "Boolean" og så videre og så videre.

Det er imidlertid viktig å forstå at relasjonell teori ikke spesifiserer hvilke typer som skal støttes. Og det er faktisk sant, det forventes for øyeblikket at bestemmelser vil være tilgjengelige for tilpassede enheter i tillegg til de innebygde som leveres av systemet.

Attributt

den relasjonsdatamodellen representerer
den relasjonsdatamodellen representerer

Dette er begrepet som brukes i teorien for det som vanligvis kalles en kolonne. På samme måte brukes tabell ofte i stedet for det teoretiske begrepet tangency (selv om det på ingen måte er synonymt med relasjon i SQL). Datastrukturen til en tabell er spesifisert som en liste over kolonnedefinisjoner, hver med et unikt kolonnenavn og typen verdier som er tillatt for den.

Attributtverdi er en oppføring på et bestemt sted, for eksempel John Doe og 35.

En tuppel er i utgangspunktet det samme som en rad, bortsett fra at i SQL RDBMS, hvor betydningen av kolonnene i en rad er ordnet, er tuplene ikke atskilt. I stedet identifiseres hver definisjonsverdi utelukkende ved navnet sitt, ikke av dens ordinære posisjon i tupelen. Attributtnavnet kan være navn eller alder.

Attitude

den relasjonsdatamodellen er
den relasjonsdatamodellen er

Det er en strukturdefinisjonstabell sammen med utseendet til data i den strukturen. Definisjonen er overskriften, og dataene i den er brødteksten, et sett med rader. Relasjonsvariabelen kalles vanligvis hovedtabellen. Tittelen på verdien som er tildelt den inår som helst samsvarer med den som er spesifisert i den gitte cellen, og kroppen samsvarer med den den sist ble tildelt, og påkaller en oppdateringssetning (vanligvis INSERT, UPDATE eller DELETE).

Mengteoretisk formulering

Grunnleggende begreper i relasjonsmodellen for relasjoner er navn og navn på attributter. De må representeres som strenger som "Person" og "Name" og vil vanligvis måtte bruke variabler for å spenne over dem. Et annet grunnleggende konsept er et sett med atomverdier som inneholder nødvendige og viktige betydninger som tall og strenger.

Anbefalt: