Faktataulukot

Faktataulukot ovat tietovaraston perusta. Ne sisältävät yrityksen perusmittaukset, ja ne ovat useimpien tietovaraston kyselyiden lopullinen kohde. Ei ole mitään järkeä nostaa faktataulukoita lipputankoon, ellei niitä ole valittu vastaamaan kiireellisiä liiketoiminnan painopisteitä, jos niiden laatu on varmistettu huolellisesti ja jos niiden ympärillä on ulottuvuuksia, jotka tarjoavat runsaasti sisääntulokohtia rajoittamiselle ja ryhmittelylle. Nyt kun olemme tasoittaneet tietä faktataulukoille, katsotaan, miten niitä rakennetaan ja käytetään.

pysy jyvälle uskollisena

ensimmäinen ja tärkein suunnitteluvaihe on faktataulukon jyvän julistaminen. Jyvä on liiketoiminnan määritelmä siitä, mitä yksittäinen faktataulukko edustaa. Viljailmoitus ei ole luettelo ulkomaisista ulottuvuusavaimista, jotka toteuttavat faktataulukon ensisijaisen avaimen. Sen sijaan jyvä on fyysisen maailman mittaustapahtuman kuvaus, joka synnyttää mittauksen. Kun ruokakaupan skanneri mittaa ostettavan tuotteen määrän ja veloitetun hinnan, vilja on kirjaimellisesti skannerin piippaus. Se on hyvä viljan määritelmä!

heti jyvän julistamisen jälkeen on mahdollista luetella ne ulottuvuusnäppäimet, jotka jyvän kohdalla ovat olemassa. Ilmoittamalla vilja ensin, keskustelu ulkomaisista avaimista pysyy maadoitettuna ja täsmällisenä.

faktataulukon todellinen tarkoitus on olla mittaustapahtuman aikana havaittujen numeeristen faktojen arkisto. On ratkaisevan tärkeää, että nämä tosiasiat pitävät paikkansa viljasta. Päivittäistavarakauppa ”piip” mittaa skannattavan tuotteen määrän ja pidennetyn hinnan. Emme koskaan ota mukaan muita jyvää loukkaavia numeerisia mittauksia, kuten kategorian kokonaismyyntiä tai tämän tuotteen viime kuun myyntiä. Vaikka näistä muista mittauksista saattaa olla niukasti hyötyä valikoiduissa laskelmissa, niitä ei voida yhdistää faktatietoihin ja ne aiheuttavat outoja epäsymmetrioita sovellusten suunnittelussa. Annamme business intelligence (BI)-työkalujemme laskea nämä off-topic-arvot kyselyaikaan sen sijaan, että ne koodattaisiin ahkerasti faktataulukoihimme.

pyrimme aina siihen, että faktat olisivat mitoiltaan additiivisia ja täsmälleen jyvän mukaisia. Huomaa, että emme tallenna skannattavan tuotteen hintaa, koska hinta ei ole additiivinen. Sen sijaan säilytämme pidennetyn hinnan, jota voi lisätä vapaasti tuotteiden, kauppojen, kellonaikojen ja kaikkien muiden mittojen kautta.

kertymä pienimmästä mahdollisesta jyvästä

tietovarasto on aina rakennettava faktataulukoille, jotka on ilmaistu pienimmällä mahdollisella jyvällä. Esimerkissä ruokakaupan kassan piippaus on pienin mahdollinen vilja, koska sitä ei voi jakaa enempää. Alimman viljan faktataulukot ovat ilmeikkäimpiä, koska niissä on mahdollisimman täydelliset mitat kyseiseen liiketoimintaprosessiin. Piip-viljan faktataulukossa voisi olla päivämäärä, myymälä, tuote, kassa, johtaja, asiakas, promootio, kilpailu, kori ja jopa sää, jos kaikki nämä tietolähteet voidaan järjestää, kun faktatietoja luodaan. Korkeammat viljan aggregoidut taulukot, kuten piirikohtainen luokkamyynti, eivät voi tukea kaikkia näitä ulottuvuuksia ja ovat siksi paljon vähemmän ilmaisuvoimaisia. On perustavanlaatuinen virhe julkaista vain kootut taulukot loppukäyttäjille ilman, että alimmat viljan faktataulukot ovat helposti saatavilla poraamalla alas. Suurin osa vääristä käsityksistä, että ulottuvuustaulukoissa edellytetään liiketoiminnan kysymys tulevat tämän perustavanlaatuinen virhe.

kolmenlaisia Faktataulukoita

Jos pysyt uskollisena jyvälle, kaikki faktataulukkosi voidaan ryhmitellä vain kolmeen tyyppiin: transaktiojyvä, jaksollinen tilanneviljajyvä ja kertyvä tilanneviljajyvä (nämä kolme tyyppiä on esitetty kuvassa 1). Kuvassa 1 muuttujat on merkitty FK: lla (foreign key) ja numeeriset faktat kursivoitu.

transaktiojyvä vastaa yhdellä sekunnilla otettua mittausta. Ruokakaupan piip on kaupan viljaa. Mitatut tosiasiat pätevät vain siihen hetkeen ja kyseiseen tapahtumaan. Seuraava mittaustapahtuma voi tapahtua millisekunnin kuluttua tai ensi kuussa tai ei koskaan. Näin ollen transaktioviljan faktataulukot ovat arvaamattoman harvassa tai tiheässä. Meillä ei ole mitään takeita siitä, että kaikki mahdolliset ulkomaiset avaimet ovat edustettuina. Transaction grain fact-taulukot voivat olla valtavia, joista suurimmat sisältävät useita miljardeja tietueita.

jaksollinen tilannekatsaus vastaa ennalta määriteltyä ajanjaksoa, usein taloudellista raportointijaksoa. Kuviossa 1 esitetään kuukausittainen tilinpidon jaksollinen tilannekuva. Mitatut faktat tiivistävät aktiivisuutta aikajänteen aikana tai lopussa. Jaksottaisella tilannekuvajyvällä on vahva tae siitä, että kaikki raportoivat yhteisöt (kuten kuvan 1 pankkitili) esiintyvät jokaisessa tilannekuvassa, vaikka toimintaa ei olisikaan. Jaksollinen tilannekuva on ennustettavan tiheä, ja sovellukset voivat luottaa siihen, että näppäinyhdistelmät ovat aina läsnä. Myös jaksolliset tilannekuvaustaulukot voivat paisua suuriksi. Pankilla, jolla on 20 miljoonaa tiliä ja 10 vuoden historia, olisi 2.4 miljardia kirjaa kuukausittain tilille määräajoin tilannekuva!

kertyvä tilannekuvaustaulukko vastaa ennustettavaa prosessia, jolla on tarkoin määritelty alku ja loppu. Tilausten käsittely, korvausvaatimusten käsittely, palvelupuhelujen ratkaiseminen ja korkeakoulujen hyväksymiset ovat tyypillisiä ehdokkaita. Esimerkiksi tilauskäsittelyyn tarkoitetun kertyvän tilannekuvan jyvä on yleensä tilauksessa oleva riviesine. Huomaa kuvassa 1, että on olemassa useita päivämääriä, jotka edustavat standardiskenaariota, jonka toimeksianto käy läpi. Kertyvät snapshot records tarkistetaan ja korvataan prosessin edetessä sen vaiheet alusta loppuun. Kertyvät tilannekuva faktataulukot ovat yleensä paljon pienempiä kuin kaksi muuta tyyppiä tämän vastausstrategian vuoksi.

Vastaa

Sähköpostiosoitettasi ei julkaista.